Web/14-前端面试/04-HTTP协议.md

217 lines
5.7 KiB
Markdown
Raw Normal View History

2018-03-06 05:41:43 +00:00
一面中如果有笔试考HTTP协议的可能性较大。
## 前言
2018-03-06 07:12:07 +00:00
一面要讲的内容:
2018-03-06 05:41:43 +00:00
- HTTP协议的主要特点
- HTTP报文的组成部分
- HTTP方法
- get 和 post的区别
- HTTP状态码
- 什么是持久连接
- 什么是管线化
2018-03-06 07:12:07 +00:00
二面要讲的内容;
- 缓存
- CSRF攻击
## HTTP协议的主要特点
- 简单快速
- 灵活
- **无连接**
- **无状态**
通常我们要答出以上四个内容。如果实在记不住,一定要记得后面的两个:**无连接、无状态**。
我们分别来解释一下。
### 简单快速
**简单**:每个资源(比如图片、页面)都通过 url 来定位。这都是固定的在http协议中处理起来也比较简单想访问什么资源直接输入url即可。
### 灵活
http协议的头部有一个`数据类型`通过http协议就可以完成不同数据类型的传输。
### 无连接
连接一次,就会断开,不会继续保持连接。
### 无状态
客户端和服务器端是两种身份。第一次请求结束后,就断开了,第二次请求时,**服务器端并没有记住之前的状态**,也就是说,服务器端无法区分客户端是否为同一个人、同一个身份。
有的时候,我们访问网站时,网站能记住我们的账号,这个是通过其他的手段(比如 session做到的并不是http协议能做到的。
## HTTP报文的组成部分
2018-03-06 14:22:25 +00:00
![](http://img.smyhvae.com/20180306_1400.png)
2018-03-06 07:12:07 +00:00
在回答此问题时,我们要按照顺序回答:
- 先回答的是http报文包括**请求报文**和**响应报文**。
- 再回答的是,每个报文包含什么部分。
- 最后回答,每个部分的内容是什么
### 请求报文包括:
2018-03-06 14:22:25 +00:00
![](http://img.smyhvae.com/20180228_1505.jpg)
2018-03-06 07:12:07 +00:00
- 请求行包括请求方法、请求的url、http协议及版本。
- 请求头:一大堆的键值对。
- **空行**指的是:当服务器在解析请求头的时候,如果遇到了空行,则表明,后面的内容是请求体。
- 请求体:数据部分。
### 响应报文包括:
2018-03-06 14:22:25 +00:00
![](http://img.smyhvae.com/20180228_1510.jpg)
2018-03-06 07:12:07 +00:00
- 状态行http协议及版本、状态码及状态描述。
- 响应头
- 空行
- 响应体
## HTTP方法
包括:
- GET获取资源
- POST传输资源
- put更新资源
- DELETE删除资源
- HEAD获得报文首部
HTTP方法有很多但是上面这五个方法要求在面试时全部说出来不要漏掉。
get 和 post 比较常见。
put 和 delete 在实际应用中用的很少。况且,业务中,一般不删除服务器端的资源。
head 可能偶尔用的到。
## get 和 post的区别
2018-03-06 14:22:25 +00:00
![](http://img.smyhvae.com/20180306_1415.png)
2018-03-06 07:12:07 +00:00
区别有很多,如果记不住,面试时,至少要任意答出其中的三四条。
有一点要强调,**get是相对不隐私的而post是相对隐私的**。
我们大概要记住以下几点:
1、浏览器在回退时get**不会重新请求**但是post会重新请求。【重要】
2、get请求会被浏览器**主动缓存**而post不会。【重要】
3、get请求的参数会报**保留**在浏览器的**历史记录**里而post不会。做业务时要注意。为了防止CSRF攻击很多公司把get统一改成了post。
4、get请求在url中传递的参数有大小限制基本是2kb不同的浏览器略有不同。而post没有注意。
5、get的参数是直接暴露在url上的相对不安全。而post是放在请求体中的。
## http状态码
http状态码分类
2018-03-06 14:22:25 +00:00
![](http://img.smyhvae.com/20180306_1430.png)
2018-03-06 07:12:07 +00:00
常见的http状态码
2018-03-06 14:22:25 +00:00
![](http://img.smyhvae.com/20180306_1431.png)
2018-03-06 07:12:07 +00:00
部分解释:
- 206的应用`range`指的是请求的范围客户端只请求某个大文件里的一部分内容。比如说如果播放视频地址或音频地址的前面一部分可以用到206。
- 301重定向永久
- 302重定向临时
- 304我这个服务器告诉客户端你已经有缓存了不需要从我这里取了。
2018-03-06 14:22:25 +00:00
![](http://img.smyhvae.com/20180306_1440.png)
2018-03-06 07:12:07 +00:00
400和401用的不多。403指的是请求被拒绝。404指的是资源不存在。
## 持久链接/http长连接
> 如果你能答出持久链接,这是面试官很想知道的一个点。
- **轮询**http1.0中客户端每隔很短的时间都会对服务器发出请求查看是否有新的消息只要轮询速度足够快例如1秒就能给人造成交互是实时进行的印象。这种做法是无奈之举实际上对服务器、客户端双方都造成了大量的性能浪费。
- **长连接**HTTP1.1中通过使用Connection:keep-alive进行长连接。客户端只请求一次但是服务器会将继续保持连接当再次请求时避免了重新建立连接。
注意HTTP 1.1默认进行持久连接。在一次 TCP 连接中可以完成多个 HTTP 请求,但是对**每个请求仍然要单独发 header**Keep-Alive不会永久保持连接它有一个保持时间可以在不同的服务器软件如Apache中设定这个时间。
## 长连接中的管线化
> 如果能答出**管线化**,则属于加分项。
### 管线化的原理
长连接时,**默认**的请求这样的:
```
请求1 --> 响应1 -->请求2 --> 响应2 --> 请求3 --> 响应3
```
长连接中的管线化,请求是这样的:
```
请求1 --> 请求2 --> 请求3 --> 响应1 --> 响应2 --> 响应3
```
管线化就是,我把现在的请求打包,一次性发过去,你也给我一次响应回来。
### 管线化的注意事项
面试时,不会深究管线化。如果真要问你,就回答:“我没怎么研究过,准备回去看看~”