2018-03-06 05:41:43 +00:00
|
|
|
|
|
|
|
|
|
|
|
|
|
|
一面中,如果有笔试,考HTTP协议的可能性较大。
|
|
|
|
|
|
|
|
|
|
## 前言
|
|
|
|
|
|
2018-03-06 07:12:07 +00:00
|
|
|
|
一面要讲的内容:
|
2018-03-06 05:41:43 +00:00
|
|
|
|
|
|
|
|
|
- HTTP协议的主要特点
|
|
|
|
|
|
|
|
|
|
- HTTP报文的组成部分
|
|
|
|
|
|
|
|
|
|
- HTTP方法
|
|
|
|
|
|
|
|
|
|
- get 和 post的区别
|
|
|
|
|
|
|
|
|
|
- HTTP状态码
|
|
|
|
|
|
|
|
|
|
- 什么是持久连接
|
|
|
|
|
|
|
|
|
|
- 什么是管线化
|
|
|
|
|
|
|
|
|
|
|
2018-03-06 07:12:07 +00:00
|
|
|
|
二面要讲的内容;
|
|
|
|
|
|
|
|
|
|
- 缓存
|
|
|
|
|
|
|
|
|
|
- CSRF攻击
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
## HTTP协议的主要特点
|
|
|
|
|
|
|
|
|
|
- 简单快速
|
|
|
|
|
|
|
|
|
|
- 灵活
|
|
|
|
|
|
|
|
|
|
- **无连接**
|
|
|
|
|
|
|
|
|
|
- **无状态**
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
通常我们要答出以上四个内容。如果实在记不住,一定要记得后面的两个:**无连接、无状态**。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
我们分别来解释一下。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
### 简单快速
|
|
|
|
|
|
|
|
|
|
**简单**:每个资源(比如图片、页面)都通过 url 来定位。这都是固定的,在http协议中,处理起来也比较简单,想访问什么资源,直接输入url即可。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
### 灵活
|
|
|
|
|
|
|
|
|
|
http协议的头部有一个`数据类型`,通过http协议,就可以完成不同数据类型的传输。
|
|
|
|
|
|
|
|
|
|
### 无连接
|
|
|
|
|
|
|
|
|
|
连接一次,就会断开,不会继续保持连接。
|
|
|
|
|
|
|
|
|
|
### 无状态
|
|
|
|
|
|
|
|
|
|
客户端和服务器端是两种身份。第一次请求结束后,就断开了,第二次请求时,**服务器端并没有记住之前的状态**,也就是说,服务器端无法区分客户端是否为同一个人、同一个身份。
|
|
|
|
|
|
|
|
|
|
有的时候,我们访问网站时,网站能记住我们的账号,这个是通过其他的手段(比如 session)做到的,并不是http协议能做到的。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
## HTTP报文的组成部分
|
|
|
|
|
|
2018-03-06 14:22:25 +00:00
|
|
|
|
![](http://img.smyhvae.com/20180306_1400.png)
|
2018-03-06 07:12:07 +00:00
|
|
|
|
|
|
|
|
|
在回答此问题时,我们要按照顺序回答:
|
|
|
|
|
|
|
|
|
|
- 先回答的是,http报文包括:**请求报文**和**响应报文**。
|
|
|
|
|
|
|
|
|
|
- 再回答的是,每个报文包含什么部分。
|
|
|
|
|
|
|
|
|
|
- 最后回答,每个部分的内容是什么
|
|
|
|
|
|
|
|
|
|
### 请求报文包括:
|
|
|
|
|
|
2018-03-06 14:22:25 +00:00
|
|
|
|
![](http://img.smyhvae.com/20180228_1505.jpg)
|
2018-03-06 07:12:07 +00:00
|
|
|
|
|
|
|
|
|
- 请求行:包括请求方法、请求的url、http协议及版本。
|
|
|
|
|
|
|
|
|
|
- 请求头:一大堆的键值对。
|
|
|
|
|
|
|
|
|
|
- **空行**指的是:当服务器在解析请求头的时候,如果遇到了空行,则表明,后面的内容是请求体。
|
|
|
|
|
|
|
|
|
|
- 请求体:数据部分。
|
|
|
|
|
|
|
|
|
|
### 响应报文包括:
|
|
|
|
|
|
2018-03-06 14:22:25 +00:00
|
|
|
|
![](http://img.smyhvae.com/20180228_1510.jpg)
|
2018-03-06 07:12:07 +00:00
|
|
|
|
|
|
|
|
|
|
|
|
|
|
- 状态行:http协议及版本、状态码及状态描述。
|
|
|
|
|
|
|
|
|
|
- 响应头
|
|
|
|
|
|
|
|
|
|
- 空行
|
|
|
|
|
|
|
|
|
|
- 响应体
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
## HTTP方法
|
|
|
|
|
|
|
|
|
|
包括:
|
|
|
|
|
|
|
|
|
|
- GET:获取资源
|
|
|
|
|
|
|
|
|
|
- POST:传输资源
|
|
|
|
|
|
|
|
|
|
- put:更新资源
|
|
|
|
|
|
|
|
|
|
- DELETE:删除资源
|
|
|
|
|
|
|
|
|
|
- HEAD:获得报文首部
|
|
|
|
|
|
|
|
|
|
HTTP方法有很多,但是上面这五个方法,要求在面试时全部说出来,不要漏掉。
|
|
|
|
|
|
|
|
|
|
get 和 post 比较常见。
|
|
|
|
|
|
|
|
|
|
put 和 delete 在实际应用中用的很少。况且,业务中,一般不删除服务器端的资源。
|
|
|
|
|
|
|
|
|
|
head 可能偶尔用的到。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
## get 和 post的区别
|
|
|
|
|
|
2018-03-06 14:22:25 +00:00
|
|
|
|
![](http://img.smyhvae.com/20180306_1415.png)
|
2018-03-06 07:12:07 +00:00
|
|
|
|
|
|
|
|
|
区别有很多,如果记不住,面试时,至少要任意答出其中的三四条。
|
|
|
|
|
|
|
|
|
|
有一点要强调,**get是相对不隐私的,而post是相对隐私的**。
|
|
|
|
|
|
|
|
|
|
我们大概要记住以下几点:
|
|
|
|
|
|
|
|
|
|
1、浏览器在回退时,get**不会重新请求**,但是post会重新请求。【重要】
|
|
|
|
|
|
|
|
|
|
2、get请求会被浏览器**主动缓存**,而post不会。【重要】
|
|
|
|
|
|
|
|
|
|
3、get请求的参数,会报**保留**在浏览器的**历史记录**里,而post不会。做业务时要注意。为了防止CSRF攻击,很多公司把get统一改成了post。
|
|
|
|
|
|
|
|
|
|
4、get请求在url中传递的参数有大小限制,基本是2kb,不同的浏览器略有不同。而post没有注意。
|
|
|
|
|
|
|
|
|
|
5、get的参数是直接暴露在url上的,相对不安全。而post是放在请求体中的。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
## http状态码
|
|
|
|
|
|
|
|
|
|
http状态码分类:
|
|
|
|
|
|
2018-03-06 14:22:25 +00:00
|
|
|
|
![](http://img.smyhvae.com/20180306_1430.png)
|
2018-03-06 07:12:07 +00:00
|
|
|
|
|
|
|
|
|
常见的http状态码:
|
|
|
|
|
|
2018-03-06 14:22:25 +00:00
|
|
|
|
![](http://img.smyhvae.com/20180306_1431.png)
|
2018-03-06 07:12:07 +00:00
|
|
|
|
|
|
|
|
|
|
|
|
|
|
部分解释:
|
|
|
|
|
|
|
|
|
|
- 206的应用:`range`指的是请求的范围,客户端只请求某个大文件里的一部分内容。比如说,如果播放视频地址或音频地址的前面一部分,可以用到206。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
- 301:重定向(永久)。
|
|
|
|
|
|
|
|
|
|
- 302:重定向(临时)。
|
|
|
|
|
|
|
|
|
|
- 304:我这个服务器告诉客户端,你已经有缓存了,不需要从我这里取了。
|
|
|
|
|
|
|
|
|
|
|
2018-03-06 14:22:25 +00:00
|
|
|
|
![](http://img.smyhvae.com/20180306_1440.png)
|
2018-03-06 07:12:07 +00:00
|
|
|
|
|
|
|
|
|
400和401用的不多。403指的是请求被拒绝。404指的是资源不存在。
|
|
|
|
|
|
|
|
|
|
## 持久链接/http长连接
|
|
|
|
|
|
|
|
|
|
> 如果你能答出持久链接,这是面试官很想知道的一个点。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
- **轮询**:http1.0中,客户端每隔很短的时间,都会对服务器发出请求,查看是否有新的消息,只要轮询速度足够快,例如1秒,就能给人造成交互是实时进行的印象。这种做法是无奈之举,实际上对服务器、客户端双方都造成了大量的性能浪费。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
- **长连接**:HTTP1.1中,通过使用Connection:keep-alive进行长连接,。客户端只请求一次,但是服务器会将继续保持连接,当再次请求时,避免了重新建立连接。
|
|
|
|
|
|
|
|
|
|
注意,HTTP 1.1默认进行持久连接。在一次 TCP 连接中可以完成多个 HTTP 请求,但是对**每个请求仍然要单独发 header**,Keep-Alive不会永久保持连接,它有一个保持时间,可以在不同的服务器软件(如Apache)中设定这个时间。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
## 长连接中的管线化
|
|
|
|
|
|
|
|
|
|
> 如果能答出**管线化**,则属于加分项。
|
|
|
|
|
|
|
|
|
|
### 管线化的原理
|
|
|
|
|
|
|
|
|
|
长连接时,**默认**的请求这样的:
|
|
|
|
|
|
|
|
|
|
```
|
|
|
|
|
请求1 --> 响应1 -->请求2 --> 响应2 --> 请求3 --> 响应3
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
长连接中的管线化,请求是这样的:
|
|
|
|
|
|
|
|
|
|
```
|
|
|
|
|
请求1 --> 请求2 --> 请求3 --> 响应1 --> 响应2 --> 响应3
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
管线化就是,我把现在的请求打包,一次性发过去,你也给我一次响应回来。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
### 管线化的注意事项
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
面试时,不会深究管线化。如果真要问你,就回答:“我没怎么研究过,准备回去看看~”
|
|
|
|
|
|