http协议
统一资源定位符(Uniform Resource Locator),简称URL,这就是人们俗称的网址。URL的格式和要素是什么,我举个例子。

HTTP协议认识
URL格式
上图就是一个URL的基本格式,需要添加的是深蓝的线划的这个部分。
这个部分叫做查询字符串,引出两个知识点,分别是urlencode和urldecode,即url编码和url解码。
HTTP协议认识
HTTP协议认识
url编码是将特殊字符的每一个字节都转换成为16进制,然后从右到左,取4位(不足4位直接处理),每2位做一位。

这里就是将"+“转义成了"2b”。考虑到用户本身提交的数据中有2b,也会造成歧义,因此在对每一个字节进行转换后,需要在前面加上%表示紧跟其后的两个字符经过了url编码。

url解码就是其逆过程。

HTTP协议格式

HTTP协议格式就是协议的实现
用fiddler工具进行浏览器的抓包,抓取浏览器与服务器之间的通信数据
HTTP协议认识

HTTP请求首行:请求方法丶URL丶协议版本

请求方法 功能
GET 获取资源
HEAD 获得报文首部
POST 传输实体主体
DELETE 删除文件
OPTIONS 询问支持的方法
TRACE 追踪路径
LINK 建立和资源之间的联系
CONNECT 要求用隧道协议连接代理
UNLINE 断开连接关系
PUT 传输文件

URL:主要信息就是请求的资源路径以及提交的查询字符串

协议版本

协议版本 说明
0.9 默认只支持GET请求方法,并且是短连接
1.0 支持了GET/HEAD/POST请求方法,并且支持长连接
1.1 支持了更多的请求方法,并且新增了更多的特性,实现管线化传输
2 支持服务端向客户端主动推送消息

头部: 空行的作用是间隔头部与正文
请求的属性, 冒号分割的键值对;每组属性之间使用\n分隔;遇到空行表示Header部分结束

正文: 空行后面的内容都是Body. Body允许为空字符串. 如果Body存在, 则在Header中会有一个Content-Length属性来标识Body的长度。
HTTP协议认识

响应首行: 协议版本丶响应状态码丶状态码描述

首行

响应状态码 类别
1xx informational(信息性状态码)
2xx Success(成功状态码)
3xx Redirection(重定向状态码)
4xx Client Error (客户端错误状态码 )
5xx Server Error (服务器错误状态码)

头部:请求的属性, 冒号分割的键值对;每组属性之间使用\n分隔;遇到空行表示Header部分结束

正文: 空行后面的内容都是Body. Body允许为空字符串. 如果Body存在, 则在Header中会有一个Content-Length属性来标识Body的长度; 如果服务器返回了一个html页面, 那么html页面内容就是在body中。

相关文章: