这个http server的实现源代码我放在了我的github上,有兴趣的话可以点击查看哦。

在上一篇文章中,讲述了如何编写一个最简单的server,但该程序只是接受到请求之后马上返回响应,实在不能更简单。在正常的开发中,应该根据不同的请求做出不同的响应。要做到上述的功能,首先要解析客户端发来的请求报文。

报文在不同的上下文情景下有不同的理解,本文所说的报文都是在HTTP上下文中描述的名词。

HTTP报文是什么

在HTTP程序中,报文就是HTTP用来搬运东西的包裹,也可以理解为程序之间传递信息时发送的数据块。这些数据块以一些文本形式的元信息开头,这些信息描述了报文的内容和含义,后面跟着可选的数据部分。

报文的流动

HTTP使用属于流入和流出来描述报文的传递方向。HTTP报文会像合水一样流动。不管时请求报文还是响应报文,都会向下游流动,所有报文的发送者都在接受者的上游。下图展示了报文向下游流动的例子。

报文的组成

报文由三个部分组成:

  • 对报文进行描述的起始行

  • 包含属性的首部块

  • 可选的、包含数据的主体部分

起始行和首部是由行分隔的ASCII文本。每行都以一个由两个字符(回车符--ASCII码13和换行符--ASCII码10)组成的行终止序列结束。可以写做CRLF

尽管规范说明应该用CRLF来表示行终止,但稳健的应用程序也应该接受单个换行作为行的终止。笔者仅支持以CRLF换行的解析,因为我觉得既然有了规范,那就需要遵循,遵循相同的协议的程序才能互相通信。

实体是一个可选的数据块。与起始行和首部不同的是,主体中可以包含主体或二进制数据,也可以为空(比如仅仅GET一个页面或文件)。

下面来看看报文的语法的格式和规则。

报文的语法

请求报文的语法:

<method> <request-URL> <version>
<headers><entity-body>

响应报文的语法:

<version> <status-code> <reason-phrase>
<headers><entity-body>

method,方法

客户端希望服务器对资源执行的操作。比如GET、POST

request-URL,请求URL

请求资源,或者URL路径组件的完整URL。

version,版本

报文所使用的HTTP版本。格式:HTTP/<major>.<minor>。其中major(主要版本号)和minor(次要版本号)都是整数。

status-code,状态码

描述请求过程所发生的情况的数字。

reason-phrase,原因短语

数字状态码的文字描述版本。

headers,首部

每个首部包含一个名字,后面跟着一个冒号(:),然后是一个可选的空格,接着是一个值,最后是一个CRLF。可以有零个或多个首部。首部由一个CRLF结束,表示首部结束和实体主体开始。

entity-body,实体的主体部分

包含一个由任意数据组成的数据块。可以没有,此时是以一个CRLF结束。

请求行

请求报文的起始行称为请求行。所有的HTTP报文都以一行起始行作为开始。请求行包含一个方法和一个请求URL以及HTTP的版本三个字段。每个字段都以空格分隔。

比如:GET / HTTP/1.1

请求方法为GET,请求URL为/,HTTP版本为HTTP/1.1。

响应行

响应报文的起始行称为响应行。响应行包含HTTP版本、数字状态码以及描述操作状态的文本形式的原因短语。三个字段也是以空格分隔。

比如:HTTP/1.1 200 OK

HTTP版本为HTTP/1.1,数字状态码是200,原因短语是OK。表示请求成功。

首部

首部是是包含在请求和响应报文的一些附加信息。本质上,他们只是一些键值对的列表。

比如:Content-Length: 19

表示返回内容长度为19。

实体的主体部分

简单地说,这部分就是HTTP要传输的内容。

解析请求报文

了解了报文是如何组成和各部分代表的内容之后,就对如何解析请求报文心里有数了。

核心代码

    /* 解析请求行 */int parse_start_line(int sockfd, char *recv_buf, req_pack *rp){char *p = recv_buf;char *ch = p;int i = 0;enum parts { method, url, ver } req_part = method;char *method_str;char *url_str;char *ver_str;int k = 0;if (*ch < 'A' || *ch > 'Z') {return -1;}while (*ch != CR) {if (*ch != BLANK) {k++;} else if (req_part == method) {method_str = (char *)malloc(k * sizeof(char *));memset(method_str, 0, sizeof(char *));strncpy(method_str, recv_buf, k);k = 0;req_part = url;} else if (req_part == url) {url_str = (char *)malloc(k * sizeof(char *));memset(url_str, 0, sizeof(char *));strncpy(url_str, recv_buf + strlen(method_str) + 1, k);k = 0;req_part = ver;}ch++;i++;}if (req_part == url) {if (k != 0) {url_str = (char *)malloc(k * sizeof(char));memset(url_str, 0, sizeof(char));strncpy(url_str, recv_buf + strlen(method_str) + 1, k);k = 0;} else {return -1;}}if (k == 0) {ver_str = (char *)malloc(8 * sizeof(char));memset(ver_str, 0, sizeof(char));strcpy(ver_str, "HTTP/1.1");} else {ver_str = (char *)malloc(k * sizeof(char));memset(ver_str, 0, sizeof(char));strncpy(ver_str,recv_buf + strlen(method_str) + strlen(url_str) + 2, k);}rp->method = method_str;rp->url = url_str;rp->version = ver_str;return (i + 2);}/* 解析首部字段 */int parse_header(int sockfd, char *recv_buf, header headers[]){char *p = recv_buf;char *ch = p;int i = 0;int k = 0;int v = 0;int h_i = 0;bool is_newline = false;char *key_str;char *value_str;header *tmp_header = (header *)malloc(sizeof(header *));memset(tmp_header, 0, sizeof(header));while (1) {if (*ch == CR && *(ch + 1) == LF) {break;}while (*ch != COLON) {ch++;i++;k++;}if (*ch == COLON) {key_str = (char *)malloc(k * sizeof(char *));memset(key_str, 0, sizeof(char *));strncpy(key_str, recv_buf + i - k, k);k = 0;ch++;i++;}while (*ch != CR) {ch++;i++;v++;}if (*ch == CR) {value_str = (char *)malloc(v * sizeof(char *));memset(value_str, 0, sizeof(char *));strncpy(value_str, recv_buf + i - v, v);v = 0;i++;ch++;}i++;ch++;headers[h_i].key = key_str;headers[h_i].value = value_str;h_i++;}return (i + 2);}

解析思想

遍历recv接受到的请求字符串,检查是否遇到回车符r判断一行数据。

对于起始行,检查是否遇到空格分隔不同的字段;对于首部,检查是否遇到冒号分隔键值对的字段值;对于实体的主体部分,则先判断是否遇到CRLF字符串,然后将剩余内容全部作为实体的主体部分。

返回值是告知程序下一次遍历的起始位置。

如果遇到非法请求行则返回400的响应。

总结

解析报文的过程就是遵循HTTP协议规定的内容去解析报文,获取报文包含的信息。

由于基础知识较薄弱,代码还有很多错误以及很多地方需要优化。如果有看到错误的地方或有其它建议望各位大侠不吝赐教。^_^

这个http server的实现源代码我放在了我的github上,有兴趣的话可以点击查看哦。

原创文章,文笔有限,才疏学浅,文中若有不正之处,万望告知。

如果本文对你有帮助,请点下推荐吧,谢谢^_^

[计算机网络]httpserver--如何解析HTTP请求报文相关推荐

  1. 【项目学习】C++实现高并发服务器——代码学习(二)存储解析HTTP请求报文,创建响应报文

    项目来源:WebServer 上一篇:Reactor高并发模型 本文介绍以下功能的代码实现 利用标准库容器封装char,实现自动增长的缓冲区: 利用正则与状态机解析HTTP请求报文,实现处理静态资源的 ...

  2. Web服务器踩坑之旅03:解析HTTP请求报文

    项目地址: 本文实现的文件在源码中的SimpleWebServer/http_parser目录下 本文内容 目标:解析HTTP报文,从而获取客户请求的文件的文件名及文件地址 浏览器与服务器间的通信过程 ...

  3. 解析HTTP请求报文(GET、POST)

    目的: 一个WEB服务器需要解析客户端(浏览器)发来的请求,两种常见的请求方式是GET和POST. GET的请求格式: GET请求没有请求体只有请求头 GET请求的请求参数放在URL后加上一个&quo ...

  4. 解析 http 请求 header 错误_详解http报文(2)-web容器是如何解析http报文的

    摘要 在详解http报文一文中,详细介绍了http报文的文本结构.那么作为服务端,web容器是如何解析http报文的呢?本文以jetty和undertow容器为例,来解析web容器是如何处理http报 ...

  5. 【计算机网络】应用层 : 万维网 和 HTTP 协议 ( 万维网概述 | HTTP 协议特点 | HTTP 协议连接方式 | HTTP 协议报文结构 | HTTP 请求报文 | HTTP 响应报文 )

    文章目录 一.万维网概述 ★ 二.HTTP 协议 ( 超文本传输协议 ) ★ 三.HTTP 协议特点 ★ 四.HTTP 连接方式 ★ 五.HTTP 协议报文结构 六.HTTP 请求报文 ★ 七.HTT ...

  6. http请求报文 主机IP_计算机网络基础:这是一份详细HTTP学习指南

    作者:carson_ho 前言 关于计算机网络,HTTP网络通信协议在任何的开发工作中都非常重要 今天,我将献上一份HTTP的学习指南,希望你们会喜欢 目录 1. 储备知识 讲解HTPP协议前,先了解 ...

  7. html解析 英文,http请求报文解析(国外英文资料).doc

    http请求报文解析(国外英文资料) http请求报文解析(国外英文资料) HTTP request message sample: POST/pass/demo/requesttest.jsp HT ...

  8. TCP/IP协议、请求报文和响应报文

    一.TCP/IP协议 1.计算机与网络设备相互通信 计算机与网络设备要相互通信, 双方就必须基于相同的方法. 比如:如何探测到通信目标. 由哪一边先发起通信. 使用哪种语言进行通 信. 怎样结束通信等 ...

  9. web网络和http协议(了解域名和网页,制作第一个网页,了解http协议,流程和请求报文格式)

    文章目录 web网络和http协议 了解域名 早期使用HOST文件解析域名 现在DNS(Domain Name system 域名系统) 域名的概述 域名空间结构 域名介绍 域名注册 域名注册步骤 网 ...

最新文章

  1. 【视频】使用VLC采集摄像头,以RTSP协议发送流到网络上
  2. 【学习笔记】【oc】类和对象及类的三大基本特征
  3. 给我们宿舍做的游戏--snack
  4. ROS+Turtlebot3+RVIZ 显示机器人历史轨迹方法
  5. CodeForces - 1203F1 Complete the Projects (easy version)(贪心)
  6. 关于WSAEWOULDBLOCK和WSA_IO_PENDING错误
  7. [Redis6]常用数据类型_Zset有序集合
  8. Oracle中Date和Timestamp的区别
  9. Reddit热议:为什么PyTorch比TensorFlow更快?
  10. JavaScript 面向对象编程(四) —— 正则表达式
  11. 【Java从0到架构师】SpringCloud - Eureka、Ribbon、Feign
  12. mysql 游戏背包_用sql实现背包问题
  13. 借Java EE守护者联盟之力拯救Java EE
  14. java jar在电脑哪里_例举jar文件怎么打开
  15. 黄国酬老师的ExtPB.Net
  16. everedit 格式化json_Mac Init
  17. 学累了可以看漫威电影啊
  18. 网页制作语言HTML5的应用
  19. win7计算机usb解除禁用,win7系统USB接口被禁用了怎么办?win7USB被禁用后打开的方法教程...
  20. 双写、双写缓冲、双删、双活、双机热备

热门文章

  1. php mysql bootstart_PHP MySQL 创建数据库
  2. apache 设置session超时时间_深入分析 Session 和 Cookie,看这篇就对了
  3. 2017年9月计算机二级c语言,2017年9月计算机二级C语言程序设计练习题
  4. 用计算机表示45,计算机应用基础信息专业技术习题(45页)-原创力文档
  5. adb 重命名_adb中常用的命令
  6. oracle java存储过程返回值_java程序调用Oracle 存储过程 获取返回值(无返回,非结果集,结果集)...
  7. php装箱,php兑现装箱算法
  8. 1109: 数根(函数专题)
  9. mysql 5.6 生产my.cnf_一个生产可用的mysql参数文件my.cnf
  10. C语言过时了?你在做梦?