1.浏览器与web服务器的通信原理概述
本文是《网络是如何连接的》一书的笔记,很久以前看的,这本书很有趣,没有教科书那样晦涩难懂,看了它,对计网更感兴趣了,也理解的更透彻了
大家都看到过苹果落地,但只有牛顿追问了为什么。
TCP/IP、以太网等技术,是一种规定网络物理设备和软件如何工作的一种规则,仅仅学习这些规则是无法看到设备和软件的内部构造的,本书将重点介绍其内部工作方式
网络实际上由两大部分组成:
1. 传输信息的机制:网络控制软件,交换机、路由器等硬件
2. 浏览器、web服务器这些网络应用程序
目录
1.1 生成HTTP请求消息
1.2 向DNS服务器查询web服务器的IP地址
1.3 DNS服务器大接力
1.4委托协议栈发送消息
本章看点:
- 浏览器如何解析URL
- 浏览器会根据网址含义生成请求消息,通过它将用户需要哪些数据告知服务器,那么请求消息具体是什么
- 浏览器会委托操作系统向web服务器发出请求,但需要先告诉操作系统接收方的IP地址。URL中只有web服务器的域名,因此浏览器需要向DNS服务器查询域名对应的IP地址
- 全世界的DNS服务器相互协作完成IP地址的查询
- IP地址查到后,浏览器就会委托操作系统(发送message对于所有的应用程序都是通用的,所以让操作系统来实现这一功能)向web服务器发出请求,这个委托是如何完成的
1.1 生成HTTP请求消息
1.1.1 输入网址
- URL(Uniform resource locator),统一资源定位符
- URL有多种,因为浏览器是一个具备客户端功能的综合性客户端软件,不同的URL适用于不同的场合
- URL的开头部分就表示协议类型,也可以说是访问方法
- 1.访问web服务器使用HTTP(hypertext transfer protocol)协议 2.访问FTP(file transfer protocol)服务器使用FTP协议(使用FTP协议来传送文件的程序也被叫做FTP)
1.1.2 解析URL
- URL =协议类型+web服务器域名+文件路径
- 如:https://mp.csdn.net/postedit/80036681
1.1.3 省略文件名的情况
- http://www.lab.dgd.com/dir/ 以 / 结尾表示后面的文件名被省略
- http://www.lab.dgd.com/ 也表示省略了文件名(只有 / 表示根目录)
- http://www.lab.dgd.com 没有路径名,表示访问根目录下事先设定好的默认文件
- 以上的URL,只要没有文件名或文件路径,都会访问默认文件
- 只要末尾有 / , 就表示这是一个目录,下级还有文件
1.1.4 HTTP协议基本思路
- 客户端发送请求消息
- 服务器接受消息,处理,发响应消息
- 客户端接受响应消息,使用
- 注:一条请求消息只能含1个URL,如果需要多个文件,必须对每个文件单独发送1条请求(后来人们设计出了能在一次连接中收发多个请求和响应的办法)
a.请求消息
- 请求消息 = URI(对什么) + 方法(进行什么操作) 注:还有一些表示附加信息的头字段,客户端会先发送头字段,再发送数据
- URI(identifier,统一资源标识符):URI的内容是一个存放网页数据的文件或是一个CGI程序(对web服务器程序调用其他程序的规则所做的定义,按照CGI规范来工作的程序称为CGI程序),也可以使用URL作为URI,换句话说,可以写各种访问目标,它们统称为URI
- 方法:GET, POST等
- POST:URI会指向web服务器中运行的一个应用程序的文件名;在请求消息中,还要加上传给应用程序和脚本的数据(表单中填写的数据)
b.响应消息
- 响应消息开头有一个状态码,表示操作结果成功与否。如:访问web服务器时,遇到找不到的文件就会显示404 NOT found
- 状态码后面就是头字段和网页数据
1.1.5 生成HTTP请求消息
- 第一行称为请求行,包括方法,URI,HTTP版本等
- 然后是消息头,每一行包含一个头字段,表示请求的附加信息(日期,客户端支持的数据类型,语言,压缩格式等)
- 空行
- 然后是消息体,包含向服务器发送的数据,例如POST方法中的网页表单数据,GET方法的消息体中则不需要任何数据
1.1.6 响应消息
- 与请求消息差别只在第一行,内容为状态码(告知程序执行的结果)+响应短语(告知人)
1.2 向DNS服务器查询web服务器的IP地址
1.2.1 IP地址基本知识
- 子网:用集线器连接起来的几台计算机(当计算机数量较多时,一台集线器可能无法承受,可以增加集线器数量并将它们相互连接起来,这时,凡是通过集线器连接的所有设备都属于一个子网)
- 网络:将子网通过路由器连接起来(一些路由器内置了集线器功能)
- IP地址= 网络号+主机号
- 准确的说,IP地址不是分配给每一台设备的,而是分配给设备中安装的网络硬件的。很多服务器上都会安装多块网卡,这是一台计算机就有多个IP地址
- 子网掩码
- 主机号:全0表示整个子网 , 全1表示向子网上所有设备发送包,即广播
1.2.2 域名和IP地址并用的原因
- IP地址记忆困难,所以使用域名
- 域名最短也要几十个字节,所以使用IP地址
1.2.3 Socket库提供查询IP地址的功能
- 对于DNS(domain name system)服务器,计算机上有相应的DNS客户端,叫DNS解析器
- 解析器实际上是一段程序,包含在操作系统的Socket库中(网络开发的一种标准库)
- Socket库中包含的程序组件可以让其他应用程序(如浏览器)调用操作系统的网络功能(这些程序组件可以理解为一个通道、或是一座桥梁)
1.2.4 通过解析器向DNS服务器发出查询
只需要调用解析器程序,将域名告诉它就可以了(实际上实现解析器需要多个程序配合)
DNS服务器的IP地址事先以已置好,不需要查询
1.2.5 解析器的内部原理
- 解析器会生成要发送给DNS服务器的查询消息
- 发送消息不是由解析器执行(解析器可以理解为一座桥梁),而是委托给操作系统内部的协议栈(网络控制软件,也叫协议驱动,TCP/IP驱动),因为和浏览器一样,解析器也不具备使用网络收发数据的功能。
- 协议栈会通过网卡将消息发送出去
上图中:socket库分到操作系统似乎更好
1.3 DNS服务器大接力
1.3.1 DNS服务器的基本工作
DNS服务器会从域名与IP地址的对照表中查找相应的记录,并返回IP地址
来自客户端的查询消息包括以下三种信息:
- 域名
- class:识别是哪一种网络
- 记录类型:A:表示域名对应的是IP地址 MX(mail exchange):表示对应的是邮件服务器(对于不同的类型,服务器返回的信息也不同)(当然还有其他的类型)
DNS服务器中信息是保存在配置文件中的,一行信息成为一条资源记录
1.3.2 域名的层次结构
- 在域名中,越靠右的位置表示其层级越高
- 一个域的信息是作为整体存放在DNS服务器中的,不能将一个域拆开存在多台服务器
- 一台服务器可以存放多个域的信息
1.3.3 寻找相应的DNS服务器并获取IP地址
- 根域:在域名的最后加一个点
- 根域的DNS服务器信息保存在互联网所有DNS服务器中
- 根域服务器不止一个
- 客户端首先会访问默认的DNS服务器
1.3.4 通过缓存加快服务器的响应
- DNS服务器有缓存功能,可以记住之前查询过的域名
“不存在”的响应结果也可以被缓存
- 缓存信息有有效期,超期会被删除
- 响应时,DNS服务器会告知客户端相应结果来自缓存还是负责管理该域名的服务器
1.4委托协议栈发送消息
1.4.1 数据收发概览
- 创建套接字
- 连接
- 收发数据
- 断开并删除
以上每一步在Socket库中都有对应的程序组件
- 委托这个操作是通过调用Socket库中的程序组件来执行的,而这些程序组件不执行任何实质性的操作,应用程序的委托内容最终会传递到协议栈
1.4.2 创建套接字
- 套接字创建后,协议栈会返回一个描述符,用来识别不同的套接字
1.4.3 连接
- 调用connect,需指定描述符,服务器IP地址,端口号
- 端口号和IP地址:客户端和服务器之间用来识别对方套接字的机制
- 描述符:应用程序用来识别套接字的机制(告诉协议栈使用哪个套接字去和服务器端的套接字连接)
1.4.4 通信
1.4.5 断开
1.浏览器与web服务器的通信原理概述相关推荐
- Web服务器的工作原理
了解WEB服务器的工作原理和相关概念是后台开发人员的必修课,这篇文章来自 : Web服务器的工作原理 很多时候我们都想知道,web容器或web服务器(比如Tomcat或者jboss)是怎样工作的?它们 ...
- 浏览器访问web服务器经过了哪些过程
文章目录 一.URL输入 二.DNS解析 三.建立TCP连接 四.发送HTTP/HTTPS请求 五.服务器响应请求 六.浏览器解析渲染页面 七.HTTP请求结束,断开TCP连接 八.总结 一.URL输 ...
- 内嵌WEB服务器加载原理
内嵌WEB服务器加载原理 理解里面的tomcat是如何启动的 Startup.bat Server.start() 1,概述 我们在使用springboot项目的时候并没有使用外部的tomcat,那么 ...
- 浏览器访问web服务器的图解和tomcat体系结构图
浏览器访问web服务器: 注意:上图是以浏览器中访问主机为localhost,端口号为8080的votesystem这个web应用中的index.html资源文件为例. Tomcat体系结构: 注意: ...
- 浏览器与WEB服务器交互
问题:打开浏览器,在地址栏输入url到页面展现,整个过程发生了什么? 图示: 步骤: 1 用户输入网址,包括协议和域名. 2 浏览器先查找自身缓存有没有记录,没有的话再找操作系统缓存. 3 当浏览器在 ...
- 计网 | 服务器到底是什么?浏览器和Web服务器的区别
服务器:我是谁 可能有很多网友不清楚,服务器和普通电脑到底有什么区别?对于普通用户而言,确实对服务器感觉很神秘,不知道服务器到底是个什么东东. 首先可以很明确的告诉你,服务器也是电脑,服务器是为电脑提 ...
- 浏览器与web服务器的交互过程
(1)TCP/IP协议栈是谁维护的?操作系统?物理网卡?还是上层应用开发者?:http://bbs.csdn.net/topics/390767288 (2)路由器是什么东西,可以用来干什么?:htt ...
- 整理:各个浏览器及web服务器对URL(get)长度的限制
为什么80%的码农都做不了架构师?>>> http 1.1 协议中对url的长度是不受限制的: The HTTP protocol does not place any a p ...
- 浏览器访问Web服务器流程详细解析
浏览器不管访问JSP.PHP还是ASP.NET,其流程几乎是一样的. 1.浏览器拿到URL后,会首先查找IP,两方面查找,①查询hosts文件,成功则直接进行第5步,无果②查询DNS,无果,返回错误. ...
最新文章
- 【Android开发教程】一、基础概念
- linux 脚本案例,30个关于Shell脚本的经典案例(上)
- 小学奥数 7827 质数的和与积 python
- 关于ArcGIS Rest API
- 6月全球Web服务器市场份额:Apache升至64.33%
- 这座中国小城,靠“造假”称霸一个全球市场
- Axure 经典实例高保真原型下载(Axure高保真企业办公oa系统OA协同办公后台管理会议管理用户管理统计分析活动管理+考勤管理+档案管理+行政支持管理)
- 教你辨别Access用户级安全的两个密码
- tensorflow2.1学习--认识张量和常用函数一
- 【NCD 2019 B】Let me sleep【边双连通分量缩点、树的直径】
- 使用maya.cmds加载和卸载插件
- 电商之下:服务类商品订单履约系统如何设计
- 解决cannot find module providing package或cannot find main module
- go concurrent map writes map并发问题
- OMA-DM协议资料汇总
- 如何压缩数据与图像?
- <Rasa实战>第五章实例运行
- 从高考到程序员之毕业流水帐
- 浪潮服务器 引导,浪潮服务器RAID配置及系统引导
- UE4渲染的整体流程(可视性、GBuffer、反射、动态光照阴影、后期处理)