本文公众号来源:01二进制  作者:雇个城管打天下

记得在面试的时候也被问到这题,当时答得并不好,这道题目其实可以挖掘很多的知识点出来,建议阅读!

前几天有个学妹问我为什么在浏览器里面输了网址就会显示出来页面,虽然这个现象很常见,但是要想解释清楚确实有些小困难,当时也只是简单的回答了她,现在想趁着这个机会好好整理下相关知识。整理完才觉得其实就和我们去一个地方找人是一个道理。所以说艺术源于生活却又高于生活,技术同样如此。

在回答这个问题前, 我们先来了解下我们平常说的那个网址到底是啥?

网址的学名叫做统一资源定位符(Uniform Resource Locator, 常缩写为URL), 我们知道现在的互联网其实就是由众多资源所构成的一张巨大的网, 如何定位那些资源就是靠的URL, 因此我们也可以把URL理解为是网络上资源的“门牌号“, 我们在浏览器中输入网址, 就相当于开一辆车(浏览器)去找一个地址(URL)

1. 缓存查找

如果你要出门找一个地方, 第一想法肯定是先想这个地方你有没有去过, 你要是去过的话那就不需要问人直接过去就好了。 我们的系统也是这么想的。 当你在浏览器中输入了URL之后, 浏览器会先查看 浏览器缓存 中有没有这个地址, 如果没有那就再去 系统缓存, 如果系统缓存还没有, 那就去路由器缓存找, 总之只要缓存中有, 就说明有这个资源, 那浏览器直接显示出来就好了。

Tips: 这里说下 hosts文件hosts 是一个没有扩展名的系统文件, 可以用记事本等工具打开, 其作用就是将一些常用的网址域名与其对应的IP地址建立一个关联“数据库”, 当用户在浏览器中输入一个需要登录的网址时, 系统会首先自动从 hosts 文件中寻找对应的 IP 地址,一旦找到, 系统会立即打开对应网页, 如果没有找到, 则系统会再将网址提交 DNS 域名解析服务器进行IP地址的解析。 需要注意的是, hosts文件配置的映射是静态的, 如果网络上的计算机更改了请及时更新IP地址, 否则将不能访问。

2. DNS 解析

如果你认得去那个地址的路自然是最好, 那如果你根本就没去过那咋办? 肯定会有人说导航, 但并不是所有的地方都是导航能搜到的, 这个时候我们自然而然就会想着去问路人了。 浏览器也是这样的, 如果在本地缓存中没有找到想要的资源, 那就只能去其他网络上的机器中寻找我想要的资源了。 那你怎么知道你要的资源在那台机器上? 这时, DNS就横空出世了。

DNS(Domain Name System, 域名系统),DNS解析的过程就是寻找哪台机器上有你需要资源的过程。当你在浏览器中输入一个地址时, 例如 www.baidu.com, 其实这段URL并不是真正意义上的地址。 互联网上每一台计算机的唯一标识是它的 IP 地址(比如127.0.0.1就是我们本机的 IP 地址), 但是 IP 地址并不方便记忆(毕竟都是很长的数字串), 所以也就出现了网址(URL)这个玩意了, 目的就是为了方便普通用户去寻找网络上的其他计算机。 所以 DNS 实际上充当了一个翻译的角色, 将网址翻译成 IP 地址(就跟我想去南京大学, 问路的那个人告诉我南京大学在广州路上是一个道理)。

2.1 DNS 解析过程

DNS解析其实是一个递归查询的过程:

在上述过程中, 首先在本地域名服务器中查询 IP 地址, 如果没有找到, 本地域名服务器会向根域名服务器发送一个请求, 如果根域名服务器也不存在该域名时, 本地域名会向com顶级域名服务器发送一个请求, 依次类推下去。 直到最后找到目标网址所对应的 IP, 并将其缓存到本地, 以供下次使用。

2.2 DNS负载均衡

在讲DNS负载均衡前先来看张图片:

看到这可能就会有人犯嘀咕了, 我们不是 ping 的同一个网址吗, 为啥两次IP都不一样啊? 其实原因很简单, 如果每次都一样是否说明你请求的资源都位于同一台机器上面, 那么这台机器需要多高的性能和储存才能满足亿万请求呢? 其实真实的互联网世界背后存在成千上百台服务器, 大型的网站甚至更多。 但是在用户的眼中, 它需要的只是处理他的请求, 哪台机器处理请求并不重要。 DNS可以返回一个合适的机器的IP给用户, 例如可以根据每台机器的负载量, 该机器离用户地理位置的距离等等, 这种过程就是DNS负载均衡, 又叫做DNS重定向。

再来举个例子, 如果你在新街口用地图搜南京大学, 返回给你的第一条数据可能就是南京大学鼓楼校区(因为距离最近), 但如果你是在仙林用地图搜南京大学, 返回给你的第一条数据就有可能是南京大学仙林校区了。 DNS负载均衡简单来说也是这个道理。

2.3 DNS 污染

DNS 污染(DNS cache pollution), 又称域名服务器缓存投毒(DNS cache poisoning), 是指一些刻意制造或无意中制造出来的域名服务器数据包, 把域名指往不正确的IP地址

某些网络运营商为了某些目的, 对DNS进行了某些操作, 导致上网的用户无法通过域名取得正确的IP地址。 某些国家或地区出于某些目的为了防止某网站被访问, 而且其又掌握部分国际DNS根目录服务器或镜像, 也会利用此方法进行屏蔽。 (Google、 Facebook等)

至于如果防止DNS污染, 这里只说一个方法就是修改hosts文件, 其他的自行搜索吧。

3. TCP连接

其实在上面DNS解析的图中就已经有了TCP连接的过程了:

我们通过DNS解析获取到了网址所对应的IP地址后, 便需要发起TCP连接请求, 这里总共需要三次握手, 具体的过程就不赘述了, 可以查阅相关资料, 这里推荐刘欣老师的《TCP/IP 之 大明王朝邮差》, 以及大学计算机网络课本里面的TCP相关章节。

4. HTTP 请求

握手成功后, 浏览器就可以向服务器发送http请求了, 请求数据包。 发送HTTP请求的过程就是构建HTTP请求报文并通过TCP协议中发送到服务器指定端口(HTTP协议80/8080, HTTPS协议443)。HTTP请求报文是由三部分组成: 请求行,请求报头和请求正文。

4.1 请求行

格式如下:

Method  RequestURL  HTTPVersion CRLF

例如:

GET index.html HTTP/1.1

常用的方法有: GET,POST,PUT,DELETE,OPTIONS,HEAD

4.2 请求报头

请求报头允许客户端向服务器传递请求的附加信息和客户端自身的信息。

Tips:客户端不一定特指浏览器, 有时候也可使用Linux下的CURL命令以及HTTP客户端测试工具等。

常见的请求报头有: Accept,AcceptCharset,AcceptEncoding,AcceptLanguage,ContentType,Authorization,Cookie,UserAgent等。

上图是使用Chrome开发者工具截取的对百度的HTTP请求以及响应报文, 从图中可以看出, 请求报头中使用了Accept, AcceptEncoding, AcceptLanguage, CacheControl, Connection, Cookie等字段。 Accept 用于指定客户端用于接受哪些类型的信息, AcceptEncoding 与 Accept 类似, 它用于指定接受的编码方式。Connection 设置为 Keepalive 用于告诉客户端本次 HTTP 请求结束之后并不需要关闭 TCP 连接, 这样可以使下次 HTTP 请求使用相同的 TCP 通道, 节省 TCP 连接建立的时间。

5. 服务器响应

这部分对应的就是后端工程师眼中的 HTTP。 后端从在固定的端口接收到 TCP 报文开始, 这一部分对应于编程语言中的 socket。 它会对 TCP 连接进行处理, 对 HTTP 协议进行解析, 并按照报文格式进一步封装成 HTTP Request对象, 供上层使用。 这一部分工作一般是由 Web 服务器去进行, 常用的Web服务器有 Tomcat, IIS 和 Netty 等等。

HTTP响应报文也是由三部分组成: 状态码, 响应报头响应报文。 篇幅原因这里就不详细展开了。

6. 浏览器解析网页信息

服务器返回给浏览器的文本信息, 通常是 HTML, CSS, JS, 图片等文件, 那么浏览器是如何对泽泻内容进行渲染呢? 通常是下面五个步骤:

  1. 处理 HTML 标记并构建 DOM 树。

  2. 处理 CSS 标记并构建 CSSOM 树。

  3. 将 DOM 与 CSSOM 合并成一个渲染树。

  4. 根据渲染树来布局, 以计算每个节点的几何信息。

  5. 将各个节点绘制到屏幕上。

不过这五个步骤在不同内核的浏览器中执行细节是不同的, 想深入了解的可以查阅相关资料, 这里推荐一篇文章:《浏览器渲染页面过程与页面优化》(https://segmentfault.com/a/1190000010298038)

浏览器是一个边解析边渲染的过程。 首先浏览器解析HTML文件构建DOM树, 然后解析CSS文件构建渲染树, 等到渲染树构建完成后, 浏览器开始布局渲染树并将其绘制到屏幕上。

JS的解析是由浏览器中的 JS 解析引擎完成的。 JS是单线程运行, 也就是说, 在同一个时间内只能做一件事, 所有的任务都需要排队, 前一个任务结束, 后一个任务才能开始。 但是又存在某些任务比较耗时, 如IO读写等, 所以需要一种机制可以先执行排在后面的任务, 这就是: 同步任务(synchronous)和异步任务(asynchronous)。 JS的执行机制就可以看做是一个主线程加上一个任务队列(task queue)。 同步任务就是放在主线程上执行的任务, 异步任务是放在任务队列中的任务。 所有的同步任务在主线程上执行, 形成一个执行栈; 异步任务有了运行结果就会在任务队列中放置一个事件; 脚本运行时先依次运行执行栈, 然后会从任务队列里提取事件, 运行任务队列中的任务, 这个过程是不断重复的, 所以又叫做事件循环(Event loop)。 如下图所示:

7. 总结

当上述步骤执行完成后我们便可在浏览器中看到一个完整的页面了, 总结下其实就只有几步:

  1. 浏览器地址栏输入url

  2. 浏览器会先查看浏览器缓存系统缓存路由缓存, 如有存在缓存, 就直接显示。 如果没有, 接着第3步

  3. 域名解析(DNS)获取相应的 IP

  4. 浏览器向服务器发起 tcp 连接, 与浏览器建立 tcp 三次握手

  5. 握手成功, 浏览器向服务器发送 http 请求, 请求数据包

  6. 服务器请求数据, 将数据返回到浏览器

  7. 浏览器接收响应, 读取页面内容, 解析 html 源码, 生成 Dom 树

  8. 解析 css 样式、 浏览器渲染, js交互

其实简单来看这几个过程并不是很复杂, 但是每个步骤都可以深挖出一大堆的知识, 比如DNS的优化、页面渲染的优化、 HTTPS等等非常多的东西, 这里考虑到篇幅以及科普效果很多东西都一笔带过了。

最后

乐于输出干货的Java技术公众号:Java3y。公众号内有200多篇原创技术文章、海量视频资源、精美脑图,不妨来关注一下!

有帮助?在看!转发!

地址栏中输入网址后发生了什么?相关推荐

  1. 面试 地址栏中输入网址后发生了什么 url 生成网页 三次握手 四次挥手 ctp http ip

    title: [重识前端]地址栏中输入网址后发生了什么 date: 2020-10-09 10:08:31 tags: [浏览器] category: [重拾前端] cover: /image/cov ...

  2. 如何向学妹解释在地址栏中输入网址后发生了什么?

    前几天有个学妹问我为什么在浏览器里面输了网址就会显示出来页面,虽然这个现象很常见,但是要想解释清楚确实有些小困难,当时也只是简单的回答了她,现在想趁着这个机会好好整理下相关知识.整理完才觉得其实就和我 ...

  3. 在浏览器地址栏中输入URL后发生了什么

    在浏览器地址栏中输入URL后发生了什么 基本流程: ①查询ip地址 ②建立tcp连接,接入服务器 ③浏览器发起http请求 ④服务器后台操作并做出http响应 ⑤网页的解析与渲染 详细步骤如下: 查询 ...

  4. 【web】HTTP(s)协议详解(重点:HTTPS 的加密过程浏览器中输入网址后,发生了什么?)

    [大家好,我是爱干饭的猿,本文介绍应用层HTTP协议.HTTPS协议.当你在浏览器中输入网址后,到底发生了什么事情?HTTPS 如何进行的加密?对称加密.非对称加密.CA证书又是什么? 后续会继续分享 ...

  5. 在浏览器地址栏中输入地址后浏览器发生了什么?

    文章目录 前言 一.DNS查询 二.TCP连接 三.发送HTTP请求 四.服务器处理HTTP请求并返回HTTP报文 五.浏览器解析并渲染页面 六.HTTP连接断开 前言 当我们向浏览器的地址栏中输入一 ...

  6. 在浏览器中输入网址后的流程

    1.浏览器发起DNS查询请求 在广域网中是基于IP地址进行通信的.但通常客户访问的是一个网址,为此需要先得到网址对应的IP地址,这就需要域名服务系统将域名转换成IP地址.在客户端浏览器中输入网址时,浏 ...

  7. 浏览器 输入网址 发生什么_在浏览器中输入网址时发生了什么

    浏览器 输入网址 发生什么 It's commonplace. We type a web address into the browser and hit Enter. With modern in ...

  8. 浏览器输入网址后发生了什么?

    当你在浏览器输入一个网址(比如www.iis.se)并敲回车,这个过程后面发生了什么? 一.Web 浏览器指示本机的OS设置本机与 www.iis.se 之间的通信 二. OS检查它的 DNS 缓存, ...

  9. 输入网址后发生了什么没有listen(accept)能建立连接吗SYN洪水

    网络复习一 键入网址到网页显示,期间发生了什么 一.HTTP 二.DNS 域名系统 三.TCP 四.IP 五.MAC 六.网卡 七.交换机 八.路由器 sk_buff 网卡上有数据如何得知? 网络中如 ...

最新文章

  1. 开源工具之valgrind
  2. 二叉排序树(完整代码)
  3. 容易忽视但是功能灰常强大的Java API(五. 二分查找)
  4. 《微软的软件测试之道》读书笔记 之 结构测试技术
  5. 上科大、腾讯提出Liquid Warping GAN,实现人体动作迁移的新高度!
  6. 再学 GDI+[94]: TGPImage(14) - 增减图像的红、绿、蓝三色的成分
  7. ios整理(五)小应用-重力感应
  8. 【PS】制作水彩画效果
  9. 网络性能测试(系统层面、针对Linux、安卓)
  10. 【C语言】 《弹跳的小球》游戏编写过程及思路,清屏函数、Sleep()函数的应用
  11. PYTHON地理出图配色及旁门左道
  12. 鸿蒙HarmonyOS应用开发系列 | 解读鸿蒙源码
  13. 大数据物流项目:Kudu 入门使用(五)
  14. android安全开发_现代android安全开发
  15. spoolsv.exe占用100%的解决之道
  16. Validform_v5.3.2 自定义规则
  17. 关于有氧运动的误区 你知道几个
  18. ASCII编码,unicode编码,utf-8编码,三者的关系与区别(山河变幻到大一统)
  19. unity全息技术入门打包至真机详解
  20. 计算机毕业设计Java仓库管理系统(源码+系统+mysql数据库+lw文档)

热门文章

  1. 寻求真心话大冒险之猜数游戏的最佳策略
  2. 一文读懂IaaS、PaaS、SaaS的含义及区别
  3. koomail公共地址薄使用方法
  4. Code jam 2008 practice A
  5. ZT看不懂的中国历史:老蒋的智力竟然在50之下
  6. 《复仇者联盟4》经典台词——与热爱交易的小伙伴共勉
  7. scp 拷贝文件夹到远程服务器被拒绝ssh: connect to host xxx.xxx.xxx.xxx port xxxxx: Connection refused
  8. Music Store(音乐商店)简易中文教程
  9. 【图像增强】基于matlab萤火虫算法图像对比度增强【含Matlab源码 2142期】
  10. Uva1218 Perfect Services