(本文适合所1-3年的前端阅读)

原文链接:

http://blog.poetries.top/2019/01/02/browser-cache/

一、浏览器缓存基本认识

分为强缓存和协商缓存

  1. 浏览器在加载资源时,先根据这个资源的一些http header判断它是否命中强缓存,强缓存如果命中,浏览器直接从自己的缓存中读取资源,不会发请求到服务器。比如某个css文件,如果浏览器在加载它所在的网页时,这个css文件的缓存配置命中了强缓存,浏览器就直接从缓存中加载这个css,连请求都不会发送到网页所在服务器

  2. 当强缓存没有命中的时候,浏览器一定会发送一个请求到服务器,通过服务器端依据资源的另外一些http header验证这个资源是否命中协商缓存,如果协商缓存命中,服务器会将这个请求返回,但是不会返回这个资源的数据,而是告诉客户端可以直接从缓存中加载这个资源,于是浏览器就又会从自己的缓存中去加载这个资源

  3. 强缓存与协商缓存的共同点是:如果命中,都是从客户端缓存中加载资源,而不是从服务器加载资源数据;区别是:强缓存不发请求到服务器,协商缓存会发请求到服务器

  4. 当协商缓存也没有命中的时候,浏览器直接从服务器加载资源数据

二、强缓存的原理

2.1 介绍

当浏览器对某个资源的请求命中了强缓存时,返回的http状态为200,在chrome的开发者工具的network里面size会显示为from cache,比如京东的首页里就有很多静态资源配置了强缓存,用chrome打开几次,再用f12查看network,可以看到有不少请求就是从缓存中加载的

  • 强缓存是利用Expires或者Cache-Control这两个http response header实现的,它们都用来表示资源在客户端缓存的有效期。

Expireshttp1.0提出的一个表示资源过期时间的header,它描述的是一个绝对时间,由服务器返回,用GMT格式的字符串表示,如:Expires:Thu, 31 Dec 2037 23:55:55 GMT

2.2 Expires缓存原理

  1. 浏览器第一次跟服务器请求一个资源,服务器在返回这个资源的同时,在responeheader加上Expires,如

  1. 浏览器在接收到这个资源后,会把这个资源连同所有response header一起缓存下来(所以缓存命中的请求返回的header并不是来自服务器,而是来自之前缓存的header)

  2. 浏览器再请求这个资源时,先从缓存中寻找,找到这个资源后,拿出它的Expires跟当前的请求时间比较,如果请求时间在Expires指定的时间之前,就能命中缓存,否则就不行

  3. 如果缓存没有命中,浏览器直接从服务器加载资源时,Expires Header在重新加载的时候会被更新

Expires是较老的强缓存管理header,由于它是服务器返回的一个绝对时间,在服务器时间与客户端时间相差较大时,缓存管理容易出现问题,比如随意修改下客户端时间,就能影响缓存命中的结果。所以在http1.1的时候,提出了一个新的header,就是Cache-Control,这是一个相对时间,在配置缓存的时候,以秒为单位,用数值表示,如:Cache-Control:max-age=315360000

2.3 Cache-Control缓存原理

  1. 浏览器第一次跟服务器请求一个资源,服务器在返回这个资源的同时,在responeheader加上Cache-Control,如:

  1. 浏览器在接收到这个资源后,会把这个资源连同所有response header一起缓存下来

  2. 浏览器再请求这个资源时,先从缓存中寻找,找到这个资源后,根据它第一次的请求时间和Cache-Control设定的有效期,计算出一个资源过期时间,再拿这个过期时间跟当前的请求时间比较,如果请求时间在过期时间之前,就能命中缓存,否则就不行

  3. 如果缓存没有命中,浏览器直接从服务器加载资源时,Cache-Control Header在重新加载的时候会被更新

  • Cache-Control描述的是一个相对时间,在进行缓存命中的时候,都是利用客户端时间进行判断,所以相比较ExpiresCache-Control的缓存管理更有效,安全一些。

  • 这两个header可以只启用一个,也可以同时启用,当response header中,ExpiresCache-Control同时存在时,Cache-Control优先级高于Expires

三、强缓存的管理

前面介绍的是强缓存的原理,在实际应用中我们会碰到需要强缓存的场景和不需要强缓存的场景,通常有2种方式来设置是否启用强缓存

  1. 通过代码的方式,在web服务器返回的响应中添加ExpiresCache-Control Header

  2. 通过配置web服务器的方式,让web服务器在响应资源的时候统一添加ExpiresCache-Control Header

比如在javaweb里面,我们可以使用类似下面的代码设置强缓存

java.util.Date date = new java.util.Date();    response.setDateHeader("Expires",date.getTime()+20000); //Expires:过时期限值response.setHeader("Cache-Control", "public"); //Cache-Control来控制页面的缓存与否,public:浏览器和缓存服务器都可以缓存页面信息;response.setHeader("Pragma", "Pragma"); //Pragma:设置页面是否缓存,为Pragma则缓存,no-cache则不缓存

还可以通过类似下面的java代码设置不启用强缓存

response.setHeader( "Pragma", "no-cache" );  response.setDateHeader("Expires", 0);  response.addHeader( "Cache-Control", "no-cache" );//浏览器和缓存服务器都不应该缓存页面信息
  • nginxapache作为专业的web服务器,都有专门的配置文件,可以配置expirescache-control,这方面的知识,如果你对运维感兴趣的话,可以在百度上搜索nginx 设置 expires cache-control或 apache 设置 expires cache-control 都能找到不少相关的文章。

  • 由于在开发的时候不会专门去配置强缓存,而浏览器又默认会缓存图片,cssjs等静态资源,所以开发环境下经常会因为强缓存导致资源没有及时更新而看不到最新的效果,解决这个问题的方法有很多,常用的有以下几种

处理缓存带来的问题

  1. 直接ctrl+f5,这个办法能解决页面直接引用的资源更新的问题

  2. 使用浏览器的隐私模式开发

  3. 如果用的是chrome,可以f12network那里把缓存给禁掉(这是个非常有效的方法)

  1. 在开发阶段,给资源加上一个动态的参数,如css/index.css?v=0.0001,由于每次资源的修改都要更新引用的位置,同时修改参数的值,所以操作起来不是很方便,除非你是在动态页面比如jsp里开发就可以用服务器变量来解决(v=${sysRnd}),或者你能用一些前端的构建工具来处理这个参数修改的问题

  2. 如果资源引用的页面,被嵌入到了一个iframe里面,可以在iframe的区域右键单击重新加载该页面,以chrome为例

  1. 如果缓存问题出现在ajax请求中,最有效的解决办法就是ajax的请求地址追加随机数

  2. 还有一种情况就是动态设置iframesrc时,有可能也会因为缓存问题,导致看不到最新的效果,这时候在要设置的src后面添加随机数也能解决问题

  3. 如果你用的是gruntgulpwebpack这种前端工具开发,通过它们的插件比如grunt-contrib-connect来启动一个静态服务器,则完全不用担心开发阶段的资源更新问题,因为在这个静态服务器下的所有资源返回的respone header中,cache-control始终被设置为不缓存

四、强缓存的应用

强缓存是前端性能优化最有力的工具,没有之一,对于有大量静态资源的网页,一定要利用强缓存,提高响应速度。通常的做法是,为这些静态资源全部配置一个超时时间超长的ExpiresCache-Control,这样用户在访问网页时,只会在第一次加载时从服务器请求静态资源,其它时候只要缓存没有失效并且用户没有强制刷新的条件下都会从自己的缓存中加载,比如前面提到过的京东首页缓存的资源,它的缓存过期时间都设置到了2026

强缓存还有一点需要注意的是,通常都是针对静态资源使用,动态资源需要慎用,除了服务端页面可以看作动态资源外,那些引用静态资源的html也可以看作是动态资源,如果这种html也被缓存,当这些html更新之后,可能就没有机制能够通知浏览器这些html有更新,尤其是前后端分离的应用里,页面都是纯html页面,每个访问地址可能都是直接访问html页面,这些页面通常不加强缓存,以保证浏览器访问这些页面时始终请求服务器最新的资源

五、协商缓存的原理

5.1 介绍

当浏览器对某个资源的请求没有命中强缓存,就会发一个请求到服务器,验证协商缓存是否命中,如果协商缓存命中,请求响应返回的http状态为304并且会显示一个Not Modified的字符串,比如你打开京东的首页,按f12打开开发者工具,再按f5刷新页面,查看network,可以看到有不少请求就是命中了协商缓存的

查看单个请求的Response Header,也能看到304的状态码和Not Modified的字符串,只要看到这个就可说明这个资源是命中了协商缓存,然后从客户端缓存中加载的,而不是服务器最新的资源

5.2 Last-Modified,If-Modified-Since控制协商缓存

  1. 浏览器第一次跟服务器请求一个资源,服务器在返回这个资源的同时,在responeheader加上Last-Modifiedheader,这个header表示这个资源在服务器上的最后修改时间

  1. 浏览器再次跟服务器请求这个资源时,在requestheader上加上If-Modified-Sinceheader,这个header的值就是上一次请求时返回的Last-Modified的值

  1. 服务器再次收到资源请求时,根据浏览器传过来If-Modified-Since和资源在服务器上的最后修改时间判断资源是否有变化,如果没有变化则返回304 Not Modified,但是不会返回资源内容;如果有变化,就正常返回资源内容。当服务器返回304 Not Modified的响应时,response header中不会再添加Last-Modifiedheader,因为既然资源没有变化,那么Last-Modified也就不会改变,这是服务器返回304时的response header

  1. 浏览器收到304的响应后,就会从缓存中加载资源

  2. 如果协商缓存没有命中,浏览器直接从服务器加载资源时,Last-Modified Header在重新加载的时候会被更新,下次请求时,If-Modified-Since会启用上次返回的Last-Modified

Last-ModifiedIf-Modified-Since】都是根据服务器时间返回的header,一般来说,在没有调整服务器时间和篡改客户端缓存的情况下,这两个header配合起来管理协商缓存是非常可靠的,但是有时候也会服务器上资源其实有变化,但是最后修改时间却没有变化的情况,而这种问题又很不容易被定位出来,而当这种情况出现的时候,就会影响协商缓存的可靠性。所以就有了另外一对header来管理协商缓存,这对header就是【ETagIf-None-Match】。它们的缓存管理的方式是

5.3 ETag、If-None-Match控制协商缓存

  1. 浏览器第一次跟服务器请求一个资源,服务器在返回这个资源的同时,在responeheader加上ETagheader,这个header是服务器根据当前请求的资源生成的一个唯一标识,这个唯一标识是一个字符串,只要资源有变化这个串就不同,跟最后修改时间没有关系,所以能很好的补充Last-Modified的问题

  1. 浏览器再次跟服务器请求这个资源时,在requestheader上加上If-None-Matchheader,这个header的值就是上一次请求时返回的ETag的值

  1. 服务器再次收到资源请求时,根据浏览器传过来If-None-Match和然后再根据资源生成一个新的ETag,如果这两个值相同就说明资源没有变化,否则就是有变化;如果没有变化则返回304 Not Modified,但是不会返回资源内容;如果有变化,就正常返回资源内容。与Last-Modified不一样的是,当服务器返回304 Not Modified的响应时,由于ETag重新生成过,response header中还会把这个ETag返回,即使这个ETag跟之前的没有变化

  1. 浏览器收到304的响应后,就会从缓存中加载资源。

六、协商缓存的管理

协商缓存跟强缓存不一样,强缓存不发请求到服务器,所以有时候资源更新了浏览器还不知道,但是协商缓存会发请求到服务器,所以资源是否更新,服务器肯定知道。大部分web服务器都默认开启协商缓存,而且是同时启用【Last-ModifiedIf-Modified-Since】和【ETagIf-None-Match】,比如apache:

如果没有协商缓存,每个到服务器的请求,就都得返回资源内容,这样服务器的性能会极差。

  • Last-ModifiedIf-Modified-Since】和【ETagIf-None-Match】一般都是同时启用,这是为了处理Last-Modified不可靠的情况。

有一种场景需要注意

  • 分布式系统里多台机器间文件的Last-Modified必须保持一致,以免负载均衡到不同机器导致比对失败;

  • 分布式系统尽量关闭掉ETag(每台机器生成的ETag都会不一样);

  • 京东页面的资源请求,返回的repsones header就只有Last-Modified,没有ETag

协商缓存需要配合强缓存使用,你看前面这个截图中,除了Last-Modified这个header,还有强缓存的相关header,因为如果不启用强缓存的话,协商缓存根本没有意义

七、相关浏览器行为对缓存的影响

如果资源已经被浏览器缓存下来,在缓存失效之前,再次请求时,默认会先检查是否命中强缓存,如果强缓存命中则直接读取缓存,如果强缓存没有命中则发请求到服务器检查是否命中协商缓存,如果协商缓存命中,则告诉浏览器还是可以从缓存读取,否则才从服务器返回最新的资源。这是默认的处理方式,这个方式可能被浏览器的行为改变:

  • ctrl+f5强制刷新网页时,直接从服务器加载,跳过强缓存和协商缓存;

  • f5刷新网页时,跳过强缓存,但是会检查协商缓存

长按关注:前端码头

私人微信:yun1015911204

任何问题

欢迎叨扰

往期推荐01

今日头条前端面经(4轮技术面+hr面)

02

前端面试从技术总监到hr一“篇”拿下

03

利用webpack4手把手带你搭建一个vue多页面应用

觉得有用

记得点个在看哦~???

前端对所有文件请求添加header_【前端面试必问】浏览器缓存原理?送你满分答案...相关推荐

  1. 浏览器渲染机制面试_前端面试大全:浏览器渲染原理-文件无法渲染

    在这一篇文章中,我们将一起学习浏览器渲染原理这部分的知识.你可能会有疑问,我又不是做浏览器研发的,为什么要来学习这个?其实我们学习浏览器渲染原理更多的是为了解决性能的问题,如果你不了解这部分的知识,你 ...

  2. (建议收藏)前端面试必问的十六条HTTP网络知识体系

    大家好,我是若川.最近组织了源码共读活动,感兴趣的可以加我微信 ruochuan12 参与,每周大家一起学习200行左右的源码,共同进步.已进行四个月了,很多小伙伴表示收获颇丰. 想学源码,极力推荐订 ...

  3. (2.6w字)网络知识点灵魂拷问(下)——前端面试必问

    关注公众号"执鸢者",获取大量教学视频并进入专业交流群. 十一.HTTP协议(请求报文和响应报文) 11.1 请求报文 HTTP请求报文主要包括:请求行.请求头部以及请求的数据(实 ...

  4. 网络知识点灵魂拷问——前端面试必问

    一.当浏览器输入一个url请求会经历什么? 1.浏览器的地址栏输入URL并按下回车 2.DNS域名解析 (1)在浏览器DNS缓存中搜索 (2)如果浏览器缓存中没有,操作系统会先检查自己本地的hosts ...

  5. 前端面试必问(后台管理系统的权限控制与管理)

    此文章根据视频教程进行整理前端面试官必问系列-后台系统的权限控制与管理,建议搭配视频教程一起食用效果更佳 在Web 系统中,权限很久以来一直都只是后端程序所控制的. 为什么呢? 因为Web 系统的不质 ...

  6. 为组件添加Expires头,最大化利用浏览器缓存

    web项目一旦部署完毕,项目中的图片.CSS以及JS基本上很少发生变动,那么假如把这些组件缓存在浏览器客户端,而不再从服务器上获取,那么网站的访问者在首次访问网站后,后续的请求将会大量减轻服务器的请求 ...

  7. 用于web网页的html文件属于,南开15春学期《Web页面设计》在线作业满分答案

    南开大学2015春学期<Web页面设计>在线作业(满分答案) 单选题多选题判断题 一.单选题(共20 道试题,共40 分.) 1. 由1位/像素的信息组成,占用内存最小的颜色模式是 A. ...

  8. 前端导出excel文件带样式_vue前端使用xlsx导出数据到excel中--最简单的方式

    最新项目中需要将页面数据导出到excel中,首先想到的就是度娘,得到的结果都是千篇一律,答案都是你复制我我复制你的,虽然能解决问题,但是这个过程也太复杂. 既然无法改变,那就只好插手你的生活了. 废话 ...

  9. 2022前端面试必问的几个小问题,你学费了吗?

    写在前面 CSDN话题挑战赛第1期 活动详情地址:https://marketing.csdn.net/p/bb5081d88a77db8d6ef45bb7b6ef3d7f 参赛话题:前端面试宝典 话 ...

最新文章

  1. java和js的正则表达式一样吗_JavaScript与Java正则表达式写法的区别
  2. 2016秋季阅读笔记一
  3. [cpp] 字符数组,字符指针,sizeof,strlen总结
  4. Windows驱动开发 - 设备对象初步学习
  5. c语言用double最大,C语言里double类型的最大值和最小值是多少?
  6. xcode的bundle identifier修改
  7. python中的logger模块详细讲解
  8. 使用vue-print-nb插件页面空白以及打印没有样式问题
  9. leetcode [383] 赎金信 / Ransom Note , 空间换时间的哈希策略
  10. java中常用的数据结构_Java中常用的数据结构类
  11. 计算机选择题在线,计算机基础知识选择题题库全集.doc
  12. linux u盘 修复工具,怎样Linux下修复U盘驱动器
  13. 中国城市云计算首站现场会成都隆重举行
  14. matlab中plot画图的颜色线型
  15. 查询手机号的归属地及运营商接口(验证可用)
  16. JAVA:实现求StandardDeviation标准差算法(附完整源码)
  17. 植树节的微信软文如何写?素材加文案帮你分分钟搞定!
  18. OMAPL138的DSPLINK开发入门
  19. 汉字转16进制 php,php中文汉字与16进制编码转换三种方法
  20. 深入浅出地理解机器人手眼标定

热门文章

  1. pycharm中更新pip版本的问题
  2. uniapp中使用微信jssdk
  3. apollo报:系统出错,请重试或联系系统负责人
  4. Jmeter日志输出和日志级别设置
  5. eclipse 安装git
  6. 31 | 深度和广度优先搜索:如何找出社交网络中的三度好友关系?
  7. 信息抽取--关键词提取
  8. leetcode 121
  9. zookeeper集群安装部署
  10. 【Vue】【Router】手动跳转用 this.$router.push() 时 $router 未定义的问题