前言:

由于本人工作原因,涉及到网络直播领域,其中视频的回放下载,涉及到了一些视频下载方面的技术。针对于一个完整视频的下载,目前市面上的主流做法是,先将整个视频流切片,存储到文件服务器中,在用户需要观看回放视频时。通过一个视频回源服务器,去文件服务器中逐个请求切片,返回给用户播放。
今天着重探讨的是关于回源服务器缓存的配置以及合理的缓存策略。

通过给回源服务器配置缓存的案例,详细讲解一整套缓存配置机制,并且可沿用到其他任何缓存配置场景中。

今天的讲解分为四点:
  • 回源服务器的工作是啥
  • 为啥需要给回源服务器加缓存
  • 如何配置缓存
  • 如何针对业务场景配置完备的缓存机制

回源服务器的工作:

回源服务器在下面叙述中简称:源站
如图所示,在文件下载的过程中,横跨在cdn与文件服务器之间,作为下载枢纽。

源站架构:源站是nginx+php的webserver架构,如图所示:

但如果源站只是简单的收到请求,然后下载资源,再返回,势必会存在以下几点不够优化的问题:
1、cdn可能存在多次回源现象
2、源站对同一资源的多次下载,存在网络流量带宽浪费,以及不必要的耗时。
所以为了优化这些问题,需要给源站做一层缓存。缓存策略采用nginx自带的proxy_cache模块。

proxy_cache原理:

proxy_cache模块的工作原理如图所示:

如何配置proxy_cache模块

在nginx.conf文件中添加如下代码:
[plain] view plaincopy
  1. http{
  2. ......
  3. proxy_cache_path/data/nginx/tmp-test levels=1:2 keys_zone=tmp-test:100m inactive=7d max_size=1000g;
  4. }
代码说明:

proxy_cache_path 缓存文件路径

levels 设置缓存文件目录层次;levels=1:2 表示两级目录

keys_zone 设置缓存名字和共享内存大小

inactive 在指定时间内没人访问则被删除

max_size 最大缓存空间,如果缓存空间满,默认覆盖掉缓存时间最长的资源。

当配置好之后,重启nginx,如果不报错,则配置的proxy_cache会生效

查看  proxy_cache_path /data/nginx/目录,
会发现生成了tmp-test文件夹。

如何使用proxy_cache

在你对应的nginx vhost server配置文件中添加如下代码:
[plain] view plaincopy
  1. location /tmp-test/ {
  2. proxy_cache tmp-test;
  3. proxy_cache_valid  200 206 304 301 302 10d;
  4. proxy_cache_key $uri;
  5. proxy_set_header Host $host:$server_port;
  6. proxy_set_header X-Real-IP $remote_addr;
  7. proxy_set_header   X-Forwarded-For $proxy_add_x_forwarded_for;
  8. proxy_passhttp://127.0.0.1:8081/media_store.php/tmp-test/;
  9. }
配置项介绍:
Proxy_cache tmp-test 使用名为tmp-test的对应缓存配置

proxy_cache_valid  200 206 304 301 302 10d; 对httpcode为200…的缓存10天

proxy_cache_key $uri  定义缓存唯一key,通过唯一key来进行hash存取

proxy_set_header  自定义http header头,用于发送给后端真实服务器。

proxy_pass  指代理后转发的路径,注意是否需要最后的/
到这里,最基本的proxy_cache功能就配置成功了。当uri成功匹配到该location,则proxy_cache就会生效。

添加proxy_cache之后,请求过程的变化:

1、第一次访问:

第一次访问,proxy_cache并没有找到对应的缓存文件(未命中缓存MISS),所以当第一次请求完成的同时,proxy_cache会保持缓存:
2、保存缓存,如图所示:

3、同一个url第二次访问,当同一个文件再次到达源站,proxy_cache就会找到其对应的缓存文件(命中缓存HIT)直接返回给请求端,无需再执行php程序,如图所示:

提出疑问:

到此,就完成了最基本的proxy_cache配置和访问过程介绍,但是最基本的配置,往往无法满足我们的业务需求,我们往往会提出以下几点疑问和需求:
  1. 需要主动清理缓存文件
  2. 写入路径为一块磁盘,如果磁盘打满该怎么解决?
  3. 如何让源站支持断点续传,以及断点续传的缓存策略
  4. 如果请求端 range 请求(分片下载)一个大资源,同样的uri,如何区别请求?
  5. 还需要告诉请求端,资源的过期时间
  6. 日志统计,如何配置命中与不命中字段,如何做统计?
面对以上疑问,我们一个一个解决。

问题一:主动清理缓存

采用:nginx  proxy_cache_purge 模块 ,该模块与proxy_cache成对出现,功能正好相反。
设计方法:在nginx中,另启一个server,当需要清理响应资源的缓存时,在本机访问这个server。
例如:
访问 127.0.0.1:8083/tmp-test/TL39ef7ea6d8e8d48e87a30c43b8f75e30.txt 即可清理该资源的缓存文件。
配置方法:
[plain] view plaincopy
  1. location /tmp-test/ {
  2. allow 127.0.0.1; //只允许本机访问
  3. deny all; //禁止其他所有ip
  4. proxy_cache_purge tmp-test $uri;  //清理缓存
  5. }
proxy_cache_purge:缓存清理模块
tmp-test:指定的key_zone
$uri:指定的生成key的参数
proxy_cache_purge缓存清理过程,如图所示:

问题二:缓存文件强磁盘打满该怎么办?

由于写入路径为一个单一目录,只能写入一块磁盘。一块磁盘很快就会被打满,解决该问题有如下两种方法:
1、将多块磁盘做磁盘阵列? 缺点是:减小了实际的存储空间。
2、巧妙得运用proxy_cache_path的目录结构,由于levels=1:2,这导致缓存文件的目录结构为两层,每层目录名,都是由hash函数生成。如图所示:

总共含有16*16*16=4096个文件目录。对该一级目录进行软连接,分别将0-f软连接到你所需要的指定磁盘目录上,如图所示:
通过软链的方法,实现:将不同盘下的目录作为真正存放数据的路径,解决了多盘利用,单盘被打满的问题。

问题三:支持range(断点续传)

添加上缓存代理之后,客户端发起的range请求将会失效,如下图所示:

导致range参数无法传递到下一级的原因如下:
当缓存代理转发http请求到后端服务器时,http header会改变,header中的部分参数,会被取消掉。其中range参数被取消,导致,后端nginx服务器没有收到range参数,最终导致这个分片下载不成功。所以需要对代理转发的header进行配置。
例如:
[plain] view plaincopy
  1. location /tmp-test/ {
  2. proxy_cache tmp-test;
  3. proxy_cache_valid  200 206 304 301 302 10d;
  4. proxy_cache_key $uri;
  5. <span style="color:#ff0000;">proxy_set_header Range $http_range;</span>
  6. proxy_pass http://127.0.0.1:8081/media_store.php/tmp-test/;
  7. }
红色部分的含义:将http请求中的range值($http_range)放到代理转发的http请求头中作为参数range的值。

问题四,当支持range加载后,proxy_cache_key,则需要重新配置:

如果请求端 Range请求(分片下载)一个大资源,同样的uri,proxy cache如何识别资源对应的key。
由于nginx配置为:proxy_cache_key $uri,用uri作为key
所以当请求为普通请求和range请求时,都是同样的uri作为key。proxy_cache将有可能导致错误返回。如下图所示:

解决方法如下:
修改proxy_cache_key ,配置proxy_cache_key $http_range$uri;
这样就能解决:key唯一性。可以避免不管是正常请求还是不同的range请求,第一次获取的内容和之后获取的缓存内容都不会出现异常。

问题五:如何配置-返回过期时间

需要通过返回过期时间来指定请求端,哪些资源需要缓存,哪些资源不缓存,
参数 正常请求 range请求
返回过期时间 返回 不返回
为了防止请求端将分片资源当做完整资源缓存起来,我们需要对正常请求,返回过期时间;对range请求, 不返回过期时间。
解决该问题,通过对nginx配置即可解决:
[plain] view plaincopy
  1. location /media_store.php {
  2. fastcgi_pass   127.0.0.1:9000;
  3. fastcgi_index  media_store.php;
  4. fastcgi_param  SCRIPT_FILENAME  $document_root/$fastcgi_script_name;
  5. include        fastcgi_params;
  6. if ( $http_range = ''){
  7. expires 2592000s;
  8. }
  9. }
在proxy_pass代理之后的location中加入对$http_range的判断,expires 表示过期时间。 2592000s指缓存过期时间。

问题七:缓存命中情况如何在http头中体现,以及在nginx日志中查看

解决方法:
利用nginx $upstream_cache_status变量:该变量代表缓存命中的状态,
如果命中,为HIT;如果未命中,为MISS
在返回nginx server配置中添加:
add_header  Nginx-Cache "$upstream_cache_status";
在nginxlog中添加:
log_format       combinedio  …$upstream_cache_status;
http返回head截图:


nginx log日志截图:

总结:

整个一套完备的缓存策略就介绍到此,这套方案中不仅实现了基本的缓存配置,还解决了实际场景应用中会遇到的,磁盘扩展,缓存清理,断点续传,缓存过期时间,缓存命中提示等问题,只要将这套方案灵活运用,不管是再复杂的场景,基本都能满足需求。以上都是我在工作中爬过的坑,不断完善总结出的结果,希望对读者能有帮助。

nginx proxy_cache 缓存配置相关推荐

  1. NGINX内容缓存配置

    NGINX内容缓存配置 本节介绍如何启用和配置从代理服务器收到的响应的缓存. 总览 启用响应缓存 缓存涉及的NGINX进程 指定要缓存的请求 限制或绕过缓存 从缓存中清除内容 配置缓存清除 发送清除命 ...

  2. nginx proxy_cache缓存详解

    目录 1. 关于缓冲区指令 1.1 proxy_buffer_size 1.2 proxy_buffering 1.3 proxy_buffers 1.4 proxy_busy_buffers_siz ...

  3. 在CentOS 6.9 x86_64上开启nginx 1.12.2的proxy_cache缓存配置

    本文研究nginx提供的缓存功能,下面是实操记录. 这篇博文基于前面文章的基础上搭建,至始至终都是root用户操作 http://blog.csdn.net/tao_627/article/detai ...

  4. nginx 的 proxy_cache 缓存配置

    2019独角兽企业重金招聘Python工程师标准>>> 有个项目用到了百度语音接口,由于功能比较小所以不想在服务端写,打算直接用 js 调百度接口,然后用 nginx 代理解决跨域问 ...

  5. Nginx 清除缓存配置

    ㅤㅤㅤ ㅤㅤㅤ ㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤ(没有不冒风险就能克服的风险. 皮布里吕斯让 诺安) ㅤㅤㅤ ㅤㅤㅤ ㅤㅤㅤㅤㅤㅤㅤㅤㅤ nginx配置缓存禁用 location ~*index.htm ...

  6. nginx 反向代理,动静态请求分离,proxy_cache缓存及缓存清除

    一,nginx反向代理配置 #tomcat 显然就是用户访问www.wolfdream.com(需要设置本地localhost,将www.wolfdream.com指向nginx所在IP)的时候(或将 ...

  7. nginx 缓存配置及报错解决

    研究了2天的nginx缓存 出现各种报错 我把配置文件修改过后还是报错 1 2 3 4 5 6 7 location ~ /purge(/.*)                 {           ...

  8. 使用Nginx反向代理和proxy_cache缓存搭建CDN服务器加快Web访问速度

    碰到问题:移动用户访问web服务器www.osyunwei.com很慢 解决办法: 1.在移动机房放置一台nginx反向代理服务器 2.通过域名DNS智能解析,所有移动用户访问www.osyunwei ...

  9. Nginx——缓存配置

    缓存配置 对于一个含有大量内容的网站来说,随着访问量的增多,对于经常被用户访问的内容,若每一次都要到后端服务器中获取,会给服务器造成很大的压力.为此,利用反向代理服务器对访问频率较多的内容进行缓存,有 ...

最新文章

  1. 清华大学:2021元宇宙发展研究报告
  2. 7-21 求前缀表达式的值
  3. xcode 本地git代码管理
  4. 科技边框_又一种新折叠屏曝光:极窄边框更具科技感
  5. 006-高级语言程序设计C 第六章,高级语言程序设计_C语言(第六章 数组.ppt
  6. 扫二维码缴违章停车罚款?骗你的!
  7. php解析torrent文件,PHP基于闭包思想实现的BT(torrent)文件解析工具实例详解
  8. ActionErrors 使用说明 struts1 validate 处理流程 详细教程(转)
  9. html制作翻牌游戏,基于javascript实现句子翻牌网页版小游戏
  10. c#服务器后台搭建_微信影视小程序搭建拆解:第一课,影视小程序简介,搭建影视小程序的整体流程...
  11. 精益求精,抑或得过且过
  12. 下行文格式图片_通知的格式及范文图片_通知格式 通知的格式及范文
  13. P3369 普通平衡树模板 treap
  14. 双向晶闸管控制AC220V电机
  15. 淮师计算机网络试题库,淮阴师范学院(淮师)计算机基础一至六章习题
  16. 180724 安卓-SSLPinning及反制
  17. 从0开始安装k8s1.25【最新k8s版本——20220904】
  18. 处理solr时遇到的问题
  19. OpenCV调用手机摄像头与人脸检测
  20. CSP2021提高组游记

热门文章

  1. Zabbix 2.2(一):Web监控的监控项
  2. TCP/IP协议是什么
  3. 牛客 - Yuki with emofunc and playf(同余最短路)
  4. CodeForces - 123A prime permutation(并查集,水题)
  5. 制作linux安装镜像文件,制作CentOS 6.5一键自安装ISO镜像光盘 | 聂扬帆博客
  6. virtualbox 创建桥接网络_VirtualBox 配置虚拟网卡(桥接),实现主机-虚拟机网络互通(图文教程)...
  7. matlab求被21整除,用matlab求[100,999]之间能被21整除的数的个数,还有建立一个字符串向量,删除大写字母._...
  8. 来自看雪的手把手调试DebugPort清零
  9. RedrawWindow, UpdateWindow,InvalidateRect 用法
  10. QEMU 构建系统架构