LNMP的运维追踪技巧总结

曾几何时我开始运维公司的LNMP网站,经过一段时间的摸爬滚打,也算是总结了不少在LNMP服务器下调试追踪各种网站错误的方法。好记性不如烂笔头,还是总结一下吧!

在开始我会梳理一下我所理解的一个web请求从发起到响应的各个阶段服务器和浏览器分别做了什么。所以的用户响应异常都是发生在这个流程中的,知道每个流程的细节可以通过不同的方法分别定位异常发生在哪个阶段,从而更准确快速的定位错误。后面就是持续更新的我在被这个网站折磨中经历的各种错误,给自己做一个记录,当然如果能帮到其他人,我也很荣幸。

一个Web请求过程中到底发生了什么?

上图是一个简单的web请求全过程,嗯,画的确实有点过于简单,上图中我隐藏了很多细节,下面一一说明,可能有没涉及到的地方欢迎补充:

第一步

用户输入url如http:www.baidu.com到浏览器,浏览器如chrom需要将其解析为ip地址才知道需要到哪里去访问哪个服务器。浏览器解析DNS步骤如下:

  1. 搜索浏览器自身的dns缓存,这个缓存缓存时间短,缓存数目有限。
  2. 搜索操作系统的dns缓存
  3. 读取host文件的dns映射(一般做本地开发映射都是修改这个文件来达到拦截浏览器请求到本地服务器的目的,从而使本地可以成功映射服务器地址)
  4. 先本地网卡配置里的dns服务器发起域名解析请求,这里好像还有一套运营商的处理流程就不在展开了。
  5. 下面好像还有一些流程,由于基本不会执行到这一步,一般所以dns运营商的dns服务器都会搞定的。
  6. 解析失败,以上任何一步成功都会返回一个成功的ip地址

第二步

浏览器以一个随机的端口享这个ip地址的特定端口(默认80)发起著名的TCP3次握手。关于一个http请求是如何到达nginx服务的流程大致如下:

st=>start: TCP请求
en=>end: 异常
op=>operation: Nginx模块
cond1=>condition: 进入网卡?
cond2=>condition: 内核的TCP/IP协议栈?
cond3=>condition: 防火墙?st->cond1
cond1(yes)->cond2
cond1(no)->en
cond2(yes)->cond3
cond2(no)->en
cond3(no)->en
cond3(yes)->op

第三步

握手完成后的浏览器和服务器就可以愉快地发送http请求了,具体在nginx上流程如下:

st=>start: http请求
en=>end: response响应
op1=>operation: 第二步流程
op2=>operation: nginx进程
op3=>operation: 获取http的头部信息
op4=>operation: 匹配server_name,定位到站点的root
op5=>operation: 进入代码框架的路由
op6=>operation: 框架的路由解析器解析出php文件
op7=>operation: php进入fastcgi进程
op8=>operation: fastcgi进程将php填充成html文件
op9=>operation: html文件递交给nginx并设置响应信息 st->op1->op2->op3->op4->op5->op6->op7->op8->op9->en

第四步

浏览器根据服务器resopnse的响应头和响应体渲染出可视化页面

响应码 说明
1xx 信息性状态说明
2xx 成功状态码
3xx 重定向状态码
301 永久重定向, Location响应首部的值仍为当前URL,因此为隐藏重定向
302 临时重定向,显式重定向, Location响应首部的值为新的URL
304 Not Modified 未修改,比如本地缓存的资源文件和服务器上比较时,发现并没有修改,服务器返回一个304状态码,告诉浏览器,你不用请求该资源,直接使用本地的资源即可
4xx 客户端错误
404 Not Found 请求的URL资源并不存在
5xx 服务器错误
500 Internal Server Error 服务器内部错误
502 Bad Gateway 前面代理服务器联系不到后端的服务器时出现
504 Gateway Timeout 这个是代理能联系到后端的服务器,但是后端的服务器在规定的时间内没有给代理服务器响应

上面大致梳理了下一个http请求在LNMP服务端体系下的流程。心中有个整体流程的概念才可以更好的追踪实际问题。下面就是针对上面几个基本步骤中会出现的问题的定位和追踪。

第一步和第二步出现问题,可以通过「端口可用性探测」来定位。

  1. ping www.baidu.com 检测域名解析器是否异常

检查域名解析是否错误

  1. telnet 127.0.0.1 80 追踪端口是否异常

检查端口是否打开,防火墙是否过滤

第三步出现的问题

这一步一般是网站出问题的主要地方,绝大部分问题都是出现在这个阶段,同样这个阶段出现的问题也是最难定位和解决的。为了更好的处理这个阶段的问题我们需要更深入地了解下一个web服务器与一个web程序直接的信息通信的模型与流程。

要说明这个问题,首先我们需要了解什么是大名顶顶的CGI协议、FASTCGI协议和PHP-FPM,以及它们之前的关系。

对于一个PHP的web程序来说,web服务器(如:nginx)要想与它通信需要通过CGI协议。当一个web请求触达web服务器时,web服务器会创建一个CGI进程,CGI进程将web的请求按照固定的格式进行解析,然后写入标准输入(STDIN)和环境变量中,然后PHP启动的CGI解析器会从标准输入(STDIN)和环境变量中读取http请求的数据,所以$_SERVER才会有数据,然后做出相应的逻辑处理,然后将处理结果放入标准输出(STDOUT),CGI进程从STDOUT中读取响应数据然后传输给浏览器,这样服务端就完成了一次http请求。

上面是CGI的实现流程,但是使用CGI协议的服务器在用户每次访问服务器的时候都需要fork/销毁CGI进程,必然照成多余的系统开销,所以FASTCGI就是为了解决这个问题的。

FastCGI会创建一个常驻的master进程和多个worker进程,master进程负责管理和为worker进程反派任务,worker进程负责内部嵌入了CGI解析器用于解释php代码。

PHP-FPM是一个FastCGI进程管理器,在LNMP体系中就是由它来实现FastCGI协议的。同样,它也会创建一个常驻的master进程和多个worker进程,master进程负责监听端口和接收来自nginx的请求,指派任务给worker进程。worker进程的负责解释php代码。PHP-FPM可以通过配置预先启动一定数量的worker进程,这样当http请求触达时就可以更快速的响应。

nginx与PHP-FPM之间的通信一般通过其ngx_http_fastcgi_module模块来实现。其中fastcgi_pass用于设置fastcgi服务器的IP地址;fastcgi_param设置传入fastcgi服务器的参数。这个模块出现的配置问题一般集中在这一块。

相对于并发状态下出现的问题,一般也都集中在fastcgi服务器上,具体表现为fastcgi服务器为了应对大量的http请求必须不停的fork新的worker进程,这时就需要考虑服务器可支持的最大链接数和最大打开文件数(可通过ulimit -n查看)以及php-fpm配置里的最低开启worker数和最高开启worker数的限制。高性能服务器可以在这个方向上调优。这也是我目前还在探索的地方,以后肯定也会写一个总结。

第四步出现的问题

这一步一般很少出现问题,出现问题也很容易定位,多是前端渲染问题,我也不是很懂。


未完分割线,后面我会总结一些各个阶段可能发生的错误,这些错误在客户端的表现,如何定位,以及如何解决。

CSDN传送门

LNMP的运维追踪技巧总结相关推荐

  1. 有哪些不为人知的安全运维小技巧?

    今天分享一些实用安全运维小技巧. 1.主动预防 攻防之间信息往往不对称,很多攻击利用安全漏洞趁火打劫,运维工程师未必能在第一时间拦截,导致服务器被黑.因此运维工程师要主动预防,积极获取信息. 原因无外 ...

  2. 运维前线 一线运维专家的运维方法 技巧与实践pdf

    下载地址:网盘下载 内容简介 编辑 本书是运维领域的"集大成"之作,精选了运维领域重要的6大主题: (1)自动化运维 (2)系统运维 (3)云与虚拟化 (4)Web运维 (5)游戏 ...

  3. 降低网络运维管理成本技巧分析

    如何正确的降低网络运维管理成本,是每一个企业IT管理员必须要解决的问题.受国内外各方面因素的综合影响,IT市场整体需求下滑,而传统的网络产品的价格却越来越透明,竞争越来越大,产品利润越来越低,不少中小 ...

  4. 一些拍案叫绝的运维小技巧

    需求 在运维工作中随着经验不断增多,以下场景想必经常遇到: Linux如何快速删除大量文件? Vsphere如何在不重启的情况下识别新添加的iscsi硬盘? Linux中rm命令如何做到防误删? 不同 ...

  5. mysql运维技巧_​mysql初级运维使用技巧

    整理了一下,工作中用到的最高的关于mysql的一些命令和使用技巧,分享给刚接触mysql的小伙伴么. 1mysql最基础 1.1mysql安装 建议新人安装mysql直接使用yum安装即可,大牛们已经 ...

  6. shell 死循环if判断_运维小技巧(2):shell函数

    shell函数是什么 shell函数可以看作是一组shell命令的组合,用来完成一个特定的功能,它的功能和java中的方法类似. 2. shell函数长什么样 铛铛铛,先上代码. function l ...

  7. linux下查看mysql数据库的字段类型_系统运维|[小白技巧]如何在Linux上检查MySQL数据表的存储引擎类型...

    提问: 我想要知道我的MySQL数据库是MyISAM还是Innodb类型.我该如何检查MySQL数据库表的类型? MySQl主要使用两种存储引擎:MyISAM 和 Innodb.MyISAM是非事务的 ...

  8. Linux线上运维经验分享与故障排除技巧-高俊峰-专题视频课程

    Linux线上运维经验分享与故障排除技巧-743人已学习 课程介绍         主要介绍Linux线上服务器的运维经验和实战操作过程,并介绍常见的系统故障排查思路与问题解决技巧. 课程收益     ...

  9. Kubernetes 常见运维技巧

    注:本文节选自<Kubernetes权威指南>,主要对常用的Kubernetes系统运维操作和技巧进行详细说明. 1.Node的隔离和恢复 apiVersion: v1 kind: Nod ...

  10. 一篇文章全面了解运维监控知识体系

    文章目录: 0 监控目标 1 监控方法 2 监控核心 3 监控工具 4 监控流程 5 监控指标 5.1 硬件监控 5.2 系统监控 5.3 应用监控 5.4 网络监控 5.5 流量分析 5.6 日志监 ...

最新文章

  1. 怎么只选中一部分_关于Excel中数据隐藏的技巧,你真的会吗?看看高手都是怎么操作的!...
  2. (~解题报告~)L1-016 查验身份证 (15分)(29行代码AC!)
  3. Git 常用命令和教程
  4. SAP UI5应用部署在tomcat上运行的部署路径问题,基于Eclipse
  5. php制图汉字,PHP用imageTtfText函数在图片上写入汉字
  6. 高校开学返校最新消息!学生票乘车时间延长至5月31日!
  7. 飞鸽传书:造假与成功
  8. JMeter 压力测试使用CSV参数
  9. 通过Rancher部署并扩容Kubernetes集群基础篇一
  10. 左耳朵耗子:聊聊分布式系统架构
  11. 使用nginx代理实现前后端分离开发调试,零基础教程
  12. HHL算法的QISKit实现
  13. 算法分析与设计实验报告——图的m着色问题
  14. 利用Python编写脚本批量下载公众号中的音频
  15. Python re模块 —— 从零基础开始入门正则表达式
  16. 人工智能带来的岗位减少更多是重复性、机械性、门槛低的岗位
  17. R语言在图上标出点坐标_R语言绘制平行坐标图(PCP)示例
  18. 【计算机毕业设计】Java基于协同过滤算法的音乐推荐系统
  19. Sentinel 集群限流设计原理
  20. Struts2的运行流程

热门文章

  1. SPSS正态性检验(图文+数据集)【SPSS 015期】
  2. poi 获取删除线_Houdini 删除相机看不到的点背面的点或面
  3. 计算机专业c类大学,【计算机应用技术】专业排名A+、A、B+、B、C类院校分数线...
  4. 小学计算机应用到英语课教案,人教版小学英语三年级上册unit one hello!文具单词教学信息技术应用成果(教学设计方案).doc...
  5. oracle读写mysql_Oracle读写磁盘经过的缓存
  6. fatal error: openssl/sha.h: No such file or directory
  7. 随手记--Windows系统下的cmd和powershell的区别
  8. 时间linux防火墙策略,Linux防火墙简介 – iptables配置策略(示例代码)
  9. 搭建企业级Docker Registry -- Harbor
  10. View的setLayerType() , setDrawingCacheEnabled() 方法用法