一、背景

首先,nginx是其实就是一个代理服务器,但是可以在很多场景应用,最常用的就是反向代理,负载均衡等。这在我们的日常的场景中应用非常广泛,当然也有在此基础上进行改造的,比如说淘宝的tengine服务器,就是在nginx的基础上进行改进得到的,其源码是完全开源的,笔者工作的时候,正好也是要用到tengine的作为反向代理和负载均衡服务器,因此去了解一下nginx服务器最基本的使用原理,本文介绍的方式很简单,就是让你了解一下什么是nginx,怎么用等。

二、nginx服务器的安装

如果我们要了解一个新的软件或者框架,最好的办法就是先去使用它,只有你去使用它了,才能真正的懂他,先看最简单的安装方式,这个非常的简单。这里做了一个简单的介绍不一一列举了。

1. sudo wget http://tengine.taobao.org/download/tengine-2.2.1.tar.gz
2. sudo tar -zxvf tengine-2.2.1.tar.gz
3. cd tengine-2.2.1
5. sudo yum -y install pcre-devel
6. sudo ./configure --prefix=/dts/tengine --with-openssl=/dts/openssl-1.1.0f
7. sudo make
8. sudo make install

使用也非常的简单,先执行wget下载源码,然后解压,配置一下,最后在make编译和安装一下即可,这个网上也有大量的教程。在这个过程中可能会遇到错误,比如逼着在编译的时候发现报错

./configure: error: the HTTP rewrite module requires the PCRE library.

这是因为缺少相应的openssl的组件,需要安装一下组件即可,执行一下下面的命令进行安装

sudo yum -y install pcre-devel openssl openssl-devel

这样就算安装完成了,那么我先看下nginx的目录

简单介绍一下这里面的几个目录,一个conf这个是要配置所有的信息,包括反向代理的机器,域名以及对应的负载均衡都在这里面配置,其中nginx.conf是非常重要的文件,这个在后面会讲到,基本上安装完成之后,就围绕着这个配置文件转了。在看看html文件夹,这里面主要存放的就是你的静态文件,默认他们会给两个文件一个index.html,现在我们修改一下,在里面加一句hello tengine。。。

在往下log文件夹,这个里面主要是存放tengine的日志信息,include主要存放一些脚本信息,sbin文件夹主要用来启动tengine的。这样我们先启动tengine服务器启动也非常的简单,进入到sbin目录下面

sudo ./nginx

没有报错说明启动成功我看看下进程

然后在浏览器访问tengine所在的机器的ip,看到了结果,是不是就是访问到html下面的index.html文件了,那个Hello tengine是是不是就是刚才添加的。

三、nginx服务器的基本架构和原理

到这里,一个反向代理服务器就搭建好了,是不是非常的简单,那么问题来了?tengine是怎么知道呢,当我访问这个ip的时候,给我转到这个地址,然后在访问对应页面?

首先通过下面的图来了解一下上面的是怎么实现的,因为上面访问的是完全的静态页面,没有涉及到其他的服务器,相对来说比较简单,客户端通过代理,在这里tengine就是充当了一个代理服务器,把我输入的地址转换到服务器所在的地址。然后进行访问。这么说可能比较拗口,举个简单的例子,

服务器的ip:192.168.0.113 ,如果在服务器上部署了程序,端口80,那么在本地访问的地址应该是:192.168.0.113:80/index.html才能访问到这个地址,

而加上代理之后,加入代理所在的服务器地址是:192.168.0.111,端口同样也是80,那么我们访问的格式就变成了192.168.0.111:80/index.html这样就到了代理服务器上,代理服务器在进行转发到web服务器,变成192.168.0.111:80/index.html--->192.168.0.113:80/index.html也就是说多了一层处理。

那么这么做有什么好处,费这么大劲又要加服务器,链路又变长了,看似很麻烦,其实好处太多了。比如做负载均衡、反向代理都很方便。关键是外面还不知道web服务器的真实ip,增加了安全性。

上面这个图就是典型方反向代理的流程图,客户端一般通过DNS进行访问,DNS经过解析之后指向对应的代理服务器的地址,代理服务器监听都这个端口之后,进行转发,转到对应的web服务器上面,然后将结果返回给客户端。tengine的转发规则非常的丰富,可以通过正则进行匹配,才去不同的转发策略。

这是其中的一个非常重要的功能,另外一个非常重要的功能就是负载均衡,tengine提供不同的负载均衡的策略:内置策略和外置策略,而内置策略又分为不同的算法,比如轮询,加权,hash等等。这个在后面会讲到,下面通过这个图,先了解tengine的负载均衡。 举个例子:

现在有三台服务器192.168.0.1,192.168.0.2,192.168.0.3,那么通过反向代理服务器,可以安装一定的比例,把请求分配到不同的服务器上,比如说30%到192.168.0.1,20%192.168.0.2,50%的请求到192.168.0.3这个服务器上。可以说是非常的方便和高效。

当然tengine远远不止这两个功能,比如说缓存服务器,邮件带你服务器等等,这里就不一一介绍了。

四、nginx的配置详解

看到上面的应该大致了解了一下tengine服务器是怎么去做到的这些的呢,我们该如何去实现呢,这里面就是用到了nginx的配置文件,ngxin.conf文件,基本上所有的配置都是在这里完成的,反向代理,负载均衡等等。先打开这个配置文件,看看,其中有些功能被注释掉掉了。

#user  nobody;
worker_processes  1;#error_log  logs/error.log;
#error_log  logs/error.log  notice;
#error_log  logs/error.log  info;
#error_log  "pipe:rollback logs/error_log interval=1d baknum=7 maxsize=2G";#pid        logs/nginx.pid;events {worker_connections  1024;
}# load modules compiled as Dynamic Shared Object (DSO)
#
#dso {
#    load ngx_http_fastcgi_module.so;
#    load ngx_http_rewrite_module.so;
#}http {include       mime.types;default_type  application/octet-stream;#log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '#                  '$status $body_bytes_sent "$http_referer" '#                  '"$http_user_agent" "$http_x_forwarded_for"';#access_log  logs/access.log  main;#access_log  "pipe:rollback logs/access_log interval=1d baknum=7 maxsize=2G"  main;sendfile        on;#tcp_nopush     on;#keepalive_timeout  0;keepalive_timeout  65;#gzip  on;server {listen       80;server_name  localhost;#charset koi8-r;#access_log  logs/host.access.log  main;#access_log  "pipe:rollback logs/host.access_log interval=1d baknum=7 maxsize=2G"  main;location / {root   html;index  index.html index.htm;}#error_page  404              /404.html;# redirect server error pages to the static page /50x.html#error_page   500 502 503 504  /50x.html;location = /50x.html {root   html;}# proxy the PHP scripts to Apache listening on 127.0.0.1:80##location ~ \.php$ {#    proxy_pass   http://127.0.0.1;#}# pass the PHP scripts to FastCGI server listening on 127.0.0.1:9000##location ~ \.php$ {#    root           html;#    fastcgi_pass   127.0.0.1:9000;#    fastcgi_index  index.php;#    fastcgi_param  SCRIPT_FILENAME  /scripts$fastcgi_script_name;#    include        fastcgi_params;#}# deny access to .htaccess files, if Apache's document root# concurs with nginx's one##location ~ /\.ht {#    deny  all;#}}# another virtual host using mix of IP-, name-, and port-based configuration##server {#    listen       8000;#    listen       somename:8080;#    server_name  somename  alias  another.alias;#    location / {#        root   html;#        index  index.html index.htm;#    }#}# HTTPS server##server {#    listen       443 ssl;#    server_name  localhost;#    ssl_certificate      cert.pem;#    ssl_certificate_key  cert.key;#    ssl_session_cache    shared:SSL:1m;#    ssl_session_timeout  5m;#    ssl_ciphers  HIGH:!aNULL:!MD5;#    ssl_prefer_server_ciphers  on;#    location / {#        root   html;#        index  index.html index.htm;#    }#}}

看上去好像挺乱的,其实这里里面有几个重要的关键字,掌握这些关键字,就能掌握文件的结构。首先我们看到的有{}括起来的这些,比如events,http,server和location,看上去好像也就这几个。先连接下这是啥东西

events:这个是配置nginx服务器与用户的网络连接,比如说每个进程的最大连接数,请求,序列化等等。
http块:这是一个比较核心的配置项,其中的server就是配置对应的服务器的信息,包括日志,格式,缓存代理,等都在这里配置
server:配置虚拟主机的相关参数,一个http中可以有多个server

location:配置转发的路由地址,已经各种页面的处理情况。

那么接下来,我们来详细讲解一下这个配置文件:

首先看到最开头的:

#user  nobody;   首先看下这个地方,这个是配置运行的用户和组,在window可以不需要使用,在mac或者linux一定要指定
worker_processes  1;  nginx的进程数量,一般的设置是等于cpu的总核心数,太高的会影响机器的资源,太低影响性能。#error_log  logs/error.log;   这个地方是配置全局的日志信息,当然在每个server里面也可以配置局部的信息
#error_log  logs/error.log  notice;
#error_log  logs/error.log  info;
#error_log  "pipe:rollback logs/error_log interval=1d baknum=7 maxsize=2G"; 

上面这些参数的 配置都是全局的,下面看看event的配置

events {worker_connections  1024;
} 

这里主要配置事件参考模型,有很多种,不然use poll 而参数worker_connection这个则是配置每个进程允许的最大连接数。

这些基本上都是全局,配置一次之后基本上需要改动。下面http模块才是核心需要掌握的地方。

http {include       mime.types;  这个是模块指令,可以将配置文件拆分并引用,可以减少住配置文件的复杂度default_type  application/octet-stream;  这个是默认的文件类型#log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '#                  '$status $body_bytes_sent "$http_referer" '#                  '"$http_user_agent" "$http_x_forwarded_for"';    //这个就是配置日志的格式#access_log  logs/access.log  main;    日志的默认值和地址#access_log  "pipe:rollback logs/access_log interval=1d baknum=7 maxsize=2G"  main;sendfile        on;   允许sendfile方式传输文件,默认为off#tcp_nopush     on;    keepalive_timeout  65;   连接超时时间#gzip  on;  开启gizp格式输出server {listen       80;server_name  localhost;#charset koi8-r;#access_log  logs/host.access.log  main;#access_log  "pipe:rollback logs/host.access_log interval=1d baknum=7 maxsize=2G"  main;location / {root   html;index  index.html index.htm;}#error_page  404              /404.html;# redirect server error pages to the static page /50x.htmlerror_page   500 502 503 504  /50x.html;location = /50x.html {root   html;}}
}

1.$remote_addr 与$http_x_forwarded_for 用以记录客户端的ip地址; 2.$remote_user :用来记录客户端用户名称; 3.$time_local : 用来记录访问时间与时区;4.$request : 用来记录请求的url与http协议;

5.$status : 用来记录请求状态;成功是200, 6.$body_bytes_s ent :记录发送给客户端文件主体内容大小;7.$http_referer :用来记录从那个页面链接访问过来的; 8.$http_user_agent :记录客户端浏览器的相关信息;

上面没有讲解server模块的配置和location的配置,这个两个我们最常用的配置,接下来看看:

#虚拟主机的配置
server {# 监听端口 ,这里是监听80端口,如果写成listen 443就是监听443端口,可以配置多个server,监听不同的端口listen 80;  #域名可以有多个,用空格隔开server_name  localhost;  监听的域名或者地址,这里用的是localhost,则表示监听本机ssi on;  # Server Side Include,通常称为服务器端嵌入
}

看到没有,上面监听80端口,也就是所有的80请求都会被拦截, 然后匹配域名,知道符合对应的域名进行下一步操作。那么监听请求之后,我们怎么处理呢?那么就是location要做的事情了,我们原生的location地址,很简单就是/这个代表匹配所有的地址,就是通常所说的根目录。当请求过来之后,后面没有任何相对路径,就直接到这个地址下面,其中root表示根目录所在。

 location / {root   html;index  index.html index.htm;} 

location支持正则表达式匹配,格式是这样的 location [=|~|~*|^~] /uri/ { … },这个当两个地址冲突的时候也是有匹配顺序的,首先匹配=,其次匹配^~,再往后按文件中的顺序的正则匹配,最后交给/匹配,当匹配成功的时候停止。下面举个例子,这个也是参考网友的例子,发现解释的比较好

location  = / {# 精确匹配 / ,主机名后面不能带任何字符串[ configuration A ]
}location  / {# 因为所有的地址都以 / 开头,所以这条规则将匹配到所有请求# 但是正则和最长字符串会优先匹配[ configuration B ]
}location /documents/ {# 匹配任何以 /documents/ 开头的地址,匹配符合以后,还要继续往下搜索# 只有后面的正则表达式没有匹配到时,这一条才会采用这一条[ configuration C ]
}location ~ /documents/Abc {# 匹配任何以 /documents/Abc 开头的地址,匹配符合以后,还要继续往下搜索# 只有后面的正则表达式没有匹配到时,这一条才会采用这一条[ configuration CC ]
}location ^~ /images/ {# 匹配任何以 /images/ 开头的地址,匹配符合以后,停止往下搜索正则,采用这一条。[ configuration D ]
}location ~* \.(gif|jpg|jpeg)$ {# 匹配所有以 gif,jpg或jpeg 结尾的请求# 然而,所有请求 /images/ 下的图片会被 config D 处理,因为 ^~ 到达不了这一条正则[ configuration E ]
}location /images/ {# 字符匹配到 /images/,继续往下,会发现 ^~ 存在[ configuration F ]
}location /images/abc {# 最长字符匹配到 /images/abc,继续往下,会发现 ^~ 存在# F与G的放置顺序是没有关系的[ configuration G ]
}location ~ /images/abc/ {# 只有去掉 config D 才有效:先最长匹配 config G 开头的地址,继续往下搜索,匹配到这一条正则,采用[ configuration H ]
}location ~* /js/.*/\.js
  • / -> config A
    精确完全匹配,即使/index.html也匹配不了
  • /downloads/download.html -> config B
    匹配B以后,往下没有任何匹配,采用B
  • /images/1.gif -> configuration D
    匹配到F,往下匹配到D,停止往下
  • /images/abc/def -> config D
    最长匹配到G,往下匹配D,停止往下
    你可以看到 任何以/images/开头的都会匹配到D并停止,FG写在这里是没有任何意义的,H是永远轮不到的,这里只是为了说明匹配顺序
  • /documents/document.html -> config C
    匹配到C,往下没有任何匹配,采用C
  • /documents/1.jpg -> configuration E
    匹配到C,往下正则匹配到E
  • /documents/Abc.jpg -> config CC
    最长匹配到C,往下正则顺序匹配到CC,不会往下到E

以上的这个例子发现还是比较清楚。在加上一个我在实际中的匹配规则,

 location = /test/list.json {proxy_pass   http://192.168.0.1;} 

当我的请求http://192.168.0.3/test.list.json访问请求过来的时候,会被这个location匹配到,并且转发到http://192.168.0.1/test/list.json这个请求上,从哪访问对应的服务器,找到我们都要地址。

最后一个tengine怎么实现的负载均衡的呢?

反向代理服务器tengine学习小记相关推荐

  1. 反向代理服务器的工作原理

    最近接触了nginx,nginx可以作为一个反向代理服务器完成负载均衡,下面记录一下从网上学习到的一些知识. 一  概述 反向代理(Reverse Proxy)方式是指以代理服务器来接受Interne ...

  2. 【大型网站技术实践】初级篇:借助Nginx搭建反向代理服务器

    一.反向代理:Web服务器的"经纪人" 1.1 反向代理初印象 反向代理(Reverse Proxy)方式是指以代理服务器来接受internet上的连接请求,然后将请求转发给内部网 ...

  3. 代理服务器Tengine的研究与测试

    代理服务器Tengine的研究与测试 一.Tengine介绍 1.首先要知道什么Nginx 1)Nginx(发音同 engine x)是一款轻量级的Web 服务器/反向代理服务器及电子邮件(IMAP/ ...

  4. Nginx搭建反向代理服务器过程详解

    一.反向代理:Web服务器的"经纪人" 1.1 反向代理初印象 反向代理(Reverse Proxy)方式是指以代理服务器来接受internet上的连接请求,然后将请求转发给内部网 ...

  5. 图解跨域请求、反向代理原理,对前端更友好的反向代理服务器 - Caddy

    关注 程序员成长指北,回复"1" 加入我们一起学习,天天进步 转载自:https://github.com/a1029563229/blogs/ 作者:晒兜斯 caddy 写在开头 ...

  6. 【ROS-cartographer学习小记-01】使用自己的激光雷达思岚A1运行cartographer,附代码以及bag包-直接运行即可看到结果

    [ROS-cartographer学习小记-01]使用自己的激光雷达思岚A1运行cartographer 0.前提条件 1.修改revo_Ids.lua文件 3.修改demo_revo_lds.lau ...

  7. 入门Nginx反向代理服务器

    前言 博主最近学习了Nginx,故想通过撰写博客的方式加强对知识的认识和记忆,所涉及知识浅薄,如有错误,敬请指正 一.Nginx简介 Nginx (engine x) 是一个高性能的HTTP和反向代理 ...

  8. 【Nginx】为什么说Nginx是一个反向代理服务器

    在学习到Nginx的时候,老师说Nginx是一个反向代理服务器,我比较好奇为什么说它是反向代理服务器.于是上网搜了一下,什么是反向代理.反向代理和正向代理服务器有什么区别[1] 文章[1]讲的很好,代 ...

  9. Nginx反向代理服务器搭建(超详细)

    一.简介 Nginx (engine x) 是一个高性能的Web服务器和反向代理服务器,也可以作为邮件代理服务器. 反向代理(Reverse Proxy)方式是指以代理服务器来接受internet上的 ...

  10. 反向代理服务器(Reverse Proxy)

    反向代理服务器(Reverse Proxy) 普通代理服务器是帮助内部网络的计算机访问外部网络.通常,代理服务器同时连接内网和外网.首先内网的计算机需要设置代理服务器地址和端口,然后将HTTP请求发送 ...

最新文章

  1. 关于从Image字段读取图片流并显示在PictureBox控件时报‘参数无效’异常的解决方法...
  2. Dubbo 负载均衡的实现
  3. css 文字过长 省略号,css实现文字过长显示省略号的方法
  4. dockerfile COPY ADD 命令
  5. 微信小程序错误监控方法谈
  6. [Swift]LeetCode682. 棒球比赛 | Baseball Game
  7. oracle 游标 904,如何解决Oracle数据库游标连接超出问题
  8. 哈佛大学计算机生物科学,生命科学专业
  9. Hexo博客NexT主题美化之新增看板娘(能说话、能换装)
  10. Tensor的填充与复制
  11. 高等数学,线性代数 课后题解答
  12. 基于java的奖学金_基于Java的奖学金评定系统设计与实现毕业设计论文.doc
  13. 【致敬雷神】星星之火,可以燎原
  14. 视频:这不是科幻,厉害了,用人工智能修长城
  15. 微信小游戏之飞机大战解析
  16. 运营 | 做自媒体应该从哪方面入手?
  17. 1750. 救生员 Lifeguards S
  18. 让SOA使用者像超人一样自由
  19. 如何创建NFT并OpenSea上展示《alchemy How to Develop an NFT Smart Contract》译
  20. 新的浏览器的诞生,你会选择哪个?

热门文章

  1. Java数据类型占用内存最多的_java基础数据类型的内存占用
  2. 网页加载出现没有合适的负载均衡器_一篇文章彻底了解清楚什么是负载均衡
  3. 用nodejs框架Ghost快速搭建自己的网站
  4. bazel proxy 设置
  5. Qt QPushButton 解决触摸屏点击 pressed样式表无效
  6. Qt QLabel无法显示符号
  7. 编译cloog for gcc 4.8.5 问题
  8. git如何添加远程主机_Git由浅入深之远端主机(git remote)
  9. Java中的package、import、import static
  10. Linux系统之下的基本gdb调试