Table of Contents

服务端的线程模型

2种fd

3种事件

Reactor模型-同步I/O

1.单Reactor单线程模型

2.单Reactor多线程模型

3.主从Reactor多线程模型

总结

Proactor模型-异步I/O

常见架构的进程/线程模型

Netty的线程模型

tomcat的线程模型

Nginx的进程模型

Redis的线程模型

Swoole的进程模型


推荐阅读《AIO,BIO,NIO:同步阻塞式IO,同步非阻塞IO,异步非阻塞IO》

在高性能的I/O设计中,有两个著名的模型:Reactor模型和Proactor模型,其中Reactor模型用于同步I/O,而Proactor模型运用于异步I/O操作。

想要了解两种模型,需要了解一些IO、同步异步的基础知识,《AIO,BIO,NIO:同步阻塞式IO,同步非阻塞IO,异步非阻塞IO》

IO是Input/Output的缩写。Unix网络编程中有五种IO模型:

  • blocking IO(阻塞IO)
  • nonblocking IO(非阻塞IO)
  • IO multiplexing(多路复用IO)
  • signal driven IO(信号驱动IO)
  • asynchronous IO(异步IO)

服务端的线程模型


无论是Reactor模型还是Proactor模型,对于支持多连接的服务器,一般可以总结为2种fd和3种事件,如下图:

2种fd

  1. listenfd:一般情况,只有一个。用来监听一个特定的端口(如80)。
  2. connfd:每个连接都有一个connfd。用来收发数据。

3种事件

  1. listenfd进行accept阻塞监听,创建一个connfd
  2. 用户态/内核态copy数据。每个connfd对应着2个应用缓冲区:readbuf和writebuf。
  3. 处理connfd发来的数据。业务逻辑处理,准备response到writebuf。

Reactor模型-同步I/O


无论是C++还是Java编写的网络框架,大多数都是基于Reactor模型进行设计和开发,Reactor模型基于事件驱动,特别适合处理海量的I/O事件。

Reactor模型中定义的三种角色:

  • Reactor:负责监听和分配事件,将I/O事件分派给对应的Handler。新的事件包含连接建立就绪、读就绪、写就绪等。
  • Acceptor:处理客户端新连接,并分派请求到处理器链中。
  • Handler:将自身与事件绑定,执行非阻塞读/写任务,完成channel的读入,完成处理业务逻辑后,负责将结果写出channel。可用资源池来管理。

Reactor处理请求的流程:

读取操作:

  1. 应用程序注册读就绪事件和相关联的事件处理器
  2. 事件分离器等待事件的发生
  3. 当发生读就绪事件的时候,事件分离器调用第一步注册的事件处理器

写入操作类似于读取操作,只不过第一步注册的是写就绪事件。

1.单Reactor单线程模型


Reactor线程负责多路分离套接字,accept新连接,并分派请求到handler。Redis使用单Reactor单进程的模型。

消息处理流程:

  1. Reactor对象通过select监控连接事件,收到事件后通过dispatch进行转发。
  2. 如果是连接建立的事件,则由acceptor接受连接,并创建handler处理后续事件。
  3. 如果不是建立连接事件,则Reactor会分发调用Handler来响应。
  4. handler会完成read->业务处理->send的完整业务流程。

单Reactor单线程模型只是在代码上进行了组件的区分,但是整体操作还是单线程,不能充分利用硬件资源。handler业务处理部分没有异步。

对于一些小容量应用场景,可以使用单Reactor单线程模型。但是对于高负载、大并发的应用场景却不合适,主要原因如下:

  1. 即便Reactor线程的CPU负荷达到100%,也无法满足海量消息的编码、解码、读取和发送。
  2. 当Reactor线程负载过重之后,处理速度将变慢,这会导致大量客户端连接超时,超时之后往往会进行重发,这更加重Reactor线程的负载,最终会导致大量消息积压和处理超时,成为系统的性能瓶颈。
  3. 一旦Reactor线程意外中断或者进入死循环,会导致整个系统通信模块不可用,不能接收和处理外部消息,造成节点故障。

为了解决这些问题,演进出单Reactor多线程模型。

2.单Reactor多线程模型


该模型在事件处理器(Handler)部分采用了多线程(线程池)。

消息处理流程:

  1. Reactor对象通过Select监控客户端请求事件,收到事件后通过dispatch进行分发。
  2. 如果是建立连接请求事件,则由acceptor通过accept处理连接请求,然后创建一个Handler对象处理连接完成后续的各种事件。
  3. 如果不是建立连接事件,则Reactor会分发调用连接对应的Handler来响应。
  4. Handler只负责响应事件,不做具体业务处理,通过Read读取数据后,会分发给后面的Worker线程池进行业务处理。
  5. Worker线程池会分配独立的线程完成真正的业务处理,如何将响应结果发给Handler进行处理。
  6. Handler收到响应结果后通过send将响应结果返回给Client。

相对于第一种模型来说,在处理业务逻辑,也就是获取到IO的读写事件之后,交由线程池来处理,handler收到响应后通过send将响应结果返回给客户端。这样可以降低Reactor的性能开销,从而更专注的做事件分发工作了,提升整个应用的吞吐。

但是这个模型存在的问题:

  1. 多线程数据共享和访问比较复杂。如果子线程完成业务处理后,把结果传递给主线程Reactor进行发送,就会涉及共享数据的互斥和保护机制。
  2. Reactor承担所有事件的监听和响应,只在主线程中运行,可能会存在性能问题。例如并发百万客户端连接,或者服务端需要对客户端握手进行安全认证,但是认证本身非常损耗性能。

为了解决性能问题,产生了第三种主从Reactor多线程模型。

3.主从Reactor多线程模型


比起第二种模型,它是将Reactor分成两部分:

  1. mainReactor负责监听server socket,用来处理网络IO连接建立操作,将建立的socketChannel指定注册给subReactor。
  2. subReactor主要做和建立起来的socket做数据交互和事件业务处理操作。通常,subReactor个数上可与CPU个数等同。

Nginx、Swoole、Memcached和Netty都是采用这种实现。

消息处理流程:

  1. 从主线程池中随机选择一个Reactor线程作为acceptor线程,用于绑定监听端口,接收客户端连接
  2. acceptor线程接收客户端连接请求之后创建新的SocketChannel,将其注册到主线程池的其它Reactor线程上,由其负责接入认证、IP黑白名单过滤、握手等操作
  3. 步骤2完成之后,业务层的链路正式建立,将SocketChannel从主线程池的Reactor线程的多路复用器上摘除,重新注册到Sub线程池的线程上,并创建一个Handler用于处理各种连接事件
  4. 当有新的事件发生时,SubReactor会调用连接对应的Handler进行响应
  5. Handler通过Read读取数据后,会分发给后面的Worker线程池进行业务处理
  6. Worker线程池会分配独立的线程完成真正的业务处理,如何将响应结果发给Handler进行处理
  7. Handler收到响应结果后通过Send将响应结果返回给Client

总结


Reactor模型具有如下的优点:

  1. 响应快,不必为单个同步时间所阻塞,虽然Reactor本身依然是同步的;
  2. 编程相对简单,可以最大程度的避免复杂的多线程及同步问题,并且避免了多线程/进程的切换开销;
  3. 可扩展性,可以方便地通过增加Reactor实例个数来充分利用CPU资源;
  4. 可复用性,Reactor模型本身与具体事件处理逻辑无关,具有很高的复用性。

Proactor模型-异步I/O


模块关系:

  1. Procator Initiator负责创建Procator和Handler,并将Procator和Handler都通过Asynchronous operation processor注册到内核。
  2. Asynchronous operation processor负责处理注册请求,并完成IO操作。完成IO操作后会通知procator。
  3. procator根据不同的事件类型回调不同的handler进行业务处理。handler完成业务处理,handler也可以注册新的handler到内核进程。

消息处理流程:

读取操作:

  1. 应用程序初始化一个异步读取操作,然后注册相应的事件处理器,此时事件处理器不关注读取就绪事件,而是关注读取完成事件,这是区别于Reactor的关键。
  2. 事件分离器等待读取操作完成事件
  3. 在事件分离器等待读取操作完成的时候,操作系统调用内核线程完成读取操作,并将读取的内容放入用户传递过来的缓存区中。这也是区别于Reactor的一点,Proactor中,应用程序需要传递缓存区。
  4. 事件分离器捕获到读取完成事件后,激活应用程序注册的事件处理器,事件处理器直接从缓存区读取数据,而不需要进行实际的读取操作。

异步IO都是操作系统负责将数据读写到应用传递进来的缓冲区供应用程序操作。

Proactor中写入操作和读取操作,只不过感兴趣的事件是写入完成事件。

Proactor有如下缺点:

  1. 编程复杂性,由于异步操作流程的事件的初始化和事件完成在时间和空间上都是相互分离的,因此开发异步应用程序更加复杂。应用程序还可能因为反向的流控而变得更加难以Debug;
  2. 内存使用,缓冲区在读或写操作的时间段内必须保持住,可能造成持续的不确定性,并且每个并发操作都要求有独立的缓存,相比Reactor模型,在Socket已经准备好读或写前,是不要求开辟缓存的;
  3. 操作系统支持,Windows下通过IOCP实现了真正的异步 I/O,而在Linux系统下,Linux2.6才引入,并且异步I/O使用epoll实现的,所以还不完善。

因此在 Linux 下实现高并发网络编程都是以Reactor模型为主。

常见架构的进程/线程模型


Netty的线程模型

Netty采用的是主从线程模型。下面是Netty使用中很常见的一段代码。

public class Server {public static void main(String[] args) throws Exception {EventLoopGroup bossGroup = new NioEventLoopGroup(1);EventLoopGroup workerGroup = new NioEventLoopGroup();try {ServerBootstrap b = new ServerBootstrap();b.group(bossGroup, workerGroup).channel(NioServerSocketChannel.class).childOption(ChannelOption.TCP_NODELAY, true).childAttr(AttributeKey.newInstance("childAttr"), "childAttrValue").handler(new ServerHandler()).childHandler(new ChannelInitializer<SocketChannel>() {@Overridepublic void initChannel(SocketChannel ch) {}});ChannelFuture f = b.bind(8888).sync();f.channel().closeFuture().sync();} finally {bossGroup.shutdownGracefully();workerGroup.shutdownGracefully();}}
}

对Netty示例代码进行分析:

  1. 定义了两个EventLoopGroup,其中bossGroup对应的就是主线程池,只接收客户端的连接(注册,初始化逻辑),具体的工作由workerGroup这个从线程池来完成。可以理解为老板负责招揽接待,员工负责任务完成。线程池和线程组是一个概念,所以名称里有group。之后就采用ServerBootstrap启动类,传入这两个主从线程组。
  2. 客户端和服务器建立连接后,NIO会在两者之间建立Channel,所以启动类调用channel方法就是为了指定建立什么类型的通道。这里指定的是NioServerSocketChannel这个通道类。
  3. 启动类还调用了handler()和childHandler()方法,这两个方法中提及的handler是一个处理类的概念,他负责处理连接后的一个个通道的相应处理。handler()指定的处理类是主线程池中对通道的处理类,childHandler()方法指定的是从线程池中对通道的处理类。
  4. 执行ServerBootstrap的bind方法进行绑定端口的同时也执行了sync()方法进行同步阻塞调用。
  5. 关闭通道采用Channel的closeFuture()方法关闭。
  6. 最终优雅地关闭两个线程组,执行shutdownGracefully()方法完成关闭线程组。

如果需要在客户端连接前的请求进行handler处理,则需要配置handler();如果是处理客户端连接之后的handler,则需要配置在childHandler()。option和childOption也是一样的道理。

boss线程池作用:

  1. 接收客户端的连接,初始化Channel参数。
  2. 将链路状态变更时间通知给ChannelPipeline。

worker线程池作用:

  1. 异步读取通信对端的数据报,发送读事件到ChannelPipeline。
  2. 异步发送消息到通信对端,调用ChannelPipeline的消息发送接口。
  3. 执行系统调用Task。
  4. 执行定时任务Task。

通过配置boss和worker线程池的线程个数以及是否共享线程池等方式,Netty的线程模型可以在以上三种Reactor模型之间进行切换。

tomcat的线程模型


Tomcat支持四种接收请求的处理方式:BIO、NIO、APR和AIO

  • NIO 同步非阻塞,比传统BIO能更好的支持大并发,tomcat 8.0 后默认采用该模型。 使用方法(配置server.xml):<Connector port="8080" protocol="HTTP/1.1"/> 改为 protocol="org.apache.coyote.http11.Http11NioProtocol"
  • BIO 阻塞式IO,tomcat7之前默认,采用传统的java IO进行操作,该模型下每个请求都会创建一个线程,适用于并发量小的场景。 使用方法(配置server.xml):protocol =" org.apache.coyote.http11.Http11Protocol"
  • APR tomcat 以JNI形式调用http服务器的核心动态链接库来处理文件读取或网络传输操作,需要编译安装APR库。 使用方法(配置server.xml):protocol ="org.apache.coyote.http11.Http11AprProtocol"
  • AIO 异步非阻塞 (NIO2),tomcat8.0后支持。多用于连接数目多且连接比较长(重操作)的架构,比如相册服务器,充分调用OS参与并发操作,编程比较复杂,JDK7开始支持。 使用方法(配置server.xml):protocol ="org.apache.coyote.http11.Http11Nio2Protocol"

Nginx的进程模型


Nginx采用的是多进程(单线程)&多路IO复用模型。

工作模型:

  1. Nginx在启动后,会有一个master进程和多个相互独立的worker进程。
  2. 接收来自外界的信号,向所有worker进程发送信号,每个进程都有可能来处理这个连接。
  3. master进程能监控worker进程的运行状态,当worker进程退出后(异常情况下),会自动启动新的worker进程。

Redis的线程模型


点击查看笔者之前的博客,快速搞懂Redis的线程模型

Swoole的进程模型


点击查看笔者之前的博客,Swoole引擎原理的快速入门干货

更多内容,欢迎关注微信公众号:全菜工程师小辉~

本文分享自微信公众号 - 全菜工程师小辉(mseddl),作者:全菜工程师小辉

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-08-05

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

Reactor模型和Proactor模型:同步IO与异步IO相关推荐

  1. 彻底搞懂Reactor模型和Proactor模型

    在高性能的I/O设计中,有两个著名的模型:Reactor模型和Proactor模型,其中Reactor模型用于同步I/O,而Proactor模型运用于异步I/O操作. 服务端的线程模型 无论是Reac ...

  2. 【多线程】0.理解一下5种IO模型、阻塞IO和非阻塞IO、同步IO和异步IO

    5种IO模型.阻塞IO和非阻塞IO.同步IO和异步IO 看了一些文章,发现有很多不同的理解,可能是因为大家入切的角度.环境不一样.所以,我们先说明基本的IO操作及环境. 本文是在<UNIX网络编 ...

  3. 5种IO模型、阻塞IO和非阻塞IO、同步IO和异步IO

    5种IO模型.阻塞IO和非阻塞IO.同步IO和异步IO 看了一些文章,发现有很多不同的理解,可能是因为大家入切的角度.环境不一样.所以,我们先说明基本的IO操作及环境.本文是在<UNIX网络编程 ...

  4. Linux内存管理之UMA模型和NUMA模型

    1.概述 2. 从 CPU 角度看物理内存模型 内核是以页为基本单位对物理内存进行管理的,每页大小为 4K,在内核中用 struct page 结构体来进行管理,struct page 中封装了每页内 ...

  5. 软件测试:V模型和W模型详解

      软件测试中有W模型和V模型,这是我们在测试过程中经常用到的两个模型,本篇博客我们就一起深入的学习了解这两个模型~ V模型 V模型最早是在20世纪80年代后期提出的,目的是改进软件开发的效率和结果, ...

  6. 情感分析的描述、基于词袋模型和word2vec模型的情感分析实现

    情感分析的描述.基于词袋模型和word2vec模型的情感分析实现 以购物评论为例: # 读入原始数据集 import pandas as pddfpos = pd.read_excel('../dat ...

  7. R语言广义加性模型(GAMs:Generalized Additive Model)建模:数据加载、划分数据、并分别构建线性回归模型和广义线性加性模型GAMs、并比较线性模型和GAMs模型的性能

    R语言广义加性模型(GAMs:Generalized Additive Model)建模:数据加载.划分数据.并分别构建线性回归模型和广义线性加性模型GAMs.并比较线性模型和GAMs模型的性能 目录

  8. utxo模型_什么是UTXO?简析账户/余额模型和UTXO模型

    在比特币社区内,有一种这样的说法:其实并没有比特币,有的只是UTXO.还有一种说法是:如果理解了UTXO,你就理解了比特币. 这两种说法虽然都有不同程度的夸张,但足以体现UTXO之于比特币的重要性.既 ...

  9. 【word2vec】篇三:基于Negative Sampling 的 CBOW 模型和 Skip-gram 模型

    系列文章: [word2vec]篇一:理解词向量.CBOW与Skip-Gram等知识 [word2vec]篇二:基于Hierarchical Softmax的 CBOW 模型和 Skip-gram 模 ...

最新文章

  1. zabbix 安装_zabbix系列(五) Grafana4.6.3+Zabbix 的安装部署
  2. Python培训分享:PyQT是什么?PyQt4和PyQt5的区别是什么?
  3. 北京尚学堂|程序员励志名言
  4. Centos7安装配置Xhgui
  5. 深度探索C++对象模型——关于对象
  6. PS里建立工作路径对话框中的“容差”是干什么的?
  7. 【离散数学】二元运算的性质
  8. 随题而学(二)多维数组转一维数组
  9. lamp 测试mysql_搭建LAMP测试环境
  10. 16 ValidationSummary
  11. 机器学习(统计学习方法)基础知识
  12. Prolog 语言入门教程(转)
  13. AutoCAD快速入门(二十九):视口
  14. seata的部署与微服务集成(包含多集群异地容灾配置)
  15. 抖音xlog算法解密过程
  16. java后台框架 springmvc mybaits 集代码生成器 SSM SSH
  17. ubuntu18.04安装显卡驱动,Anaconda,CUDA,pytorch全套流程
  18. 想做AR/VR相关创新项目,有什么好方向?要怎么做?
  19. MapX研究——MapX核心技术剖析(五)
  20. 8MSaaS PM:如何管理银行项目?

热门文章

  1. String类型直接赋值与构造赋值
  2. 【Java并发编程:volatile关键字之解析】
  3. Java: Number转换为BigDecimal:最好方法
  4. 最优化设置mysql的max_connections
  5. Spring Cloud 知识 思维导图
  6. 随想一·杨柳岸晓风残月
  7. 封装一个类似jquery的ajax方法
  8. RabbitMQ小结
  9. 离散事件模拟(银行业务模拟。实现算法3.6、3.7的程序)
  10. 教你如何打开android4.3和4.4中隐藏的AppOps