三年来一直从事服务器程序开发,一直都是忙忙碌碌,不久前结束了职业生涯的第一份工作,有了一个礼拜的休息时间,终于可以写写总结了。于是把以前的开源代码做了整理和优化,这就是FFLIB。虽然这边总结看起来像日记,有很多废话,但是此文仍然是有很大针对性的。针对服务器开发中常见的问题,如多线程并发、消息转发、异步、性能优化、单元测试,提出自己的见解。

面对的问题

从事开发工程中,遇到过不少问题,很多时候由于时间紧迫,没有使用优雅的方案。在跟业内的一些朋友交流过程中,我也意识到有些问题是大家都存在的。简单列举如下:

  • 多线程与并发
  • 异步消息/接口调用
  • 消息的序列化与Reflection
  • 性能优化
  • 单元测试

多线程与并发

现在是多核时代,并发才能实现更高的吞吐量、更快的响应,但也是把双刃剑。总结如下几个用法:

  • 多线程+显示锁;接口是被多线程调用的,当被调用时,显示加锁,再操作实体数据。悲剧的是,工程师为了优化会设计多个锁,以减少锁的粒度,甚至有些地方使用了原子操作。这些都为领域逻辑增加了额外的设计负担。最坏的情况是会出现死锁。
  • 多线程+任务队列;接口被多线程调用,但请求会被暂存到任务队列,而任务队列会被单线程不断执行,典型生产者消费者模式。它的并发在于不同的接口可以使用不同的任务队列。这也是我最常用的并发方式。

  这是两种最常见的多线程并发,它们有个天生的缺陷——Scalability。一个机器的性能总是有瓶颈的。两个场景的逻辑虽然由多个线程实现了并发,但是运算量十分有可能是一台机器无法承载的。如果是多进程并发,那么可以分布式把其部署到其他机器(也可部署在一台机器)。所以多进程并发比多线程并发更加Scalability。另外采用多进程后,每个进程单线程设计,这样的程序更加Simplicity。多进程的其他优点如解耦、模块化、方便调试、方便重用等就不赘言了。

异步消息/接口调用

提到分布式,就要说一下分布式的通讯技术。常用的方式如下:

  • 类RPC;包括WebService、RPC、ICE等,特点是远程同步调用。远程的接口和本地的接口非常相似。但是游戏服务器程序一般非常在意延迟和吞吐量,所以这些阻塞线程的同步远程调用方式并不常用。但是我们必须意识到他的优点,就是非常利于调用和测试。
  • 全异步消息;当调用远程接口的时候,异步发送请求消息,接口响应后返回一个结果消息,调用方的回调函数处理结果消息继续逻辑操作。所以有些逻辑就会被切割成ServiceStart和ServiceCallback两段。有时异步会讲领域逻辑变得支离破碎。另外消息处理函数中一般会写一坨的switch/case 处理不同的消息。最大的问题在于单元测试,这种情况传统单元测试根本束手无策。

消息的序列化与Reflection

实现消息的序列化和反序列化的方式有很多,常见的有Struct、json、Protobuff等都有很成功的应用。我个人倾向于使用轻量级的二进制序列化,优点是比较透明和高效,一切在掌握之中。在FFLIB 中实现了bin_encoder_t 和 bin_decoder_t 轻量级的消息序列化,几十行代码而已。

性能优化

已经写过关于性能方面的总结,参见

http://www.cnblogs.com/zhiranok/archive/2012/06/06/cpp_perf.html

     有的网友提到profiler、cpuprofiler、callgrind等工具。这些工具我都使用过,说实话,对于我来说,我太认同它有很高的价值。第一他们只能用于开发测试阶段,可以初步得到一些性能上参考数据。第二它们如何实现跟踪人们无从得知。运行其会使程序变慢,不能反映真实数据。第三重要的是,开发测试阶段性能和上线后的能一样吗?Impossible !

     关于性能,原则就是数据说话,详见博文,不在赘述。

单元测试

关于单元测试,前边已经谈论了一些。游戏服务器程序一般都比较庞大,但是不可思议的是,鄙人从来没见有项目(c++ 后台架构的)有完整单元测试的。由于存在着异步和多线程,传统的单元测试框架无法胜任,而开发支持异步的测试框架又是不现实的。我们必须看到的是,传统的单元测试框架已经取得了非常大的成功。据我了解,使用web 架构的游戏后台已经对于单元测试的使用已经非常成熟,取得了极其好的效果。所以我的思路是利用现有的单元测试框架,将异步消息、多线程的架构做出调整。

已经多次谈论单元测试了。其实在开发FFLIB的思路很大程度来源于此,否则可能只是一个c++ 网络库而已。我决定尝试去解决这个问题的时候,把FFLIB 定位于框架。

先来看一段非常简单的单元测试的代码 :

Assert(2 == Add(1, 1));

请允许我对这行代码做些解释,对Add函数输入参数,验证返回值是否是预期的结果。这不就是单元测试的本质吗?在想一下我们异步发送消息的过程,如果每个输入消息约定一个结果消息包,每次发送请求时都绑定一个回调函数接收和验证结果消息包。这样的话就恰恰满足了传统单元测试的步骤了。最后还需解决一个问题,Assert是不能处理异步的返回值的。幸运的是,future机制可以化异步为同步。不了解future 模式的可以参考这里:

http://blog.chinaunix.net/uid-23093301-id-190969.html

http://msdn.microsoft.com/zh-cn/library/dd764564.aspx#Y300

来看一下在FFLIB框架下远程调用echo 服务的示例:

struct lambda_t
{static void callback(echo_t::out_t& msg_){echo_t::in_t in;in.value = "XXX_echo_test_XXX";singleton_t<msg_bus_t>::instance().get_service_group("echo")->get_service(1)->async_call(in, &lambda_t::callback);}
};
echo_t::in_t in;in.value = "XXX_echo_test_XXX";
singleton_t<msg_bus_t>::instance().get_service_group("echo")->get_service(1)->async_call(in, &lambda_t::callback);

  当需要调用远程接口时,async_call(in, &lambda_t::callback); 异步调用必须绑定一个回调函数,回调函数接收结果消息,可以触发后续操作。这样的话,如果对echo 的远程接口做单元测试,可以这样做:

rpc_future_t< echo_t::out_t> rpc_future;
echo_t::in_t in;
in.value = "XXX_echo_test_XXX";
const echo_t::out_t& out = rpc_future.call(singleton_t<msg_bus_t>::instance().get_service_group("echo")->get_service(1), in);
Assert(in.value == out.value);
这样所有的远程接口都可以被单元测试覆盖。

FFLIB 介绍

FFLIB 结构图

如图所示,Client 不会直接和Service 相连接,而是通过Broker 中间层完成了消息传递。关于Broker 模式可以参见:http://blog.chinaunix.net/uid-23093301-id-90459.html

   进程间通信采用TPC,而不是多线程使用的共享内存方式。Service 一般是单线程架构的,通过启动多进程实现相对于多线程的并发。由于Broker模式天生石分布式的,所以有很好的Scalability。

消息时序图

如何注册服务和接口

  来看一下Echo 服务的实现:

struct echo_service_t
{
public:void echo(echo_t::in_t& in_msg_, rpc_callcack_t<echo_t::out_t>& cb_){logtrace((FF, "echo_service_t::echo done value<%s>", in_msg_.value.c_str()));echo_t::out_t out;out.value = in_msg_.value;cb_(out);}
};int main(int argc, char* argv[])
{int g_index = 1;if (argc > 1){g_index = atoi(argv[1]);}char buff[128];snprintf(buff, sizeof(buff), "tcp://%s:%s", "127.0.0.1", "10241");msg_bus_t msg_bus;assert(0 == singleton_t<msg_bus_t>::instance().open("tcp://127.0.0.1:10241") && "can't connnect to broker");echo_service_t f;singleton_t<msg_bus_t>::instance().create_service_group("echo");singleton_t<msg_bus_t>::instance().create_service("echo", g_index).bind_service(&f).reg(&echo_service_t::echo);signal_helper_t::wait();singleton_t<msg_bus_t>::instance().close();//usleep(1000);cout <<"\noh end\n";return 0;
}
  • create_service_group 创建一个服务group,一个服务组可能有多个并行的实例
  • create_service 以特定的id 创建一个服务实例
  • reg 为该服务注册接口
  • 接口的定义规范为void echo(echo_t::in_t& in_msg_, rpc_callcack_t<echo_t::out_t>& cb_),第一个参数为输入的消息struct,第二个参数为回调函数的模板特例,模板参数为返回消息的struct 类型。接口无需知道发送消息等细节,只需将结果callback 即可。
  • 注册到Broker 后,所有Client都可获取该服务

消息定义的规范

我们约定每个接口(远程或本地都应满足)都包含一个输入消息和一个结果消息。来看一下echo 服务的消息定义:

struct echo_t
{struct in_t: public msg_i{in_t():msg_i("echo_t::in_t"){}virtual string encode(){return (init_encoder() << value).get_buff();}virtual void decode(const string& src_buff_){init_decoder(src_buff_) >> value;}string value;};struct out_t: public msg_i{out_t():msg_i("echo_t::out_t"){}virtual string encode(){return (init_encoder() << value).get_buff();}virtual void decode(const string& src_buff_){init_decoder(src_buff_) >> value;}string value;};
};
  • 每个接口必须包含in_t消息和out_t消息,并且他们定义在接口名(如echo _t)的内部
  • 所有消息都继承于msg_i, 其封装了二进制的序列化、反序列化等。构造时赋予类型名作为消息的名称。
  • 每个消息必须实现encode 和 decode 函数

  这里需要指出的是,FFLIB 中不需要为每个消息定义对应的CMD。当接口如echo向Broker 注册时,reg接口通过C++ 模板的类型推断会自动将该msg name 注册给Broker, Broker为每个msg name 分配唯一的msg_id。Msg_bus 中自动维护了msg_name 和msg_id 的映射。Msg_i 的定义如下:

struct msg_i : public codec_i
{msg_i(const char* msg_name_):cmd(0),uuid(0),service_group_id(0),service_id(0),msg_id(0),msg_name(msg_name_){}void set(uint16_t group_id, uint16_t id_, uint32_t uuid_, uint16_t msg_id_){service_group_id = group_id;service_id       = id_;uuid             = uuid_;msg_id           = msg_id_;}uint16_t cmd;uint16_t get_group_id()   const{ return service_group_id; }uint16_t get_service_id() const{ return service_id;       }uint32_t get_uuid()       const{ return uuid;             }uint16_t get_msg_id()     const{ return msg_id;           }const string& get_name()  const{if (msg_name.empty() == false){return msg_name;}return singleton_t<msg_name_store_t>::instance().id_to_name(this->get_msg_id());}void     set_uuid(uint32_t id_)   { uuid = id_;  }void     set_msg_id(uint16_t id_) { msg_id = id_;}void     set_sgid(uint16_t sgid_) { service_group_id = sgid_;}void     set_sid(uint16_t sid_)   { service_id = sid_; }uint32_t uuid;uint16_t service_group_id;uint16_t service_id;uint16_t msg_id;string   msg_name;virtual string encode(uint16_t cmd_){this->cmd = cmd_;return encode();}virtual string encode() = 0;bin_encoder_t& init_encoder(){return encoder.init(cmd)  << uuid << service_group_id << service_id<< msg_id;}bin_encoder_t& init_encoder(uint16_t cmd_){return encoder.init(cmd_) << uuid << service_group_id << service_id << msg_id;}bin_decoder_t& init_decoder(const string& buff_){return decoder.init(buff_) >> uuid >> service_group_id >> service_id >> msg_id;}bin_decoder_t decoder;bin_encoder_t encoder;
};

关于性能

由于远程接口的调用必须通过Broker, Broker会为每个接口自动生成性能统计数据,并每10分钟输出到perf.txt 文件中。文件格式为CSV,参见:

http://www.cnblogs.com/zhiranok/archive/2012/06/06/cpp_perf.html

总结

FFLIB框架拥有如下的特点:

  • 使用多进程并发。Broker 把Client 和Service 的位置透明化
  • Service 的接口要注册到Broker, 所有连接Broker的Client 都可以调用(publisher/ subscriber)
  • 远程调用必须绑定回调函数
  • 利用future 模式实现同步,从而支持单元测试
  • 消息定义规范简单直接高效
  • 所有service的接口性能监控数据自动生成,免费的午餐
  • Service 单线程话,更simplicity

源代码:

Svn co http://ffown.googlecode.com/svn/trunk/

运行示例:

  • Cd example/broker && make && ./app_broker –l http://127.0.0.1:10241
  • Cd example/echo_server && make && ./app_echo_server
  • Cd example/echo_client && make && ./app_echo_client

相关连接

  1. 文档 http://h2cloud.org
  2. 源码 https://github.com/fanchy/h2engine
  3. 介绍 http://www.cnblogs.com/zhiranok/p/ffengine.html

C++多进程并发框架FFLIB相关推荐

  1. Python Gevent – 高性能的 Python 并发框架

    From:http://www.xuebuyuan.com/1604603.html Gevent 指南(英文):http://sdiehl.github.io/gevent-tutorial Gev ...

  2. #Python3中tornado高并发框架

    Python3中tornado高并发框架 简介: Tornado是一种 Web 服务器软件的开源版本.Tornado 和现在的主流 Web 服务器框架(包括大多数 Python 的框架)有着明显的区别 ...

  3. 计算机网络套接字编程实验-TCP多进程并发服务器程序与单进程客户端程序(简单回声)

    1.实验系列 ·Linux NAP-Linux网络应用编程系列 2.实验目的 ·理解多进程(Multiprocess)相关基本概念,理解父子进程之间的关系与差异,熟练掌握基于fork()的多进程编程模 ...

  4. python 进程池 freeze_support_Python 多进程并发操作中进程池Pool的实例

    在利用Python进行系统管理的时候,特别是同时操作多个文件目录,或者远程控制多台主机,并行操作可以节约大量的时间.当被操作对象数目不大时,可以直接利用multiprocessing中的Process ...

  5. java并发框架支持锁包括,tip/面试题_并发与多线程.md at master · 171437912/tip · GitHub...

    01. java用()机制实现了进程之间的同步执行 A. 监视器 B. 虚拟机 C. 多个CPU D. 异步调用 正解: A 解析: 监视器机制即锁机制 02. 线程安全的map在JDK 1.5及其更 ...

  6. java的并发框架_java并发框架有哪些

    展开全部 Java并发框架java.util.concurrent是JDK5中引入到标准库中的(采用的32313133353236313431303231363533e78988e69d8331333 ...

  7. C语言并发执行的进程怎么写,多进程并发写文件 多进程并发售票 用c语言写

    tcp多进程并发文件服务器代码? 线程是相对独立的执行单位,是计算机系统进行调度的最小单位,其切换由操作系统控制,称之为短作业调度.换句话说您没有任何必要去手动调度线程.如果您想要实现的是连接分配的话 ...

  8. centos 并发请求数_Linux Shell多进程并发以及并发数控制

    本文小编为大家详细的讲解shell多进程并发,在大部分用户眼中,所谓的多进程 只不过是将多个任务放到后台执行而已,一起来看看吧具体的内容吧. 1. 基础知识准备 1.1. linux后台进程 Unix ...

  9. Java 并发框架全览,这个牛逼!

    来自:唐尤华 https://dzone.com/articles/a-birds-eye-view-on-java-concurrency-frameworks-1 1. 为什么要写这篇文章 几年前 ...

最新文章

  1. python编程爱心-520用Python画一颗特别的爱心送给她
  2. python画图代码turtle-介绍下Python里自带的一个有趣画图模块库:Turtle库
  3. Spring Boot Spring MVC异常处理原理分析
  4. Java中的Atomic包使用指南
  5. 点击图片放大至原始图片大小
  6. Python——Python3.6.0+Scrapy安装方法(总算没有bug了)
  7. 杭电4502吉哥系列故事——临时工计划
  8. 精心整理的十个必须要知道CSS+DIV技巧
  9. HashTable源码简单介绍
  10. IT江湖之怎样成为IT界的西门吹雪和独孤求败
  11. clickhouse-client命令行参数及常用案例
  12. 杀计算机病毒软件的的使用方法,查杀电脑病毒的方法步骤
  13. 第二章:真分数理论(真分数模型:概念、假设、平行测验)
  14. 结构作为函数参数要注意什么_为什么要重视间架结构
  15. 挖掘Dark Sky Maps(热的要死后,疯传的一个气温地图网站)
  16. 北风:头条号自媒体平台怎么运营赚钱?
  17. 筑梦数字时代,城链科技战略峰会西安站顺利落幕
  18. linux如何在文件末尾添加空行,如何在文件末尾添加换行符?
  19. HBase入门到精通——培训资料分享
  20. 华为云确定性运维,为政务云平台稳定可靠运行保驾护航

热门文章

  1. 为什么程序员的社会地位不高?
  2. android蓝光播放器,安卓播放器真的拥有完美的蓝光原盘菜单导航吗?我来测试下...
  3. eclipse lombok 标红_无法使Lombok项目在Eclipse上运行
  4. 寄存器分配图着色_【02】从零开始的卡通渲染-着色篇1
  5. 摇杆控制LED灯的亮度
  6. 师弟新作 | NBT:王运浩、区健辉等综述纳米孔测序技术
  7. RFE筛选出的特征变量竟然是Boruta的4倍之多
  8. android 热修复 需要重启应用嘛?_Android热修复方案盘点
  9. python计算选手最后得分并取出前三名_MySQL中查询获取每个班级成绩前三名的学生信息...
  10. 华为 HarmonyOS2.0(鸿蒙OS) 开发者beta公测招募的报名流程