转载:http://www.ideawu.net/blog/archives/740.html

著名的 C10K 问题提出的时候, 正是 2001 年, 到如今 12 年后的 2013 年, C10K 已经不是问题了, 任何一个普通的程序员, 都能利用手边的语言和库, 轻松地写出 C10K 的服务器. 这既得益于软件的进步, 也得益于硬件性能的提高.

现在, 该是考虑 C1000K, 也就是百万连接的问题的时候了. 像 Twitter, weibo, Facebook 这些网站, 它们的同时在线用户有上千万, 同时又希望消息能接近实时地推送给用户, 这就需要服务器能维持和上千万用户的 TCP 网络连接, 虽然可以使用成百上千台服务器来支撑这么多用户, 但如果每台服务器能支持一百万连接(C1000K), 那么只需要十台服务器.

有很多技术声称能解决 C1000K 问题, 例如 Erlang, Java NIO 等等, 不过, 我们应该首先弄明白, 什么因素限制了 C1000K 问题的解决. 主要是这几点:

  1. 操作系统能否支持百万连接?

  2. 操作系统维持百万连接需要多少内存?

  3. 应用程序维持百万连接需要多少内存?

  4. 百万连接的吞吐量是否超过了网络限制?

下面来分别对这几个问题进行分析.

1. 操作系统能否支持百万连接?

对于绝大部分 Linux 操作系统, 默认情况下确实不支持 C1000K! 因为操作系统包含最大打开文件数(Max Open Files)限制, 分为系统全局的, 和进程级的限制.

全局限制

在 Linux 下执行:

cat /proc/sys/fs/file-nr

会打印出类似下面的一行输出:

5100  0   101747

第三个数字 101747 就是当前系统的全局最大打开文件数(Max Open Files), 可以看到, 只有 10 万, 所以, 在这台服务器上无法支持 C1000K. 很多系统的这个数值更小, 为了修改这个数值, 用 root 权限修改 /etc/sysctl.conf 文件:

fs.file-max = 1020000
net.ipv4.ip_conntrack_max = 1020000
net.ipv4.netfilter.ip_conntrack_max = 1020000

进程限制

执行:

ulimit -n

输出:

1024

说明当前 Linux 系统的每一个进程只能最多打开 1024 个文件. 为了支持 C1000K, 你同样需要修改这个限制.

临时修改

ulimit -n 1020000

不过, 如果你不是 root, 可能不能修改超过 1024, 会报错:

-bash: ulimit: open files: cannot modify limit: Operation not permitted

永久修改

编辑 /etc/security/limits.conf 文件, 加入如下行:

# /etc/security/limits.conf
work         hard    nofile      1020000
work         soft    nofile      1020000

第一列的 work 表示 work 用户, 你可以填 *, 或者 root. 然后保存退出, 重新登录服务器.

注意: Linux 内核源码中有一个常量(NR_OPEN in /usr/include/linux/fs.h), 限制了最大打开文件数, 如 RHEL 5 是 1048576(2^20), 所以, 要想支持 C1000K, 你可能还需要重新编译内核.

2. 操作系统维持百万连接需要多少内存?

解决了操作系统的参数限制, 接下来就要看看内存的占用情况. 首先, 是操作系统本身维护这些连接的内存占用. 对于 Linux 操作系统, socket(fd) 是一个整数, 所以, 猜想操作系统管理一百万个连接所占用的内存应该是 4M/8M, 再包括一些管理信息, 应该会是 100M 左右. 不过, 还有 socket 发送和接收缓冲区所占用的内存没有分析. 为此, 我写了最原始的 C 网络程序来验证:

服务器

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <errno.h>
#include <arpa/inet.h>
#include <netinet/tcp.h>
#include <sys/select.h>#define MAX_PORTS 10int main(int argc, char **argv){struct sockaddr_in addr;const char *ip = "0.0.0.0";int opt = 1;int bufsize;socklen_t optlen;int connections = 0;int base_port = 7000;if(argc > 2){base_port = atoi(argv[1]);}int server_socks[MAX_PORTS];for(int i=0; i<MAX_PORTS; i++){int port = base_port + i;bzero(&addr, sizeof(addr));addr.sin_family = AF_INET;addr.sin_port = htons((short)port);inet_pton(AF_INET, ip, &addr.sin_addr);int serv_sock;if((serv_sock = socket(AF_INET, SOCK_STREAM, 0)) == -1){goto sock_err;}if(setsockopt(serv_sock, SOL_SOCKET, SO_REUSEADDR, &opt, sizeof(opt)) == -1){goto sock_err;}if(bind(serv_sock, (struct sockaddr *)&addr, sizeof(addr)) == -1){goto sock_err;}if(listen(serv_sock, 1024) == -1){goto sock_err;}server_socks[i] = serv_sock;printf("server listen on port: %d\n", port);}//optlen = sizeof(bufsize);//getsockopt(serv_sock, SOL_SOCKET, SO_RCVBUF, &bufsize, &optlen);//printf("default send/recv buf size: %d\n", bufsize);while(1){fd_set readset;FD_ZERO(&readset);int maxfd = 0;for(int i=0; i<MAX_PORTS; i++){FD_SET(server_socks[i], &readset);if(server_socks[i] > maxfd){maxfd = server_socks[i];}}int ret = select(maxfd + 1, &readset, NULL, NULL, NULL);if(ret < 0){if(errno == EINTR){continue;}else{printf("select error! %s\n", strerror(errno));exit(0);}}if(ret > 0){for(int i=0; i<MAX_PORTS; i++){if(!FD_ISSET(server_socks[i], &readset)){continue;}socklen_t addrlen = sizeof(addr);int sock = accept(server_socks[i], (struct sockaddr *)&addr, &addrlen);if(sock == -1){goto sock_err;}connections ++;printf("connections: %d, fd: %d\n", connections, sock);}}}return 0;
sock_err:printf("error: %s\n", strerror(errno));return 0;
}

注意, 服务器监听了 10 个端口, 这是为了测试方便. 因为只有一台客户端测试机, 最多只能跟同一个 IP 端口创建 30000 多个连接, 所以服务器监听了 10 个端口, 这样一台测试机就可以和服务器之间创建 30 万个连接了.

客户端

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <errno.h>
#include <arpa/inet.h>
#include <netinet/tcp.h>int main(int argc, char **argv){if(argc <=  2){printf("Usage: %s ip port\n", argv[0]);exit(0);}struct sockaddr_in addr;const char *ip = argv[1];int base_port = atoi(argv[2]);int opt = 1;int bufsize;socklen_t optlen;int connections = 0;bzero(&addr, sizeof(addr));addr.sin_family = AF_INET;inet_pton(AF_INET, ip, &addr.sin_addr);char tmp_data[10];int index = 0;while(1){if(++index >= 10){index = 0;}int port = base_port + index;printf("connect to %s:%d\n", ip, port);addr.sin_port = htons((short)port);int sock;if((sock = socket(AF_INET, SOCK_STREAM, 0)) == -1){goto sock_err;}if(connect(sock, (struct sockaddr *)&addr, sizeof(addr)) == -1){goto sock_err;}connections ++;printf("connections: %d, fd: %d\n", connections, sock);if(connections % 10000 == 9999){printf("press Enter to continue: ");getchar();}usleep(1 * 1000);/*bufsize = 5000;setsockopt(serv_sock, SOL_SOCKET, SO_SNDBUF, &bufsize, sizeof(bufsize));setsockopt(serv_sock, SOL_SOCKET, SO_RCVBUF, &bufsize, sizeof(bufsize));*/}return 0;
sock_err:printf("error: %s\n", strerror(errno));return 0;
}

我测试 10 万个连接, 这些连接是空闲的, 什么数据也不发送也不接收. 这时, 进程只占用了不到 1MB 的内存. 但是, 通过程序退出前后的 free 命令对比, 发现操作系统用了 200M(大致)内存来维护这 10 万个连接! 如果是百万连接的话, 操作系统本身就要占用 2GB 的内存! 也即 2KB 每连接.

可以修改

/proc/sys/net/ipv4/tcp_wmem
/proc/sys/net/ipv4/tcp_rmem

来控制 TCP 连接的发送和接收缓冲的大小(多谢 @egmkang).

3. 应用程序维持百万连接需要多少内存?

通过上面的测试代码, 可以发现, 应用程序维持百万个空闲的连接, 只会占用操作系统的内存, 通过 ps 命令查看可知, 应用程序本身几乎不占用内存.

4. 百万连接的吞吐量是否超过了网络限制?

假设百万连接中有 20% 是活跃的, 每个连接每秒传输 1KB 的数据, 那么需要的网络带宽是 0.2M x 1KB/s x 8 = 1.6Gbps, 要求服务器至少是万兆网卡(10Gbps).

总结

Linux 系统需要修改内核参数和系统配置, 才能支持 C1000K. C1000K 的应用要求服务器至少需要 2GB 内存, 如果应用本身还需要内存, 这个要求应该是至少 10GB 内存. 同时, 网卡应该至少是万兆网卡.

当然, 这仅仅是理论分析, 实际的应用需要更多的内存和 CPU 资源来处理业务数据.

参考:

* http://www.cyberciti.biz/faq/linux-increase-the-maximum-number-of-open-files/
* http://www.lognormal.com/blog/2012/09/27/linux-tcpip-tuning/

下一篇: 构建C1000K的服务器(2) – 实现

Related posts:

  1. 要记得清除 sockaddr_in

  2. 构建C1000K的服务器(2) – 实现百万连接的comet服务器

  3. 数据传输中的停止等待机制的实现

  4. Libevent 2 HTTP 客户端示例

  5. 有趣的 main 函数参数

Posted by ideawu at 2013-09-16 22:01:16 Tags: C1000K, 高并发

转载于:https://blog.51cto.com/mengphilip/1686593

2013-09-16 构建C1000K的服务器(1) – 基础相关推荐

  1. 【转】构建C1000K的服务器(1) – 基础

    原文来自 ideawu 构建C1000K的服务器(1) – 基础 著名的 C10K 问题提出的时候, 正是 2001 年, 到如今 12 年后的 2013 年, C10K 已经不是问题了, 任何一个普 ...

  2. 构建C1000K的服务器(1) – 基础

    原文地址:http://www.ideawu.net/blog/archives/740.html 著名的 C10K 问题提出的时候, 正是 2001 年, 到如今 12 年后的 2013 年, C1 ...

  3. 当前你所在的服务器更新维护尚未完成,我们将于01月16日09:00-13:00对所有服务器进行更...

    该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 我们将于01月16日09:00-13:00对所有服务器进行更新维护,在此期间无法登录游戏,给大家带来的不便我们深表歉意. - 新武器 炼狱双刃(密码箱/活 ...

  4. c1000k 高性能服务器构建技术,C1000K高性能服务器构建技术.ppt

    C1000K高性能服务器构建技术.ppt 还剩 50页未读, 继续阅读 下载文档到电脑,马上远离加班熬夜! 亲,很抱歉,此页已超出免费预览范围啦! 如果喜欢就下载吧,价低环保! 内容要点: C1000 ...

  5. c1000k 高性能服务器构建技术,C1000K高性能服务器构建技术 (52页)-原创力文档...

    C1000K高性能服务器构建技术;C1000K面对的挑战;解决方案;Agenda;Dell R710机器;硬件体系巨大变化;Cache在现代CPU硬件上的版面, 也充分说明了cache的重要性;9.要 ...

  6. java centos 缩略图_使用 Nginx 的 image_filter 模块来构建动态缩略图服务器

    原标题:使用 Nginx 的 image_filter 模块来构建动态缩略图服务器 在以前我们实现缩略图机制通常是在当用户上传一张图片后,后端程序会固定将图片生成前端页面需要的不同大小缩略图.不管前端 ...

  7. RHEL5 下使用syslog-ng构建集中型日志服务器

    RHEL5 下使用syslog-ng构建集中型日志服务器 在生产环境中,存在一台日志服务器,专门用来记录其他服务器的日志信息是个很好的主意,不过用红帽自带的syslog,配置虽然简单,但是日志却没有办 ...

  8. LEMP构建高性能WEB服务器(第三版)

    LEMP 自动化编译脚本下载:http://docs.linuxtone.org/autoinstall/ (定期更新,欢迎多测试,找bug) 介绍参考:http://bbs.linuxtone.or ...

  9. 计算机系统招标范围,信息化系统招标文件(2015.09.16最终稿1).doc

    信息化系统招标文件(2015.09.16最终稿1) 鸡西市.七台河市供水(干线)工程 联合调度与运行管理决策支持系统 招标设计 技术规范 水利水电勘测设计研究院 二○一五年九月 目 录 1 工程概况1 ...

  10. 基于 openEuler 22.09 版本构建的 NestOS 全新发布

    2022 年 9 月,在麒麟软件和欧拉开源社区开发者的共同努力下,基于 openEuler 22.09 版本构建的 NestOS 全新发布!大家可在 NestOS 官网获取镜像(nestos.open ...

最新文章

  1. 图灵2010.02书讯
  2. 为什么磁场强度大了呢?
  3. 将 Shiro 作为应用的权限基础 五:密码的加密/解密在Spring中的应用
  4. 不是linux内核的国产系统,国产操作系统都是山寨Windows的?为何用Linux内核?
  5. sql的加减乘除运算_小白学sql(一)
  6. 全国计算机等级考试题库二级C操作题100套(第04套)
  7. sql多表查询之一:Where 和 On的秘密
  8. 程序win10_win10该文件没有与之关联的程序来执行操作
  9. js学习小计6-慎用return false;
  10. JAVA前三章预习总结
  11. 网卡驱动程序问题---电脑自己没操作,突然连不上网
  12. 「小程序JAVA实战」小程序页面的上拉下拉刷新(50)
  13. 807. 区间求和(acwing水题记)
  14. 功率因素校正(PFC)技术!
  15. 华为云webSDK说明文档
  16. 稻盛和夫「活法」| 读书笔记系列01
  17. 内存、外存、硬盘、磁盘、闪存,傻傻分不清?
  18. window 下使用typo3 neos 和 flows
  19. ob集群安装部署相关
  20. 客户端数字证书申请指南、安装指南和备份指南

热门文章

  1. 常用测试用例设计方法
  2. python程序如何发布
  3. 调制方式性能比较--BER,频带效率的极限
  4. 百度地图开发android开发,android的百度地图开发(一)
  5. Cost Function of Support Vector Machine
  6. Tool-X:在AndroidUbuntu平台安装Kali的各种小工具
  7. Raki的读paper小记:LOOKING BACK ON LEARNED EXPERIENCES FOR CLASS/TASK INCREMENTAL LEARNING
  8. linux开发读取外部存储,Android 获取外接储存的设备路径(如挂载的U盘),android挂载...
  9. arcgis自带的python版本_arcgis10.3自带的python2.7.8怎么安装geopandas?
  10. 互联网时代的了解和未来的预期_互联网时代的四个特点你了解多少?