Socket 在英文中的含义为“(连接两个物品的)凹槽”,像the eye socket,意为“眼窝”,此外还有“插座”的意思。在计算机科学中,socket 通常是指一个连接的两个端点,这里的连接可以是同一机器上的,像unix domain socket,也可以是不同机器上的,像network socket。

本文着重介绍现在用的最多的 network socket,包括其在网络模型中的位置、API 的编程范式、常见错误等方面,最后用 Python 语言中的 socket API 实现几个实际的例子。Socket 中文一般翻译为“套接字”,不得不说这是个让人摸不着头脑的翻译,我也没想到啥“信达雅”的翻译,所以本文直接用其英文表述。本文中所有代码均可在 socket.py 仓库中找到。

概述

Socket 作为一种通用的技术规范,首次是由 Berkeley 大学在 1983 为 4.2BSD Unix 提供的,后来逐渐演化为 POSIX 标准。Socket API 是由操作系统提供的一个编程接口,让应用程序可以控制使用 socket 技术。Unix 哲学中有一条一切皆为文件,所以 socket 和file 的 API 使用很类似:可以进行read、write、open、close等操作。

现在的网络系统是分层的,理论上有OSI模型,工业界有TCP/IP协议簇。其对比如下:

每层上都有其相应的协议,socket API 不属于TCP/IP协议簇,只是操作系统提供的一个用于网络编程的接口,工作在应用层与传输层之间:

我们平常浏览网站所使用的http协议,收发邮件用的smtp与imap,都是基于 socket API 构建的。

一个 socket,包含两个必要组成部分:

  1. 地址,由 ip 与 端口组成,像192.168.0.1:80。
  2. 协议,socket 所是用的传输协议,目前有三种:TCP、UDP、raw IP。

地址与协议可以确定一个socket;一台机器上,只允许存在一个同样的socket。TCP 端口 53 的 socket 与 UDP 端口 53 的 socket 是两个不同的 socket。

根据 socket 传输数据方式的不同(使用协议不同),可以分为以下三种:

  1. Stream sockets,也称为“面向连接”的 socket,使用 TCP 协议。实际通信前需要进行连接,传输的数据没有特定的结构,所以高层协议需要自己去界定数据的分隔符,但其优势是数据是可靠的。
  2. Datagram sockets,也称为“无连接”的 socket,使用 UDP 协议。实际通信前不需要连接,一个优势时 UDP 的数据包自身是可分割的(self-delimiting),也就是说每个数据包就标示了数据的开始与结束,其劣势是数据不可靠。
  3. Raw sockets,通常用在路由器或其他网络设备中,这种 socket 不经过TCP/IP协议簇中的传输层(transport layer),直接由网络层(Internet layer)通向应用层(Application layer),所以这时的数据包就不会包含 tcp 或 udp 头信息。

Python socket API

Python 里面用(ip, port)的元组来表示 socket 的地址属性,用AF_*来表示协议类型。

数据通信有两组动词可供选择:send/recv 或 read/write。read/write 方式也是 Java 采用的方式,这里不会对这种方式进行过多的解释,但是需要注意的是:

read/write 操作的具有 buffer 的“文件”,所以在进行读写后需要调用flush方法去真正发送或读取数据,否则数据会一直停留在缓冲区内。

TCP socket

TCP socket 由于在通向前需要建立连接,所以其模式较 UDP socket 负责些。具体如下:

每个API 的具体含义这里不在赘述,可以查看手册,这里给出 Python 语言的实现的 echo server。

  1. # echo_server.py
  2. # coding=utf8
  3. import socket
  4. sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
  5. # 设置 SO_REUSEADDR 后,可以立即使用 TIME_WAIT 状态的 socket
  6. sock.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)
  7. sock.bind(('', 5500))
  8. sock.listen(5)
  1. def handler(client_sock, addr):
  2. print('new client from %s:%s' % addr)
  3. msg = client_sock.recv(1024)
  4. client_sock.send(msg)
  5. client_sock.close()
  6. print('client[%s:%s] socket closed' % addr)
  7. if __name__ == '__main__':
  8. while 1:
  9. client_sock, addr = sock.accept()
  10. handler(client_sock, addr)
  1. # echo_client.py
  2. # coding=utf8
  3. import socket
  4. sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
  5. sock.connect(('', 5500))
  6. sock.send('hello socket world')
  7. print sock.recv(1024)

上面简单的echo server 代码中有一点需要注意的是:server 端的 socket 设置了SO_REUSEADDR为1,目的是可以立即使用处于TIME_WAIT状态的socket,那么TIME_WAIT又是什么意思呢?后面在讲解 tcp 状态变更图时再做详细介绍。

UDP socket

UDP socket server 端代码在进行bind后,无需调用listen方法。

  1. # udp_echo_server.py
  2. # coding=utf8
  3. import socket
  4. sock = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
  5. # 设置 SO_REUSEADDR 后,可以立即使用 TIME_WAIT 状态的 socket
  6. sock.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)
  7. sock.bind(('', 5500))
  8. # 没有调用 listen
  9. if __name__ == '__main__':
  10. while 1:
  11. data, addr = sock.recvfrom(1024)
  12. print('new client from %s:%s' % addr)
  13. sock.sendto(data, addr)
  14. # udp_echo_client.py
  15. # coding=utf8
  16. import socket
  17. udp_server_addr = ('', 5500)
  18. if __name__ == '__main__':
  19. sock = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
  20. data_to_sent = 'hello udp socket'
  21. try:
  22. sent = sock.sendto(data_to_sent, udp_server_addr)
  23. data, server = sock.recvfrom(1024)
  24. print('receive data:[%s] from %s:%s' % ((data,) + server))
  25. finally:
  26. sock.close()

常见陷阱

忽略返回值

本文中的 echo server 示例因为篇幅限制,也忽略了返回值。网络通信是个非常复杂的问题,通常无法保障通信双方的网络状态,很有可能在发送/接收数据时失败或部分失败。所以有必要对发送/接收函数的返回值进行检查。本文中的 tcp echo client 发送数据时,正确写法应该如下:

  1. total_send = 0
  2. content_length = len(data_to_sent)
  3. while total_send < content_length:
  4. sent = sock.send(data_to_sent[total_send:])
  5. if sent == 0:
  6. raise RuntimeError("socket connection broken")
  7. total_send += total_send + sent

send/recv操作的是网络缓冲区的数据,它们不必处理传入的所有数据。

一般来说,当网络缓冲区填满时,send函数就返回了;当网络缓冲区被清空时,recv 函数就返回。

当 recv 函数返回0时,意味着对端已经关闭。

可以通过下面的方式设置缓冲区大小。

  1. s.setsockopt(socket.SOL_SOCKET, socket.SO_SNDBUF, buffer_size)

认为 TCP 具有 framing

TCP 不提供 framing,这使得其很适合于传输数据流。这是其与 UDP 的重要区别之一。UDP 是一个面向消息的协议,能保持一条消息在发送者与接受者之间的完备性。

代码示例参考:framing_assumptions

TCP 的状态机

在前面echo server 的示例中,提到了TIME_WAIT状态,为了正式介绍其概念,需要了解下 TCP 从生成到结束的状态机器。(图片来源)

这个状图转移图非常非常关键,也比较复杂,我自己为了方便记忆,对这个图进行了拆解,仔细分析这个图,可以得出这样一个结论,连接的打开与关闭都有被动(passive)与主动(active)两种,主动关闭时,涉及到的状态转移最多,包括FIN_WAIT_1、FIN_WAIT_2、CLOSING、TIME_WAIT。

此外,由于 TCP 是可靠的传输协议,所以每次发送一个数据包后,都需要得到对方的确认(ACK),有了上面这两个知识后,再来看下面的图:(图片来源)

  1. 在主动关闭连接的 socket 调用 close方法的同时,会向被动关闭端发送一个 FIN
  2. 对端收到FIN后,会向主动关闭端发送ACK进行确认,这时被动关闭端处于 CLOSE_WAIT 状态
  3. 当被动关闭端调用close方法进行关闭的同时向主动关闭端发送 FIN 信号,接收到 FIN 的主动关闭端这时就处于 TIME_WAIT 状态
  4. 这时主动关闭端不会立刻转为 CLOSED 状态,而是需要等待 2MSL(max segment life,一个数据包在网络传输中最大的生命周期),以确保被动关闭端能够收到最后发出的 ACK。如果被动关闭端没有收到最后的 ACK,那么被动关闭端就会重新发送 FIN,所以处于TIME_WAIT的主动关闭端会再次发送一个 ACK 信号,这么一来(FIN来)一回(ACK),正好是两个 MSL 的时间。如果等待的时间小于 2MSL,那么新的socket就可以收到之前连接的数据。

前面 echo server 的示例也说明了,处于 TIME_WAIT 并不是说一定不能使用,可以通过设置 socket 的 SO_REUSEADDR 属性以达到不用等待 2MSL 的时间就可以复用socket 的目的,当然,这仅仅适用于测试环境,正常情况下不要修改这个属性。

实战

HTTP UA

http 协议是如今万维网的基石,可以通过 socket API 来简单模拟一个浏览器(UA)是如何解析 HTTP 协议数据的。

  1. #coding=utf8
  2. import socket
  3. sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
  4. baidu_ip = socket.gethostbyname('baidu.com')
  5. sock.connect((baidu_ip, 80))
  6. print('connected to %s' % baidu_ip)
  7. req_msg = [
  8. 'GET / HTTP/1.1',
  9. 'User-Agent: curl/7.37.1',
  10. 'Host: baidu.com',
  11. 'Accept: */*',
  12. ]
  13. delimiter = '\r\n'
  14. sock.send(delimiter.join(req_msg))
  15. sock.send(delimiter)
  16. sock.send(delimiter)
  17. print('%sreceived%s' % ('-'*20, '-'*20))
  18. http_response = sock.recv(4096)
  19. print(http_response)

运行上面的代码可以得到下面的输出

  1. --------------------received--------------------
  2. HTTP/1.1 200 OK
  3. Date: Tue, 01 Nov 2016 12:16:53 GMT
  4. Server: Apache
  5. Last-Modified: Tue, 12 Jan 2010 13:48:00 GMT
  6. ETag: "51-47cf7e6ee8400"
  7. Accept-Ranges: bytes
  8. Content-Length: 81
  9. Cache-Control: max-age=86400
  10. Expires: Wed, 02 Nov 2016 12:16:53 GMT
  11. Connection: Keep-Alive
  12. Content-Type: text/html
  13. <html>
  14. <meta http-equiv="refresh" content="0;url=http://www.baidu.com/">
  15. </html>

http_response是通过直接调用recv(4096)得到的,万一真正的返回大于这个值怎么办?我们前面知道了 TCP 协议是面向流的,它本身并不关心消息的内容,需要应用程序自己去界定消息的边界,对于应用层的 HTTP 协议来说,有几种情况,最简单的一种时通过解析返回值头部的Content-Length属性,这样就知道body的大小了,对于 HTTP 1.1版本,支持Transfer-Encoding: chunked传输,对于这种格式,这里不在展开讲解,大家只需要知道, TCP 协议本身无法区分消息体就可以了。对这块感兴趣的可以查看 CPython 核心模块 http.client

Unix_domain_socket

UDS 用于同一机器上不同进程通信的一种机制,其API适用与 network socket 很类似。只是其连接地址为本地文件而已。

代码示例参考:uds_server.py、uds_client.py

ping

ping 命令作为检测网络联通性最常用的工具,其适用的传输协议既不是TCP,也不是 UDP,而是 ICMP,利用 raw sockets,我们可以适用纯 Python 代码来实现其功能。

代码示例参考:ping.py

netstat vs ss

netstat 与 ss 是类 Unix 系统上查看 Socket 信息的命令。netstat 是比较老牌的命令,我常用的选择有

  • -t,只显示 tcp 连接
  • -u,只显示 udp 连接
  • -n,不用解析hostname,用 IP 显示主机,可以加快执行速度
  • -p,查看连接的进程信息
  • -l,只显示监听的连接

ss 是新兴的命令,其选项和 netstat 差不多,主要区别是能够进行过滤(通过state与exclude关键字)。

  1. $ ss -o state time-wait -n | head
  2. Recv-Q Send-Q             Local Address:Port               Peer Address:Port
  3. 0      0                 10.200.181.220:2222              10.200.180.28:12865  timer:(timewait,33sec,0)
  4. 0      0                      127.0.0.1:45977                 127.0.0.1:3306   timer:(timewait,46sec,0)
  5. 0      0                      127.0.0.1:45945                 127.0.0.1:3306   timer:(timewait,6.621ms,0)
  6. 0      0                 10.200.181.220:2222              10.200.180.28:12280  timer:(timewait,12sec,0)
  7. 0      0                 10.200.181.220:2222              10.200.180.28:35045  timer:(timewait,43sec,0)
  8. 0      0                 10.200.181.220:2222              10.200.180.28:42675  timer:(timewait,46sec,0)
  9. 0      0                      127.0.0.1:45949                 127.0.0.1:3306   timer:(timewait,11sec,0)
  10. 0      0                      127.0.0.1:45954                 127.0.0.1:3306   timer:(timewait,21sec,0)
  11. 0      0               ::ffff:127.0.0.1:3306           ::ffff:127.0.0.1:45964  timer:(timewait,31sec,0)

这两个命令更多用法可以参考:

  • SS Utility: Quick Intro
  • 10 basic examples of linux netstat command

总结

我们的生活已经离不开网络,平时的开发也充斥着各种复杂的网络应用,从最基本的数据库,到各种分布式系统,不论其应用层怎么复杂,其底层传输数据的的协议簇是一致的。Socket 这一概念我们很少直接与其打交道,但是当我们的系统出现问题时,往往是对底层的协议认识不足造成的,希望这篇文章能对大家编程网络方面的程序有所帮助。

作者:jiacai2050

来源:51CTO

Socket编程实战相关推荐

  1. Socket 编程实战

    为什么80%的码农都做不了架构师?>>>    Socket 编程实战 转载于:https://my.oschina.net/michao/blog/782584

  2. 网络通信编程学习笔记(六):socket编程实战

    目录 一.wireshark抓包分析TCP协议 1.1.TCP协议的连接与断开简介 1.2.用wireshark抓取使用TCP协议传输的握手包 二.用Teardrop代码编写一个假包,并抓取 2.1. ...

  3. 《JavaScript编程实战》

    <JavaScript编程实战> 基本信息 原书名:JavaScript programming: pushing the limits 作者: (美)Jon Raasch 译者: 吴海星 ...

  4. 基于Winsock API的VC网络编程实战

    基于Winsock API的VC网络编程实战 随着计算机信息技术的飞速发展,互联网与人类社会的工作.生活越来越紧密相关,它已经成为人类获取.交流信息的重要途径和手段.所以当前对于开发人员来说,网络编程 ...

  5. Linux下C编程实战

    2019独角兽企业重金招聘Python工程师标准>>> Linux下的C编程实战(一) ――开发平台搭建 1.引言 Linux操作系统在服务器领域的应用和普及已经有较长的历史,这源于 ...

  6. linuxC编程实战 my_server.c例子问题总结

    今天看linux C 编程实战的my_server例子时,敲到这段代码,对其父子进程关闭socket 进行close调用产生疑问 如图中标注的三个close socket,思考子进程通信结束 关闭自己 ...

  7. python编程实例-python编程实战

    广告关闭 2017年12月,云+社区对外发布,从最开始的技术博客到现在拥有多个社区产品.未来,我们一起乘风破浪,创造无限可能. 另外又学了几个python3的新decorator. 创建型设计模式抽象 ...

  8. 今天用Java开发主机IP扫描神器,零基础Socket编程详细

    目录 一.开发背景 二.准备工作 三.远程主机 IP 探测 四.核心算法 1.IP地址转化为十进制数 2.十进制数转化为IP地址 五.主机 IP 扫描神器界面 六.各功能代码及IP扫描演示 1.主机扫 ...

  9. Netty网络编程实战2,使用Netty开发聊天室功能

    目录 一.服务端 1.主程序类 2.自定义初始化器 3.自定义处理器 二.客户端 1.主程序类 2.自定义初始化器 3.自定义处理器 三.启动服务端.客户端 1.服务端:你好,我是服务端,哪吒编程 2 ...

最新文章

  1. 博客基础_django_python从入门到实践_创建项目_创建应用
  2. [转载].Freescale.伦德全 - 电路板级的电磁兼容设计
  3. Silverlight同步(Synchro“.NET研究”nous)调用WCF服务
  4. 张正友相机标定Opencv实现以及标定流程标定结果评价图像矫正流程解析(附标定程序和棋盘图)
  5. vscode怎么全局搜索_VS Code 新版本发布!支持远程开发、同步设置等新特性
  6. Angular通过CORS实现跨域方案
  7. Linux-安装python3环境
  8. 科密考勤机RS485接头接线方法和加班计算公式
  9. (法)H.嘉当(H.Cartan)、塞尔(J.P.Serre)、施瓦茨(L.Schwartz)等[著],刘应明、胡师度[译]:代数结构与拓扑结构
  10. 【Web前端HTML5CSS3】12-字体
  11. 新方法破解Wi-Fi WPA2加密平均只需10分钟
  12. 缓冲进度条或加载进度条
  13. 初学者LDPC码扫盲
  14. 【微信测试版】支持安卓平板和手机同时登录
  15. vue3.0 ref reactive nextTick watch toRaw defineProps defineEmits
  16. Lesson 47 A cup of coffee 一杯咖啡
  17. 基于Matlab计算天线阵列方向图和绘制方向图
  18. 【有趣的实验】JAVA 遍历数组的几种方式的耗时对比
  19. 回顾苹果Macintosh的进化史
  20. rpm 与deb转换

热门文章

  1. 【枚举】【二分答案】【分块答案】【BFS】【最大流】【Dinic】bzoj1189 [HNOI2007]紧急疏散evacuate...
  2. 理财周报,致歉还远远不够
  3. [CTO札记]高效能辅导(Coach)转摘
  4. com学习笔记(6)类厂
  5. Linux内核源码树学习:Kconfig和Makefile
  6. 区块链系列4-智能合约
  7. shared_ptr 的使用及注意事项
  8. JavaScript 的面向对象编程
  9. 深度 | 人工智能的游戏征途:超级玛丽简直小菜一碟,星际争霸、LOL才是大boss...
  10. 分布式文件系统:HDFS