目录

  • socket编程
    • 基本概念
    • 编程流程
      • socket函数
    • 协议
      • TCP
      • UDP
      • DNS
      • HTTP
      • HTTPS

socket编程

基本概念

socket编程即计算机网络编程,目的是使两台主机能够进行远程连接,既然要使两者产生联系,那么就要有至少一个信息发送端和一个信息接收端,因此形成了现在绝大多数 socket 编程都会用到的 C/S 架构(Client[客户端]/Server[服务端]),最典型的应用就是 web服务器/客户端。
在 Unix/Linux 中执行任何形式的 I/O 操作(比如网络连接)时,都是在读取或写入一个文件描述符,而在 Windows 中则被称为文件句柄,其本质都是一个东西,但是 Windows系统会把 socket 当成一个网络连接,需要调用专门设计的数据传输函数。
socket (套接字)是一种抽象层,程序通过它来收发数据,就像打开一个句柄将数据写在存储器上一样,使用 socket 能将程序放在网络中,并与同一网络下其他计算机进行通信。
现在问题又来了,主机内部应用间进行通信,不同应用可用进程号作为唯一标识,那么在网络间通信用什么作为唯一标识呢?其实 TCP/IP 协议簇已经解决了问题,在网络层 IP 地址可以用作网络中主机的唯一标识,传输层的"协议+端口"可用作主机应用的唯一标识,因此利用三元组(IP地址、协议、端口)就可以标识网络应用了,网络应用间可以用三元组作为标志和其他应用进行交互,socket 通信大致如下:

如图所示,应用程序进程在网络间的通信全部通过 socket 与底层协议交互,进行网络通信,但是 socket 并没有层的概念,它只是一种设计模式(软件抽象层),方便编程而已。

编程流程

socket 编程的底层实现是基于 TCP 和 UDP 的,因此其编程的流程也是围绕着这两个协议的客户端、服务端来进行的,大致流程如下图:

socket函数

在实现上述功能的过程中,要用到很多接口函数,这一节就针对这些接口函数作详细解释。
1、socket()
这个函数作用是创建一个 socket 的操作对象,它被用作 socket 描述符的唯一标识(相当于文件描述符),在本地我们可以用这个对象进行文件操作,在主机远程连接时则可以用于建立连接、收发数据。
2、bind()
这是服务器端特有的接口函数,把 socket 对象和服务器的 IP 地址、开放端口绑定在一起,在 listen() 的调用下提供服务,客户端可以通过这个来连接服务器。但是客户端是没有 bind() 绑定地址和端口的,因为客户端不用发起监听,在客户端是在调用 connect() 时由系统随机生成一个。
3、listen()
也是服务器端特有的一个接口函数,作用是监听一个端口是否有数据发送过来,函数工作的时候会调用 bind() 函数,获取里面的套接字、地址和端口信息,如果有指向这个套接字描述符、本服务器地址和正在监听的这个端口的连接发送过来,则会让其通过并开始建立连接。
4、connect()
这个函数接口是 TCP 客户端特有的,用于向服务器发起连接建立请求。只要在 connect() 的参数中输入目标服务器的地址和端口,就会向目标发起连接请求,在服务端收到请求后就会调用 accept() 开始自动进行三次握手,从而建立连接。
5、accept()
这个函数接口是 TCP 服务端特有的,当 listen() 监听到请求后就会调用这个函数去建立连接,也就是说,只要这个函数执行成功,与客户端的连接就建立完成,并且可以互相传输数据了。
6、recv(),recvfrom()
这两个函数接口是用来接收数据的,recv() 方法对应 TCP 数据流,recvfrom() 则对应 UDP 数据流,因为 TCP 面向连接而 UDP 传输数据并不创建连接,所以要分这两种办法进行数据的接收。
7、send(),sendto()
和第 6 点的函数接口类似,但是用于发送数据的,和 recv()、recvfrom() 一起实现了网络中不同进程间的通信,其中 send() 对应 TCP 的传输方式,sendto() 对应的是 UDP 的传输方式。
8、read(),write()
这两个函数其实是通用的 I/O 读写操作,可以用来读写本地的文件,自然也可以用于网络间的读写操作。
9、close()
当客户端和服务端建立连接并处理完业务后,就要关闭相应的 socket 描述符以节省系统资源。在调用 close() 后,该 socket 描述字的引用计数 -1,不能够再由对应的调用进程使用,但是只有当引用计数=0 的时候,才会触发 TCP 客户端向服务端发起终止连接的请求。

协议

既然是通过底层协议进行信息传递,那么肯定少不了 OSI 七层模型:

现在有很多文章都讲得比较详细了,这里就只列出一些 socket 编程会用到的协议。

TCP

TCP 协议是一种面向连接的、可靠的、基于字节流的传输层通信协议,是为了互联网上提供可靠的端到端字节流而专门设计的,因此 TCP 协议做了一些规定:数据分片、到达确认、超时重发、滑动窗口、失序处理、重复处理、数据校验。
作为可靠传输的一种协议,它有以下特点:
1.基于流的方式
2.面向连接
3.网络不佳时尽量降低系统由于重传带来的带宽开销
4.连接维护面向通信的两个端点
在连接上,因为是可靠的,所以在建立连接的时候会进行三次握手,断开连接的时候则会进行四次挥手,在 socket 编程中体现如下:

在 socket 编程中,因为可靠性,TCP 是用的最多的连接协议,就连 http 协议也是基于 TCP 的。
当两台主机要建立 TCP 连接时,客户端要向服务端发送 SYN 包发起连接请求,服务端收到 SYN 包后获取到客户端地址然后响应一个 SYN+ACK 包进行确认,表示接受连接,客户端收到这个确认包后也会返回一个用于确认的 ACK,到这里连接就建立完成了,接下来就可以传输数据了;
如图所示,TCP 为了保证可靠性和降低开销,每次传输的数据是分片传输的,第一个分片会告诉服务端这一次有多少个分片要传输,传输序号为最后一个的分片则会告诉服务端数据传输完毕,服务端每接收一次数据包就会响应一个 ACK 确认,反过来也一样;
在断开连接的时候则要经过四次挥手,断开连接的发起方可以是客户端也可以是服务端,其中一方发送 FIN+ACK 包告诉另一端数据传输完毕,询问是否能够断开连接,另一端收到后响应一个 ACK ,如果数据未接收完成,则通过这个 ACK 告诉对方未接收完成,暂时不要断开连。若数据传输完毕,则会发送 FIN 给信息发送方,告诉对方数据接收完成,准备好关闭连接了,另一端接收到 FIN 包后响应一个 ACK,同时状态变成 TIME_WAIT,接收方收到 ACK 确认后就断开连接,发送端等待 2msl 后若没收到接收端新的信息也会断开连接。
上面的原理看起来很复杂,但是在 socket 层面就简化了很多,双方在连接前都要先建立好套接字,服务端还要开启监听,准备工作就完成了。客户端用 connect() 向服务端发起连接请求,服务端监听到请求后用 accept() 建立连接,这样三次握手就完成了;接下来连接双方都可以用 recv() 方法和 send() 方法进行数据的收发;数据传输完成后直接调用 close() 方法就可以完成四次挥手从而断开连接。

UDP

UDP 协议和 TCP 一样用来处理数据包,并且都位于传输层,不同的是 UDP 提供面向事务的简单不可靠信息传送服务,也就是说 UDP 协议的数据包发送后是没法知道是否安全、完整到达的,而且也不提供向 TCP 那样分片、重传、确认等功能,但是有个优点就是传输性能比 TCP 要高很多,毕竟不用分配资源去保证可靠性。因此在一些条件下 UDP 传输会更加实用。
在 socket 编程中,用 UDP 协议传输数据也非常简单,客户端和服务端双方分别绑定套接字,服务端开始监听,客户端用 sendto() 直接发送数据,然后调用 close() 关闭数据出口,服务端则用 recvfrom() 接收;一次 UDP 数据传输就结束了。虽然 UDP 传输非常节省资源,但是会存在各种问题,因此在编程的时候要注意:一个 UDP 包允许报文长度 <512 字节,而 TCP 报文允许 >512 字节。

DNS

DNS 协议即地址解析协议,作用是将域名和 IP 地址互相转换,因为是基于 TCP、UDP 协议工作的,因此可以通过 socket 编程来实现其中的一些功能。在这之前我们先简单了解一下 DNS:
首先,DNS(域名系统)是一个分布式数据库,被用来维护系统内每个主机名和 IP 的对应关系,用户输入域名时会自动查询 DNS 服务器,由服务器检索数据库,返回相应的 IP 地址;
如果指定的 DNS 服务器没有记录,则会向上一层次的 DNS 服务器发起查找请求,各逻辑的树形结构(域名空间结构)如下图:

在解析请求时,如果本地(hosts文件)没有目标信息,就会去询问其他 DNS 服务器,这个过程是逐级提交的,其由高到低的层次划分可以分为下面几大类:

分类 作用
根域名服务器 最高层次的域名服务器,全世界仅13台,负责管理顶级域名
顶级域名服务器 负责管理在该顶级域名服务器下注册的二级子域
权威域名服务器 负责一个区的域名解析工作
本地域名服务器 当主机发起DNS查询请求时第一个查询的对象,一般为主机hosts文件/本地DNS服务器

当其他 DNS 服务器返回查询结果时,该 DNS 服务器会把结果记录在本地缓存中,成为 DNS 缓存。
查询方式分为两种:
1.递归查询:在该模式下 DNS 服务器接收到客户机请求,必须使用一个准确的查询结果回复客户机。如果 DNS 服务器本地没有存储查询 DNS 信息,那么该服务器会询问其他服务器,并将返回的查询结果提交给客户机;
2.迭代查询:当客户机发送查询请求时,DNS 服务器并不直接回复查询结果,而是告诉客户机另一台 DNS 服务器地址,客户机再向这台 DNS 服务器提交请求,依次循环直到返回查询的结果为止。
基于这些理论,我们可以利用 socket 构造 DNS 查询请求,甚至可以把连接产生的 TCP 流量封装到 DNS 查询里,实现内网穿透。

HTTP

HTTP 协议(超文本传输协议)是现在互联网中最常用的一种网络协议,是一个标准的请求-应答模型(B/S),也就是说通信过程永远都是客户端发起请求,服务器返回响应信息,当然,也是基于 TCP 协议进行通信的。在客户机与服务器建立连接后,浏览器可以向 web 服务器发送请求并显示收到的网页,当用户在浏览器地址栏中输入一个 URL 时就会向 web 服务器发出 HTTP 请求,信息包括请求修饰符、客户端信息、提交的数据等,web 服务器接收到请求后对其进行处理并响应,响应的内容包括响应状态码、协议版本、服务器的部分信息、实体信息等,这些内容以 HTTP 规定的格式送回给客户端浏览器,浏览器对其进行显示。另外,HTTP 协议是无状态协议,即对事务处理没有记忆能力,在服务器不需要先前信息时应答速度就会很快。
在 socket 编程中也遵循这个模型,分为客户端、服务端,客户端可以构造请求,发送数据给服务器,服务端可以发布静态/动态资源,供客户端获取,或者提供 I/O 接口,进行数据交互,也可以通过连接数据库,实现数据存储、查询等功能。
其工作流程如下:
1.浏览器根据域名解析 IP 地址;
2.客户端通过浏览器与 web 服务器建立一个 TCP 连接;
3.客户端向服务端发起请求;
4.服务端响应客户端的 HTTP 请求,返回 html 代码;
5.客户端解析 html 代码,请求资源;
6.资源下载完毕后关闭 TCP 连接,浏览器对页面进行渲染然后呈现给用户。
客户端根据服务器的设置发起的请求有很多种,下面列出一些常见的请求方式:

方法 作用
GET 申请获取资源
POST 客户端向服务器提交数据的方法
HEAD 申请获取响应的头部信息
PUT 用于上传资源
DELETE 用于删除资源
TRACE 用于返回原始请求内容,可用来查看中间服务器对http请求的影响
OPTIONS 用于查看服务器对特定URL都支持哪些请求
CONNECT 用于代理服务器,可把请求的连接转换成隧道
PATCH 对资源做部分修改

每次请求的请求头都会附加一些信息,补充了请求的附加内容、客户端信息、相应内容相关优先级信息,下面是一些常见的请求头信息:

头部字段名 说明
Accept 用户代理可处理的媒体类型
Accept-Charset 优先的字符集
Accept-Encoding 优先的内容编码
Accept-Language 优先的语言
Authorization web认证信息
Expect 期待服务器的特定行为
From 用户邮箱地址
Host 请求资源所在的服务器
Proxy-Authorization 代理服务器要求客户端的认证信息
Range 实体的字节范围请求
Referer 对请求中uri的原始获取方式
TE 传输编码优先级
User-Agent 浏览器信息

而响应头则补充了资源内容更新时间等与实体有关的信息

头部字段名 说明
Accept-Ranges 是否接收字节范围的请求
Age 资源创建时间
ETag 资源匹配信息
Location 让客户端重定向到某uri
Proxy-Authenticate 代理服务器对客户端的认证信息
Retry-After 对再次请求的发起时机要求
Server 服务器的banner信息
Vary 代理缓存的管理信息
WW-Authenticate 服务器对客户端的认证信息

实体资源的头部:

头部字段名 说明
Allow 资源可支持的http方法
Content-Encoding 适用的编码方式
Content-Language 优先语言
Content-Length 网页资源的大小
Content-Location 替代对应资源的uri
Content-MD5 资源的md5值
Content-Range 资源的位置范围
Content-Type 接收的数据格式类型
Expires 资源过期的时间
Last-Modified 资源最后修改日期

除了上面的特征头部字段,还有通用的头部字段:

头部字段名 说明
Cache-Control 进行缓存操作的工作机制
Connection 控制不在转发给代理的首部字段,管理持久连接
Date 创建报文的时间
Pragma 编译报文指令
Transfer-Encoding 指定主体传输的编码方式
Upgrade 用于检测HTTP及其他协议是否可使用更高的版本进行通信
Via 代理相关信息
Warning 报错通知

HTTPS

HTTPS 是加密的 HTTP 通道,因为 HTTP 传输是明文的,存在信息泄露的风险,因此HTTPS就是在这基础上通过传输加密和身份认证保证了传输过程的安全性。
HTTPS 其实并不是应用层的新协议,而是在 http 接口通过 SSL、TLS 来加密和认证的机制,其加密过程如下:
1.客户端和服务器进行握手请求(https的握手)
2.协商加密算法
(客户端告诉服务器自己支持多少种加密组合,一个组合里面有 对称、非对称、hash、密钥交换算法,服务器选择自己支持的加密强度最高的一种)
3.服务器发公钥证书给客户端
4.客户端收到后在本地进行证书匹配(验证)
(本地有根证书能解开的就说明这个公钥是那个根证书的公司签名的,没有能解开的就是不受信任的)
5.客户端收到后在本地随机生成对称密钥(本次会话结束失效)
6.客户端把生成的对称密钥用服务器给的公钥加密发给服务器
7.服务器拿到用自己公钥加密的密文后用私钥解开,取得内容
开始传输数据(两边都有加密密钥)
8.客户端把加密的信息对应的hash值加了密的hash值发给服务器
(明文信息用对称密钥加密,然后做hash计算,生成固定长度的hash值,用得到的公钥证书里的公钥对这个hash进行加密,生成hash值(给hash加密))
9.服务器拿到这3部分信息后,用自己的私钥解开由自己公钥加了密的hash值,和客户端发的对应的hash值做比较,如果相同就表示没被篡改,再用客户端发的对称密钥解开加密的信息,再做hash计算,计算出的hash值和对应的hash值做比较,相同的话表示数据完整性没被破坏(身份验证)
10.服务器开始接收数据
在 socket 编程中也是可以实现 https,只是除了基本的 http 模块外还需要导入 SSL 相关的模块,编程的流程大致如下:


如果有不对的地方,还请各位大佬指出 ^ _ ^


相关文章:
多线程编程概念
Golang socket 编程
Python socket 编程
PHP socket 编程
Java socket 编程

Socket 编程原理相关推荐

  1. socket 编程原理1

    socket 编程原理1 主要用于解决网络间进程通信的问题,需要三级寻址. 1.指定特定网络: 2.指定特定主机: 3.特定进程 特定进程用端口号指定,tcp/udp均用16位端口号来表示用户进程,小 ...

  2. Socket编程原理概述

    1 问题的引入  UNIX系统的I/O命令集,是从Maltics和早期系统中的命令演变出来的,其模式为打开一读/写一关闭(open-write-read-close).在一个用户进程进行I/O操作时, ...

  3. Linux C Socket编程原理及简单实例

    部分转自:http://goodcandle.cnblogs.com/archive/2005/12/10/294652.aspx 1.   什么是TCP/IP.UDP? 2.   Socket在哪里 ...

  4. SOCKET编程的详细电子文档

    第二章 socket编程原理  2.1 问题的引入  UNIX系统的I/O命令集,是从Maltics和早期系统中的命令演变出来的,其模式为打开一读/写一关闭(open-write-read-close ...

  5. Linux的SOCKET编程详解——非常叼

    http://blog.csdn.net/hguisu/article/details/7445768/ 版权声明:本文为博主原创文章,未经博主允许不得转载. 目录(?)[+] Linux的SOCKE ...

  6. socket 编程入门教程(三)TCP原理:5、TCP的三次握手(three-way handshake)

    socket 编程入门教程(三)TCP原理:5.TCP的三次握手(three-way handshake) 前面3个小节介绍了socket机制对TCP协议三次握手的实现,需要强调的是,与协议独立于实现 ...

  7. 计算机网络原理 实验1 《Windows Socket编程》

    计算机网络原理 实验1 <Windows Socket编程> 一.实验目的 通过实验,熟悉并掌握计算机Windows 编程的基本知识,进一步加深对课堂所学基本内容的理解,掌握基本的Wind ...

  8. Python基础----Socket编程规范及底层原理(三)---socketserver实现并发及底层原理

    Socket网络编程: 前面实现的TCP服务端只能接受一个用户接入,这里使用了并发来实现多用户接入,不废话直接上代码!原理后面慢慢给大家讲! import socketserverclass MySe ...

  9. Linux下Socket编程

    Linux下Socket编程    网络的Socket数据传输是一种特殊的I/O,Socket也是一种文件描述符.Socket也具有一个类似于打开文件的函数调用Socket(),该函数返回一个整型的S ...

最新文章

  1. 小扎的野心不止做社交 市政厅的上线说明了这一点
  2. 站在这山看着那山高,到了那山没柴烧.
  3. struts2获取服务器临时目录
  4. js pug 代码_用JS写的windows95操作系统
  5. swoole mysql 协程_关于协程的优点以及swoole 协程的用法
  6. php获取ip写到文本,php 文本转HTML与获取IP函数
  7. 在ubuntu16.04-32bits 下编译vlc和vlc-qt开源项目
  8. 有道翻译js逆向解析
  9. 风力摆控制系统赛题分析
  10. 如何复制出计算机缓存中的歌曲,怎么把哔哩哔哩里缓存的视频中的音频单独提取出来。...
  11. 已解决IndentationError: unindent does not match any outer indentation level
  12. 功能测试几种方法简单介绍
  13. 启动新内核出现:Kernel panic - not syncing: Attempted to kill init! exitcode=0x00000004
  14. 在美国做实习生必须避免的十…
  15. java f else_java else if 为什么比 switch 效率低?最好可以解释下原理
  16. 五分之四的不同表达式_省技能大赛题库(五) 滴定分析基础知识
  17. selenium 成功绕过淘宝登录反爬机制
  18. Ubuntu下用cue文件对ape和wav文件自动分轨
  19. linux黄颜色文件,了解 Linux 文件的颜色代码
  20. opencv python gpu加速_在Windows上使用OpenCV和Python进行硬件加速解码(MSMT/IntelMFX/FFMPEG/any-backend)...

热门文章

  1. jsp内置对象--request对象
  2. Python数组字典排序sorted()与sort()用法
  3. Beego generate命令
  4. 让中药的12位美白仙子重塑健康肌肤
  5. (LaTeX) Solved: 引用网页时出现的空格间距过大;网页链接的字体不符合要求
  6. Java面试知识点(一)
  7. 问题解决08使用Hibernate框架报错:Transaction not successfully started--解决方案如下:...
  8. 对于图片压缩的 三种方式
  9. Dedicated Web Worker 和 Shared Web Worker
  10. java关闭tomcat服务器端口_关闭tomcat端口号