linux内核网络协议栈--数据包的发送过程(二十一)
继上一篇介绍了数据包的接收过程后,本文将介绍在Linux系统中,数据包是如何一步一步从应用程序到网卡并最终发送出去的。
socket层
+-------------+| Application |+-------------+||↓
+------------------------------------------+
| socket(AF_INET, SOCK_DGRAM, IPPROTO_UDP) |
+------------------------------------------+||↓+-------------------+| sendto(sock, ...) |+-------------------+||↓+--------------+| inet_sendmsg |+--------------+||↓+---------------+| inet_autobind |+---------------+||↓+-----------+| UDP layer |+-----------+
- socket(…): 创建一个socket结构体,并初始化相应的操作函数,由于我们定义的是UDP的socket,所以里面存放的都是跟UDP相关的函数
- sendto(sock, …): 应用层的程序(Application)调用该函数开始发送数据包,该函数数会调用后面的inet_sendmsg
- inet_sendmsg: 该函数主要是检查当前socket有没有绑定源端口,如果没有的话,调用inet_autobind分配一个,然后调用UDP层的函数
- inet_autobind: 该函数会调用socket上绑定的get_port函数获取一个可用的端口,由于该socket是UDP的socket,所以get_port函数会调到UDP代码里面的相应函数。
UDP层
||↓+-------------+| udp_sendmsg |+-------------+||↓+----------------------+| ip_route_output_flow |+----------------------+||↓+-------------+| ip_make_skb |+-------------+||↓
+------------------------+
| udp_send_skb(skb, fl4) |
+------------------------+||↓+----------+| IP layer |+----------+
- udp_sendmsg: udp模块发送数据包的入口,该函数较长,在该函数中会先调用ip_route_output_flow获取路由信息(主要包括源IP和网卡),然后调用ip_make_skb构造skb结构体,最后将网卡的信息和该skb关联。
- ip_route_output_flow: 该函数会根据路由表和目的IP,找到这个数据包应该从哪个设备发送出去,如果该socket没有绑定源IP,该函数还会根据路由表找到一个最合适的源IP给它。如果该socket已经绑定了源IP,但根据路由表,从这个源IP对应的网卡没法到达目的地址,则该包会被丢弃,于是数据发送失败,sendto函数将返回错误。该函数最后会将找到的设备和源IP塞进flowi4结构体并返回给udp_sendmsg
- ip_make_skb: 该函数的功能是构造skb包,构造好的skb包里面已经分配了IP包头,并且初始化了部分信息(IP包头的源IP就在这里被设置进去),同时该函数会调用__ip_append_dat,如果需要分片的话,会在__ip_append_data函数中进行分片,同时还会在该函数中检查socket的send buffer是否已经用光,如果被用光的话,返回ENOBUFS
- udp_send_skb(skb, fl4) 主要是往skb里面填充UDP的包头,同时处理checksum,然后调用IP层的相应函数。
IP层
||↓+-------------+| ip_send_skb |+-------------+||↓+-------------------+ +-------------------+ +---------------+| __ip_local_out_sk |------>| NF_INET_LOCAL_OUT |------>| dst_output_sk |+-------------------+ +-------------------+ +---------------+||↓
+------------------+ +----------------------+ +-----------+
| ip_finish_output |<-------| NF_INET_POST_ROUTING |<------| ip_output |
+------------------+ +----------------------+ +-----------+||↓+-------------------+ +------------------+ +----------------------+| ip_finish_output2 |----->| dst_neigh_output |------>| neigh_resolve_output |+-------------------+ +------------------+ +----------------------+||↓+----------------+| dev_queue_xmit |+----------------+
- ip_send_skb: IP模块发送数据包的入口,该函数只是简单的调用一下后面的函数
- __ip_local_out_sk: 设置IP报文头的长度和checksum,然后调用下面netfilter的钩子
- NF_INET_LOCAL_OUT: netfilter的钩子,可以通过iptables来配置怎么处理该数据包,如果该数据包没被丢弃,则继续往下走
- dst_output_sk: 该函数根据skb里面的信息,调用相应的output函数,在我们UDP IPv4这种情况下,会调用ip_output
- ip_output: 将上面udp_sendmsg得到的网卡信息写入skb,然后调用NF_INET_POST_ROUTING的钩子
- NF_INET_POST_ROUTING: 在这里,用户有可能配置了SNAT,从而导致该skb的路由信息发生变化
- ip_finish_output: 这里会判断经过了上一步后,路由信息是否发生变化,如果发生变化的话,需要重新调用dst_output_sk(重新调用这个函数时,可能就不会再走到ip_output,而是走到被netfilter指定的output函数里,这里有可能是xfrm4_transport_output),否则往下走
- ip_finish_output2: 根据目的IP到路由表里面找到下一跳(nexthop)的地址,然后调用__ipv4_neigh_lookup_noref去arp表里面找下一跳的neigh信息,没找到的话会调用__neigh_create构造一个空的neigh结构体
- dst_neigh_output: 在该函数中,如果上一步ip_finish_output2没得到neigh信息,那么将会走到函数neigh_resolve_output中,否则直接调用neigh_hh_output,在该函数中,会将neigh信息里面的mac地址填到skb中,然后调用dev_queue_xmit发送数据包
- neigh_resolve_output: 该函数里面会发送arp请求,得到下一跳的mac地址,然后将mac地址填到skb中并调用dev_queue_xmit
netdevice子系统
||↓+----------------+
+----------------| dev_queue_xmit |
| +----------------+
| |
| |
| ↓
| +-----------------+
| | Traffic Control |
| +-----------------+
| loopback |
| or +--------------------------------------------------------------+
| IP tunnels ↓ |
| ↓ |
| +---------------------+ Failed +----------------------+ +---------------+
+----------->| dev_hard_start_xmit |---------->| raise NET_TX_SOFTIRQ |- - - - >| net_tx_action |+---------------------+ +----------------------+ +---------------+|+----------------------------------+| |↓ ↓+----------------+ +------------------------+| ndo_start_xmit | | packet taps(AF_PACKET) |+----------------+ +------------------------+
- dev_queue_xmit: netdevice子系统的入口函数,在该函数中,会先获取设备对应的qdisc,如果没有的话(如loopback或者IP tunnels),就直接调用dev_hard_start_xmit,否则数据包将经过Traffic Control模块进行处理
- Traffic Control: 这里主要是进行一些过滤和优先级处理,在这里,如果队列满了的话,数据包会被丢掉,详情请参考文档,这步完成后也会走到dev_hard_start_xmit
- dev_hard_start_xmit: 该函数中,首先是拷贝一份skb给“packet taps”,tcpdump就是从这里得到数据的,然后调用ndo_start_xmit。如果dev_hard_start_xmit返回错误的话(大部分情况可能是NETDEV_TX_BUSY),调用它的函数会把skb放到一个地方,然后抛出软中断NET_TX_SOFTIRQ,交给软中断处理程序net_tx_action稍后重试(如果是loopback或者IP tunnels的话,失败后不会有重试的逻辑)
- ndo_start_xmit: 这是一个函数指针,会指向具体驱动发送数据的函数
Device Driver
ndo_start_xmit会绑定到具体网卡驱动的相应函数,到这步之后,就归网卡驱动管了,不同的网卡驱动有不同的处理方式,这里不做详细介绍,其大概流程如下:
- 将skb放入网卡自己的发送队列
- 通知网卡发送数据包
- 网卡发送完成后发送中断给CPU
- 收到中断后进行skb的清理工作
在网卡驱动发送数据包过程中,会有一些地方需要和netdevice子系统打交道,比如网卡的队列满了,需要告诉上层不要再发了,等队列有空闲的时候,再通知上层接着发数据。
其它
- SO_SNDBUF: 从上面的流程中可以看出来,对于UDP来说,没有一个对应send buffer存在,SO_SNDBUF只是一个限制,当这个socket分配的skb占用的内存超过这个值的时候,会返回ENOBUFS,所以说只要不出现ENOBUFS错误,把这个值调大没有意义。从sendto函数的帮助文件里面看到这样一句话:(Normally,this does not occur in Linux. Packets are just silently dropped when a device queue overflows.)。这里的device queue应该指的是Traffic Control里面的queue,说明在linux里面,默认的SO_SNDBUF值已经够queue用了,疑问的地方是,queue的长度和个数是可以配置的,如果配置太大的话,按道理应该有可能会出现ENOBUFS的情况。
- txqueuelen: 很多地方都说这个是控制qdisc里queue的长度的,但貌似只是部分类型的qdisc用了该配置,如linux默认的pfifo_fast。
- hardware RX: 一般网卡都有一个自己的ring queue,这个queue的大小可以通过ethtool来配置,当驱动收到发送请求时,一般是放到这个queue里面,然后通知网卡发送数据,当这个queue满的时候,会给上层调用返回NETDEV_TX_BUSY
- packet taps(AF_PACKET): 当第一次发送数据包和重试发送数据包时,都会经过这里,如果发生重试的情况的话,不确定tcpdump是否会抓到两次包,按道理应该不会,可能是我哪里没看懂
原文链接:https://segmentfault.com/a/1190000008926093
linux内核网络协议栈--数据包的发送过程(二十一)相关推荐
- linux内核网络协议栈--数据包的接收过程(二十)
本文将介绍在Linux系统中,数据包是如何一步一步从网卡传到进程手中的. 本文只讨论以太网的物理网卡,不涉及虚拟设备,并且以一个UDP包的接收过程作为示例. 本示例里列出的函数调用关系来自于kerne ...
- linux内核网络协议栈--数据包的接收过程(二十二)
与其说这篇文章分析了网卡驱动中中数据包的接收,还不如说基于Kernel:2.6.12,以e100为例,对网卡驱动编写的一个说明.当然,对数据包的接收说的很清楚. 一.从网卡说起 这并非是一个网卡驱动分 ...
- linux内核网络协议栈--数据包的网卡缓冲区(二十四)
程序员可能关心的基本网卡知识 网卡相关介绍:http://www.linuxidc.com/Linux/2012-12/77132.htm 一.什么是网卡? 它是主机的网络设备,本身是LAN(局域网) ...
- linux内核网络协议栈--数据包的skb桥转发蓝图(二十六)
话不多说,先看一张桥转发时函数调用的一个基本蓝图. 这张图中,简单的展示了,数据的接收和发送,其中还包括netfilet的钩子点所处的位置. 需要说明的是: 1.我们先暂时忽略数据包从一开始是怎么从驱 ...
- linux内核网络协议栈--数据包的网卡驱动收发包过程(二十五)
网卡 网卡工作在物理层和数据链路层,主要由PHY/MAC芯片.Tx/Rx FIFO.DMA等组成,其中网线通过变压器接PHY芯片.PHY芯片通过MII接MAC芯片.MAC芯片接PCI总线 PHY芯片主 ...
- linux内核网络协议栈--数据包的接收流程(二十三)
网卡在接受数据包时会产生中断,即当 有一个以太网帧到来时,网卡向内核产生一次中断: CPU收到中断信号后,执行中断处理程序,中断处理程序会设置 缓冲区地址.DMA 地址等信息: 网卡通过DMA 方式将 ...
- linux内核网络协议栈--数据包的数据收发简略流程图(二十八)
基于内核3.17.1版本 原文链接:https://blog.csdn.net/subfate/article/details/53107435
- linux内核网络协议栈--数据包的网卡转发流程(二十七)
原文链接:https://blog.csdn.net/jackywgw/article/details/78321226
- Linux内核网络udp数据包发送(二)——UDP协议层分析
1. 前言 本文分享了Linux内核网络数据包发送在UDP协议层的处理,主要分析了udp_sendmsg和udp_send_skb函数,并分享了UDP层的数据统计和监控以及socket发送队列大小的调 ...
最新文章
- xmpp这一段蛋疼的 坑,
- Go命令行库Cobra的使用
- 在线2-36进制转文本工具
- 最简单的视音频播放示例2:GDI播放YUV, RGB
- web项目中图标的前端处理方案
- 从弧长的计算到逆时针与顺时针旋转的定义 (二维空间)
- Python第三方库大全
- 一款微信小程序商城项目(附源码)
- uc android 4.2,uc网盘下载10.4.2 安卓版-uc网盘手机版西西软件下载
- Win10双网卡上网冲突(内网、外网)
- Apple Watch怎么设置蜂窝网络
- 附解决方案,小程序用户昵称突然变成了“微信用户”,而且头像也显示不了?
- Appium元素定位操作app
- 人脸识别+深度学习,水平远超人类大脑!
- 【fast ICA】基于fast ICA算法的去除伪迹matlab仿真
- 找对打字的感觉Tickeys1.1.1打字带声音工具
- 物联网PLC远程控制方案
- Inno Setup 常用代码
- 赚钱宝 mysql_基于35DIR完善版网站分类目录源码 适合行业/个人网站目录
- linux centos amd显卡驱动,【14-12-04】 【分享】关于CentOS 7联想电脑AMD显卡驱动的问题...
热门文章
- python详细安装教程视频-如何安装Python运行环境Anaconda?(视频教程)
- python项目归纳总结-【第108期】总结最近项目中常用的几个Python库
- python中数据分析的流程为-利用python进行数据分析——histogram
- 学python那本书比较好-Python初学者最应该读的8本书
- python算法与程序设计基础第二版-算法与程序设计基础(Python版) - 吴萍
- python怎么读文件名-python读取文件名并改名字的实例
- python语言怎么用-在python语言中,如何使用注释
- python快速编程入门课后程序题答案-Python 入门编程题:1~10(答案)
- 把LabelImg标注的YOLO格式标签转化为VOC格式标签 和 把VOC格式标签转化为YOLO格式标签
- Github上的十大机器学习项目