本文主要内容:网络数据包接收的上半部实现,主要分析内核接口相关部分。

内核版本:2.6.37

上半部的实现

接收数据包的上半部处理流程为:

el_interrupt() // 网卡驱动

|--> el_receive() // 网卡驱动

|--> netif_rx() // 内核接口

|--> enqueue_to_backlog() // 内核接口

我们已经分析了网卡驱动相关部分,现在来看下内核接口相关部分:)

netif_rx

netif_rx()是内核接收网络数据包的入口(目前多数网卡支持新的接口NAPI,后续文章会分析)。

netif_rx()主要调用enqueue_to_backlog()进行后续处理。

[java] view plaincopy
  1. /**
  2. * netif_rx - post buffer to the network code
  3. * @skb: buffer to post
  4. * This function receives a packet from a device and queues it for the upper (protocol)
  5. * levels to process. It always succeeds. The buffer may be dropped during processing
  6. * for congestion control or by the protocol layers.
  7. * return values:
  8. * NET_RX_SUCCESS (no congestion)
  9. * NET_RX_DROP (packet was dropped)
  10. */
  11. int netif_rx(struct sk_buff *skb)
  12. {
  13. int ret;
  14. /* if netpoll wants it, pretend we never saw it */
  15. if (netpoll_rx(skb))
  16. return NET_RX_DROP;
  17. /* 记录接收时间到skb->tstamp */
  18. if (netdev_tstamp_prequeue)
  19. net_timestamp_check(skb);
  20. trace_netif_rx(skb);
  21. #ifdef CONFIG_RPS
  22. /* 暂不考虑RPS,后续再分析 */
  23. ...
  24. #else
  25. {
  26. unsigned int qtail;
  27. ret = enqueue_to_backlog(skb, get_cpu(), &qtail);
  28. put_cpu();
  29. }
  30. #endif
  31. return ret;
  32. }

softnet_data

每个cpu都有一个softnet_data实例,用于收发数据包。

[java] view plaincopy
  1. /* Incoming packets are placed on per-cpu queues */
  2. struct softnet_data {
  3. struct Qdisc *output_queue; /* 输出包队列 */
  4. struct Qdisc **output_queue_tailp;
  5. /* 其中设备是处于轮询状态的,即入口队列有新的帧等待处理 */
  6. struct list_head poll_list;
  7. struct sk_buff *completion_queue; /* 成功传输的数据包队列 */
  8. /* 处理队列,把input_pkt_queue接入 */
  9. struct sk_buff_head process_queue;
  10. /* stats */
  11. unsigned int processed; /* 处理过的数据包个数 */
  12. unsigned int time_squeeze; /* poll受限于允许的时间或数据包个数 */
  13. unsigned int cpu_collision;
  14. unsigned int received_rps;
  15. #ifdef CONFIG_RPS
  16. /* 暂不研究RPS */
  17. ...
  18. #endif
  19. unsigned dropped; /* 因输入队列满而丢包的个数 */
  20. /* 输入队列,保存接收到的数据包。
  21. * 非NAPI使用,支持NAPI的网卡驱动有自己的私有队列。
  22. */
  23. struct sk_buff_head input_pkt_queue;
  24. struct napi_struct backlog; /* 虚拟设备,非NAPI设备共用 */
  25. };

定义

[java] view plaincopy
  1. /* Device drivers call our routines to queue packets here.
  2. * We empty the queue in the local softnet handler.
  3. */
  4. DEFINE_PER_CPU_ALIGNED(struct softnet_data, softnet_data);
  5. EXPORT_PER_CPU_SYMBOL(softnet_data);

初始化

[java] view plaincopy
  1. /* Initialize the DEV module. At boot time this walks the device list and
  2. * unhooks any devices that fail to initialise (normally hardware not present)
  3. * and leaves us with a valid list of present and active devices.
  4. *
  5. * This is called single threaded during boot, so no need to take the rtnl semaphore.
  6. */
  7. static int __init net_dev_init(void)
  8. {
  9. ...
  10. /* Initialise the packet receive queues.
  11. * 初始化每个cpu的softnet_data实例。
  12. */
  13. for_each_possible_cpu(i) {
  14. struct softnet_data *sd = &per_cpu(softnet_data, i);
  15. memset(sd, 0, sizeof(*sd));
  16. skb_queue_head_init(&sd->input_pkt_queue);
  17. skb_queue_head_init(&sd->process_queue);
  18. sd->completion_queue = NULL;
  19. INIT_LIST_HEAD(&sd->poll_list);
  20. sd->output_queue = NULL;
  21. sd->output_queue_tailp = &sd->output_queue;
  22. #ifdef CONFIG_RPS
  23. ...
  24. #endif
  25. sd->backlog.poll = process_backlog; /* 非NAPI的默认轮询函数 */
  26. sd->backlog.weight = weight_p; /* 64,每次轮询处理数据包个数上限 */
  27. sd->backlog.gro_list = NULL;
  28. sd->backlog.gro_count = 0;
  29. }
  30. ...
  31. /* 注册软中断处理函数 */
  32. open_softirq(NET_TX_SOFTIRQ, net_tx_action);
  33. open_softirq(NET_RX_SOFTIRQ, net_rx_action);
  34. ...
  35. }

enqueue_to_backlog

netif_rx()调用enqueue_to_backlog()来处理。

首先获取当前cpu的softnet_data实例sd,然后:

1. 如果接收队列sd->input_pkt_queue不为空,说明已经有软中断在处理数据包了,

则不需要再次触发软中断,直接将数据包添加到接收队列尾部即可。

2. 如果接收队列sd->input_pkt_queue为空,说明当前没有软中断在处理数据包,

则把虚拟设备backlog添加到sd->poll_list中以便进行轮询,最后设置NET_RX_SOFTIRQ

标志触发软中断。

3. 如果接收队列sd->input_pkt_queue满了,则直接丢弃数据包。

[java] view plaincopy
  1. /* queue an skb to a per CPU backlog queue (may be a remote CPU queue). */
  2. static int enqueue_to_backlog(struct sk_buff *skb, int cpu, unsigned int *qtail)
  3. {
  4. struct softnet_data *sd;
  5. unsigned long flags;
  6. sd = &per_cpu(softnet_data, cpu); /* 获取当前cpu上的softnet_data实例 */
  7. local_irq_save(flags); /* 禁止本地中断 */
  8. rps_lock(sd);
  9. if (skb_queue_len(&sd->input_pkt_queue) <= netdev_max_backlog) {
  10. /* 如果接收队列不为空,则说明已经有软中断在处理数据包了,
  11. * 则不需要再次触发软中断,直接将数据包添加到接收队列尾部即可。
  12. */
  13. if (skb_queue_len(&sd->input_pkt_queue)) {
  14. enqueue:
  15. __skb_queue_tail(&sd->input_pkt_queue, skb); /* 添加到接收队列尾部 */
  16. input_queue_tail_incr_save(sd, qtail);
  17. rps_unlock(sd);
  18. local_irq_restore(flags); /* 恢复本地中断 */
  19. return NET_RX_SUCCESS;
  20. }
  21. /* Schedule NAPI for backlog device.
  22. * 如果接收队列为空,说明当前没有软中断在处理数据包,
  23. * 把虚拟设备backlog添加到sd->poll_list中以便进行轮询,
  24. * 最后设置NET_RX_SOFTIRQ标志触发软中断。
  25. */
  26. if (! __test_and_set_bit(NAPT_STATE_SCHED, &sd->backlog.state)) {
  27. if (! rps_ipi_queued(sd))
  28. ____napi_schedule(sd, &sd->backlog);
  29. }
  30. goto enqueue;
  31. }
  32. sd->dropped++; /* 如果接收队列满了就直接丢弃 */
  33. rps_unlock(sd);
  34. local_irq_restore(flags); /* 恢复本地中断 */
  35. atomic_long_inc(&skb->dev->rx_dropped);
  36. kfree_skb(skb); /* 释放数据包 */
  37. return NET_RX_DROP;
  38. }
  39. int netdev_tstamp_prequeue = 1; /* 记录接收时间 */
  40. int netdev_max_backlog = 1000; /* 接收队列的最大长度 */

napi_struct代表一个虚拟设备,用于兼容非NAPI的驱动。

[java] view plaincopy
  1. /* Structure for NAPI scheduling similar to tasklet but with weighting */
  2. struct napi_struct {
  3. /* The poll_list must only be managed by the entity which changes the
  4. * state of the NAPI_STATE_SCHED bit. This means whoever atomically
  5. * sets that bit can add this napi_struct to the per-cpu poll_list, and
  6. * whoever clears that bit can remove from the list right before clearing the bit.
  7. */
  8. struct list_head poll_list; /* 用于加入处于轮询状态的设备队列 */
  9. unsigned long state; /* 虚拟设备的状态 */
  10. int weight; /* 每次处理的最大数量,非NAPI为weight_p,默认为64 */
  11. int (*poll) (struct napi_struct *, int); /* 此设备的轮询方法,默认为process_backlog() */
  12. #ifdef CONFIG_NETPOLL
  13. ...
  14. #endif
  15. unsigned int gro_count;
  16. struct net_device *dev;
  17. struct list_head dev_list;
  18. struct sk_buff *gro_list;
  19. struct sk_buff *skb;
  20. };
[java] view plaincopy
  1. static inline void ____napi_schedule(struct softnet_data *sd, struct napi_struct *napi)
  2. {
  3. /* 把napi_struct添加到softnet_data的poll_list中 */
  4. list_add_tail(&napi->poll_list, &sd->poll_list);
  5. __raise_softirq_irqoff(NET_RX_SOFTIRQ); /* 设置软中断标志位 */
  6. }

数据包接收系列 — 上半部实现(内核接口)相关推荐

  1. 数据包接收系列 — IP协议处理流程(一)

    本文主要内容:在接收数据包时,IP协议的处理流程. 内核版本:2.6.37 Author:zhangskd @ csdn blog IP报头 IP报头: struct iphdr { #if defi ...

  2. 数据包接收系列 — 数据包的接收过程(宏观整体)

    本文将介绍在Linux系统中,数据包是如何一步一步从网卡传到进程手中的. 如果英文没有问题,强烈建议阅读后面参考里的两篇文章,里面介绍的更详细. 本文只讨论以太网的物理网卡,不涉及虚拟设备,并且以一个 ...

  3. 网卡驱动和队列层中的数据包接收

    一.从网卡说起 这并非是一个网卡驱动分析的专门文档,只是对网卡处理数据包的流程进行一个重点的分析.这里以Intel的e100驱动为例进行分析. 大多数网卡都是一个PCI设备,PCI设备都包含了一个标准 ...

  4. UDP数据包接收逻辑的优化修改以及对性能的影响

    UDP数据包接收逻辑的优化修改以及对性能的影响 #include <stdio.h> #include <stdlib.h> #include <unistd.h> ...

  5. Linux网络数据包接收处理过程

    因为要对百万.千万.甚至是过亿的用户提供各种网络服务,所以在一线互联网企业里面试和晋升后端开发同学的其中一个重点要求就是要能支撑高并发,要理解性能开销,会进行性能优化.而很多时候,如果你对Linux底 ...

  6. linux tcp 包大小,Linux TCP数据包接收处理 --- 转

    在接收流程一节中可以看到数据包在读取到用户空间前,都要经过tcp_v4_do_rcv处理,从而在receive queue中排队. 在该函数中,我们只分析当连接已经建立后的数据包处理流程,也即tcp_ ...

  7. JAVA实现udp接收文件数据,java – 播放以UDP数据包接收的原始PCM音频

    以下是获取输出线并在其上播放PCM的简单示例.在运行时,它会播放大约一秒长的恼人的哔哔声. import javax.sound.sampled.AudioFormat; import javax.s ...

  8. linux数据包注释,关于 linux中TCP数据包(SKB)序列号的小笔记

    关于  SKB序列号的小笔记 为了修改TCP协议,现在遇到了要改动tcp分组的序列号,但是只是在tcp_sendmsg函数中找到了SKB的end_seq  一直没有找到seq 不清楚在那里初始化了,就 ...

  9. linux内核网络协议栈--数据包的接收过程(二十二)

    与其说这篇文章分析了网卡驱动中中数据包的接收,还不如说基于Kernel:2.6.12,以e100为例,对网卡驱动编写的一个说明.当然,对数据包的接收说的很清楚. 一.从网卡说起 这并非是一个网卡驱动分 ...

  10. linux收发包内核进程名称,Linux内核IP Queue机制的分析(一)——用户态接收数据包...

    序 笔者将会通过包括本文在内的三篇文章,对IP Queue机制从用户态的应用到内核态的模块程序设计进行分析.三篇文章的题目分别是: Linux内核IP Queue机制的分析(一)­--用户态接收数据包 ...

最新文章

  1. GWT更改元素样式属性
  2. java的源代码文件扩展名_【单选题】Java 的源代码文件具有( )的扩展名 (5.0分) A. .c B. .class C...
  3. html5画板功能,JS实现canvas简单小画板功能
  4. [JavaWeb-Bootstrap]Bootstrap概述
  5. 三类危险的TXT文件
  6. Thrift源码学习二——Server层
  7. 微信地位,牢不可破?
  8. solr学习笔记-增加mmesg4J中文分词
  9. CodeForces - 748C Santa Claus and Robot
  10. 电报telegramPC电脑端调为中文
  11. 全国30省市分地区能源结构(煤炭占比)2003-2019年
  12. 一款可以由电脑投屏到手机的软件deskreen[粉丝少于1000的电脑直播]
  13. DLL load failed while importing _sqlite3: 找不到指定的模块。
  14. 工商银行理财快速刷星汇总
  15. speedoffice表格如何对内容进行分组?
  16. ensp 移动主机搜索不到AP信道_H3C路由器GR2200 支持LAN/WAN切换,负载均衡 支持快速扩展无线AP 高性能企业级路由器_GR2200_支持LAN/WAN切换,负载均衡...
  17. CCF大会腾源会专场即将召开,聚焦基础软件与开发语言未来发展
  18. 介绍理想工作计算机 英语作文,理想工作的英语作文6篇
  19. Unity入门--Unity的下载安装及基本使用
  20. STM32实现8*8点阵动态显示

热门文章

  1. mysql workbench 建表时PK, NN, UQ, BIN, UN, ZF, AI
  2. 在Java中如何高效判断数组中是否包含某个元素
  3. VMware Workstation 備份與恢復虛擬機
  4. Jstatd方式远程监控Linux下 JVM运行情况
  5. 传输层的端口与TCP标志中的URG和PSH位
  6. 异步消息的性能与激情之Netty开发思路
  7. 两种方式设置单元格的下划线
  8. PHP 中 json_encode中文处理、urlencode方法、post中文乱码
  9. Android播放在线音乐文件
  10. 仿大众点评下拉菜单实现