Linux内核网络栈1.2.13-route.c概述
参考资料
<<linux内核网络栈源代码情景分析>>
route路由表概述
在IP协议的实现中,只要发送数据包都要查询路由表,选择合适的路由选项,确定下一站的地址,并构造MAC地址,进而将数据包发往链路层进行处理,本文就继续学习route相关内容
route概述
route数据结构
路由表项的数据结构如下;
/* This is an entry in the IP routing table. */
struct rtable
{struct rtable *rt_next; // 指向下一个rtable表项unsigned long rt_dst; // 目的地址unsigned long rt_mask; // 子网掩码unsigned long rt_gateway; // 网关地址unsigned char rt_flags; // 标志位unsigned char rt_metric; // 度量值short rt_refcnt; // 使用计数unsigned long rt_use; // 被使用标志位unsigned short rt_mss; // MSS值unsigned long rt_window; // 窗口大小struct device *rt_dev; // 与该路由项绑定的接口
};
rtable结构表示一个路由表项,系统路由表即是由许多rtable结构构成的一个链表。
rt_del函数
该函数是删除一个rtable数据;
/** The routing table list*/static struct rtable *rt_base = NULL; // 指向路由表项构成的链表/** Pointer to the loopback route*/static struct rtable *rt_loopback = NULL; // 指向本地路由/** Remove a routing table entry. 删除一个路由表项 dst 表示这个表项对应的目的地址 devname表示表项绑定的接口名称*/ static void rt_del(unsigned long dst, char *devname)
{struct rtable *r, **rp;unsigned long flags;rp = &rt_base; // 获取头部信息/** This must be done with interrupts off because we could take* an ICMP_REDIRECT.*/save_flags(flags);cli(); // 禁止中断while((r = *rp) != NULL) // 遍历循环{/* Make sure both the destination and the device match */if ( r->rt_dst != dst ||(devname != NULL && strcmp((r->rt_dev)->name,devname) != 0) ) // 检查地址是否相同并且devname不为空 并且devname相同的表项{ rp = &r->rt_next; // 如果不满足就循环下一个continue;}*rp = r->rt_next; // 找到该链接/** If we delete the loopback route update its pointer.*/if (rt_loopback == r) // 检查是否和rt_loopback相同 如果相同则置空rt_loopback = NULL;kfree_s(r, sizeof(struct rtable)); // 释放该表项} restore_flags(flags);
}
该函数的主要工作就是循环表项链表,依次比较查找对应的表项,然后删除,功能较为简单。
ip_rt_flush函数
删除与一个设备相绑定的所有路由表项
/** Remove all routing table entries for a device. This is called when* a device is downed. 删除与一个设备相绑定的所有路由表项*/void ip_rt_flush(struct device *dev)
{struct rtable *r;struct rtable **rp;unsigned long flags;rp = &rt_base; // 获取链表头部save_flags(flags);cli(); // 禁止中断while ((r = *rp) != NULL) { // 选好链表if (r->rt_dev != dev) { // 检查设备是否相同rp = &r->rt_next; // 如果不相同则下一个continue;}*rp = r->rt_next; // 获取链表的下一个元素if (rt_loopback == r) // 如果和rt_loopback相同则置空rt_loopback = NULL;kfree_s(r, sizeof(struct rtable)); // 删除该数据} restore_flags(flags);
}
掩码的判断函数
/** Used by 'rt_add()' when we can't get the netmask any other way..** If the lower byte or two are zero, we guess the mask based on the* number of zero 8-bit net numbers, otherwise we use the "default"* masks judging by the destination address and our device netmask. 计算对应目的地址的网络掩码*/static inline unsigned long default_mask(unsigned long dst)
{dst = ntohl(dst);if (IN_CLASSA(dst))return htonl(IN_CLASSA_NET);if (IN_CLASSB(dst))return htonl(IN_CLASSB_NET);return htonl(IN_CLASSC_NET);
}/** If no mask is specified then generate a default entry. 猜测目的地之对应的掩码*/static unsigned long guess_mask(unsigned long dst, struct device * dev)
{unsigned long mask;if (!dst)return 0;mask = default_mask(dst); // 获取子网掩码if ((dst ^ dev->pa_addr) & mask) // 如果为0则表示不属于同一网段 如果相同则返回计算的掩码return mask;return dev->pa_mask; // 返回本地接口地址的掩码
}
通过这两个函数来检查掩码的相关内容。
ip_rt_add函数
/** Find the route entry through which our gateway will be reached 寻找到达该网关或者路由器的本地接口*/static inline struct device * get_gw_dev(unsigned long gw)
{struct rtable * rt;for (rt = rt_base ; ; rt = rt->rt_next) // 循环链表{if (!rt) // 如果为空直接返回return NULL;if ((gw ^ rt->rt_dst) & rt->rt_mask) // 如果网关或者路由器地址与本地接口地址属于一个子网 则该接口可直达该网关或者路由器continue;/* * Gateways behind gateways are a no-no */if (rt->rt_flags & RTF_GATEWAY) // 如果该表项是一个网关转发的地址 则表示出现了循环的状况return NULL;return rt->rt_dev; // 返回绑定的网络接口}
}/** Rewrote rt_add(), as the old one was weird - Linus** This routine is used to update the IP routing table, either* from the kernel (ICMP_REDIRECT) or via an ioctl call issued* by the superuser. 添加一个新的路由表项*/void ip_rt_add(short flags, unsigned long dst, unsigned long mask,unsigned long gw, struct device *dev, unsigned short mtu, unsigned long window)
{struct rtable *r, *rt;struct rtable **rp;unsigned long cpuflags;/** A host is a unique machine and has no network bits.*/if (flags & RTF_HOST) // 如果目的地址是主机地址 则子网掩码为255.255.255.255{mask = 0xffffffff;} /** Calculate the network mask*/else if (!mask) // 如果没有指定子网掩码{if (!((dst ^ dev->pa_addr) & dev->pa_mask)) // 检测目的网络与本地接口地址是否属于同一个子网{mask = dev->pa_mask; // 获取掩码flags &= ~RTF_GATEWAY; // 清楚掉该RTF_GATEWAY标志位if (flags & RTF_DYNAMIC) {/*printk("Dynamic route to my own net rejected\n");*/return;}} elsemask = guess_mask(dst, dev); // 如果不为同一个子网则猜测子网掩码dst &= mask;}/** A gateway must be reachable and not a local address*/if (gw == dev->pa_addr) // 如果输入gw时本地接口地址 就表示目的主机或者网络是直达的 清除掉RTF_GATEWAY标志位flags &= ~RTF_GATEWAY;if (flags & RTF_GATEWAY) {/** Don't try to add a gateway we can't reach.. */if (dev != get_gw_dev(gw)) // 判断传入的dev是否与该函数返回的是同一个设备 如果不是则返回return;flags |= RTF_GATEWAY;} elsegw = 0; // 如果目的地址是一个直达网络或者主机 则网关地址设置为0 /** Allocate an entry and fill it in.*/rt = (struct rtable *) kmalloc(sizeof(struct rtable), GFP_ATOMIC); // 申请内存if (rt == NULL) {return;}memset(rt, 0, sizeof(struct rtable)); // 重置内存rt->rt_flags = flags | RTF_UP;rt->rt_dst = dst;rt->rt_dev = dev;rt->rt_gateway = gw; // 设置网关rt->rt_mask = mask;rt->rt_mss = dev->mtu - HEADER_SIZE;rt->rt_window = 0; /* Default is no clamping *//* Are the MSS/Window valid ? */if(rt->rt_flags & RTF_MSS) // 设置MSS值rt->rt_mss = mtu;if(rt->rt_flags & RTF_WINDOW) // 设置窗口值大小rt->rt_window = window;/** What we have to do is loop though this until we have* found the first address which has a higher generality than* the one in rt. Then we can put rt in right before it.* The interrupts must be off for this process.*/save_flags(cpuflags);cli(); // 禁止中断/** Remove old route if we are getting a duplicate. */rp = &rt_base; // 获取链表头部while ((r = *rp) != NULL) // 遍历链表{if (r->rt_dst != dst || r->rt_mask != mask) // 如果目的地址或者mask不相同{rp = &r->rt_next; // 下一个continue;}*rp = r->rt_next; // 否则删除该表项if (rt_loopback == r)rt_loopback = NULL;kfree_s(r, sizeof(struct rtable));}/** Add the new route */rp = &rt_base; // 添加新的表项while ((r = *rp) != NULL) {if ((r->rt_mask & mask) != mask) // 判断网址大小break;rp = &r->rt_next; // 获取当前的rp}rt->rt_next = r; // 插入该表项*rp = rt;/** Update the loopback route*/if ((rt->rt_dev->flags & IFF_LOOPBACK) && !rt_loopback) // 更新路由表项rt_loopback = rt;/** Restore the interrupts and return*/restore_flags(cpuflags);return;
}
Ip_rt_add函数主要用来添加一个新的路由表项,首先对子网掩码和网关地址以及路由标志位进行校正,然后创建一个新的rtable结构并对其进行初始化,再将初始化完成后的表项添加到系统路由表中。
rt_new函数
/** Check if a mask is acceptable. 检查子网掩码是否正确*/static inline int bad_mask(unsigned long mask, unsigned long addr)
{if (addr & (mask = ~mask)) // 将子网掩码取反后与地址进行与操作 如果非0 则表示地址对应的子网掩码不正确return 1;mask = ntohl(mask);if (mask & (mask+1)) // 检查0 1 交错的情况 如果0 1交错则子网掩码不对return 1;return 0;
}/** Process a route add request from the user 根据传入的rtentry结构添加一个新的路由表项*/static int rt_new(struct rtentry *r)
{int err;char * devname;struct device * dev = NULL;unsigned long flags, daddr, mask, gw;/** If a device is specified find it.*/if ((devname = r->rt_dev) != NULL) // 遍历rtentry列表{err = getname(devname, &devname); // 获取设备的名称if (err)return err;dev = dev_get(devname); // 获取对应的dev putname(devname);if (!dev)return -EINVAL;}/** If the device isn't INET, don't allow it*/if (r->rt_dst.sa_family != AF_INET) // 检查是否是INET协议 如果不是则直接返回return -EAFNOSUPPORT;/** Make local copies of the important bits*/flags = r->rt_flags; // 取出各个参数的值daddr = ((struct sockaddr_in *) &r->rt_dst)->sin_addr.s_addr;mask = ((struct sockaddr_in *) &r->rt_genmask)->sin_addr.s_addr;gw = ((struct sockaddr_in *) &r->rt_gateway)->sin_addr.s_addr;/** BSD emulation: Permits route add someroute gw one-of-my-addresses* to indicate which iface. Not as clean as the nice Linux dev technique* but people keep using it... */if (!dev && (flags & RTF_GATEWAY)) // 如果dev为NULL 并且RTF_GATEWAY标志位被设置 就需要对提供的网关地址进行检查{struct device *dev2;for (dev2 = dev_base ; dev2 != NULL ; dev2 = dev2->next) // 遍历设备列表{if ((dev2->flags & IFF_UP) && dev2->pa_addr == gw) // 如果目的主机或者网络可直达 清楚RTF_GATEWAY标志位{flags &= ~RTF_GATEWAY;dev = dev2;break;}}}/** Ignore faulty masks*/if (bad_mask(mask, daddr)) // 检查子网掩码是否正确mask = 0;/** Set the mask to nothing for host routes.*/if (flags & RTF_HOST) // 如果目的地址是主机地址 则设置子网掩码全为1mask = 0xffffffff;else if (mask && r->rt_genmask.sa_family != AF_INET) // 如果不是AF_INET域则返回return -EAFNOSUPPORT;/** You can only gateway IP via IP..*/if (flags & RTF_GATEWAY) // 对于一个非直达网络或者主机 {if (r->rt_gateway.sa_family != AF_INET) // 如果不是AF_INET域则返回return -EAFNOSUPPORT;if (!dev)dev = get_gw_dev(gw); // 获取网关设备} else if (!dev) // 如果是直达设备dev = ip_dev_check(daddr); // 获取该设备/** Unknown device.*/if (dev == NULL)return -ENETUNREACH;/** Add the route*/ip_rt_add(flags, daddr, mask, gw, dev, r->rt_mss, r->rt_window); // 添加到新的路由表项中return 0;
}
该函数主要是根据上层传入的rtentry参数添加一个新的路由表项,首先先检查rtentry结构中各个字段的合法性,根据rtentry结构字段值产生路由表项所需要的字段值,最后调用ip_rt_add函数完成对新的路由表项的添加。
路由查找函数ip_rt_route和ip_rt_local函数
/** This is hackish, but results in better code. Use "-S" to see why.*/#define early_out ({ goto no_route; 1; })/** Route a packet. This needs to be fairly quick. Florian & Co. * suggested a unified ARP and IP routing cache. Done right its* probably a brilliant idea. I'd actually suggest a unified* ARP/IP routing/Socket pointer cache. Volunteers welcome 查找一个合适的路由表项*/struct rtable * ip_rt_route(unsigned long daddr, struct options *opt, unsigned long *src_addr)
{struct rtable *rt;for (rt = rt_base; rt != NULL || early_out ; rt = rt->rt_next) // 遍历列表{if (!((rt->rt_dst ^ daddr) & rt->rt_mask)) // 检测目的网络与本地接口地址是否属于同一个子网break;/** broadcast addresses can be special cases.. */if (rt->rt_flags & RTF_GATEWAY) // 如果是网关则继续continue; if ((rt->rt_dev->flags & IFF_BROADCAST) &&(rt->rt_dev->pa_brdaddr == daddr)) // 检查是否广播 广播地址是否相同break;}if(src_addr!=NULL)*src_addr= rt->rt_dev->pa_addr; // 获取该设备上的地址if (daddr == rt->rt_dev->pa_addr) { // 如果路由地址是本机地址 则是一个回环地址if ((rt = rt_loopback) == NULL) // 如果rt_loopback地址为空则跳转到空地址goto no_route;}rt->rt_use++; // 计算加一return rt; // 返回该rt
no_route:return NULL;
}struct rtable * ip_rt_local(unsigned long daddr, struct options *opt, unsigned long *src_addr) // 完成对本地链路上主机或者网络地址的路由查询工作
{struct rtable *rt;for (rt = rt_base; rt != NULL || early_out ; rt = rt->rt_next) {/** No routed addressing.*/if (rt->rt_flags&RTF_GATEWAY) // 先查找是路由的设备 如果不是直达地址则跳过continue;if (!((rt->rt_dst ^ daddr) & rt->rt_mask)) break;/** broadcast addresses can be special cases.. */if ((rt->rt_dev->flags & IFF_BROADCAST) &&rt->rt_dev->pa_brdaddr == daddr)break;}if(src_addr!=NULL)*src_addr= rt->rt_dev->pa_addr; // if (daddr == rt->rt_dev->pa_addr) {if ((rt = rt_loopback) == NULL)goto no_route;}rt->rt_use++;return rt;
no_route:return NULL;
}
Ip_rt_route函数主要是查找一个合适的路由表项数据,rp_rt_local函数主要是完成本地链路上主机或者网路地址的路由查询工作。主要就是查询相关的网络设备。
总结
route.c主要就是路由表的相关操作,路由表本质上是通过一个链表来维护的,查询路由本质上就是在链表上查找每个元素进行检查并比较表项中目的地址和实际要发送数据包中的目的地址进行网络号的比较,进而达到查找的目的。由于本人才疏学浅,如有错误请批评指正。
Linux内核网络栈1.2.13-route.c概述相关推荐
- Linux内核网络栈1.2.13-socket.c函数概述
参考资料 <<linux内核网络栈源代码情景分析>> socket常用函数概述 根据socket提供的常用的库函数,socket,read,write等函数, 执行的过程 in ...
- Linux内核--网络栈实现分析(二)--数据包的传递过程--转
转载地址http://blog.csdn.net/yming0221/article/details/7492423 作者:闫明 本文分析基于Linux Kernel 1.2.13 注:标题中的&qu ...
- Linux内核网络栈1.2.13-icmp.c概述
参考资料 <<linux内核网络栈源代码情景分析>> icmp协议 在实现的过程中, ICMP协议工作再IP协议之上,但又不与TCP协议工作再一级,而是在下一级,在一般ICMP ...
- linux内核网络初始化,Linux内核--网络栈实现分析
本文分析基于内核Linux Kernel 1.2.13 以后的系列博文将深入分析Linux内核的网络栈实现原理,这里看到曹桂平博士的分析后,也决定选择Linux内核1.2.13版本进行分析. 原因如下 ...
- Linux内核--网络栈实现分析(三)--驱动程序层+链路层(上)
本文分析基于Linux Kernel 1.2.13 原创作品,转载请标明http://blog.csdn.net/yming0221/article/details/7497260 更多请看专栏,地址 ...
- Linux内核--网络栈实现分析(一)--网络栈初始化--转
转载地址 http://blog.csdn.net/yming0221/article/details/7488828 作者:闫明 本文分析基于内核Linux Kernel 1.2.13 以后的系列博 ...
- Linux内核网络栈1.2.13-tcp.c概述
参考资料 <<linux内核网络栈源代码情景分析>> af_inet.c文件中调用函数在协议层的实现 本文主要根据在af_inet.c文件中根据初始化不同的协议,来调用不同的协 ...
- Linux内核网络栈1.2.13-af_inet.c概述
参考资料 <<linux内核网络栈源代码情景分析>> socket常用函数继续调用分析 根据socket提供的常用库函数,socket.read和write等函数,继续往下一层 ...
- Linux内核网络栈1.2.13-网卡设备的初始化流程
参考资料 <<linux内核网络栈源代码情景分析>> 网卡设备的初始化 本文主要描述一下网卡设备的整个初始化的过程,该过程主要就是根据设备的硬件信息来获取与传输网络数据,注册相 ...
最新文章
- 与python相关的考研专业-给考研人:掌握这项技能,让你每天的学习高效又充实...
- 十三、开多线程,咱们一起来斗图
- rxjs里concatMap operators的用法
- 判断一个字符串是否为另外一个字符串旋转之后的字符串。
- SegmentFault 创始人祁宁对话 C# 之父 Anders Hejlsberg
- linux基础操作与实践,Linux操作系统基础与实践
- android点击切换,android 导航栏中的按钮的点击切换
- Kafka-batch.size属性
- 判断力有时候有多么重要?懂得选择多么重要?
- python生成验证码_Python快速生成验证码
- ffmpeg之G711解析成pcm
- 响应式十日谈第一日:使用 rem 设置文字大小
- 当代体育杂志当代体育杂志社当代体育编辑部2022年第24期目录
- html5 做屏幕保护效果,电脑屏保制作软件如何制作屏保 及如何设置屏幕保护
- 主题:北京亿阳信通Oracle笔试题
- Action Recognition with Improved Trajectories
- Python+selenium实现Drcom校园网自动检测网络以及自动登录
- html盒子模型 正方形嵌套,前端box(盒子嵌套)
- C++字符串转为大写/小写
- 图片url显示服务器,服务器上图片的url地址
热门文章
- 微软Cortana全面升级神经网络语音,效果堪比真人发音
- 对人脑而言,阅读计算机代码和阅读语言有何不同?
- Uber 前无人驾驶工程师告诉你,国内无人驾驶之路还要走多久?
- 又一年5.20,用Python助力程序员脱单大攻略(视频版)
- 太生猛!AI应届生年薪涨到80万!网友:后悔生的太早
- 求助:我有一辆机器人小车,怎么让它跑起来,还会避障、目标跟踪、路径规划?...
- CVPR 2019超全论文合集新鲜出炉!| 资源帖
- AI一分钟 | Facebook或将面临2万亿美元罚款;大疆寻求新一轮融资,估值150亿美元
- Spring Boot 中实现跨域的 5 种方式,你一定要知道!
- Elasticsearch性能优化实战指南