前段时间在学习内核的进程管理方面的东西,看了进程创建和进程调度的代码,想写个大而全的东西,即有内核代码分析,又有一些实验在效果上证明内核的代码。 但是这篇文章很难产,感觉自己还是驾驭不了这个宏大的主题。 好久没写文章了,今天就放弃这个想法,写一个简单的东西。

 
    我们都知道fork创建进程的时候,并没有真正的copy内存,因为我们知道,对于fork来讲,有一个很讨厌的东西叫exec系列的系统调用,它会勾引子进程另起炉灶。如果创建子进程就要内存拷贝的的话,一执行exec,辛辛苦苦拷贝的内存又被完全放弃了。
    内核采用的策略是写时拷贝,换言之,先把页表映射关系建立起来,并不真正将内存拷贝。如果进程读访问,什么都不许要做,如果进程写访问,情况就不同了,因为父子进程的内存空间是独立的,不应该互相干扰。所以这时候不能在公用同一块内存了,否则子进程的改动会被父进程觉察到。
    下图是linux toolbox里面的一张图,比较好,我就拷贝出来了(如果有侵权通知立删),很好的解释了COW的原理。
 下面我们看下,fork一个进程,在kernel/fork.c文件中那些函数调到了。vfork,fork,pthread_create,最终,都会调用do_fork,所不同的就是传递的标志位不同,标志位又控制父子进程,或者父进程和线程他们哪些资源是共用的,哪些资源需要各存一份。
  1. #include<stdio.h>
  2. #include<stdlib.h>
  3. #include<unistd.h>
  4. #include<sys/types.h>
  5. #include<sys/wait.h>
  6. #include<string.h>
  7. int g_var[102400] = {0};
  8. int main()
  9. {
  10. int l_var[102400] = {0};
  11. fprintf(stderr,"g_var 's address is %lx\n",(unsigned long)g_var);
  12. fprintf(stderr,"l_var 's address is %lx\n",(unsigned long)l_var);
  13. memset(g_var,0,sizeof(g_var));
  14. memset(l_var,0,sizeof(l_var));
  15. sleep(15);
  16. int ret = fork();
  17. if(ret < 0 )
  18. {
  19. fprintf(stderr,"fork failed ,nothing to do now!\n");
  20. return -1;
  21. }
  22. if(ret == 0)
  23. {
  24. sleep(10);
  25. fprintf(stderr, "I begin to write now\n");
  26. fprintf(stderr,"address at %-10lx value(%-6d) will cause page falut\n",
  27. (unsigned long)(g_var+2048),g_var[2048]);
  28. g_var[2048] = 4;
  29. sleep(6);
  30. fprintf(stderr,"address at %-10lx value(%-6d) will cause page fault\n",
  31. (unsigned long)(g_var+10240),g_var[10240]);
  32. g_var[10240] = 8;
  33. sleep(4);
  34. fprintf(stderr,"address at %-10lx value(%-6d) will cause page falut\n",
  35. (unsigned long)(l_var+2048),l_var[2048]);
  36. l_var[2048] = 8;
  37. sleep(4);
  38. fprintf(stderr,"address at %-10lx value(%-6d) will cause page falut\n",
  39. (unsigned long)(l_var+10240),l_var[10240]);
  40. l_var[10240] = 8;
  41. }
  42. if(ret >0)
  43. {
  44. waitpid(-1,NULL,0);
  45. fprintf(stderr,"child process exit, now check the value\n");
  46. fprintf(stderr,"g_var[%-6d] = %-4d\ng_var[%-6d] = %-4d\n",
  47. 2048,g_var[2048],10240,g_var[10240]);
  48. fprintf(stderr,"l_var[%-6d] = %-4d\nl_var[%-6d] = %-4d\n",
  49. 2048,l_var[2048],10240,l_var[10240]);
  50. return 0;
  51. }
  52. }

这里面执行了一个fork系统调用,我们调用下systemtap脚本看下他都调用了kernel/fork.c里面的那些函数:systemtap脚本如下:

  1. probe kernel.function("*@kernel/fork.c")
  2. {
  3. if(pid() == target())
  4. {
  5. printf("PID(%d) ,execname(%s) probe point:(%s) \n",pid(),execname(),pp());
  6. }
  7. }
  8. probe timer.s(60)
  9. {
  10. exit();
  11. }
  1. root@libin:~/program/systemtap/process# stap fork_call.stp -x 7192
  2. PID(7192) ,execname(fork_cow) probe point:(kernel.function("do_fork@/build/buildd/linux-2.6.32/kernel/fork.c:1364"))
  3. PID(7192) ,execname(fork_cow) probe point:(kernel.function("copy_process@/build/buildd/linux-2.6.32/kernel/fork.c:978"))
  4. PID(7192) ,execname(fork_cow) probe point:(kernel.function("dup_task_struct@/build/buildd/linux-2.6.32/kernel/fork.c:221"))
  5. PID(7192) ,execname(fork_cow) probe point:(kernel.function("account_kernel_stack@/build/buildd/linux-2.6.32/kernel/fork.c:141"))
  6. PID(7192) ,execname(fork_cow) probe point:(kernel.function("rt_mutex_init_task@/build/buildd/linux-2.6.32/kernel/fork.c:941"))
  7. PID(7192) ,execname(fork_cow) probe point:(kernel.function("copy_flags@/build/buildd/linux-2.6.32/kernel/fork.c:923"))
  8. PID(7192) ,execname(fork_cow) probe point:(kernel.function("posix_cpu_timers_init@/build/buildd/linux-2.6.32/kernel/fork.c:960"))
  9. PID(7192) ,execname(fork_cow) probe point:(kernel.function("copy_files@/build/buildd/linux-2.6.32/kernel/fork.c:747"))
  10. PID(7192) ,execname(fork_cow) probe point:(kernel.function("copy_fs@/build/buildd/linux-2.6.32/kernel/fork.c:727"))
  11. PID(7192) ,execname(fork_cow) probe point:(kernel.function("copy_sighand@/build/buildd/linux-2.6.32/kernel/fork.c:799"))
  12. PID(7192) ,execname(fork_cow) probe point:(kernel.function("copy_signal@/build/buildd/linux-2.6.32/kernel/fork.c:854"))
  13. PID(7192) ,execname(fork_cow) probe point:(kernel.function("posix_cpu_timers_init_group@/build/buildd/linux-2.6.32/kernel/fork.c:826"))
  14. PID(7192) ,execname(fork_cow) probe point:(kernel.function("copy_mm@/build/buildd/linux-2.6.32/kernel/fork.c:680"))
  15. PID(7192) ,execname(fork_cow) probe point:(kernel.function("dup_mm@/build/buildd/linux-2.6.32/kernel/fork.c:624"))
  16. PID(7192) ,execname(fork_cow) probe point:(kernel.function("mm_init@/build/buildd/linux-2.6.32/kernel/fork.c:448"))
  17. PID(7192) ,execname(fork_cow) probe point:(kernel.function("mm_alloc_pgd@/build/buildd/linux-2.6.32/kernel/fork.c:403"))
  18. PID(7192) ,execname(fork_cow) probe point:(kernel.function("mm_init_aio@/build/buildd/linux-2.6.32/kernel/fork.c:440"))
  19. PID(7192) ,execname(fork_cow) probe point:(kernel.function("mm_init_owner@/build/buildd/linux-2.6.32/kernel/fork.c:951"))
  20. PID(7192) ,execname(fork_cow) probe point:(kernel.function("dup_mmap@/build/buildd/linux-2.6.32/kernel/fork.c:278"))
  21. PID(7192) ,execname(fork_cow) probe point:(kernel.function("copy_io@/build/buildd/linux-2.6.32/kernel/fork.c:774"))
  22. PID(7192) ,execname(fork_cow) probe point:(kernel.function("__cleanup_sighand@/build/buildd/linux-2.6.32/kernel/fork.c:816"))
  23. PID(7192) ,execname(fork_cow) probe point:(kernel.function("__cleanup_signal@/build/buildd/linux-2.6.32/kernel/fork.c:916"))
  24. PID(7192) ,execname(fork_cow) probe point:(kernel.function("mm_release@/build/buildd/linux-2.6.32/kernel/fork.c:570"))
  25. PID(7192) ,execname(fork_cow) probe point:(kernel.function("mmput@/build/buildd/linux-2.6.32/kernel/fork.c:509"))

fork调用了do_fork这个内核函数,这个函数比较大,主干程序是copy_process,这里有一系列的copy_xxx系列产品,这个系列产品会根据传进来的标志位,来决定那些资源子进程需要copy一份,那些不用拷贝了,直接用父进程的就可以了。 我们关注的copy_mm这个函数,如果用户标志位中的CLONE_VM置了1,得了,和父进程共享一份就成了,不需要费劲在copy一份了:

  1. if (clone_flags & CLONE_VM) {
  2. atomic_inc(&oldmm->mm_users);
  3. mm = oldmm;
  4. goto good_mm;
  5. }

这个地方语意很怪,正常应该是CLONE_VM是1,我应该copy一份,但是正好相反,CLONE_XX意味值share_XX,意味着,不需要copy。

    需要copy内存的话,真正干活的函数是dup_mm,pthread_create函数就不会走到dup_mm函数,因为他不需要copy一份父进程的内存空间,他是共用一份内存空间的。请看下面pthread_create引发的do_fork。
  1. root@libin:~/program/C/process_share# ./pthread_cmp &
  2. [3] 7787
  3. root@libin:~/program/C/process_share# thread OUT
  4. thread IN
  5. thread OUT
  6. [2]- Done ./pthread_cmp
  7. [3]+ Done ./pthread_cmp
  1. root@libin:~/program/systemtap/process# stap fork_call.stp -x 7787
  2. PID(7787) ,execname(pthread_cmp) probe point:(kernel.function("do_fork@/build/buildd/linux-2.6.32/kernel/fork.c:1364"))
  3. PID(7787) ,execname(pthread_cmp) probe point:(kernel.function("copy_process@/build/buildd/linux-2.6.32/kernel/fork.c:978"))
  4. PID(7787) ,execname(pthread_cmp) probe point:(kernel.function("dup_task_struct@/build/buildd/linux-2.6.32/kernel/fork.c:221"))
  5. PID(7787) ,execname(pthread_cmp) probe point:(kernel.function("account_kernel_stack@/build/buildd/linux-2.6.32/kernel/fork.c:141"))
  6. PID(7787) ,execname(pthread_cmp) probe point:(kernel.function("rt_mutex_init_task@/build/buildd/linux-2.6.32/kernel/fork.c:941"))
  7. PID(7787) ,execname(pthread_cmp) probe point:(kernel.function("copy_flags@/build/buildd/linux-2.6.32/kernel/fork.c:923"))
  8. PID(7787) ,execname(pthread_cmp) probe point:(kernel.function("posix_cpu_timers_init@/build/buildd/linux-2.6.32/kernel/fork.c:960"))
  9. PID(7787) ,execname(pthread_cmp) probe point:(kernel.function("copy_files@/build/buildd/linux-2.6.32/kernel/fork.c:747"))
  10. PID(7787) ,execname(pthread_cmp) probe point:(kernel.function("copy_fs@/build/buildd/linux-2.6.32/kernel/fork.c:727"))
  11. PID(7787) ,execname(pthread_cmp) probe point:(kernel.function("copy_sighand@/build/buildd/linux-2.6.32/kernel/fork.c:799"))
  12. PID(7787) ,execname(pthread_cmp) probe point:(kernel.function("copy_signal@/build/buildd/linux-2.6.32/kernel/fork.c:854"))
  13. PID(7787) ,execname(pthread_cmp) probe point:(kernel.function("copy_mm@/build/buildd/linux-2.6.32/kernel/fork.c:680"))
  14. PID(7787) ,execname(pthread_cmp) probe point:(kernel.function("copy_io@/build/buildd/linux-2.6.32/kernel/fork.c:774"))
  15. PID(7787) ,execname(pthread_cmp) probe point:(kernel.function("mm_release@/build/buildd/linux-2.6.32/kernel/fork.c:570"))
  16. PID(7787) ,execname(pthread_cmp) probe point:(kernel.function("mmput@/build/buildd/linux-2.6.32/kernel/fork.c:509"))
  17. PID(7787) ,execname(pthread_cmp) probe point:(kernel.function("__cleanup_sighand@/build/buildd/linux-2.6.32/kernel/fork.c:816"))
  18. PID(7787) ,execname(pthread_cmp) probe point:(kernel.function("mm_release@/build/buildd/linux-2.6.32/kernel/fork.c:570"))
  19. PID(7787) ,execname(pthread_cmp) probe point:(kernel.function("mmput@/build/buildd/linux-2.6.32/kernel/fork.c:509"))

dup_mm这里面有两个分支指的注意

   1 mm_init-->mm_alloc_pgd
   2 dup_mmap
    这两个分支真正将父进程的页表拷贝了一份,尤其是dup_mmap,沿着copy_page_range-->copy_pud_range---> copy_pmd_range--->copy_pte_range,一路向西,将页表拷贝了一份。
    由于fork创建的子进程并没有拷贝整个内存,所以,当子进程修改内存某地址对应的值的时候,会产生缺页中断,page fault 。 我的C程序中有will cause page fault的字样,只要是写时拷贝,就会出现page fault 。 所以我们只需要在程序运行过程中监控page_fault,只要我们修改的变量的地址,引起了page fault,就证明fork 采用了COW 。
    看监控程序systemtap脚本:
  1. #! /usr/bin/env stap
  2. global fault_entry_time, fault_address, fault_access
  3. global time_offset
  4. probe begin { time_offset = gettimeofday_us() }
  5. probe vm.pagefault {
  6. if(pid() == target() || ppid() == target())
  7. {
  8. t = gettimeofday_us()
  9. p = pid()
  10. fault_entry_time[p] = t
  11. fault_address[p] = address
  12. fault_access[p] = write_access ? "w" : "r"
  13. }
  14. }
  15. probe vm.pagefault.return {
  16. if(pid() == target() || ppid() == target())
  17. {
  18. t=gettimeofday_us()
  19. p = pid()
  20. if (!(p in fault_entry_time)) next
  21. e = t - fault_entry_time[p]
  22. if (vm_fault_contains(fault_type,VM_FAULT_MINOR)) {
  23. ftype="minor"
  24. } else if (vm_fault_contains(fault_type,VM_FAULT_MAJOR)) {
  25. ftype="major"
  26. } else {
  27. next #only want to deal with minor and major page faults
  28. }
  29. printf("%d:%d:%p:%s:%s:%d\n",
  30. t - time_offset, p, fault_address[p], fault_access[p], ftype, e)
  31. #free up memory
  32. delete fault_entry_time[p]
  33. delete fault_address[p]
  34. delete fault_access[p]
  35. }
  36. }
  37. probe timer.s(100){
  38. exit();
  39. }
systemtap脚本的含义是跟踪指定进程和子进程,如果有page fault 会打印一条记录出来 。 

下面看现象:

  1. root@libin:~/program/C/process_share# g_var 's address is 804a060
  2. l_var 's address is bf8edf0c
  3. I begin to write now
  4. address at 804c060 value(0 ) will cause page falut
  5. address at 8054060 value(0 ) will cause page fault
  6. address at bf8eff0c value(0 ) will cause page falut
  7. address at bf8f7f0c value(0 ) will cause page falut
  8. .....
  1. root@libin:~/program/systemtap#
  2. root@libin:~/program/systemtap#
  3. root@libin:~/program/systemtap# stap pfaults.stp -x 9081
  4. 4767196:9081:0xb77ec72c:w:minor:35
  5. 4767230:9092:0xb77ec728:w:minor:23
  6. 4767239:9081:0xbf8edea8:w:minor:29
  7. .....
  8. 14768229:9092:0x0804c060:w:minor:13
  9. 20768379:9092:0x08054060:w:minor:37
  10. 24768564:9092:0xbf8eff0c:w:minor:39
  11. 28768745:9092:0xbf8f7f0c:w:minor:39
  12. ...
这写个空格的出现是由于我手工敲的,因为中间有sleep,所以我有足够的时间敲回车。
产生了page_fault,证明了我们的推断。
另外我在调试的过程中发现,如果不调用memset,子进程退出后,父进程读访问数组指定位置的变量,也会出现page fault,有心的筒子可以自行验证。
提示: 代码在写博客的过程中有一些微调,输出格式有调整,也有其他的一些微调,所以可能输出和代码对应并不是100% 。 对此有困惑的筒子可以自行验证,总之我没有造假了,呵呵。
参考文献:
1 systemtap example
2 深入linux 内核架构
3 Linux Toolbox

fork,你拿什么证明你的写时拷贝(COW)相关推荐

  1. Linux | fork()、僵死进程、写时拷贝

    目录 1. 获取进程id的方法 2. 父进程的父进程~bash 3. fork()示例 之 打印了多少个A? (1)打印3个A (2)打印6个A (3)fork()试题总结 4. 进程的结束.僵死进程 ...

  2. 【Linux进程、线程、任务调度】二 fork/vfork与写时拷贝 线程的本质 托孤 进程睡眠和等待队列

    学习交流加(可免费帮忙下载CSDN资源): 个人微信: liu1126137994 学习交流资源分享qq群1(已满): 962535112 学习交流资源分享qq群2(已满): 780902027 学习 ...

  3. 写时复制,写时拷贝,写时分裂,Copy on write

    2019独角兽企业重金招聘Python工程师标准>>> 写时复制,写时拷贝,写时分裂 (Copy-on-write,简称COW)是计算机资源管理方面的一种优化技术,有着广泛的应用,比 ...

  4. linux进程--写时拷贝技术copy-on-write(七)

    COW技术初窥: 在Linux程序中,fork()会产生一个和父进程完全相同的子进程,但子进程在此后多会exec系统调用,出于效率考虑,linux中引入了"写时复制"技术,也就是只 ...

  5. Linux写时拷贝技术(copy-on-write)

    COW技术初窥: 在Linux程序中,fork()会产生一个和父进程完全相同的子进程,但子进程在此后多会exec系统调用,出于效率考虑,linux中引入了"写时复制"技术,也就是只 ...

  6. 【转】Linux写时拷贝技术(copy-on-write)

    http://www.cnblogs.com/biyeymyhjob/archive/2012/07/20/2601655.html 源于网上资料 COW技术初窥: 在Linux程序中,fork()会 ...

  7. Linux系统编程15:进程控制之如何创建进程和写时拷贝技术

    文章目录 (1)fork函数回顾 (2)写时拷贝 (1)fork函数回顾 在下面这篇文章我们演示了fork函数以及相关细节 点击跳转 还是借助上文中的程序和效果图片 #include <stdi ...

  8. linux 进程0 写时复制,linux 写时复制 COW 过程梳理

    最后一次谈到缺页,是在一年多以前,http://blog..net/chenyu105/article/details/7061845 那时结个了草率的尾,定格在了handle_pte_fault,留 ...

  9. Linux 10分钟让你掌握虚拟地址--写时拷贝技术

    程序地址空间 地址:对内存单元的编号 程序是不占用内存的,运行起来的程序才会被加载到内存,才会占用空间.所以程序地址空间也叫做进程地址空间 我们先来看一下代码: zone.c #include < ...

  10. 写时拷贝技术(COW)

    文章目录 写时拷贝技术 写时拷贝技术原理 举个例子 写时拷贝技术   写时拷贝技术实际上是一种拖延战术,是为了提高效率而产生的技术,这怎么提高效率呢?实际上就是在需要开辟空间时,假装开了空间,实际上用 ...

最新文章

  1. linux如何登陆oracle?如何停止、启动oracle和其监听?
  2. 硬计算、软计算与混合计算
  3. 搜狐2012.9.15校园招聘会笔试题
  4. URAL-1982 Electrification Plan 最小生成树
  5. 盘点那些世间顶级直男hhhhhh | 今日最佳
  6. 【转载保存】匿名内部类中this的使用
  7. 作者:杜圣东(1981-),男,西南交通大学信息科学与技术学院讲师,中国计算机学会(CCF)和国际计算机学会(ACM)会员。...
  8. 关于产品与数据该如何结合的一点想法(一)
  9. hashset如何检查重复_如何使用 C# 中的 HashSet
  10. ubuntu安装ulipad
  11. 百度网盘使用Motrix下载资源
  12. 鼠标不受控制一直向右移动的解决办法
  13. Hadoop生态圈之即席查询工具Presto
  14. WeWork中国实现全面本土化运营;巴黎欧莱雅沙龙专属全球首家旗舰沙龙开业 | 美通企业日报...
  15. sklearn 随机森林代码示例
  16. “FCoE全解系列”之网络融合交换机类型
  17. 单月营业额一个亿,任泉李冰冰黄晓明追着投钱!这家企业是谁?
  18. 门萨--高智商者的集中营
  19. RTL概念与常用RTL建模
  20. 西工大PAMI论文:发布大规模人群计数/定位基准平台

热门文章

  1. C++的C4305和C4800的编译警告
  2. 关联查询objectid_SAP 删除的BOM如何查询呢?
  3. plsql能连mysql吗_每日囧图连世界首富都秃顶,你还觉脱发是能用钱解决的事吗?...
  4. Python爬虫从入门到放弃(二十四)之 Scrapy登录知乎
  5. MySql中in和exists效率
  6. C++ 从零单排(2)-基础知识二
  7. [转]winform控件webbrowser和js脚本互调
  8. cmd启动某个server卡住解决办法
  9. spring框架包含的模块
  10. WEB前端 盒子模型稳定性