CC_STACKPROTECTOR防内核堆栈溢出补丁分析【转】
转自:https://yq.aliyun.com/articles/1723
摘要: 作者:王智通 CC_STACKPROTECT补丁是Tejun Heo在09年给主线kernel提交的一个用来防止内核堆栈溢出的补丁。默认的config是将这个选项关闭的,可以在编译内核的时候, 修改.config文件为CONFIG_CC_STACKPROTECTOR=y来启...
作者:王智通
CC_STACKPROTECT补丁是Tejun Heo在09年给主线kernel提交的一个用来防止内核堆栈溢出的补丁。默认的config是将这个选项关闭的,可以在编译内核的时候, 修改.config文件为CONFIG_CC_STACKPROTECTOR=y来启用。未来飞天内核可以将这个选项开启来防止利用内核stack溢出的0day攻击。这个补丁的防溢出原理是: 在进程启动的时候, 在每个buffer的后面放置一个预先设置好的stack canary,你可以把它理解成一个哨兵, 当buffer发生缓冲区溢出的时候, 肯定会破坏stack canary的值, 当stack canary的值被破坏的时候, 内核就会直接当机。那么是怎么判断stack canary被覆盖了呢? 其实这个事情是gcc来做的,内核在编译的时候给gcc加了个-fstack-protector参数, 我们先来研究下这个参数是做什么用的。
先写个简单的有溢出的程序:
[wzt@localhost csaw]$ cat test.c
#include <stdio.h> #include <stdlib.h>void test(void) {char buff[64];memset(buff, 0x41, 128); //向64大小的buffer拷贝128字节, 肯定会发生缓冲区溢出。 }int main(void) {test();return 0; }
[wzt@localhost csaw]$ gcc -o test test.c [wzt@localhost csaw]$ ./test
段错误
反汇编看看:
[wzt@localhost csaw]$ objdump -d test > hex08048384 <test>:8048384: 55 push %ebp8048385: 89 e5 mov %esp,%ebp8048387: 83 ec 58 sub $0x58,%esp804838a: c7 44 24 08 80 00 00 movl $0x80,0x8(%esp)8048391: 008048392: c7 44 24 04 41 00 00 movl $0x41,0x4(%esp)8048399: 00804839a: 8d 45 c0 lea 0xffffffc0(%ebp),%eax804839d: 89 04 24 mov %eax,(%esp)80483a0: e8 e3 fe ff ff call 8048288 <memset@plt>80483a5: c9 leave80483a6: c3 ret
没什么特别的,我们在加上-fstack-protector参数看看:
[wzt@localhost csaw]$ gcc -o test test.c -fstack-protector [wzt@localhost csaw]$ ./test *** stack smashing detected ***: ./test terminated 已放弃
这次程序打印了一条堆栈被溢出的信息,然后就自动退出了。
在反汇编看下:
[wzt@localhost csaw]$ objdump -d test > hex1080483d4 <test>:80483d4: 55 push %ebp80483d5: 89 e5 mov %esp,%ebp80483d7: 83 ec 68 sub $0x68,%esp80483da: 65 a1 14 00 00 00 mov %gs:0x14,%eax80483e0: 89 45 fc mov %eax,0xfffffffc(%ebp)80483e3: 31 c0 xor %eax,%eax80483e5: c7 44 24 08 80 00 00 movl $0x80,0x8(%esp)80483ec: 0080483ed: c7 44 24 04 41 00 00 movl $0x41,0x4(%esp)80483f4: 0080483f5: 8d 45 bc lea 0xffffffbc(%ebp),%eax80483f8: 89 04 24 mov %eax,(%esp)80483fb: e8 cc fe ff ff call 80482cc <memset@plt>8048400: 8b 45 fc mov 0xfffffffc(%ebp),%eax8048403: 65 33 05 14 00 00 00 xor %gs:0x14,%eax804840a: 74 05 je 8048411 <test+0x3d>804840c: e8 db fe ff ff call 80482ec <__stack_chk_fail@plt>8048411: c9 leave8048412: c3 ret
使用-fstack-protector参数后, gcc在函数的开头放置了几条汇编代码:
!sh80483d7: 83 ec 68 sub $0x68,%esp80483da: 65 a1 14 00 00 00 mov %gs:0x14,%eax80483e0: 89 45 fc mov %eax,0xfffffffc(%ebp)
将代码段gs偏移0×14内存处的值赋值给了ebp-4, 也就是第一个变量值的后面。
在call完memeset后,有如下汇编代码:
!sh80483fb: e8 cc fe ff ff call 80482cc <memset@plt>8048400: 8b 45 fc mov 0xfffffffc(%ebp),%eax8048403: 65 33 05 14 00 00 00 xor %gs:0x14,%eax804840a: 74 05 je 8048411 <test+0x3d>804840c: e8 db fe ff ff call 80482ec <__stack_chk_fail@plt>
在memset后,gcc要检查这个操作是否发生了堆栈溢出, 将保存在ebp-4的这个值与原来的值对比一下,如果不相同, 说明堆栈发生了溢出,那么就会执行stack_chk_fail这个函数, 这个函数是glibc实现的,打印出上面看到的信息, 然后进程退出。
从这个例子中我们可以看出gcc使用了-fstack-protector参数后,会自动检查堆栈是否发生了溢出, 但是有一个前提就是内核要给每个进程提前设置好一个检测值放置在%gs:0×14位置处,这个值称之为stack canary。所以我们可以看到防止堆栈溢出是由内核和gcc共同来完成的。
gcc的任务就是放置几条汇编代码, 然后和%gs:0×14位置处的值进行对比即可。 主要任务还是内核如何来设置stack canary, 也是CC_STACKPROTECTOR补丁要实现的目的, 下面我们仔细来看下这个补丁是如何实现的。
既然gcc硬性规定了stack canary必须在%gs的某个偏移位置处, 那么内核也必须按着这个规定来设置。
对于32位和64位内核, gs寄存器有着不同的功能。
64位内核gcc要求stack canary是放置在gs段的40偏移处, 并且gs寄存器在每cpu变量中是共享的,每cpu变量irq_stack_union的结构如下:
arch/x86/include/asm/processor.h
union irq_stack_union {char irq_stack[IRQ_STACK_SIZE];/** GCC hardcodes the stack canary as %gs:40. Since the* irq_stack is the object at %gs:0, we reserve the bottom* 48 bytes of the irq stack for the canary. */struct {char gs_base[40];unsigned long stack_canary;}; };DECLARE_PER_CPU_FIRST(union irq_stack_union, irq_stack_union);
gs_base只是一个40字节的站位空间, stack_canary就紧挨其后。并且在应用程序进出内核的时候,内核会使用swapgs指令自动更换gs寄存器的内容。
32位下就稍微有点复杂了。由于某些处理器在加载不同的段寄存器时很慢, 所以内核使用fs段寄存器替换了gs寄存器。 但是gcc在使用-fstack-protector的时候, 还要用到gs段寄存器, 所以内核还要管理gs寄存器,我们要把CONFIG_X86_32_LAZY_GS选项关闭, gs也只在进程切换的时候才改变。 32位用每cpu变量stack_canary保存stack canary。
struct stack_canary {char __pad[20]; /* canary at %gs:20 */unsigned long canary; }; DECLARE_PER_CPU_ALIGNED(struct stack_canary, stack_canary);
内核是处于保护模式的, 因此gs寄存器就变成了保护模式下的段选子,在GDT表中也要有相应的设置:
diff --git a/arch/x86/include/asm/segment.h b/arch/x86/include/asm/segment.h index 1dc1b51..14e0ed8 100644 (file) --- a/arch/x86/include/asm/segment.h +++ b/arch/x86/include/asm/segment.h @@ -61,7 +61,7 @@** 26 - ESPFIX small SS* 27 - per-cpu [ offset to per-cpu data area ] - * 28 - unused + * 28 - stack_canary-20 [ for stack protector ]* 29 - unused* 30 - unused* 31 - TSS for double fault handler @@ -95,6 +95,13 @@#define __KERNEL_PERCPU 0#endif+#define GDT_ENTRY_STACK_CANARY (GDT_ENTRY_KERNEL_BASE + 16) +#ifdef CONFIG_CC_STACKPROTECTOR +#define __KERNEL_STACK_CANARY (GDT_ENTRY_STACK_CANARY * 8) +#else +#define __KERNEL_STACK_CANARY 0 +#endif +#define GDT_ENTRY_DOUBLEFAULT_TSS 31
GDT表中的第28个表项用来定为stack canary所在的段。
#define GDT_STACK_CANARY_INIT \[GDT_ENTRY_STACK_CANARY] = GDT_ENTRY_INIT(0x4090, 0, 0x18),
GDT_STACK_CANARY_INIT在刚进入保护模式的时候被调用, 这个段描述符项被设置为基地址为0, 段大小设为24,因为只在基地址为0, 偏移为0×14处放置一个4bytes的stack canary, 所以24字节正好。不理解的同学可以看看intel保护模式的手册, 对着段描述符结构一个个看就行了。
在进入保护模式后, start_kernel()会调用boot_init_stack_canary()来初始话一个stack canary。
/* * Initialize the stackprotector canary value.** NOTE: this must only be called from functions that never return,* and it must always be inlined.*/ static __always_inline void boot_init_stack_canary(void) {u64 canary;u64 tsc;#ifdef CONFIG_X86_64BUILD_BUG_ON(offsetof(union irq_stack_union, stack_canary) != 40); #endif/** We both use the random pool and the current TSC as a source* of randomness. The TSC only matters for very early init,* there it already has some randomness on most systems. Later* on during the bootup the random pool has true entropy too.*/get_random_bytes(&canary, sizeof(canary));tsc = __native_read_tsc();canary += tsc + (tsc << 32UL);current->stack_canary = canary; #ifdef CONFIG_X86_64percpu_write(irq_stack_union.stack_canary, canary); #elsepercpu_write(stack_canary.canary, canary); #endif }
随机出了一个值赋值给每cpu变量, 32位是stack_canary, 64位是irq_stack_union。
内核在进一步初始化cpu的时候,会调用setup_stack_canary_segment()来设置每个cpu的GDT的stack canary描述符项:
start_kernel()->setup_per_cpu_areas()->setup_stack_canary_segment:
static inline void setup_stack_canary_segment(int cpu) { #ifdef CONFIG_X86_32unsigned long canary = (unsigned long)&per_cpu(stack_canary, cpu);struct desc_struct *gdt_table = get_cpu_gdt_table(cpu);struct desc_struct desc;desc = gdt_table[GDT_ENTRY_STACK_CANARY];set_desc_base(&desc, canary);write_gdt_entry(gdt_table, GDT_ENTRY_STACK_CANARY, &desc, DESCTYPE_S); #endif }
在内核刚进入保护模式的时候, stack canary描述符的基地址被初始化为0, 现在在cpu初始化的时候要重新设置为每cpu变量stack_canary的地址, 而不是变量保存的值。通过这些设置当内核代码在访问%gs:0×14的时候, 就会访问stack canry保存的值。注意:setup_stack_canary_segment是针对32位内核做设置, 因为64位内核中的irq_stack_union是每cpu共享的, 不用针对每个cpu单独设置。 然后就可以调用switch_to_new_gdt(cpu);来加载GDT表和加载gs寄存器。
经过上述初始化过程,在内核代码里访问%gs:0×14就可以定位stack canary的值了, 那么每个进程的stack canary是什么时候设置的呢?
在内核启动一个进程的时候, 会把gs寄存器的值设为KERNEL_STACK_CANARY
--- a/arch/x86/kernel/process_32.c +++ b/arch/x86/kernel/process_32.c @@ -212,6 +212,7 @@ int kernel_thread(int (*fn)(void *), void *arg, unsigned long flags)regs.ds = __USER_DS;regs.es = __USER_DS;regs.fs = __KERNEL_PERCPU; + regs.gs = __KERNEL_STACK_CANARY;regs.orig_ax = -1;regs.ip = (unsigned long) kernel_thread_helper;regs.cs = __KERNEL_CS | get_kernel_rpl();
内核在fork一个进程的时候, 有如下操作:
static struct task_struct *dup_task_struct(struct task_struct *orig) { #ifdef CONFIG_CC_STACKPROTECTORtsk->stack_canary = get_random_int(); #endif }
随机初始化了一个stack_canary保存在task_struct结构中的stack_canary变量中。当进程在切换的时候, 通过switch宏把新进程的stack canary保存在每cpu变量stack_canary中, 当前进程的stack_canary也保存在一个每cpu变量中,完成stack canary的切换。
diff --git a/arch/x86/include/asm/system.h b/arch/x86/include/asm/system.h index 79b98e5..2692ee8 100644 (file) --- a/arch/x86/include/asm/system.h +++ b/arch/x86/include/asm/system.h @@ -23,6 +23,22 @@ struct task_struct *__switch_to(struct task_struct *prev,#ifdef CONFIG_X86_32+#ifdef CONFIG_CC_STACKPROTECTOR +#define __switch_canary \ + "movl "__percpu_arg([current_task])",%%ebx\n\t" \ + "movl %P[task_canary](%%ebx),%%ebx\n\t" \ + "movl %%ebx,"__percpu_arg([stack_canary])"\n\t" +#define __switch_canary_oparam \ + , [stack_canary] "=m" (per_cpu_var(stack_canary)) +#define __switch_canary_iparam \ + , [current_task] "m" (per_cpu_var(current_task)) \ + , [task_canary] "i" (offsetof(struct task_struct, stack_canary)) +#else /* CC_STACKPROTECTOR */ +#define __switch_canary +#define __switch_canary_oparam +#define __switch_canary_iparam +#endif /* CC_STACKPROTECTOR */ +/** Saving eflags is important. It switches not only IOPL between tasks,* it also protects other tasks from NT leaking through sysenter etc. @@ -46,6 +62,7 @@ do { \"pushl %[next_ip]\n\t" /* restore EIP */ \"jmp __switch_to\n" /* regparm call */ \"1:\t" \ + __switch_canary \"popl %%ebp\n\t" /* restore EBP */ \"popfl\n" /* restore flags */ \\ @@ -58,6 +75,8 @@ do { \"=b" (ebx), "=c" (ecx), "=d" (edx), \"=S" (esi), "=D" (edi) \\ + __switch_canary_oparam \ + \/* input parameters: */ \: [next_sp] "m" (next->thread.sp), \[next_ip] "m" (next->thread.ip), \ @@ -66,6 +85,8 @@ do { \[prev] "a" (prev), \[next] "d" (next) \\ + __switch_canary_iparam \ + \: /* reloaded segment registers */ \"memory"); \} while (0)
前面讲过当gcc检测到堆栈溢出的时候, 会调用glibc的stack_chk_fail函数, 但是当内核堆栈发生溢出的时候,
不能调用glibc的函数,所以内核自己实现了一个stack_chk_fail函数:
kernel/panic.c
#ifdef CONFIG_CC_STACKPROTECTOR/** Called when gcc's -fstack-protector feature is used, and* gcc detects corruption of the on-stack canary value*/ void __stack_chk_fail(void) {panic("stack-protector: Kernel stack is corrupted in: %p\n",__builtin_return_address(0)); } EXPORT_SYMBOL(__stack_chk_fail);#endif
当内核堆栈发生溢出的时候,就会执行stack_chk_fail函数, 内核当机。
这就是这个补丁的原理,不懂的同学请参考: http://git.kernel.org/?p=linux/kernel/git/next/linux-next.git;a=commitdiff;h=60a5317ff0f42dd313094b88f809f63041568b08
CC_STACKPROTECTOR防内核堆栈溢出补丁分析【转】相关推荐
- 45.JVM调优策略、常见问题:内存泄漏(年老代堆空间被占满、持久代被占满、堆栈溢出、线程堆栈满、系统内存被占满)优化方法:优化目标、优化GC步骤、优化总结;案例分析(公司系统参数、网上给的配置参数)
45.JVM调优策略 45.1.常见问题 45.1.1.内存泄漏 45.1.1.1.年老代堆空间被占满 45.1.1.2.持久代被占满 45.1.1.3.堆栈溢出 45.1.1.4.线程堆栈满 45. ...
- 分析堆栈溢出原因_我分析了有关堆栈溢出的所有书籍。 这是最受欢迎的。
分析堆栈溢出原因 by Vlad Wetzel 通过弗拉德·韦泽尔 我分析了有关堆栈溢出的所有书籍. 这是最受欢迎的. (I analyzed every book ever mentioned on ...
- linux信号机制 - 用户堆栈和内核堆栈的变化【转】
转自:http://itindex.net/detail/16418-linux-%E4%BF%A1%E5%8F%B7-%E5%A0%86%E6%A0%88 此文只简单分析发送信号给用户程序后,用户堆 ...
- 一种新的Heap区溢出技术分析[转贴]
一种新的Heap区溢出技术分析[转贴]---http://www.linuxsir.org/bbs/thread50097.html 作者:warning3 < maito:warning3@n ...
- c++ dump某个变量_linux内核调试之 crash分析dump文件
Linux 下也有众多的内存转储分析工具,lcrash.Alicia.Crash.Crash 是由 Dave Anderson 开发和维护的一个内存转储分析工具,目前它的最新版本是 5.0.0. 在没 ...
- C语言高级编程:利用堆栈溢出修改函数返回地址
利用函数堆栈溢出,修改函数返回地址,进而调用别的函数. 测试环境: win10 x86-64 gcc: x86_64-pc-cygwin 代码 #include <stdio.h> #in ...
- 堆栈溢出从入门到提高
转自:http://www.jiaonan.net/html/2007/06/20070624034620915.htm 入门篇 2007-6-24 15:46:20 本讲的预备知识: 首先你应该了解 ...
- 内核堆栈 用户堆栈_弹性堆栈介绍
内核堆栈 用户堆栈 当您运行对公司至关重要的软件时,您将无法拥有仅用于分析一段时间前发生的事情的日志,让客户端告诉您您的应用程序已损坏,而您甚至不知道发生了什么是真实的问题. 解决该问题的方法之一是使 ...
- 设置线程堆栈大小_哇擦,传说中的堆栈溢出和快速排序
stack overflow 堆栈溢出和快速排序这两个概念对开发人员来说并不陌生,但是通知都只是听说过,真正开发过程中却很少会遇到.我也是敲代码好些行后非常有幸撞上了,而且还是两个一起出现的,这其中过 ...
- c++堆栈溢出怎么解决_栈溢出基础
一. 基础知识 什么是缓冲区溢出 在深入探讨技术之前, 让我们先了解一下缓冲区溢出的实际内容.想象一个非常简单的程序, 要求你输入你的用户名, 然后返回到它在做什么.从视觉上看, 如下所示 注意到括号 ...
最新文章
- 互联网公司「敏捷开发」,打造高效执行能力
- android 获取MP4文件的图片大小
- 《数据库SQL实战》查找最晚入职员工的所有信息
- Flask和mysql多线程_数据库连接池Flask-SQLAlchemy中多线程安全的问题
- 【C#桌面应用】第四节:制作简单的登录注册模拟窗口-登录部分的模拟
- 44 MM配置-采购-条件-定价过程-定义条件类型
- 【华为云技术分享】40%性能提升,华为云推出PostgreSQL 12 商用版
- Web前端的学习路线,你真的知道吗?
- html之CSS设计(四种引入方式、各种选择器)
- Python使用numpy滤除图像中的低频信号
- 编写一个生成器需要编写__iter__和__next__
- 生物信息学主要研究方向
- 手把手带你玩摄像头模组
- 算王标准层的量如何计算机,算王软件常用功能技巧
- 浅谈输入阻抗、输出阻抗和阻抗匹配
- python123随机密码生成器_python实例--随机密码生成器
- 炉石传说 历代无面斩杀宇宙龙术
- 渗透一个最近很火的闲鱼钓鱼网站
- 利用C51单片机模拟SPI进行双机通信
- 计算机二级最难的excel题,计算机二级什么最难?excel函数啊!
热门文章
- Container With Most Water(C++)
- Linux系统重要日志文件
- 【机器学习系列】变分推断第三讲:基于随机梯度上升法SGD的变分推断解法
- Deep Reinforcement Learning for Dialogue Generation-关于生成对话的深度强化学习
- java使用io上传文件_文件传输基础——Java IO流
- java中json进阶_JSON学习
- jenkins shell 权限_Jenkins+gitee+nuxt自动化部署
- SpringMVC初写(四)上传和下载功能的实现
- 201671030113 李星宇 《英文文本统计分析》结对项目报告
- 在WPF中调用Winform控件