属性声明:weak

GNU C 通过 __attribute__ 声明weak属性,可以将一个强符号转换为弱符号。

使用方法如下。

void  __attribute__((weak))  func(void);
int  num  __attribte__((weak);

编译器在编译源程序时,无论你是变量名、函数名,在它眼里,都是一个符号而已,用来表征一个地址。编译器会将这些符号集中,存放到一个叫符号表的 section 中。

在一个软件工程项目中,可能有多个源文件,由不同工程师开发。有时候可能会遇到这种情况:A 工程师在他负责的 A.c 源文件中定义了一个全局变量 num,而 B 工程师也在他负责的 B.c 源文件中定义了一个同名全局变量 num。那么当我们在程序中打印变量 num 的值时,是该打印哪个值呢?

是时候表演真正的技术了。这时候,就需要用编译链接的原理知识来分析这个问题了。编译链接的基本过程其实很简单,主要分为三个阶段。

  • 编译阶段:编译器以源文件为单位,将每一个源文件编译为一个 .o 后缀的目标文件。每一个目标文件由代码段、数据段、符号表等组成。
  • 链接阶段:链接器将各个目标文件组装成一个大目标文件。链接器将各个目标文件中的代码段组装在一起,组成一个大的代码段;各个数据段组装在一起,组成一个大的数据段;各个符号表也会集中在一起,组成一个大的符号表。最后再将合并后的代码段、数据段、符号表等组合成一个大的目标文件。
  • 重定位:因为各个目标文件重新组装,各个目标文件中的变量、函数的地址都发生了变化,所以要重新修正这些函数、变量的地址,这个过程称为重定位。重定位结束后,就生成了可以在机器上运行的可执行程序。

上面举例的工程项目,在编译过程中的链接阶段,可能就会出现问题:A.c 和 B.c 文件中都定义了一个同名变量 num,那链接器到底该用哪一个呢?

这个时候,就需要引入强符号和弱符号的概念了。

强符号和弱符号

在一个程序中,无论是变量名,还是函数名,在编译器的眼里,就是一个符号而已。符号可以分为强符号和弱符号。

  • 强符号:函数名、初始化的全局变量名;
  • 弱符号:未初始化的全局变量名。

在一个工程项目中,对于相同的全局变量名、函数名,我们一般可以归结为下面三种场景。

  • 强符号+强符号
  • 强符号+弱符号
  • 弱符号+弱符号

强符号和弱符号在解决程序编译链接过程中,出现的多个同名变量、函数的冲突问题非常有用。一般我们遵循下面三个规则。

  • 一山不容二虎
  • 强弱可以共处
  • 体积大者胜出

为了方便,这是我编的顺口溜。主要意思就是:在一个项目中,不能同时存在两个强符号,比如你在一个多文件的工程中定义两个同名的函数,或初始化的全局变量,那么链接器在链接时就会报重定义的错误。但一个工程中允许强符号和弱符号同时存在。比如你可以同时定义一个初始化的全局变量和一个未初始化的全局变量,这种写法在编译时是可以编译通过的。编译器对于这种同名符号冲突,在作符号决议时,一般会选用强符号,丢掉弱符号。还有一种情况就是,一个工程中,同名的符号都是弱符号,那编译器该选择哪个呢?谁的体积大,即谁在内存中存储空间大,就选谁。

我们接下来写一个简单的程序,来验证上面的理论。定义两个源文件:main.c 和 func.c。

//func.c
int a = 1;
int b;
void func(void)
{printf("func:a = %d\n", a);printf("func: b = %d\n", b);
}//main.c
int a;
int b = 2;
void func(void);
int main(void)
{printf("main:a = %d\n", a);printf("main: b = %d\n", b);func();return 0;
}

编译程序,可以看到程序运行结果。

$ gcc -o a.out main.c func.c
main: a = 1
main: b = 2
func: a = 1
func: b = 2

我们在 main.c 和 func.c 中分别定义了两个同名全局变量 a 和 b,但是一个是强符号,一个是弱符号。链接器在链接过程中,看到冲突的同名符号,会选择强符号,所以你会看到,无论是 main 函数,还是 func 函数,打印的都是强符号的值。

一般来讲,不建议在一个工程中定义多个不同类型的弱符号,编译的时候可能会出现各种各样的问题,这里就不举例了。在一个工程中,也不能同时定义两个同名的强符号,即初始化的全局变量或函数,否则就会报重定义错误。但是我们可以使用 GNU C 扩展的 weak 属性,将一个强符号转换为弱符号。

//func.c
int a __attribute__((weak)) = 1;
void func(void)
{printf("func:a = %d\n", a);
}//main.c
int a = 4;
void func(void);
int main(void)
{printf("main:a = %d\n", a);func();return 0;
}

编译程序,可以看到程序运行结果。

$ gcc -o a.out main.c func.c
main: a = 4
func: a = 4

我们通过 weak 属性声明,将 func.c 中的全局变量 a,转换为一个弱符号,然后在 main.c 里同样定义一个全局变量 a,并初始化 a 为4。链接器在链接时会选择 main.c 中的这个强符号,所以在两个文件中,打印变量 a 的值都是4。

函数的强符号和弱符号

链接器对于同名变量冲突的处理遵循上面的强弱规则,对于函数同名冲突,同样也遵循相同的规则。函数名本身就是一个强符号,在一个工程中定义两个同名的函数,编译时肯定会报重定义错误。但我们可以通过 weak 属性声明,将其中一个函数转换为弱符号。

//func.c
int a __attribute__((weak)) = 1;
void __attribute__((weak)) func(void)
{printf("func:a = %d\n", a);
}//main.c
int a = 4;
void func(void)
{printf("I am a strong symbol!\n");
}
int main(void)
{printf("main:a = %d\n", a);func();return 0;
}

编译程序,可以看到程序运行结果。

$ gcc -o a.out main.c func.c
main: a = 4
func: I am a strong symbol!

在这个程序示例中,我们在 main.c 中重新定义了一个同名的 func 函数,然后将 func.c 文件中的 func() 函数,通过 weak 属性声明转换为一个弱符号。链接器在链接时会选择 main.c 中的强符号,所以我们在 main 函数中调用 func() 时,实际上调用的是 main.c 文件里的 func() 函数。

弱符号的用途

在一个源文件中引用一个变量或函数,当我们只声明,而没有定义时,一般编译是可以通过的。这是因为编译是以文件为单位的,编译器会将一个个源文件首先编译为 .o 目标文件。编译器只要能看到函数或变量的声明,会认为这个变量或函数的定义可能会在其它的文件中,所以不会报错。甚至如果你没有包含头文件,连个声明也没有,编译器也不会报错,顶多就是给你一个警告信息。但链接阶段是要报错的,链接器在各个目标文件、库中都找不到这个变量或函数的定义,一般就会报未定义错误。

当函数被声明为一个弱符号时,会有一个奇特的地方:当链接器找不到这个函数的定义时,也不会报错。编译器会将这个函数名,即弱符号,设置为0或一个特殊的值。只有当程序运行时,调用到这个函数,跳转到0地址或一个特殊的地址才会报错。

//func.c
int a __attribute__((weak)) = 1;//main.c
int a = 4;
void __attribute__((weak)) func(void);
int main(void)
{printf("main:a = %d\n", a);func();return 0;
}

编译程序,可以看到程序运行结果。

$ gcc -o a.out main.c func.c
main: a = 4
Segmentation fault (core dumped)

在这个示例程序中,我们没有定义 func() 函数,仅仅是在 main.c 里作了一个声明,并将其声明为一个弱符号。编译这个工程,你会发现是可以编译通过的,只是到了程序运行时才会出错。

为了防止函数运行出错,我们可以在运行这个函数之前,先做一个判断,即看这个函数名的地址是不是0,然后再决定是否调用、运行。这样就可以避免段错误了,示例代码如下。

//func.c
int a __attribute__((weak)) = 1;//main.c
int a = 4;
void __attribute__((weak)) func(void);
int main(void)
{printf("main:a = %d\n", a);if (func)func();return 0;
}

编译程序,可以看到程序运行结果。

$ gcc -o a.out main.c func.c
main: a = 4

函数名的本质就是一个地址,在调用 func 之前,我们先判断其是否为0,为0的话就不调用了,直接跳过。你会发现,通过这样的设计,即使这个 func() 函数没有定义,我们整个工程也能正常的编译、链接和运行!

弱符号的这个特性,在库函数中应用很广泛。比如你在开发一个库,基础的功能已经实现,有些高级的功能还没实现,那你可以将这些函数通过 weak 属性声明,转换为一个弱符号。通过这样设置,即使函数还没有定义,我们在应用程序中只要做一个非0的判断就可以了,并不影响我们程序的运行。等以后你发布新的库版本,实现了这些高级功能,应用程序也不需要任何修改,直接运行就可以调用这些高级功能。

弱符号还有一个好处,如果我们对库函数的实现不满意,我们可以自定义与库函数同名的函数,实现更好的功能。比如我们 C 标准库中定义的 gets() 函数,就存在漏洞,常常成为黑客堆栈溢出攻击的靶子。

int main(void)
{char a[10];gets(a);puts(a);return 0;
}

C 标准定义的库函数 gets() 主要用于输入字符串,它的一个 Bug 就是使用回车符来判断用户输入结束标志。这样的设计很容易造成堆栈溢出。比如上面的程序,我们定义一个长度为10的字符数组用来存储用户输入的字符串,当我们输入一个长度大于10的字符串时,就会发生内存错误。

接着我们定义一个跟 gets() 相同类型的同名函数,并在 main 函数中直接调用,代码如下。

#include<stdio.h>char * gets (char * str){printf("hello world!\n");return (char *)0;}int main(void)
{char a[10];gets(a);return 0;
}

程序运行结果如下。

hello world!

通过运行结果,我们可以看到,虽然我们定义了跟 C 标准库函数同名的 gets() 函数,但编译是可以通过的。程序运行时调用 gets() 函数时,就会跳转到我们自定义的 gets() 函数中运行。

属性声明:alias

GNU C 扩展了一个 alias 属性,这个属性很简单,主要用来给函数定义一个别名。

void __f(void)
{printf("__f\n");
}void f() __attribute__((alias("__f")));
int main(void)
{f();return 0;
}

程序运行结果如下。

__f

通过 alias 属性声明,我们就可以给 __f() 函数定义一个别名 f(),以后我们想调用 __f() 函数,可以直接通过 f() 调用即可。

在 Linux 内核中,你会发现 alias 有时会和 weak 属性一起使用。比如有些函数随着内核版本升级,函数接口发生了变化,我们可以通过 alias 属性给这个旧接口名字做下封装,起一个新接口的名字。

//f.c
void __f(void)
{printf("__f()\n");
}
void f() __attribute__((weak,alias("__f");//main.c
void __attribute__((weak)) f(void);
void f(void)
{printf("f()\n");
}int main(void)
{f();return 0;
}

当我们在 main.c 中新定义了 f() 函数时,在 main 函数中调用 f() 函数,会直接调用 main.c 中新定义的函数;当 f() 函数没有新定义时,就会调用 __f() 函数。

linux内核C -- 第09课:链接过程中的强符号和弱符号相关推荐

  1. 【嵌入式】C语言高级编程-强符号和弱符号(09)

    00. 目录 文章目录 00. 目录 01. weak属性 02. 变量强符号和弱符号 03. 函数强符号和弱符号 04. 弱符号的作用 05. alias属性 06. 附录 01. weak属性 G ...

  2. Linux内核学习①:内核的下载、编译及过程中的问题处理

    Linux内核学习①:内核的下载.编译及过程中的问题处理 Linux内核文件下载 内核下载网址: http://ftp.sjtu.edu.cn/sites/ftp.kernel.org/pub/lin ...

  3. linux内核的配置过程,linux内核的配置机制及其编译过程

    linux内核的配置机制及其编译过程. 一.配置系统的基本结构 Linux内核的配置系统由三个部分组成,分别是: 1.Makefile:分布在 Linux 内核源代码根目录及各层目录中,定义 Linu ...

  4. Linux内核启动及文件系统加载过程

    当u-boot开始执行bootcmd命令,就进入linux内核启动阶段 与 u-boot 类似,普通 Linux 内核的启动过程也可以分为两个阶段,但针对压缩了的内核如 uImage 就要包括内核自解 ...

  5. linux搭建一个的过程,Linux内核创建一个新进程的过程

    此文仅用于MOOCLinux内核分析作业 task_struct数据结构 根据wiki的定义,进程是计算机中已运行程序的实体.在面向线程设计的系统(Linux 2.6及更新的版本)中,进程本身不是基本 ...

  6. Linux内核创建一个新进程的过程

    作者:王鹤楼 原创作品转载请注明出处 <Linux内核分析>MOOC课程 http://mooc.study.163.com/course/USTC-1000029000 操作系统的三大功 ...

  7. Linux内核信号杀死内核线程,linux内核线程对信号的处理过程.

    linux中的线程分为用户线程和内核线程,用户线程是规范的线程,全面的自主性,全面的抢占性:然而内核线程就不那么好了,某种含义上未曾用户线程那么安逸,这个怎么会意呢?用户线程的编写者只必需告终利用逻辑 ...

  8. 实验六:分析Linux内核创建一个新进程的过程

    20135108 李泽源 阅读理解task_struct数据结构http://codelab.shiyanlou.com/xref/linux-3.18.6/include/linux/sched.h ...

  9. 6、分析Linux内核创建一个新进程的过程

    姓名:周毅原创作品转载请注明出处 <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 这篇文章主要分析lin ...

  10. linux内核创建用户,分析Linux内核创建一个新进程的过程

    谢文杰 + 原创作品转载请注明出处 + <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 一.实验目的 阅 ...

最新文章

  1. 更换ip软件安卓_2019十大手机读书软件排行榜
  2. 二次规划问题matlab,matlab5二次规划问题.doc
  3. ArcGIS API + Echarts 实现动态雷达图
  4. 怎么给图片或视频添加夜视效果?
  5. linux下多线程断点下载工具-axel
  6. [两道递推题] 美团 CodeM 初赛 Round A 二分图染色 OEIS A001499
  7. lte tm模式_TD―LTE TM8传输模式分析
  8. linux下更新pip3
  9. html中代表颜色的字母16个,html中16进制的代码对应颜色表
  10. 自然语言处理常用单词
  11. PyInstaller 的安装和使用(python生成exe文件)_联网安装
  12. 微信公众号普通消息接收接口
  13. iPhone 蓝牙通信编程初步(网上收集)
  14. 计算机网络常用知识点
  15. LTE物理信道PHICH--学习笔记
  16. Shaders for Game
  17. 基于Vue实现的网页音乐播放器
  18. CentOS 7 从下载到安装
  19. 解决Oracle锁表问题
  20. java多线程(4) ----- Lock的使用

热门文章

  1. - 动规讲解基础讲解一——01背包(模板)
  2. ORACLE VARCHAR2
  3. php中sprintf与printf函数用法区别
  4. 13、XSI,信号量简介
  5. php环境用什么服务器好些_PHP环境部署,Linux真的比Windows好吗?
  6. 设计模式(Design Patterns)
  7. redux之createStore
  8. 制作简单的GIF动图
  9. 项目管理-自上而下还是自下而上的沟通?
  10. 使用@Transactional(SUPPORTS)和不加@Transactional 有什么区别?