arm-linux-ld指令详解

我们对每个c或者汇编文件进行单独编译,但是不去连接,生成很多.o 的文件,这些.o文件首先是分散的,我们首先要考虑的如何组合起来;其次,这些.o文件存在相互调用的关系;再者,我们最后生成的bin文件是要在硬件中运行的,每一部分放在什么地址都要有仔细的说明。我觉得在写makefile的时候,最为重要的就是ld的理解,下面说说我的经验:

首先,要确定我们的程序用没有用到标准的c库,或者一些系统的库文件,这些一般是在操作系统之上开发要注意的问题,这里并不多说,熟悉在Linux编程的人,基本上都会用ld命令;这里,我们从头开始,直接进行汇编语言的连接。

我们写一个汇编程序,控制GPIO,从而控制外接的LED,代码如下;

.text

.global _start

_start:

LDR R0,=0x56000010 @GPBCON寄存器

MOV R1,# 0x00000400

str R1,[R0]

LDR R0,=0x56000014

MOV R1,#0x00000000

STR R1,[R0]

MAIN_LOOP:

B MAIN_LOOP

代码很简单,就是一个对io口进行设置然后写数据。我们看它是如何编译的,注意我们这里使用的不是arm-linux-gcc而是arm-elf- gcc,二者之间没有什么比较大的区别,arm-linux-gcc可能包含更多的库文件,在命令行的编译上面是没有区别。我们来看是如何编译的:

arm-elf-gcc -g -c -o led_On.o led_On.s  首先纯编译不连接

arm-elf-ld  -Ttext 0x00000000 -g led_On.o -o led_on_elf

用Ttext指明我们程序存储的地方,这里生成的是elf文件,还不是我们真正的bin,但是可以借助一些工具可以进行调试。然后:

arm-elf-objcopy -O binary -S led_on_elf led_on.bin

生成bin文件。

-T选项是ld命令中比较重要的一个选项,可以用它直接指明代码的代码段、数据段、博士生、

段,对于复杂的连接,可以专门写一个脚本来告诉编译器如何连接。

-Ttext   addr

-Tdata  addr

-Tbss     addr

arm-elf-ld  -Ttext 0x00000000 -g led_On.o -o led_on_elf  ,运行地址为0x00000000,由于没有指明数据段和bss,他们会默认的依次放在后面。相同的代码不同的Ttext,你可以对比一下他们之间会变的差异,ld会自动调整跳转的地址。

第二个概念:section,section可以理解成一块,例如像c里面的一个子函数,就是一个section,链接器ld把object文件中的每个section都作为一个整体,为其分配运行的地址(memory layout),这个过程就是重定位(relocation);最后把所有目标文件合并为一个目标文件。

链接通过一个linker script来控制,这个脚本描述了输入文件的sections到输出文件的映射,以及输出文件的memory layout。

因此,linker总会使用一个linker script,如果不特别指定,则使用默认的script;可以使用‘-T’命令行选项来指定一个linker script。

*映像文件的输入段与输出段

linker把多个输入文件合并为一个输出文件。输出文件和输入文件都是目标文件(object file),输出文件通常被称为可执行文件(executable)。

每个目标文件都有一系列section,输入文件的section称为input section,输出文件的section则称为output section。

一个section可以是loadable的,即输出文件运行时需要将这样的section加载到memory(类似于RO&RW段);也可以是 allocatable的,这样的section没有任何内容,某些时候用0对相应的memory区域进行初始化(类似于ZI段);如果一个 section既非loadable也非allocatable,则它通常包含的是调试信息。

每个loadable或 allocatable的output section都有两个地址,一是VMA(virtual memory address),是该section的运行时域地址;二是LMA(load memory address),是该section的加载时域地址。

可以通过objdump工具附加'-h'选项来查看目标文件中的sections。

*简单的Linker script

(1) SECTIONS命令:

The SECTIONS command tells the linker how to map input sections into output sections, and how to place the output sections in memory.

命令格式如下:

SECTIONS

{

sections-command

sections-command

......

}

其中sections-command可以是ENTRY命令,符号赋值,输出段描述,也可以是overlay描述。

(2) 地址计数器‘.’(location counter):

该符号只能用于SECTIONS命令内部,初始值为‘0’,可以对该符号进行赋值,也可以使用该符号进行计算或赋值给其他符号。它会自动根据SECTIONS命令内部所描述的输出段的大小来计算当前的地址。

(3) 输出段描述(output section description):

前面提到在SECTIONS命令中可以作输出段描述,描述的格式如下:

section [address] [(type)] : [AT(lma)]

{

output-section-command

output-section-command

...

} [>region] [AT>lma_region] [:phdr :phdr ...] [=fillexp]

很多附加选项是用不到的。其中的output-section-command又可以是符号赋值,输入段描述,要直接包含的数据值,或者某一特定的输出段关键字。

*linker script 实例

==============================

OUTPUT_ARCH(arm)

ENTRY(_start)

SECTIONS {

. = 0xa3f00000;

__boot_start = .;

.start ALIGN(4) : {

*(.text.start)

}

.setup ALIGN(4) : {

setup_block = .;

*(.setup)

setup_block_end = .;

}

.text ALIGN(4) : {

*(.text)

}

.rodata ALIGN(4) : {

*(.rodata)

}

.data ALIGN(4) : {

*(.data)

}

.got ALIGN(4) : {

*(.got)

}

__boot_end = .;

.bss ALIGN(16) : {

bss_start = .;

*(.bss)

*(COMMON)

bss_end = .;

}

.comment ALIGN(16) : {

*(.comment)

}

stack_point = __boot_start + 0x00100000;

loader_size = __boot_end - __boot_start;

setup_size = setup_block_end - setup_block;

}

=============================

在SECTIONS命令中的类似于下面的描述结构就是输出段描述:

.start ALIGN(4) : {

*(.text.start)

}

.start 为output section name,ALIGN(4)返回一个基于location counter(.)的4字节对齐的地址值。*(.text.start)是输入段描述,*为通配符,意思是把所有被链接的object文件中的.text.start段都链接进这个名为.start的输出段。

源文件中所标识的section及其属性实际上就是对输入段的描述,例如.text.start输入段在源文件start.S中的代码如下:

.section .text.start

.global _start

_start :

b start

arm-elf-ld -Ttimer.lds -o timer_elf header .o

这里就必须存在一个timer.lds的文件。

对于.lds文件,它定义了整个程序编译之后的连接过程,决定了一个可执行程序的各个段的存储位置。虽然现在我还没怎么用它,但感觉还是挺重要的,有必要了解一下。

先看一下GNU官方网站上对.lds文件形式的完整描述:

SECTIONS {

...

secname start BLOCK(align) (NOLOAD) : AT ( ldadr )

{ contents } >region :phdr =fill

...

}

secname和contents是必须的,其他的都是可选的。下面挑几个常用的看看:

1、secname:段名

2、contents:决定哪些内容放在本段,可以是整个目标文件,也可以是目标文件中的某段(代码段、数据段等)

3、start:本段连接(运行)的地址,如果没有使用AT(ldadr),本段存储的地址也是start。GNU网站上说start可以用任意一种描述地址的符号来描述。

4、AT(ldadr):定义本段存储(加载)的地址。

/* nand.lds */

SECTIONS {

firtst 0x00000000 : { head.o init.o }

second 0x30000000 : AT(4096) { main.o }

}

以上,head.o放在0x00000000地址开始处,init.o放在head.o后面,他们的运行地址也是0x00000000,即连接和存储地址相同(没有AT指定);main.o放在4096(0x1000,是AT指定的,存储地址)开始处,但是它的运行地址在0x30000000,运行之前需要从0x1000(加载处)复制到0x30000000(运行处),此过程也就用到了读取Nand flash。

这就是存储地址和连接(运行)地址的不同,称为加载时域和运行时域,可以在.lds连接脚本文件中分别指定。

编写好的.lds文件,在用arm-linux-ld连接命令时带-Tfilename来调用执行,如

arm-linux-ld –Tnand.lds x.o y.o –o xy.o。也用-Ttext参数直接指定连接地址,如

arm-linux-ld –Ttext 0x30000000 x.o y.o –o xy.o。

既然程序有了两种地址,就涉及到一些跳转指令的区别,这里正好写下来,以后万一忘记了也可查看,以前不少东西没记下来现在忘得差不多了。

ARM汇编中,常有两种跳转方法:b跳转指令、ldr指令向PC赋值。

我自己经过归纳如下:

b step1 :b跳转指令是相对跳转,依赖当前PC的值,偏移量是通过该指令本身的bit[23:0]算出来的,这使得使用b指令的程序不依赖于要跳到的代码的位置,只看指令本身。

ldr pc, =step1 :该指令是从内存中的某个位置(step1)读出数据并赋给PC,同样依赖当前PC的值,但是偏移量是那个位置(step1)的连接地址(运行时的地址),所以可以用它实现从Flash到RAM的程序跳转。

此外,有必要回味一下adr伪指令,U-boot中那段relocate代码就是通过adr实现当前程序是在RAM中还是flash中。仍然用我当时的注释

adr r0, _start /* r0是代码的当前位置 */

/* adr伪指令,汇编器自动通过当前PC的值算出 如果执行到_start时PC的值,放到r0中:

当此段在flash中执行时r0 = _start = 0;当此段在RAM中执行时_start = _TEXT_BASE(在board/smdk2410/config.mk中指定的值为0x33F80000,即u-boot在把代码拷贝到RAM中去执行的代码段的开始) */

ldr r1, _TEXT_BASE /* 测试判断是从Flash启动,还是RAM */

/* 此句执行的结果r1始终是0x33FF80000,因为此值是又编译器指定的(ads中设置,或-D设置编译器参数) */

cmp r0, r1 /* 比较r0和r1,调试的时候不要执行重定位 */

下面,结合u-boot.lds看看一个正式的连接脚本文件。这个文件的基本功能还能看明白,虽然上面分析了好多,但其中那些GNU风格的符号还是着实让我感到迷惑。

OUTPUT_FORMAT("elf32­littlearm", "elf32­littlearm", "elf32­littlearm")

;指定输出可执行文件是elf格式,32位ARM指令,小端

OUTPUT_ARCH(arm)

;指定输出可执行文件的平台为ARM

ENTRY(_start)

;指定输出可执行文件的起始代码段为_start.

SECTIONS

{

. = 0x00000000 ; 从0x0位置开始

. = ALIGN(4) ; 代码以4字节对齐

.text : ;指定代码段

{

cpu/arm920t/start.o (.text) ; 代码的第一个代码部分

*(.text) ;其它代码部分

}

. = ALIGN(4)

.rodata : { *(.rodata) } ;指定只读数据段

. = ALIGN(4);

.data : { *(.data) } ;指定读/写数据段

. = ALIGN(4);

.got : { *(.got) } ;指定got段, got段式是uboot自定义的一个段, 非标准段

__u_boot_cmd_start = . ;把__u_boot_cmd_start赋值为当前位置, 即起始位置

.u_boot_cmd : { *(.u_boot_cmd) } ;指定u_boot_cmd段, uboot把所有的uboot命令放在该段.

__u_boot_cmd_end = .;把__u_boot_cmd_end赋值为当前位置,即结束位置

. = ALIGN(4);

__bss_start = .; 把__bss_start赋值为当前位置,即bss段的开始位置

.bss : { *(.bss) }; 指定bss段

_end = .; 把_end赋值为当前位置,即bss段的结束位置

arm-linux-ld中的参数,arm-linux-ld指令详解相关推荐

  1. Linux内核中的软中断、tasklet和工作队列详解

    本文基于Linux2.6.32内核版本. 引言 软中断.tasklet和工作队列并不是Linux内核中一直存在的机制,而是由更早版本的内核中的"下半部"(bottom half)演 ...

  2. 详解 Linux环境中DHCP分配IP地址(实验详解)

    Linux中DHCP小实验详解 一.DHCP中继概述 二.DHCP在linux系统中的相关配置 1.配置DHCP服务器 2.设置全局配置参数 3.subnet网段声明 4.host主机声明 三.实验例 ...

  3. linux 系统中 /etc/passwd 和 /etc/shadow文件详解

    在linux操作系统中, /etc/passwd文件中的每个用户都有一个对应的记录行,记录着这个用户的一下基本属性.该文件对所有用户可读.   而/etc/shadow文件正如他的名字一样,他是pas ...

  4. python函数中可变参数的传递方式是_详解Python函数可变参数定义及其参数传递方式...

    Python函数可变参数定义及其参数传递方式详解 python中 函数不定参数的定义形式如下 1. func(*args) 传入的参数为以元组形式存在args中,如: def func(*args): ...

  5. springMVC注解中@RequestMapping中常用参数value params 以及@RequestParam 详解

    转载自 https://blog.csdn.net/qq_35067322/article/details/52811300?locationNum=9&fps=1 https://www.c ...

  6. Linux系统中软件的“四”种安装原理详解:源码包安装、RPM二进制安装、YUM在线安装、脚本安装包...

    一.Linux软件包分类 1.1 源码包 优点: 开源,如果有足够的能力,可以修改源代码: 可以自由选择所需的功能: 软件是编译安装,所以更加适合自己的系统,更加稳定.效率更高: 卸载方便: 缺点: ...

  7. linux系统中安装和使用rz/sz命令详解

    对于经常使用Linux系统的人员来说,少不了将本地的文件上传到服务器或者从服务器上下载文件到本地,rz / sz命令很方便的帮我们实现了这个功能,但是很多Linux系统初始并没有这两个命令.今天,我们 ...

  8. linux中替换命令详解,linux中sed命令字符串替换的用法详解

    Linux系统中sed命令可以将字符串批量替换,省去了很多麻烦,下面由学习啦小编为大家整理了linux系统中sed命令字符串替换的用法详解,希望对大家有帮助! linux中sed命令字符串替换的用法详 ...

  9. Linux中man手册的安装以及使用详解

    Linux中man手册的安装以及使用详解 linux中man手册的安装以及使用详解 man手册是什么 man手册是干嘛的 man手册如何安装 man手册如何使用 举例讲解 我们来看一下man手册的目录 ...

  10. Linux中的ps指令详解

    [时间]2018.12.16 [题目]Linux中的ps指令详解 转载地址:https://www.cnblogs.com/exe19/p/5511733.html 概述 要对进程进行监测和控制,首先 ...

最新文章

  1. Cisco3560交换机enable密码破解和恢复出厂设置
  2. 11、CROSS JOIN:交叉连接(笛卡尔积)
  3. mac搭建nginx+rtmp直播流
  4. Java黑皮书课后题第7章:*7.30(模式识别:四个连续相等的数)编写下面的方法,测试某数组是否有四个连续相同值的数。编写测试程序,提示用户输入一个整数列表,调用方法看是否有4个连续且相等的数
  5. (四)开源C# WPF控件库《AduSkin – UI》
  6. Centos5上安装JRE和LUMAQQ
  7. vue中使用ts后,父组件获取执行子组件方法报错问题
  8. 【javascipt】Generator函数(生成器)
  9. 阶段3 2.Spring_08.面向切面编程 AOP_4 spring基于XML的AOP-配置步骤
  10. 学习C语言,有哪些值得推荐的经典书籍?
  11. 机器学习数据导入方法总结
  12. 在线制作车牌效果图_写实效果用3dsmax,想快用智能效果图软件
  13. GET请求淘宝H5页面获取商品信息
  14. StarGFS海量小文件的高性能存储和保护方案
  15. 支付宝,百度,头条集卡群,过年一起玩
  16. 创业过程中的63个技术问题
  17. 网络中国象棋对战中象棋的规则以及棋盘、棋子的Java源码
  18. 【Git】fatal: unable to access ‘http://gitlab.example.com/root/test_gitlab.git/‘: Could not resolve ho
  19. Vue2 大型项目升级 Vue3 详细经验总结
  20. 工作中的完美主义心态

热门文章

  1. python实现二叉树的重建2 之由中序遍历和后序遍历重建
  2. 奇异值分解与最小二乘问题 线性回归
  3. G6实现标签拖动连线画流程图
  4. PyTorch 自动微分示例
  5. 传感器融合带来多重好处
  6. 将深度学习低延迟推理性能提高一倍
  7. CVPR2020最新论文扫描盘点(下)
  8. Python:新浪网分类资讯爬虫
  9. python 怎样让 print 打印的结果不换行
  10. thymeleaf+layui 展示table 报500