一、概述

通过dlopen、dlsym获取共享库函数地址、全局变量是一种经常使用到的编程技巧,尤其是在Hook框架中。然而无论是dlsym还是一些常用框架(如Nougat_dlfunctions),都只能搜索**.dynsym段,而无法搜索.symtab**段。因此实现.symtab段搜索是一个亟待解决的问题。

本文将介绍在Nougat_dlfunctions框架基础上,如何实现搜索.symtab段的功能。(如果对FastHook不了解,请查阅FastHook——一种高效稳定、简洁易用的Android Hook框架) 项目地址:Enhanced_dlfunctions

二、Enhanced dlfunctions实现

ELF文件实际是个表结构,以段为单位,每个段存储不同的信息,段与段之间以索引来关联形成一个表。所以只要有一个头,就可以通过这些关系访问所有的段,这个头便是ELF文件头。下面我们来看看需要获取那些信息:

  1. ELF文件头:存储所有段头部的信息,段头部是描述段信息的元数据,可以通过段头部来获取段信息。
  2. .shstrtab段。存储所有的段的段名。通过ELF文件头,可以实现段的遍历,而无法识别具体的段(不同段类型可以相同),因此需要用段名来确定段。
  3. .dynsym段:动态符号表,存储与动态链接相关的导入导出符号,不包括模块内部的符号。Nougat_dlfunctions只查询这个段,因此会漏掉很多符号。
  4. .dynstr段:存储.dynsym段符号对应的符号名。
  5. .symtab段:符号表。存储在程序中被定义和引用的函数和全局变量的信息。
  6. .strtab段:存储.symtab段符号对应的符号名。
  7. .comment段:程序相关信息,用与定位符号地址。

2.1 enhanced_dlopen

void *enhanced_dlopen(const char *libpath, int flags) {FILE *maps;char buff[256];struct ctx *ctx = 0;off_t load_addr, size;int k, fd = -1, found = 0;void *shoff;Elf_Ehdr *elf = (Elf_Ehdr *) MAP_FAILED;#define fatal(fmt, args...) do { log_err(fmt,##args); goto err_exit; } while(0)maps = fopen("/proc/self/maps", "r");if (!maps) fatal("failed to open maps");while (!found && fgets(buff, sizeof(buff), maps))if (strstr(buff, "r-xp") && strstr(buff, libpath)) found = 1;fclose(maps);if (!found) fatal("%s not found in my userspace", libpath);if (sscanf(buff, "%lx", &load_addr) != 1)fatal("failed to read load address for %s", libpath);log_info("%s loaded in Android at 0x%08lx", libpath, load_addr);/* Now, mmap the same library once again */fd = open(libpath, O_RDONLY);if (fd < 0) fatal("failed to open %s", libpath);size = lseek(fd, 0, SEEK_END);if (size <= 0) fatal("lseek() failed for %s", libpath);elf = (Elf_Ehdr *) mmap(0, size, PROT_READ, MAP_SHARED, fd, 0);close(fd);fd = -1;if (elf == MAP_FAILED) fatal("mmap() failed for %s", libpath);ctx = (struct ctx *) calloc(1, sizeof(struct ctx));if (!ctx) fatal("no memory for %s", libpath);ctx->load_addr = (void *) load_addr;shoff = ((void *) elf) + elf->e_shoff;Elf_Shdr *shstrtab = (Elf_Shdr *)(shoff + elf->e_shstrndx * elf->e_shentsize);char * shstr = malloc(shstrtab->sh_size);memcpy(shstr, ((void *) elf) + shstrtab->sh_offset, shstrtab->sh_size);for (k = 0; k < elf->e_shnum; k++, shoff += elf->e_shentsize) {Elf_Shdr *sh = (Elf_Shdr *) shoff;log_dbg("%s: k=%d shdr=%p type=%d", __func__, k, sh, sh->sh_type);switch (sh->sh_type) {case SHT_DYNSYM:if (ctx->dynsym) fatal("%s: duplicate DYNSYM sections", libpath); /* .dynsym */ctx->dynsym = malloc(sh->sh_size);if (!ctx->dynsym) fatal("%s: no memory for .dynsym", libpath);memcpy(ctx->dynsym, ((void *) elf) + sh->sh_offset, sh->sh_size);ctx->dynsym_num = (sh->sh_size / sizeof(Elf_Sym));break;case SHT_SYMTAB:if (ctx->symtab) fatal("%s: duplicate SYMTAB sections", libpath); /* .symtab */ctx->symtab = malloc(sh->sh_size);if (!ctx->symtab) fatal("%s: no memory for .symtab", libpath);memcpy(ctx->symtab, ((void *) elf) + sh->sh_offset, sh->sh_size);ctx->symtab_num = (sh->sh_size / sizeof(Elf_Sym));break;case SHT_STRTAB:if(!strcmp(shstr+sh->sh_name,".dynstr")) {if (ctx->dynstr) break;    /* .dynstr is guaranteed to be the first STRTAB */ctx->dynstr = malloc(sh->sh_size);if (!ctx->dynstr) fatal("%s: no memory for .dynstr", libpath);memcpy(ctx->dynstr, ((void *) elf) + sh->sh_offset, sh->sh_size);}else if(!strcmp(shstr+sh->sh_name,".strtab")) {if (ctx->strtab) break;ctx->strtab = malloc(sh->sh_size);if (!ctx->strtab) fatal("%s: no memory for .strtab", libpath);memcpy(ctx->strtab, ((void *) elf) + sh->sh_offset, sh->sh_size);}break;case SHT_PROGBITS:if (!ctx->dynstr || !ctx->dynsym || ctx->bias) break;/* won't even bother checking against the section name */ctx->bias = (off_t) sh->sh_addr - (off_t) sh->sh_offset;break;}}munmap(elf, size);elf = 0;if (!ctx->dynstr || !ctx->dynsym) fatal("dynamic sections not found in %s", libpath);
#undef fatallog_dbg("%s: ok, dynsym = %p, dynstr = %p symtab = %p strtab = %p", libpath, ctx->dynsym, ctx->dynstr, ctx->symtab, ctx->strtab);return ctx;}
复制代码

1. 获取so加载的地址,存储在load_addr

    maps = fopen("/proc/self/maps", "r");while (!found && fgets(buff, sizeof(buff), maps))if (strstr(buff, "r-xp") && strstr(buff, libpath)) found = 1;fclose(maps);if (sscanf(buff, "%lx", &load_addr) != 1)fatal("failed to read load address for %s", libpath);
复制代码

2. 重新映射so,获取ELF文件头

    fd = open(libpath, O_RDONLY);size = lseek(fd, 0, SEEK_END);elf = (Elf_Ehdr *) mmap(0, size, PROT_READ, MAP_SHARED, fd, 0);
复制代码

3. 获取.shstrtab段。

    Elf_Shdr *shstrtab = (Elf_Shdr *)(shoff + elf->e_shstrndx * elf->e_shentsize);char * shstr = malloc(shstrtab->sh_size);memcpy(shstr, ((void *) elf) + shstrtab->sh_offset, shstrtab->sh_size);
复制代码

4.获取.dynsym段、.dynstr段、.symtab段、.strtab段

 for (k = 0; k < elf->e_shnum; k++, shoff += elf->e_shentsize) {Elf_Shdr *sh = (Elf_Shdr *) shoff;switch (sh->sh_type) {case SHT_DYNSYM:ctx->dynsym = malloc(sh->sh_size);memcpy(ctx->dynsym, ((void *) elf) + sh->sh_offset, sh->sh_size);ctx->dynsym_num = (sh->sh_size / sizeof(Elf_Sym));break;case SHT_SYMTAB:ctx->symtab = malloc(sh->sh_size);memcpy(ctx->symtab, ((void *) elf) + sh->sh_offset, sh->sh_size);ctx->symtab_num = (sh->sh_size / sizeof(Elf_Sym));break;case SHT_STRTAB:if(!strcmp(shstr+sh->sh_name,".dynstr")) {ctx->dynstr = malloc(sh->sh_size);memcpy(ctx->dynstr, ((void *) elf) + sh->sh_offset, sh->sh_size);}else if(!strcmp(shstr+sh->sh_name,".strtab")) {ctx->strtab = malloc(sh->sh_size);memcpy(ctx->strtab, ((void *) elf) + sh->sh_offset, sh->sh_size);}break;case SHT_PROGBITS:if (!ctx->dynstr || !ctx->dynsym || ctx->bias) break;ctx->bias = (off_t) sh->sh_addr - (off_t) sh->sh_offset;break;}}
复制代码

2.2 enhanced_dlsym

void *enhanced_dlsym(void *handle, const char *name) {int k;struct ctx *ctx = (struct ctx *) handle;Elf_Sym *dynsym = (Elf_Sym *) ctx->dynsym;Elf_Sym *symtab = (Elf_Sym *) ctx->symtab;char *dynstr = (char *) ctx->dynstr;char *strtab = (char *) ctx->strtab;for (k = 0; k < ctx->dynsym_num; k++, dynsym++) {if (strcmp(dynstr + dynsym->st_name, name) == 0) {void *ret = ctx->load_addr + dynsym->st_value - ctx->bias;log_info("%s found at %p", name, ret);return ret;}}if(symtab) {for (k = 0; k < ctx->symtab_num; k++, symtab++) {sym_tab->st_name,strings + sym_tab->st_name,k);if (strcmp(strtab + symtab->st_name, name) == 0) {void *ret = ctx->load_addr + symtab->st_value - ctx->bias;log_info("%s found at %p", name, ret);return ret;}}}return 0;
}
复制代码

1. 先查询.dynsym段。遍历.dymsym所有符号,查找符号名与给定字符串一致的符号。用load_addr、bias结合符号偏移来获取实际地址。

for (k = 0; k < ctx->dynsym_num; k++, dynsym++) {if (strcmp(dynstr + dynsym->st_name, name) == 0) {void *ret = ctx->load_addr + dynsym->st_value - ctx->bias;log_info("%s found at %p", name, ret);return ret;}}
复制代码

2. 如果.dynsym段找不到目标符号且.symtab段存在时,遍历.symtab所有符号,查找符号名与给定字符串一致的符号。用load_addr、bias结合符号偏移来获取实际地址。

for (k = 0; k < ctx->symtab_num; k++, symtab++) {sym_tab->st_name,strings + sym_tab->st_name,k);if (strcmp(strtab + symtab->st_name, name) == 0) {void *ret = ctx->load_addr + symtab->st_value - ctx->bias;log_info("%s found at %p", name, ret);return ret;}}
复制代码

三、结语

Nougat_dlfunctions只支持arm平台,而我在实际工作中也不涉及到x86平台,所以Enhanced dlfunctions暂时只支持arm32和arm64,如果要兼容x86等其他平台也不难,不需要改实现,主要就是elf.h一些结构体的不同。

四、参考

  1. FastHook——一种高效稳定、简洁易用的Android Hook框架
  2. FastHook——巧妙利用动态代理实现非侵入式AOP
  3. FastHook——远超YAHFA的优异稳定性
  4. 如何使用FastHook免root hook微信

FastHook——实现.dynsym段和.symtab段符号查询相关推荐

  1. Latex悬挂缩进——整段缩进or列表符号不缩进,段落缩进

    宏包(正文编辑前) 正文输入前需要加入宏包"\usepackage{CJK}",如下代码: \documentclass[journal]{IEEEtran} \usepackag ...

  2. 关于text段、data段和bss段

    根据APUE,程序分为下面的段:.text, data (initialized), bss, stack, heap. data/bss/text: text段在内存中被映射为只读,但.data和. ...

  3. 内存空间分几部分:代码段、数据段,栈,堆 (收集整理)

    1.函数代码存放在代码段.声明的类如果从未使用,则在编译时,会优化掉,其成员函数不占代码段空间. 全局变量或静态变量,放在数据段, 局部变量放在栈中, 用new产生的对象放在堆中, 内存分为4段,栈区 ...

  4. (深入理解计算机系统) bss段,data段、text段、堆(heap)和栈(stack)(C/C++存储类型总结)(内存管理)

    文章目录 bss段 data段 text段 堆(heap) 栈(stack) 一个程序本质上都是由 bss段.data段.text段三个组成的. 存储类型总结 bss段 bss段(bss segmen ...

  5. matlab浊音段和清音段,基于Matlab编写的语音端点检测1

    wavread 基于Matlab编写的语音端点检测 专业: 班级: 姓名: 指导教师: 2011年6月18日 一.实验目的 1.学会MATLAB的使用,掌握MATLAB的程序设计方法: 3.掌握语音处 ...

  6. ELF中的.data段和.bss段

    .data 段: 已初始化的全局变量和局部静态变量都保存在 .data 段. .bss 段: 未初始化的全局变量和局部静态变量默认值都为 0,本来它们也可以被放在 .data 段的,但是因为它们都是 ...

  7. C/C++程序内存布局(data段,bss段,text段)以及static关键字详解

    目录 1.内存布局 1.1 data段(可读可写) 1.2 text段(只读) 1.3 bss段(可读可写) 1.4 堆区 1.5 栈区 1.6全局区/静态区 1.7 字符串常量区 1.8 代码区 1 ...

  8. 程序内存空间(代码段、数据段、堆栈段)

    在冯诺依曼的体系结构中,一个进程必须有:代码段,堆栈段,数据段. 进程的虚拟地址空间图示如下: 堆栈段: 1. 为函数内部的局部变量提供存储空间. 2. 进行函数调用时,存储"过程活动记录& ...

  9. RO段、RW段和ZI段 --Image$$??$$Limit 含义

    要了解RO,RW和ZI需要首先了解以下知识: (1) ARM程序的组成             此处所说的"ARM程序"是指在ARM系统中正在执行的程序,而非保存在ROM中的bin ...

最新文章

  1. host ntrip 千寻rtk_什么是千寻知寸cors账号?它提供的定位服务精度如何?使用时需要注意哪些问题?...
  2. Eclipse中JSP生成的class文件去了哪里?(转)
  3. c++ STL模板(一)
  4. 最新版chrome安装adblock插件
  5. Python+OpenCV3.3图像处理视频教程-贾志刚-专题视频课程
  6. 由于启动计算机e盘不见了,电脑开机检测不到硬盘怎么办
  7. 17. 如何通过 SAP ABAP OData $expand 操作在同一个 HTTP 请求中返回多个节点的数据
  8. 特征选择方法详解Part2-卡方检验、互信息(Mutual Information)
  9. Excel VBA:设置行高与列宽
  10. IP交换机与路由器配置
  11. HTTP常用请求头与请求体实例
  12. 【艾兰岛建筑】系列1—五大实用绝招!教你场景建造又快又美!
  13. program和module区别
  14. WVP-PRO+ZLMediaKit搭建GB28181视频平台(linux详细教学)
  15. CCF-CSP 202112-2 序列查询新解
  16. 将3DMax编辑的动画,导入给已经绑定蒙皮好的模型给Unity使用
  17. Task2 bayes_plus
  18. 关于华为Ascend P6的各种技术资料整理
  19. 近59%消费者将提前购物丨2022美国购物旺季消费者调研
  20. 3.Mac安装Vue出现的问题解决方案:Error: EACCES: permission denied

热门文章

  1. linux 查看网站目录权限,解决SELinux对网站目录权限控制的不当的问题
  2. dreamweaver 正则表达式为属性值加上双引号_IT兄弟连 HTML5教程 HTML5表单 新增的表单属性3...
  3. CentOS使用 Crontab定时任务清理程序日志
  4. linux命令ps -aux|grep xxx详解
  5. 编译原理---代码优化基础(自己看)
  6. rabbitmq windows 连接 linux,在Centos7中,从主机 Windows 上无法远程访问 Linux 上rabbitmq的解决方法...
  7. 软件质量保证与测试(什么是图灵测试)
  8. 标准表达式中数据类型不匹配_三观不同的人在一起有多累?三观一致的标准,不进行三观测试真不知道!人生观测试,价值观测试,世界观测试题推荐!超准三观匹配度测试!...
  9. 基于matlab的数字水印技术研究,MATLAB在数字水印技术研究中的应用
  10. 不是shell具有的功能和特点的是_环境监控主机具有哪些功能特点