背景

最近准备一个教程,案例的过程中准备了如下代码碎片,演示解析http scheme

#include <stdio.h>
#include <stdlib.h>
#include <string.h>char *parse_scheme(const char *url)
{char *p = strstr(url,"://");return strndup(url,p-url);
}int main()
{const char *url = "http://static.mengkang.net/upload/image/2019/0907/1567834464450406.png";char *scheme = parse_scheme(url);printf("%sn",scheme);free(scheme);return 0;
}

上面是通过strndup的方式,背后也依托了malloc,所以最后也需要free
有人在微信群私信parse_scheme能用char []来做返回值吗?我们知道栈上的数组也能用来存储字符串,那我们可以改写成下面这样吗?

char *parse_scheme(const char *url)
{char *p = strstr(url,"://");long l = p - url + 1;char scheme[l];strncpy(scheme, url, l-1);return scheme;
}

大多数人都知道不能这样写,因为返回的是栈上的地址,当从该函数返回之后,那段栈空间的操作权也释放了,当再次使用该地址的时候,值就是不确定的了。

那我们今天就一起探讨下出现这样情况的背后的真正原理。

基础预备

每个函数运行的时候因为需要内存来存放函数参数以及局部变量等,需要给每个函数分配一段连续的内存,这段内存就叫做函数的栈帧(Stack Frame)。
因为是一块连续的内存地址,所以叫帧;为什么叫要加一个呢?
想必大家都熟悉了函数调用栈,为什么叫函数调用栈呢?比如下面的表达式

array_values(explode(",",file_get_contents(...)));

函数的执行顺序是最内层的函数最先执行,然后依次返回执行外层的函数。所以函数的执行就是利用了栈的数据结构,所以就叫栈帧。

x86_64 cpu上的 rbp 寄存器存函数栈底地址,rsp 寄存器存函数栈顶地址。

实验

#include <stdio.h>void foo(void)
{int i;printf("%dn", i);i = 666;
}int main(void)
{foo();foo();return 0;
}
$gcc -g 2.c$./a.out
0
666

为什么第二次调用foo函数输出的结果都是上次函数调用的赋值呢?先看下反汇编之后的代码

000000000040052d <foo>:
#include <stdio.h>void foo(void)
{40052d:    55                       push   %rbp40052e:    48 89 e5                 mov    %rsp,%rbp400531:    48 83 ec 10              sub    $0x10,%rspint i;printf("%dn", i);400535:    8b 45 fc                 mov    -0x4(%rbp),%eax400538:    89 c6                    mov    %eax,%esi40053a:    bf 00 06 40 00           mov    $0x400600,%edi40053f:    b8 00 00 00 00           mov    $0x0,%eax400544:    e8 c7 fe ff ff           callq  400410 <printf@plt>i = 666;400549:    c7 45 fc 9a 02 00 00     movl   $0x29a,-0x4(%rbp)
}400550:    c9                       leaveq400551:    c3                       retq0000000000400552 <main>:int main(void)
{400552:    55                       push   %rbp400553:    48 89 e5                 mov    %rsp,%rbpfoo();400556:    e8 d2 ff ff ff           callq  40052d <foo>foo();40055b:    e8 cd ff ff ff           callq  40052d <foo>return 0;400560:    b8 00 00 00 00           mov    $0x0,%eax
}400565:    5d                       pop    %rbp400566:    c3                       retq400567:    66 0f 1f 84 00 00 00     nopw   0x0(%rax,%rax,1)40056e:    00 00

理论分析

第一次进入 foo函数前后

在进入foo函数之前,因为main里没有参数也没有局部变量,所以,main 的栈帧的长度就是0,rbprsp相等(0x7fffffffe2c0)。当执行

callq  40052d <foo>

会把main函数的在调用foo之后需要返回执行的下一行代码的地址压栈,因为是64位机器,地址8字节。
进入foo之后

push   %rbp

rbp的值压栈,因为也是存的地址,所以又占了8字节,所以当初始化foo函数的rbp的时候

mov    %rsp,%rbp

rsp已经在原来的基础上加了16字节,所以从0x7fffffffe2c0变成了0x7fffffffe2b0

sub    $0x10,%rsp

因为foo函数里面局部变量,编译的时候就预留了16字节,所以rsp变为了0x7fffffffe2a0
最后执行了

movl   $0x29a,-0x4(%rbp)

666放在了0x7fffffffe2ac,当第二次调用的时候,打印i的汇编代码如下

printf("%dn", i);400535:    8b 45 fc                 mov    -0x4(%rbp),%eax400538:    89 c6                    mov    %eax,%esi40053a:    bf 00 06 40 00           mov    $0x400600,%edi40053f:    b8 00 00 00 00           mov    $0x0,%eax400544:    e8 c7 fe ff ff           callq  400410 <printf@plt>

第二次进入 foo函数前后

因为上次-0x4(%rbp)存了666,而第二次调用foorbp的值又和第一次一样,所以是一个地址。所以666就被打印出来了。

回到主题

#include <stdio.h>
#include <stdlib.h>
#include <string.h>char *parse_scheme(const char *url)
{char *p = strstr(url,"://");long l = p - url + 1;char scheme[l];strncpy(scheme, url, l-1);printf("%sn",scheme);return scheme;
}int main()
{const char *url = "http://static.mengkang.net/upload/image/2019/0907/1567834464450406.png";char *scheme = parse_scheme(url);printf("%sn",scheme);return 0;
}

调试信息如下,当从parse_scheme返回时,打印scheme的结果还是http,但是当我们调用printf之后,和上面样例中一样,parse_scheme出栈,printf入栈,则栈上内存就又替换了,所以打印出来的结果则不一定是http了。

本文作者:周梦康

原文链接

更多技术干货敬请关注云栖社区知乎机构号:阿里云云栖社区 - 知乎

本文为云栖社区原创内容,未经允许不得转载。

printf打印数组_彻底弄懂为什么不能把栈上分配的数组(字符串)作为返回值相关推荐

  1. c语言数组在栈上的分配,彻底弄懂为什么不能把栈上分配的数组(字符串)作为返回值...

    背景 最近准备从 C 语言零基础到 PHP 扩展开发实战,案例的过程中准备了如下代码碎片,演示解析http scheme #include #include #include char *parse_ ...

  2. 彻底弄懂为什么不能把栈上分配的数组(字符串)作为返回值

    背景 最近准备一个教程,案例的过程中准备了如下代码碎片,演示解析http scheme #include <stdio.h> #include <stdlib.h> #incl ...

  3. java接口防抖_彻底弄懂节流和防抖

    节流和防抖 这两个东西,你肯定听过,就是两种优化浏览器性能的手段.相关文章你肯定也看过,如果还是不太清楚,没关系,看完这篇短文,相信你能轻松理解其中差别. 防抖(deounce) 我们先说防抖吧,这里 ...

  4. 离线缓存占内存吗_彻底弄懂浏览器缓存策略

    浏览器缓存策略对于前端开发同学来说不陌生,大家都有一定的了解,但如果没有系统的归纳总结,可能三言两语很难说明白,甚至说错,尤其在面试过程中感触颇深,很多候选人对这类基础知识竟然都是一知半解,说出几个概 ...

  5. stringbuilder调用tostring常量池_彻底弄懂java中的常量池

    作者:tracy_666链接:https://www.jianshu.com/p/55f65dac1b4b JVM常量池主要分为Class文件常量池.运行时常量池,全局字符串常量池,以及基本类型包装类 ...

  6. python 树状数组_【算法日积月累】19-高级数据结构:树状数组

    树状数组能解决的问题 树状数组,也称作"二叉索引树"(Binary Indexed Tree)或 Fenwick 树. 它可以高效地实现如下两个操作: 1.数组前缀和的查询: 2. ...

  7. 保存数组_面试官:讲一讲你对据结构——数组、链表、栈、队列的理解

    一.解释定义 1. 数据结构: 数据结构是指相互之间存在一种或多种特定关系的数据元素的集合.再简单描述一下:数据结构就是描述对象间逻辑关系的学科. 如果还是不太清楚下面会举例说明的. 2. 数据存储结 ...

  8. python 构件二维数组_通过这四个构件块来升级您的javascript数组

    python 构件二维数组 Arrays in JavaScript are something special, as they leverage the prototype feature of ...

  9. numpy 数组 ::_看起来不错,没有麻烦:使用NumPy进行数组编程

    numpy 数组 :: It is sometimes said that Python, compared to low-level languages such as C++, improves ...

最新文章

  1. module_init和init_module的区别
  2. python斑点检测
  3. spring boot整合mail
  4. Effective Java之请不要在新代码中使用原生态类型(二十三)
  5. AIX 添加开机启动项
  6. 网络流24题 洛谷 3355 骑士共存
  7. Maven项目整合提示:Maven Missing artifact xxx:jar 错误解决方案
  8. [C++/CLI编程宝典][5]编译与反汇编
  9. lbp特征提取算法 知乎_图像-LBP特征描述算子-人脸检测
  10. shell连接远程mongodb数据库
  11. linux下vhd win10,利用win10纯净版系统的VHD虚拟硬盘安装win10系统的方法
  12. 马来西亚国家银行暂无发行央行数字货币计划
  13. Oracle用Start with...Connect By prior子句递归查询(转)
  14. 西电Pintos操作系统课程设计 实验三
  15. C语言实现顺序表基本操作
  16. Qualcomm Ramdump debugging
  17. 手机酒店预订的革命之作——全新艺龙无线手机客户端测评
  18. hl7 java_HL7 2.X解析(JAVA版)
  19. 干货分享:app推广新人如何做好应用商店推广
  20. python学习(二)

热门文章

  1. git 无法 push 远程仓库 【Note about fast-forwards】
  2. 【C语言】创建一个函数,将输入的2个数排序
  3. 【C语言】创建一个函数,并调用比较两个数的大小
  4. 【C语言】一元二次方程(求实根和虚根)
  5. java面试编程面试题_完美的编程面试问题
  6. svn差异查看器 编码_男女学习编码的9个差异
  7. 121_Power Query之R.Execute的read.xlsxODBC
  8. java调用sqlserver存储过程_Java中调用SQLServer存储过程示例
  9. 用idea给java项目打jar包
  10. PLSQL Developer 安装与配置