Linux性能评测工具之一:gprof篇
这些天自己试着对项目作一些压力测试和性能优化,也对用过的测试工具作一些总结,并把相关的资料作一个汇总,以便以后信手拈来!
1 简介
gprof 用户手册网站 http://sourceware.org/binutils/docs-2.17/gprof/index.html
2 功能
Gprof 是GNU gnu binutils工具之一,默认情况下linux系统当中都带有这个工具。
1. 可以显示“flat profile”,包括每个函数的调用次数,每个函数消耗的处理器时间,
2. 可以显示“Call graph”,包括函数的调用关系,每个函数调用花费了多少时间。
3. 可以显示“注释的源代码”--是程序源代码的一个复本,标记有程序中每行代码的执行次数。
3 原理
4 使用流程
1. 在编译和链接时 加上-pg选项。一般我们可以加在 makefile 中。
3. 在程序运行目录下 生成 gmon.out 文件。如果原来有gmon.out 文件,将会被重写。
5 参数说明
l -p 只输出函数的调用图(Call graph的那部分信息)。
l -e Name 不再输出函数Name 及其子函数的调用图(除非它们有未被限制的其它父函数)。可以给定多个 -e 标志。一个 -e 标志只能指定一个函数。
l -E Name 不再输出函数Name 及其子函数的调用图,此标志类似于 -e 标志,但它在总时间和百分比时间的计算中排除了由函数Name 及其子函数所用的时间。
l -f Name 输出函数Name 及其子函数的调用图。可以指定多个 -f 标志。一个 -f 标志只能指定一个函数。
l -z 显示使用次数为零的例程(按照调用计数和累积时间计算)。
一般用法: gprof –b 二进制程序 gmon.out >report.txt
6 报告说明
%time |
Cumulative seconds |
Self Seconds |
Calls |
Self TS/call |
Total TS/call |
name |
该函数消耗时间占程序所有时间百分比 |
程序的累积执行时间 (只是包括gprof能够监控到的函数) |
该函数本身执行时间 (所有被调用次数的合共时间) |
函数被调用次数 |
函数平均执行时间 (不包括被调用时间) (函数的单次执行时间) |
函数平均执行时间 (包括被调用时间) (函数的单次执行时间) |
函数名 |
Index |
%time |
Self |
Children |
Called |
Name |
索引值 |
函数消耗时间占所有时间百分比 |
函数本身执行时间 |
执行子函数所用时间 |
被调用次数 |
函数名 |
程序的累积执行时间只是包括gprof能够监控到的函数。工作在内核态的函数和没有加-pg编译的第三方库函数是无法被gprof能够监控到的,(如sleep()等)
Gprof 的具体参数可以 通过 man gprof 查询。
7 共享库的支持
对于代码剖析的支持是由编译器增加的,因此如果希望从共享库中获得剖析信息,就需要使用 -pg 来编译这些库。提供已经启用代码剖析支持而编译的 C 库版本(libc_p.a)。
gcc example1.c –pg -lc_p -o example1
注意要用ldd ./example | grep libc来查看程序链接的是libc.so还是libc_p.so
8 用户时间与内核时间
有一个方法可以查看应用程序的运行时间组成,在 time 命令下面执行程序。这个命令会显示一个应用程序的实际运行时间、用户空间运行时间、内核空间运行时间。
9 注意事项
2. 只能使用静态连接libc库,否则在初始化*.so之前就调用profile代码会引起“segmentation fault”,解决办法是编译时加上-static-libgcc或-static。
4. 要监控到第三方库函数的执行时间,第三方库也必须是添加 –pg 选项编译的。
6. 程序不能以demon方式运行。否则采集不到时间。(可采集到调用次数)
7. 首先使用 time 来运行程序从而判断 gprof 是否能产生有用信息是个好方法。
8. 如果 gprof 不适合您的剖析需要,那么还有其他一些工具可以克服 gprof 部分缺陷,包括 OProfile 和 Sysprof。
9. gprof对于代码大部分是用户空间的CPU密集型的程序用处明显。对于大部分时间运行在内核空间或者由于外部因素(例如操作系统的 I/O 子系统过载)而运行得非常慢的程序难以进行优化。
11. gprof只能在程序正常结束退出之后才能生成报告(gmon.out)。
a) 原因: gprof通过在atexit()里注册了一个函数来产生结果信息,任何非正常退出都不会执行atexit()的动作,所以不会产生gmon.out文件。
b) 程序可从main函数中正常退出,或者通过系统调用exit()函数退出。
10 多线程应用
gprof 不支持多线程应用,多线程下只能采集主线程性能数据。原因是gprof采用ITIMER_PROF信号,在多线程内只有主线程才能响应该信号。
采用什么方法才能够分析所有线程呢?关键是能够让各个线程都响应ITIMER_PROF信号。可以通过桩子函数来实现,重写pthread_create函数。
static void * wrapper_routine(void *);
/* Original pthread function */
static int (*pthread_create_orig)(pthread_t *__restrict,
__const pthread_attr_t *__restrict,
/* Library initialization function */
void wooinit(void) __attribute__((constructor));
pthread_create_orig = dlsym(RTLD_NEXT, "pthread_create");
fprintf(stderr, "pthreads: using profiling hooks for gprof/n");
if(pthread_create_orig == NULL)
error = "pthread_create is NULL";
fprintf(stderr, "%s/n", error);
/* Our data structure passed to the wrapper */
void * (*start_routine)(void *);
/* The wrapper function in charge for setting the itimer value */
static void * wrapper_routine(void * data)
/* Put user data in thread-local variables */
void * (*start_routine)(void *) = ((wrapper_t*)data)->;start_routine;
void * arg = ((wrapper_t*)data)->;arg;
/* Set the profile timer value */
setitimer(ITIMER_PROF, &((wrapper_t*)data)->;itimer, NULL);
/* Tell the calling thread that we don't need its data anymore */
pthread_mutex_lock(&((wrapper_t*)data)->;lock);
pthread_cond_signal(&((wrapper_t*)data)->;wait);
pthread_mutex_unlock(&((wrapper_t*)data)->;lock);
/* Our wrapper function for the real pthread_create() */
int pthread_create(pthread_t *__restrict thread,
__const pthread_attr_t *__restrict attr,
void * (*start_routine)(void *),
/* Initialize the wrapper structure */
wrapper_data.start_routine = start_routine;
getitimer(ITIMER_PROF, &wrapper_data.itimer);
pthread_cond_init(&wrapper_data.wait, NULL);
pthread_mutex_init(&wrapper_data.lock, NULL);
pthread_mutex_lock(&wrapper_data.lock);
/* The real pthread_create call */
i_return = pthread_create_orig(thread,
/* If the thread was successfully spawned, wait for the data
pthread_cond_wait(&wrapper_data.wait, &wrapper_data.lock);
pthread_mutex_unlock(&wrapper_data.lock);
pthread_mutex_destroy(&wrapper_data.lock);
pthread_cond_destroy(&wrapper_data.wait);
然后编译成动态库 gcc -shared -fPIC gprof-helper.c -o gprof-helper.so -lpthread -ldl
Linux性能评测工具之一:gprof篇相关推荐
- linux下性能测试mon,Linux性能评测工具之一:nmon篇
1.nmon概述 1.1.概述 nmon是收集AIX或Linux主机的性能数据并分析的工具,使用简单易用.主要有两个,一个是nmon采集数据的工具,一般名称为nmon_**,例如nmon_aix5.3 ...
- Linux性能优化工具:gprof简记
1. 前言 限于作者能力水平,本文可能存在谬误,因此而给读者带来的损失,作者不做任何承诺. 2. gprof工作基本原理 在使用gcc编译时指定-pg选项,编译器在用户代码中插入性能测试代码. 3. ...
- pyDash : Linux 性能监测工具
2019独角兽企业重金招聘Python工程师标准>>> pyDash 是一个轻量且基于 web 的 Linux 性能监测工具,它是用 Python 和 Django 加上 Chart ...
- (转)超全整理!Linux性能分析工具汇总合集
原文地址:https://rdc.hundsun.com/portal/article/731.html?ref=myread 出于对Linux操作系统的兴趣,以及对底层知识的强烈欲望,因此整理了这篇 ...
- linux编程性能,Linux性能评估工具
Linux性能评估工具 2019-03-11 编程之家 https://www.jb51.cc 编程之家收集整理的这篇文章主要介绍了Linux性能评估工具,编程之家小编觉得挺不错的,现在分享给大家,也 ...
- Linux 性能分析工具汇总
Linux 性能分析工具汇总 我从cnaaa.com购买了服务器. 出于对Linux操作系统的兴趣,以及对底层知识的强烈欲望,因此整理了这篇文章.本文也可以作为检验基础知识的指标,另外文章涵盖了一个系 ...
- [Linux 性能检测工具]IOSTAT
[Linux 性能检测工具]IOSTAT IOSTAT NAME: Iostat, 报告CPU的统计,和 I/O的统计. 语法: iostat [ -c ] [ -d ] [ -N ...
- [Linux 性能检测工具]DF
[Linux 性能检测工具]DF DF NAME: df 报告了文件系统的使用 语法: df [OPTION]... [FILE]... 描述: Df显示了以文件名为从参数查看所在文件系统的可用空间. ...
- Linux性能分析工具详解
Linux性能分析工具详解 一.tcpdump 常用用法: 这里用sudo因为当前帐号无权使用tcpdump,这里仅以一个tcp的例子来说明:sudo /usr/sbin/tcpdump tcp po ...
最新文章
- Nginx 虚拟主机配置及负载均衡
- 一口一个,超灵活的Python迷你项目
- rtmp的URL里面mp3:和mp4:是啥意思
- Py之urllib2:Python库之urllib、urllib2、urllib3系列简介、安装、使用方法之详细攻略
- Java 方法、 流(Stream)、文件(File)和IO 总结
- linux tomcat java heap space_Linux下tomcat JVM内存设置
- JS中 window.location.search的作用
- [数据结构-严蔚敏版]P64循环队列-队列的顺序存储结构
- 洪水同频率放大的方法_我们应该怎么选择放大器配件?
- Dubbo-Admin 2.7 本地安装和部署
- H2最完整的资料下载地址:
- 代码重构 —— 区分代码和数据
- SSM框架架构,原理及整合流程(eclipse)
- VTK:图形基本操作进阶——连通区域分析
- 计算机学院特色迎新标语,有创意的迎新,计算机学院用代码写迎新条幅,学弟学妹表示一脸懵...
- AVD模拟器一直处于开机状态打不开的解决办法
- 太可怕啦!AI 一秒还原马赛克,有码变高清
- 牛客网-《刷C语言百题》第二期
- 使用PS快速抠图:(磁锁套抠图,快速工具,)
- 深入浅出FFMPEG(二) SDK version 0.11
热门文章
- 备库设置read_only被阻塞
- JVM学习笔记(一)------基本结构
- [XPath] XPath 与 lxml (三)XPath 坐标轴
- 几种流行的AJAX框架:jQuery,Mootools,Dojo,Ext JS的对比
- myeclipse中代码提示和编辑区颜色设置
- CodeForces - 1459C Row GCD(数论+推公式)
- CodeForces - 1438E Yurii Can Do Everything(暴力)
- CodeForces - 456C Boredom(线性dp)
- Gym - 101972H Beautiful Substrings(思维+模拟)
- HDU - 5978 To begin or not to begin(简单博弈)