【编者按】作者 Emil Soman,Rubyist,除此之外竟然同时也是艺术家,吉他手,Garden City RubyConf 组织者。本文是 DIY Ruby CPU Profiling 的第二部分。本文系 OneAPM 工程师编译整理。

原文链接:http://crypt.codemancers.com/posts/2015-04-15-diy-ruby-cpu-profiling-part-iii/

在第一部分我们了解到仪表分析器如何工作,在第二部分我们学习到如何使用 CPU time 和 Wall time 测量执行时间。建议在继续学习之前先阅读一下那些内容。本章我们将应用学到的目前为止知识做一个很基础的仪表 CPU 分析器。

Part III. DIY 仪表 CPU 分析器

Ruby 的仪表盘

在第一部分,我们学到了仪表分析工具利用能够被分析工具安装或由语言自身提供的 hooks 来工作。幸运的是,Ruby 早就拥有这些 hooks 并且提供纤巧的TracePoint类来使用这些 hooks。

TracePoint API

执行代码时,Ruby VM 发送一系列事件到不同的节点。Ruby 允许利用TracePoint类进行事件回调。TracePoint的 API 文档列出了所有可以监听的事件,但我们只对下面两个感兴趣:

  1. :call,当 Ruby 方法调用时被触发。

  2. :return, 当 Ruby 方法返回时被触发。

我们可以通过TracePoint.new方法创造 tracepoint 对象并传递一个事件类型进行监听,同时传递部分在事件触发时执行的代码。下面是为:call:return事件创造 tracepoint 的代码。

trace = TracePoint.new(:call, :return) do |trace|puts "Method: #{trace.method_id}, event: #{trace.event}"
end

被传到回调代码块的参数trace使你能够访问一系列 tracepoint 的属性,通过它们更加了解被触发的事件。举个例子,我们需要通过method_id属性得到 method name,通过event属性得到被触发的事件名。上文提到的回调代码块中将显示出方法名和被触发的事件类型,每一次都会伴随着 Ruby 方法的调用或返回。

建立 tracepoint 之后,需要将其变成可用状态:

trace.enable

一旦 tracepoint 变成可用状态,我们便可以创建方法对它进行调用,并且看我们出发的回调命令是否被执行。

def hello
endhello#=> Method: hello, event: call
#=> Method: hello, event: return

不错,我们的回调命令如预期的一样被执行了两次。

diy_prof gem

最后我们将结合之前学过的东西创造一个 RubyGem,并将这个 gem 命名为 diy_prof. 关于此 gem 的资源放在 github 上。

现在我们就用 bundler 来建造这个 gem:

bundle gem diy_prof

这就造出了我们将要做的项目的骨架。接着,我们将建立在 Part II 中介绍过的包含cpu_timewall_time方法的 TimeHelpers模块:

# lib/diy_prof/time_helpers.rbmodule DiyProf::TimeHelpers# These methods make use of `clock_gettime` method introduced in Ruby 2.1# to measure CPU time and Wall clock time.def cpu_timeProcess.clock_gettime(Process::CLOCK_PROCESS_CPUTIME_ID, :microsecond)enddef wall_timeProcess.clock_gettime(Process::CLOCK_MONOTONIC, :microsecond)end
end

我们还需要请求 gem 主文件中的这个文件lib/diy_prof.rb

# lib/diy_prof.rbrequire 'diy_prof/version'
require 'diy_prof/time_helpers'
# Rest of the original file ..

下一步,当一个:callreturn事件发生时,我们将通过 gem 里的 TracePoint API 来显示时间。

module DiyProfclass Tracerinclude TimeHelpersdef initialize(clock_type: :cpu)@tracepoint = TracePoint.new(:call, :return) do |trace|time = clock_type == :wall ? wall_time : cpu_timeprintf("%-20s:%-20s%-20s\n", time, trace.event, trace.method_id)endenddef enable@tracepoint.enableenddef disable@tracepoint.disableendend
end

同时,我们需要再一次调用这个 gem 主文件中的文件:

# lib/diy_prof.rbrequire 'diy_prof/version'
require 'diy_prof/time_helpers'
require 'diy_prof/tracer'
# Rest of the original file ..

现在,让我们来写一个例子脚本来测试至今为止创造了什么。我们将使用在 Part I 中见过的那个例子:

# examples/demo.rb$:<< File.join(File.dirname(__FILE__), "../lib")
require 'diy_prof'### Begin sample program ###
def main3.times dofind_many_square_rootsfind_many_squaresend
enddef find_many_square_roots5000.times{|i| Math.sqrt(i)}
enddef find_many_squares5000.times{|i| i**2 }
end
### End sample program ###tracer = DiyProf::Tracer.new(clock_type: :cpu)
tracer.enable
main
tracer.disable

如果运行了以上 Ruby 程序,我们将得到下列结果:

70508               :return              enable
70587               :call                main
70604               :call                find_many_square_roots
73225               :return              find_many_square_roots
73256               :call                find_many_squares
74527               :return              find_many_squares
74562               :call                find_many_square_roots
77042               :return              find_many_square_roots
77064               :call                find_many_squares
77653               :return              find_many_squares
77690               :call                find_many_square_roots
79681               :return              find_many_square_roots
79698               :call                find_many_squares
80288               :return              find_many_squares
80306               :return              main
80326               :call                disable

第一列显示的是被触发事件的 CPU time,第二列是被触发的事件名,第三列是被调用或返回的方法名。这个结果与在 Part I 中学习仪表分析器如何工作时看到的结果很相似。可以看到,我们能够轻松地通过这个结果重建调用,因为我们可以知道各个方法间的调用关系。写一个能解析这个结果并按执行时间有序显示方法列的脚本并不是很难。但这太无聊了,我们可以建造更有趣的东西。看着吧,下一部分将学习我们能够利用这些数据来做的其他事情。

概括

我们学习了 Ruby 的 TracePoint API 以及如何用它监听方法的调用和返回。同时我们整合写过的代码建立了一个能够显示 Ruby 程序的执行 trace 的 gem。在第四部分我们将学习如何有效利用 gem 收集到的数据并通过它们创造一些很酷的调用图。感谢阅读!如果你想要阅读 DIY CPU 分析系列的其他最新文章,请关注我们的 twitter @codemancershq.


OneAPM for Ruby 能够深入到所有 Ruby 应用内部完成应用性能管理和监控,包括代码级别性能问题的可见性、性能瓶颈的快速识别与追溯、真实用户体验监控、服务器监控和端到端的应用性能管理。 想技术文章,请访问 OneAPM 官方博客。

DIY Ruby CPU 分析 Part III相关推荐

  1. DIY Ruby CPU 分析——Part III

    [编者按]作者 Emil Soman,Rubyist,除此之外竟然同时也是艺术家,吉他手,Garden City RubyConf 组织者.本文是 DIY Ruby CPU Profiling 的第二 ...

  2. DIY Ruby CPU 分析 Part II

    [编者按]作者 Emil Soman,Rubyist,除此之外竟然同时也是艺术家,吉他手,Garden City RubyConf 组织者.本文是 DIY Ruby CPU Profiling 的第二 ...

  3. Windows上的Java线程CPU分析

    本文将为您提供一个教程,介绍如何在Windows OS上快速查明Java线程贡献者与CPU严重问题有关. Windows与Linux,Solaris和AIX等其他操作系统一样,使您可以在进程级别监视C ...

  4. jstack: Java占用高CPU分析之- C2 Compiler Thread

    1. 现象 应用刚上线时发现Java进程占用了大量的CPU份额,但过了几分钟后会降下来(流量没变的情况下),因为已经做了负载均衡,于是拿一台实例重新部署代码上线来分析.具体分析步骤参考另外一篇文章&l ...

  5. JAVA内存分析:使用JDK自带工具进行内存和CPU分析及垃圾回收

    JAVA内存分析:使用JDK自带工具进行内存和CPU分析及垃圾回收 JAVA内存分析一:基于dump内存溢出快照分析 JAVA内存分析二:idea集成jprofiler查看JVM内存使用情况 JAVA ...

  6. Node.js 应用故障排查手册 —— 利用 CPU 分析调优吞吐量

    楔子 在我们想要新上线一个 Node.js 应用之前,尤其是技术栈切换的第一个 Node.js 应用,由于担心其在线上的吞吐量表现,肯定会想要进行性能压测,以便对其在当前的集群规模下能抗住多少流量有一 ...

  7. 08-09 性能测试--CPU分析

    Linux 监控工具 top:展示所有进程信息 vmstat:展示系统活动,硬件和系统信息 vmstat pid 10 ps: ps aux | sort -k3nr | head -n 10:展示 ...

  8. CPU分析系列--vmstat/pidstat -wt分析进程/线程上下文切换造成的性能瓶颈

    目录 1.从系统层面看:vmstat 1 3 2.从进程层面看:pidstat -w 3.从线程层面看上下文切换:pidstat -wt 4.案例: 1.使用sysbench模拟多线程切换. yum ...

  9. CPU分析系列--sysstat(mpstat+pidstat)分析系统CPU和I/O负载

    目录 mpstat:关于CPU的详细信息,单独输出或者分组输出; pidstat:关于运行中的进程/任务.CPU.内存等的统计信息; 1.模拟cpu密集型负载: 1.stress --cpu 1 -- ...

最新文章

  1. 浅析JQuery中的html(),text(),val()区别
  2. vsftpd匿名用户上传和下载的配置
  3. sql server相关的命令行
  4. Hibernate学习之Hibernate注解总结
  5. python弹出窗口后卡死_python的tkinter模块GUI编程为啥用了while循环之后就会使得程序出现卡死未响应崩溃?...
  6. 阿里云容器服务DaemonSet实践
  7. 什么叫AI优先?不如你看谷歌CEO的办公位在哪儿
  8. android版usb转网线驱动,usb网线转换器驱动下载
  9. c语言99乘法表流程图表,C语言做99乘法表.doc
  10. 深度学习之美(张玉宏)——第四章 人生苦短我用python
  11. networkx 画图布局
  12. ZYNQ之高速AD/DA验证实验
  13. java util包排序_实现java.util.Comparator接口,对对象集合进行多属性组合排序
  14. linux 转换viso为pdf,foxpdf Visio转PDF转换器
  15. for循环--下标越界导致死循环原因
  16. window时间同步
  17. 小福利,用excel制作旋风图,小狗图和漏斗图
  18. CABAC整体讲解1
  19. 阿里巴巴菜鸟网络二面
  20. k8s之搭建单机集群

热门文章

  1. 完全平方数的判定及整数平方根的快速求解
  2. 一个QQ多用户登陆的实例代码
  3. RxJava2.x 萌新之路 操作符篇
  4. Maven项目部署方案
  5. Scut游戏服务器引擎6.1.5.6发布,直接可运行,支持热更新
  6. ExtJs4–表格--Grid
  7. L2.五.input语句
  8. 写一个关于github简历远程仓库的总结
  9. LeSS is More - 大规模敏捷开发框架LeSS实践(一)
  10. 部署 kubernetes 集群(CentOS7.3,K8S1.8.3)