点击上方“机器学习与生成对抗网络”,关注"星标"

获取有趣、好玩的前沿干货!

选自towardsdatascience,作者:Martin Heinz

本文转自机器之心(nearhuman2014

本文将介绍如何提升 Python 程序的效率,让它们运行飞快!

计时与性能分析

在开始优化之前,我们首先需要找到代码的哪一部分真正拖慢了整个程序。有时程序性能的瓶颈显而易见,但当你不知道瓶颈在何处时,这里有一些帮助找到性能瓶颈的办法:

注:下列程序用作演示目的,该程序计算 e 的 X 次方(摘自 Python 文档):

# slow_program.py
from decimal import *def exp(x):getcontext().prec += 2i, lasts, s, fact, num = 0, 0, 1, 1, 1while s != lasts:lasts = si += 1fact *= inum *= xs += num / factgetcontext().prec -= 2return +sexp(Decimal(150))
exp(Decimal(400))
exp(Decimal(3000))

最懒惰的「性能分析」

首先,最简单但说实话也很懒的方法——使用 Unix 的 time 命令:

~ $ time python3.8 slow_program.pyreal    0m11,058s
user    0m11,050s
sys     0m0,008s

如果你只想给整个程序计时,这个命令即可完成目的,但通常是不够的……

最细致的性能分析

另一个极端是 cProfile,它提供了「太多」的信息:

~ $ python3.8 -m cProfile -s time slow_program.py1297 function calls (1272 primitive calls) in 11.081 secondsOrdered by: internal timencalls  tottime  percall  cumtime  percall filename:lineno(function)3   11.079    3.693   11.079    3.693 slow_program.py:4(exp)1    0.000    0.000    0.002    0.002 {built-in method _imp.create_dynamic}4/1    0.000    0.000   11.081   11.081 {built-in method builtins.exec}6    0.000    0.000    0.000    0.000 {built-in method __new__ of type object at 0x9d12c0}6    0.000    0.000    0.000    0.000 abc.py:132(__new__)23    0.000    0.000    0.000    0.000 _weakrefset.py:36(__init__)245    0.000    0.000    0.000    0.000 {built-in method builtins.getattr}2    0.000    0.000    0.000    0.000 {built-in method marshal.loads}10    0.000    0.000    0.000    0.000 <frozen importlib._bootstrap_external>:1233(find_spec)8/4    0.000    0.000    0.000    0.000 abc.py:196(__subclasscheck__)15    0.000    0.000    0.000    0.000 {built-in method posix.stat}6    0.000    0.000    0.000    0.000 {built-in method builtins.__build_class__}1    0.000    0.000    0.000    0.000 __init__.py:357(namedtuple)48    0.000    0.000    0.000    0.000 <frozen importlib._bootstrap_external>:57(_path_join)48    0.000    0.000    0.000    0.000 <frozen importlib._bootstrap_external>:59(<listcomp>)1    0.000    0.000   11.081   11.081 slow_program.py:1(<module>)
...

这里,我们结合 cProfile 模块和 time 参数运行测试脚本,使输出行按照内部时间(cumtime)排序。这给我们提供了大量信息,上面你看到的行只是实际输出的 10%。从输出结果我们可以看到 exp 函数是罪魁祸首(惊不惊喜,意不意外),现在我们可以更加专注于计时和性能分析了……

计时专用函数

现在我们知道了需要关注哪里,那么我们可能只想要给运行缓慢的函数计时而不去管代码的其他部分。我们可以使用一个简单的装饰器来做到这点:

def timeit_wrapper(func):@wraps(func)def wrapper(*args, **kwargs):start = time.perf_counter()  # Alternatively, you can use time.process_time()func_return_val = func(*args, **kwargs)end = time.perf_counter()print('{0:<10}.{1:<8} : {2:<8}'.format(func.__module__, func.__name__, end - start))return func_return_valreturn wrapper

接着,将该装饰器按如下方式应用在待测函数上:

@timeit_wrapper
def exp(x):...print('{0:<10} {1:<8} {2:^8}'.format('module', 'function', 'time'))
exp(Decimal(150))
exp(Decimal(400))
exp(Decimal(3000))

得到如下输出:

~ $ python3.8 slow_program.py
module     function   time
__main__  .exp      : 0.003267502994276583
__main__  .exp      : 0.038535295985639095
__main__  .exp      : 11.728486061969306

此时我们需要考虑想要测量哪一类时间。time 库提供了 time.perf_counter 和 time.process_time 两种时间。其区别在于,perf_counter 返回绝对值,其中包括了 Python 程序并不在运行的时间,因此它可能受到机器负载的影响。而 process_time 只返回用户时间(除去了系统时间),也就是只有进程运行时间。

让程序更快

现在到了真正有趣的部分了,让 Python 程序跑得更快!我不会告诉你一些奇技淫巧或代码段来神奇地解决程序的性能问题,而更多是关于通用的想法和策略。使用这些策略,可以对程序性能产生巨大的影响,有时甚至可以带来高达 30% 的提速。

使用内置的数据类型

这一点非常明显。内置的数据类型非常快,尤其相比于树或链表等自定义类型而言。这主要是因为内置数据类型使用 C 语言实现,使用 Python 实现的代码在运行速度上和它们没法比。

使用 lru_cache 实现缓存/记忆

我在之前的博客中介绍过这一技巧,但我认为它值得用一个简单例子再次进行说明:

import functools
import time# caching up to 12 different results
@functools.lru_cache(maxsize=12)
def slow_func(x):time.sleep(2)  # Simulate long computationreturn xslow_func(1)  # ... waiting for 2 sec before getting result
slow_func(1)  # already cached - result returned instantaneously!slow_func(3)  # ... waiting for 2 sec before getting result

上面的函数使用 time.sleep 模拟了繁重的计算过程。当我们第一次使用参数 1 调用函数时,它等待了 2 秒钟后返回了结果。当再次调用时,结果已经被缓存起来,所以它跳过了函数体,直接返回结果。

使用局部变量

这和每个作用域中变量的查找速度有关。我之所以说「每个作用域」,是因为这不仅仅关乎局部变量或全局变量。事实上,就连函数中的局部变量、类级别的属性和全局导入函数这三者的查找速度都会有区别。函数中的局部变量最快,类级别属性(如 self.name)慢一些,全局导入函数(如 time.time)最慢。

你可以通过这种看似没有必要的代码组织方式来提高效率:

#  Example #1
class FastClass:def do_stuff(self):temp = self.value  # this speeds up lookup in loopfor i in range(10000):...  # Do something with `temp` here#  Example #2
import randomdef fast_function():r = random.randomfor i in range(10000):print(r())  # calling `r()` here, is faster than global random.random()

使用函数

这也许有些反直觉,因为调用函数会让更多的东西入栈,进而在函数返回时为程序带来负担,但这其实和之前的策略相关。如果你只是把所有代码扔进一个文件而没有把它们放进函数,那么它会因为众多的全局变量而变慢。因此,你可以通过将所有代码封装在 main 函数中并调用它来实现加速,如下所示:

def main():...  # All your previously global codemain()

不要访问属性

另一个可能让程序变慢的东西是用来访问对象属性的点运算符(.)。这个运算符会引起程序使用__getattribute__进行字典查找,进而为程序带来不必要的开销。那么,我们怎么避免(或者限制)使用它呢?

#  Slow:
import redef slow_func():for i in range(10000):re.findall(regex, line)  # Slow!#  Fast:
from re import findalldef fast_func():for i in range(10000):findall(regex, line)  # Faster!

当心字符串

当在循环中使用取模运算符(%s)或 .format() 时,字符串操作会变得很慢。有没有更好的选择呢?根据 Raymond Hettinger 近期发布的推文,我们只需要使用 f-string 即可,它可读性更强,代码更加紧凑,并且速度更快!基于这一观点,如下从快到慢列出了你可以使用的一系列方法:

f'{s} {t}'  # Fast!
s + '  ' + t
' '.join((s, t))
'%s %s' % (s, t)
'{} {}'.format(s, t)
Template('$s $t').substitute(s=s, t=t)  # Slow!

生成器本质上并不会更快,因为它们的目的是惰性计算,以节省内存而非节省时间。然而,节省的内存会让程序运行更快。为什么呢?如果你有一个大型数据集,并且你没有使用生成器(迭代器),那么数据可能造成 CPU 的 L1 缓存溢出,进而导致访存速度显著变慢。

当涉及到效率时,非常重要的一点是 CPU 会将它正在处理的数据保存得离自己越近越好,也就是保存在缓存中。读者可以看一看 Raymond Hettingers 的演讲(https://www.youtube.com/watch?v=OSGv2VnC0go&t=8m17s),其中提到了这些问题。

总结

优化的第一要义就是「不要去做」。但如果你必须要做,我希望这些小技巧可以帮助到你。然而,优化代码时一定要谨慎,因为该操作可能最终造成代码可读性变差、可维护性变差,这些弊端可能超过代码优化所带来的好处。

参考链接:https://towardsdatascience.com/making-python-programs-blazingly-fast-c1cd79bd1b32

本文为机器之心编译,转载请联系本公众号获得授权。

猜您喜欢:
附下载 | 《Python进阶》中文版
附下载 | 经典《Think Python》中文版
附下载 | 《Pytorch模型训练实用教程》
附下载 | 最新2020李沐《动手学深度学习》附下载 | 《可解释的机器学习》中文版附下载 |《TensorFlow 2.0 深度学习算法实战》附下载 | 超100篇!CVPR 2020最全GAN论文梳理汇总!
附下载 |《计算机视觉中的数学方法》分享

【进阶】嫌弃Python慢,试试这几个方法?相关推荐

  1. python程序设计与应用教程鄂大伟_鄂大伟-从零进阶的Python教学与开发之路.pdf

    从零进阶的 Python教学 与应用开发之路 厦门理工学院 集美大学 鄂大伟 目 录 CONTENTS PART1 福建省高校Python教学 情况简介 福建高校开展Python教学情况 • 集美大学 ...

  2. 【Python进阶】Python进阶专栏栏主自述:不忘初心,砥砺前行

    转眼间加入有三AI快半年了,今天给大家来个自我介绍,分享下这一路来的历程与未来的规划. 作者 | 汤兴旺 编辑 | 汤兴旺 不忘初心 不知道为啥,从小自己对IT有着莫名的兴趣,但由于自己的近视度数太高 ...

  3. python绘制饼图双层_Python入门进阶:Python绘制饼图到Microsoft Excel

    原标题:Python入门进阶:Python绘制饼图到Microsoft Excel 来自:Linux迷https://www.linuxmi.com/python-pie-chart-microsof ...

  4. 怎么用python画饼状图_Python入门进阶:Python绘制饼图到Microsoft Excel

    原标题:Python入门进阶:Python绘制饼图到Microsoft Excel 来自:Linux迷https://www.linuxmi.com/python-pie-chart-microsof ...

  5. python读取excel画出饼状图_Python入门进阶:Python绘制饼图到Microsoft Excel

    原标题:Python入门进阶:Python绘制饼图到Microsoft Excel 来自:Linux迷https://www.linuxmi.com/python-pie-chart-microsof ...

  6. Python进阶-----面向对象2.0(特有属性和方法与私有属性和方法)

    目录 前言: 1.添加特有属性/方法 示例1:添加特有属性 示例2:添加特有方法 2.私有属性/方法 (1)私有化示例 (2) 私有化属性/方法可以在类的内部使用 (3)强制访问私有化属性/方法 (4 ...

  7. python绘制饼图的子图_Python入门进阶:Python绘制饼图到Microsoft Excel

    原标题:Python入门进阶:Python绘制饼图到Microsoft Excel 来自:Linux迷https://www.linuxmi.com/python-pie-chart-microsof ...

  8. 【阿尼亚喜欢BigData】“红亚杯”数据分析进阶—使用Python操作Hive专题赛——满分解析③

    大家好,喜欢Bigdata的阿尼亚来了!希望大家会喜欢阿尼亚的文章!!哇酷哇酷!!! 本次为师傅们带来的是"红亚杯"数据分析进阶-使用Python操作Hive专题赛--满分解析系列 ...

  9. 【阿尼亚喜欢BigData】“红亚杯”数据分析进阶—使用Python操作Hive专题赛——满分解析②

    大家好,喜欢Bigdata的阿尼亚来了!希望大家会喜欢阿尼亚的文章!!哇酷哇酷!!! 本次为师傅们带来的是"红亚杯"数据分析进阶-使用Python操作Hive专题赛--满分解析系列 ...

  10. 视频教程-快速入门Python基础教程_Python基础进阶视频-Python

    快速入门Python基础教程_Python基础进阶视频 十余年计算机技术领域从业经验,在中国电信.盛大游戏等多家五百强企业任职技术开发指导顾问,国内IT技术发展奠基人之一. 杨千锋 ¥199.00 立 ...

最新文章

  1. hibernate 延迟加载的错误 failed to lazily initialize a collection of role
  2. Slave is not configured or failed to initialize properly. You must at least set --server-id
  3. 《Oracle RAC 高并发系统的故障诊断》直播资料大放送
  4. IOS工作笔记003---windows给VmWare虚拟机OS系统安装xcode
  5. 计算机本科学报,计算机学报论文
  6. identifier is too long 异常处理
  7. Hadoop中各组件的作用
  8. 如何优雅地记录操作日志
  9. 正弦波叠加成及波的分解
  10. 关于C语言中有符号的整数值范围为什么是从-32768~32767以及有符号和无符号区别
  11. 在SWD模式下用SEGGER J-Flash 下载STM32.hex文件
  12. Java Excel 复制单元格 poi Excel 复制单元格 Java Excel 复制行 Java Excel 复制 sheet 页 poi excel copy
  13. OSChina 周四乱弹 ——老司机的幼年日常
  14. Handler: Activity 之间通过 Handler 通信
  15. 容器集合——Collection(单列)、Map(双列)
  16. 实现BPS组织机构数据权限分离解决方案
  17. 十多天的鸭子得了心包积液是什么原因鸭摇头晃脑不吃食怎么治疗
  18. pycharm出现low memory警告,卡顿
  19. nCode:GlyphWorks案例教程一
  20. OpenJudge NOI题库1.1答案

热门文章

  1. 2.玩客云armbian5.9安装docker
  2. 当项目经理让我负责数据展示功能开发,我的内心为什么是拒绝的?
  3. 在执行批处理时将执行错误的语句记录下来并写到日志文件中去
  4. div盒子边框圆角_div+css用边框实现圆角矩形(多样式)
  5. ipset+iptables封禁以及自动解封IP
  6. 更精确SSR的交点检测
  7. 【原创】禁止快播自动升级到最新版本,自己发现的方法
  8. 快速明白前加加与后加加
  9. var声明与变量提升
  10. Python-list排序方法