请注意,这有点夸张。

首先,我要说明我是专业从事python工作的,我做出了许多开源贡献,并且我所有的业余爱好项目都使用python进行。我喜欢python。

但这很慢。

这是Reddit等论坛上的常见主题,人们说您不能使用python,因为它运行缓慢。是的,我们都知道python很慢。但是我们也知道,通常会使事情变慢的不是语言,而是算法。

是的,与C语言相比,python语言的运行速度非常慢,但这并不是python速度慢的99%。 Python之所以缓慢,是因为许多(即使不是大多数)Python程序员不在乎或不了解他们所做工作对性能的总体影响。编写网络应用程序时基本上可以这样做,但是如果编写的库可供成千上万,十万甚至一百万的人使用,则可能会对性能产生重大影响。

让我们看一些Python运行缓慢的实际例子:

此处显示的工具:

pip是用于安装python库的工具

virtualenv是用于创建封闭环境的工具,因此您无需全局安装所有软件包

pytest是使用最广泛的测试库(也许标准库中的unittest使用得更多,但至少非常接近)

我之所以选择这些工具,是因为这是大多数人与python的首次互动,而这是我们专业人士每天与之互动的东西。

>time pip --version

0.34 seconds

>time virtualenv -p (which python3) venv

6.24 seconds

>time pytest  # in an EMPTY directory

0.32 seconds

>time pip install pytest  # already installed!!!

0.85 seconds

这些测量是普遍的,因为它们是在新环境中且具有热缓存(我对具有冷磁盘缓存的virtualenv进行了15秒钟的测量)。 如果您的虚拟环境具有很多依赖性,那么pip安装(同样不做任何事情)的时间会增加。 很多。 我在另一个项目中测量了2.1秒。

在这里算法才是问题,不是python。 我的意思是,当我们解决算法问题时,语言将成为问题,而且它永远不可能比更快的语言快,但是我们几乎与任何地方都差不多。

我对此不够强调:python的基本工具链比它所需的要慢一个数量级。 有时更多。

Imports(导入)

在python中导入的惯用方式是个大问题。 在python中使用说说请求,您确实会在文件顶部导入请求,大多数人会认为这是免费的或接近免费的。 在python中,它并不是完全免费的,实际上,它要求导入urllib2,这是很慢的部分。 因此,人们认为请求的导入是免费的,而请求的作者则认为urllib2的导入是免费的。 到处都是这样:成千上万的人都认为进口是免费的。 他们不是。

我最常看到的一种模式是:

try:

import numpy

NUMPY_AVAILABLE=True

except ImportError:

NUMPY_AVAILABLE=False

并且在导入时运行。我们什么时候在库中使用该标志?通常从不,并且numpy导入非常昂贵。我的机器上200ms。因此,对于您的应用程序而言,它的启动性能非常出色,因为它的功能在启动路径中没有使用,在许多情况下根本没有使用。

开发时,这非常令人沮丧,因为您平均可以在整个工作日平均每分钟重新启动一次该过程。

我很高兴看到一年以前,因此pytz停止在导入时解析其整个时区数据库。从Django(可以说是最流行的Web框架)的启动开始,这节省了约100毫秒的时间。现在考虑一下,这种微小的变化将在10年内节省多少千瓦时。每次运行测试时,每次启动Web Worker时,都会在每个使用Django的站点上进行。这仅适用于Django!许多其他库和程序都使用pytz。

千纸之死

另一个问题是,人们认为“哦,启动时只有10毫秒,这没什么大不了的”,但是如果该启动每天进行数百万次,那将是真实数字。对于进口来说,这是正确的,但在更多事情上也是如此。后续问题是,人们已经引入了100种此类减速后,就会认为“仅再增加10毫秒”。因此,现在您只需要在1秒的基础上再加上10毫秒,即1%。没什么大不了的!因此,现在可以再增加10毫秒,这略低于1%。每次您使其变慢时,它就会变得更便宜(以百分比为单位),以使其变得更慢。

请不要使用这种逻辑!

上面的pip安装示例是一个很好的案例研究。从磁盘加载字典并检查其是否包含字符串“ pytest”将比python的启动时间(约30毫秒)少。但这不是pip在做什么,它正在文件系统中运行,甚至正在加载python文件以获取其版本号(为什么?我没有询问它们!为什么它们仍然没有以有效的格式存储?)。

在pytest中,我们有一个类似的问题,性能回归已被引入了上千次,但是现在一切都很缓慢,并且没有明显的方法来摆脱这种情况。我已经提供了一些补丁,但是由于我在进行优化时进行了其他更改,因此我获得的大部分收益都被抹去了!

最后,我放弃了提交补丁程序,并构建了一个名为hammett的新测试运行程序,该测试运行程序与pytest兼容,但速度更快。我的意思是走得更快。我希望,如果有替代方案,人们可​以看到存在另一个可能运行缓慢的世界。

我们如何使python更快?

我们需要关心这一问题。

我们需要了解进口不是免费的。

我们需要研究整个生态系统的基本构建模块,或者解决基本程序和库中的性能问题,或者替换它们。

我们需要衡量。

一些开始的地方:

pytest:代替我使用hammett,或敦促pytest的向后兼容性大幅度中断,以提​​高性能

pip:至少缓存一些结果!我应该能够在执行每个命令之前运行“ pip install -r requirements.txt”,而不会注意到它

virtualenv:我还没有研究过,但是似乎可以写1218个文件,总计11.6MB,可以加快速度,或者避免做一些工作

编写基准:这可能是最简单的。例如,您可以将工具与其他语言的同类工具进行基准测试。我们至少应该知道我们是否比例如java慢一百倍。

更新:

事实证明,virtualenv家伙已经在此之上了!现在,版本20需要0.8秒才能完成与之前花费6.4相同的任务。为此,virtualenv团队值得高度赞扬!

原文网址:https://kodare.net/2020/05/19/python-is-slow-does-not-have-to-be.html

【责任编辑:赵宁宁 TEL:(010)68476606】

点赞 0

python 特别慢_Python很慢?不一定哦相关推荐

  1. python的设计具有很强的可读性、相比其他语言_python简介

    python 简介 Python 是一个高层次的结合了解释性.编译性.互动性和面向对象的脚本语言.Python 的设计具有很强的可读性,相比其他语言经常使用英文关键字,其他语言的一些标点符号,它具有比 ...

  2. python大一知识点_python知识点复习

    放假归来,这几天复习了一下好久不用的python,总结了一下知识点. 语法基础tuple与list的异同都由多个元素组成 tuple由()组成,list由[]组成 tuple不可变,list可变 tu ...

  3. python没有库_Python开发者必备6个基本库,这个都没有怎么做开发呢

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理 以下文章来源于腾讯云 作者:py3study ( 想要学习Python?Pytho ...

  4. python精通难_Python 为什么入门容易 精通难

    Python都说是最容易学习的编程语言,但是为什么还是有很多的小白在学习的过程中学的云里雾里,一天到晚都是报错,异常,这也怪不得会有那么多人说,学Python是从入门到入土! 其实一门编程语言不像语文 ...

  5. python元编程_python元编程详解(3)

    今天转载一片非常精彩的文章供大家欣赏:参考文章链接. python开发者门户一个很好的学习python的网站,大家有时间可以多看看. 下面正式开始今天的内容: 在理解元类之前,你需要先掌握Python ...

  6. python自动化上传图片_Python(二)借助七牛云通过脚本自动获取上传图片外链

    概述 之前自己写博客的时候,每次的都需要通过将本地图片上传到七牛云,然后获取图片外链,再粘贴到MarkDown编辑器里面,如果一篇博客里面图片比较少的时候,还可以忍受,图片多了就感觉特别烦了,所以就上 ...

  7. python语法学习_python语法学习笔记

    定义函数的时候,我们把参数的名字和位置确定下来,函数的接口定义就完成了.对于函数的调用者来说,只需要知道如何传递正确的参数,以及函数将返回什么样的值就够了,函数内部的复杂逻辑被封装起来,调用者无需了解 ...

  8. python 线程池_python线程池

    线程池概念 什么是线程池? 诸如web服务器.数据库服务器.文件服务器和邮件服务器等许多服务器应用都面向处理来自某些远程来源的大量短小的任务. 构建服务器应用程序的一个过于简单的模型是:每当一个请求到 ...

  9. python 两点曲线_Python自学教程| 3万字详解每个重要知识点(内附视频)

    本文目录: 什么是Python? Python的用途是什么? 如何安装Python? 为什么选择Python? R与Python 学习Python的最佳方法 什么是顶级Python IDE 哪个是最适 ...

  10. python古诗默写_Python网络爬虫:爬取古诗文中的某个制定诗句来实现搜索

    Python网络爬虫:爬取古诗文中的某个制定诗句来实现搜索 发布时间:2020-07-20 23:48:19 来源:51CTO 阅读:883 python编译练习,为了将自己学习过的知识用上,自己找了 ...

最新文章

  1. 在 Virt-manager 图形界面中使用桥接网络
  2. First Missing Positive
  3. Redis 缓存数据库
  4. [BZOJ1177][Apio2009]Oil
  5. 【大会】海量高清视频服务端架构设计的变与不变
  6. 【SpringMVC】登录状态验证
  7. c语言运行k值不变,C语言期末复习(改完).doc
  8. iBATIS框架源码剖析
  9. 24.root, alias
  10. Unity移动的三种方式
  11. 嵌入式开发是什么,与纯软件什么区别?
  12. html中form异步验证,form表单验证
  13. 安装华为运动健康beta版本安装失败
  14. Google Chrome开发者工具-移动仿真:网络带宽控制
  15. 大型桥梁结构健康监测系统之GNSS位移监测系统
  16. spring中自定义注解(annotation)与AOP中获取注解___使用aspectj的@Around注解实现用户操作和操作结果日志
  17. 关于读书的一些方法--摘自李笑来《人人都能用英语》
  18. Bluetooth SIG定义的标准Characteristics UUID
  19. 15、PIC32系列-输入捕捉ICAP
  20. Material Theme on sublime text 3 一个用起来很好的Sublime主题

热门文章

  1. php输出单行,file - php如何随机输出文件内一行?
  2. 【优化算法】非支配排序遗传算法(NSGA)【含Matlab源码 176期】
  3. 【路径规划】基于matlab无线充电车辆路径和速度预测【含Matlab源码 1473期】
  4. 【旗帜识别】基于matlab GUI旗帜识别【含Matlab源码 157期】
  5. 【数字信号】基于matlab GUI可编程电音合成器【含Matlab源码 872期】
  6. 【图像隐写】基于matlab DCT数字水印添加+提取+干扰【含Matlab源码 803期】
  7. AMOS结构方程模型(SEM)简介【SPSS 049期】
  8. mysql lvs+keepalived+mha_MHA+Lvs+Keepalived实现MySQL的高可用及读负载均衡_2(MySQL)
  9. 第二十三章:触发器和行为(九)
  10. 优秀的产品管理促进了IBM的成功转型--和谐生产方式百题03