1.1。Numba的约5分钟指南 Numba是Python的即时编译器,它最适用于使用NumPy数组和函数以及循环的代码。使用Numba的最常用方法是通过其装饰器集合,可以应用于您的函数来指示Numba编译它们。当调用Numba修饰函数时,它被编译为机器代码“及时”执行,并且您的全部或部分代码随后可以以本机机器代码速度运行!

开箱即用的Numba使用以下方法:

操作系统:Windows(32位和64位),OSX和Linux(32位和64位) 架构:x86,x86_64,ppc64le。在armv7l,armv8l(aarch64)上进行实验。 GPU:Nvidia CUDA。AMD ROC的实验。 CPython的 NumPy 1.10 - 最新 1.1.1。我怎么得到它? Numba可作为畅达包为 蟒蛇Python发布:

$ conda install numba Numba还有pip可供选择:

$ pip install numba Numba也可以 从源代码编译,虽然我们不建议首次使用Numba用户。

Numba通常用作核心包,因此其依赖性保持在绝对最小值,但是,可以按如下方式安装额外的包以提供其他功能:

scipy- 支持编译numpy.linalg功能。 colorama - 支持回溯/错误消息中的颜色突出显示。 pyyaml - 通过YAML配置文件启用Numba配置。 icc_rt - 允许使用Intel SVML(高性能短矢量数学库,仅限x86_64)。安装说明在 性能提示中。 1.1.2。Numba会为我的代码工作吗? 这取决于你的代码是什么样的,如果你的代码是以数字为导向的(做了很多数学运算),经常使用NumPy和/或有很多循环,那么Numba通常是一个不错的选择。在这些例子中,我们将应用最基本的Numba的JIT装饰器,@jit试图加速一些函数来演示哪些有效,哪些无效。

Numba在代码看起来像这样:

from numba import jit import numpy as np

x = np.arange(100).reshape(10, 10)

@jit(nopython=True) # Set "nopython" mode for best performance def go_fast(a): # Function is compiled to machine code when called the first time trace = 0 for i in range(a.shape[0]): # Numba likes loops trace += np.tanh(a[i, i]) # Numba likes NumPy functions return a + trace # Numba likes NumPy broadcasting

print(go_fast(x)) 对于看起来像这样的代码,如果有的话,它将无法正常工作:

from numba import jit import pandas as pd

x = {'a': [1, 2, 3], 'b': [20, 30, 40]}

@jit def use_pandas(a): # Function will not benefit from Numba jit df = pd.DataFrame.from_dict(a) # Numba doesn't know about pd.DataFrame df += 1 # Numba doesn't understand what this is return df.cov() # or this!

print(use_pandas(x)) 请注意,Numba不理解Pandas,因此Numba只是通过解释器运行此代码,但增加了Numba内部开销的成本!

1.1.3。什么是nopython模式? Numba @jit装饰器从根本上以两种编译模式运行, nopython模式和object模式。在go_fast上面的例子中, nopython=True在@jit装饰器中设置,这是指示Numba在nopython模式下操作。nopython编译模式的行为本质上是编译装饰函数,以便它完全运行而不需要Python解释器的参与。这是使用Numba jit装饰器的推荐和最佳实践方式,因为它可以带来最佳性能。

如果编译nopython模式失败,Numba可以编译使用 ,如果没有设置,这是装饰器的 后退模式(如上例所示)。在这种模式下,Numba将识别它可以编译的循环并将它们编译成在机器代码中运行的函数,并且它将运行解释器中的其余代码。为获得最佳性能,请避免使用此模式objectmode@jitnopython=Trueuse_pandas

1.1.4。如何衡量Numba的表现? 首先,回想一下,Numba必须为执行函数的机器代码版本之前给出的参数类型编译函数,这需要时间。但是,一旦编译完成,Numba会为所呈现的特定类型的参数缓存函数的机器代码版本。如果再次使用相同的类型调用它,它可以重用缓存的版本而不必再次编译。

测量性能时,一个非常常见的错误是不考虑上述行为,并使用一个简单的计时器来计算一次,该计时器包括在执行时编译函数所花费的时间。

例如:

from numba import jit import numpy as np import time

x = np.arange(100).reshape(10, 10)

@jit(nopython=True) def go_fast(a): # Function is compiled and runs in machine code trace = 0 for i in range(a.shape[0]): trace += np.tanh(a[i, i]) return a + trace

DO NOT REPORT THIS... COMPILATION TIME IS INCLUDED IN THE EXECUTION TIME!

start = time.time() go_fast(x) end = time.time() print("Elapsed (with compilation) = %s" % (end - start))

NOW THE FUNCTION IS COMPILED, RE-TIME IT EXECUTING FROM CACHE

start = time.time() go_fast(x) end = time.time() print("Elapsed (after compilation) = %s" % (end - start)) 这,例如打印:

Elapsed (with compilation) = 0.33030009269714355 Elapsed (after compilation) = 6.67572021484375e-06 衡量Numba JIT对您的代码的影响的一个好方法是使用timeit模块函数来执行时间,这些函数测量多次执行迭代,因此可以在第一次执行时适应编译时间。

作为旁注,如果编译时间成为问题,Numba JIT支持 编译函数的磁盘缓存,并且还具有Ahead-Of-Time编译模式。

1.1.5。它有多快? 假设Numba可以在nopython模式下运行,或者至少编译一些循环,它将针对您的特定CPU进行编译。加速因应用而异,但可以是一到两个数量级。Numba有一个 性能指南,涵盖了获得额外性能的常用选项。

1.1.6。Numba如何运作? Numba读取装饰函数的Python字节码,并将其与有关函数输入参数类型的信息相结合。它分析并优化您的代码,最后使用LLVM编译器库生成函数的机器代码版本,根据您的CPU功能量身定制。每次调用函数时都会使用此编译版本。

1.1.7。其他感兴趣的东西: Numba有相当多的装饰,我们看到@jit和@njit,但也有:

@vectorize- 生成NumPy ufunc(ufunc支持所有方法)。文件在这里。 @guvectorize- 产生NumPy广义ufuncs。 文件在这里。 @stencil - 将函数声明为类似模板操作的内核。 文件在这里。 @jitclass - 对于jit感知类。文件在这里。 @cfunc - 声明一个函数用作本机回调(从C / C ++等调用)。文件在这里。 @overload- 注册您自己的函数实现,以便在nopython模式下使用,例如@overload(scipy.special.j0)。 文件在这里。 一些装饰者提供额外选项:

parallel = True- 启用功能的 自动并行化。 fastmath = True- 为该功能启用快速数学行为。 ctypes / cffi / cython互操作性:

cffi- 模式支持调用CFFI函数nopython。 ctypes- 模式支持调用ctypes包装函数nopython。。 Cython导出的函数是可调用的。 1.1.7.1。GPU目标: Numba可以针对Nvidia CUDA和(实验性)AMD ROC GPU。您可以使用纯Python编写内核,让Numba处理计算和数据移动(或明确地执行此操作)。单击关于CUDA或ROC的 Numba文档 。

示例:接下来我们写一段简单的代码,来计算一下执行时间:

示例1:不使用numba的:

import time

def num():

arr = []

for i in range(10000000):

arr.append(i)

stime = time.time() num() etime = time.time() - stime

print(arr)

print('用时:{}秒'.format(etime)) 示例输出时间:

用时:1.4500024318695068秒

示例2:使用numba @jit

import time from numba import jit

@jit def num():

arr = []

for i in range(10000000):

arr.append(i)

stime = time.time() num() etime = time.time() - stime

print(arr)

print('用时:{}秒'.format(etime)) 示例输出:

用时:0.5530002117156982秒

结论:

上述两个示例代码,一个使用了numba,另一个没有使用numba;可以看出使用numba @jit装饰后,时间明显快了很多倍。

这只是一个简单示例;对于复杂计算提高速度更明显。

linux怎么运行conda,linux怎么用conda相关推荐

  1. 内网linux服务器安装运行环境,linux下如何在内网中安装docker_网站服务器运行维护...

    docker的镜像和仓库是什么_网站服务器运行维护 docker镜像就像是一个linux的文件系统,这个文件系统里面包含了可以运行在linux内核的程序以及相应的数据.仓库是集中存储镜像的地方. 一. ...

  2. linux+后台运行+nohup,Linux后台运行命令集(、fg、bg、jobs、nohup、ctrl + z)

    Linux后台运行命令集(&.fg.bg.jobs.nohup.ctrl + z) 1).& 命令或进程最后加上"&",可以把此操作放到后台执行: 2).c ...

  3. linux安装运行jmeter,Linux下安装运行Jmeter程序

    Jmeter在linux系统中运行需要安装jdk和Jmeter两个软件: 1.安装JDK 先检查系统是否有安装jdk,在linux中执行如下命令:java -version  如果返回版本信息,说明系 ...

  4. linux 服务器运行慢,Linux运行慢?找出原因

    对Linux 和Windows 都很熟悉的同学会告诉你:在同一配置上Linux 将会有更加出色的表现.但,事实并不全是这样.有些同学会感觉到与上面的说法正好想法.据Top500统计,约90%的世界一流 ...

  5. linux sh 运行命令,linux shell运行命令详解

    在Linux下,如果你需要运行shell程序,那么应该使用那个命令呢?下面由学习啦小编为大家整理了linux shell运行命令的相关知识,希望对大家有帮助! linux shell运行命令 说明:用 ...

  6. c#在linux上运行,在Linux上运行C#的方法

    本文实例讲述了在Linux上运行C#的方法.分享给大家供大家参考.具体方法如下: 在任何一个平台(操作系统+硬件体系)上,编写和运行程序的三个最根本的需求是库.编译器/解释器.运行环境.库以类和方法( ...

  7. linux终端运行pytorch,Linux虚拟机测试pytorch运行

    1.装虚拟机,下个vmware,按步骤装就好 https://www.cnblogs.com/yxcn/p/10663230.html https://download.csdn.net/downlo ...

  8. linux如何运行用户程序,Linux系统下,如何以其他用户身份运行程序

    #1:runuser命令 runuser命令使用一个替代的用户或者组ID运行一个Shell.这个命令仅在root用户时有用. 仅以会话PAM钩子运行,并且没有密码提示.如果用一个非root用户,并且该 ...

  9. linux怎么运行ing,Linux命令笔记ing

    每个人用Linux的目的都不同,所以他们常用的命令也就差异非常大,而我主要是用Linux完成项目的部署相关.在此总结一下,还有一些是其他博主的总结,放在此处,做为笔记,方便自己查看.详细Linux ...

  10. Linux如何运行pipe1,Linux中的管道

    一.管道是进程间通信的一种重要手段,在linux中没有使用专门的数据结构,而是借助了文件系统的file结构和VFS索引节点inode.通过两个file结构指向同一个临时的VFS索引节点,而这个索引节点 ...

最新文章

  1. 什么是UUID及其实现代码
  2. Feedback about (Blockchain OR ML) AND (logistics)
  3. rs485如何使用_12个经典问答:带你全面了解RS485接口知识
  4. 收藏 | 让你纵横 GitHub 的五大神器
  5. Linux 下的驱动开发最简单例子
  6. L1-004. 计算摄氏温度-PAT团体程序设计天梯赛GPLT
  7. bitlocker正在加密 c盘_如何扩容C盘(扩容卷变灰问题)
  8. 西门子PLC模块大类
  9. 京瓷打印机p5026cdn_京瓷p5026cdn驱动下载-京瓷p5026cdn打印机驱动v2.0.1421 官方版 - 极光下载站...
  10. matConvNet学习-使用GPU
  11. c++ 专题 2 面向对象:常量成员函数
  12. php redis超卖,PHP用redis解决超卖的问题
  13. JUC并发编程基石AQS源码之结构篇-ReentrantLock
  14. android tf卡及u盘_一体化储存芯片(U 盘、SD卡、TF卡) NAND定义开发-U盘篇
  15. CLCL-多重剪切板
  16. PHP 手机短信发送验证码
  17. Java快速入门(17) - Number类及其子类
  18. 倍福PLC和C#通过ADS通信传输bool类型变量
  19. 香港20年十大最具影响力电影
  20. 如何给IBM X3650 M4 安装CentOS8.3.2011

热门文章

  1. 中国高校4篇研究今日同时登上Nature!清华北大上交浙工大等在列
  2. 华为鸿蒙系统2.0发布了!AI人工智能大有可为!
  3. 自监督媲美全监督,港中文、商汤场景去遮挡方法入选 CVPR 2020 Oral
  4. 7000 字读懂互联网公司的架构演变历程
  5. “老赖”罗永浩:就算“卖艺”也会还债!孙宇晨:我买!
  6. 分布式事务篇——第二章:分布式事务解决之2PC剖析
  7. 本地应用 v-for 指令
  8. 基于视觉的数学公式识别算法介绍
  9. 数据维度爆炸怎么办?详解 5 大常用的特征选择方法
  10. ​图像识别算法超低代码开发方案