原创2016-08-07Jamal Moir编程派

编程派微信号:codingpy

本文由 Python 翻译组 最新翻译出品,原作者为 Jamal Moir,译者为 cystone,并由编程派作者 EarlGrey 校对。这是使用 Python 进行科学计算的系列文章,上一篇可点此查看:Matplotlib 快速入门。

译者简介:cystone, 成都信息工程大学,计算机学院学生。擅长领域:图像处理,机器学习。

你可以用 NumPy 做很多有趣的事情。

NumPy 是一个运行速度非常快的数学库,主要用于数组计算。它可以让你在 Python 中使用向量和数学矩阵,以及许多用 C 语言实现的底层函数,你还可以体验到从未在原生 Python 上体验过的运行速度。

NumPy 是 Python 在科学计算领域取得成功的关键之一,如果你想通过 Python 学习数据科学或者机器学习,就必须学习 NumPy。我认为 NumPy 的功能很强大,而且入门也不难。

数组基础

创建数组

NumPy 的核心是数组(arrays)。具体来说是多维数组(ndarrays),但是我们不用管这些。通过这些数组,我们能以闪电般的速度使用像向量和数学矩阵之类的功能。赶紧捡起你的线性代数吧!(只是开玩笑,其实并不需要很多复杂的数学知识)

# 1D Array

a = np.array([0, 1, 2, 3, 4])
b = np.array((0, 1, 2, 3, 4))
c = np.arange(5)
d = np.linspace(0, 2*np.pi, 5)print(a) # >>>[0 1 2 3 4]

print(b) # >>>[0 1 2 3 4]

print(c) # >>>[0 1 2 3 4]

print(d) # >>>[ 0.          1.57079633  3.14159265  4.71238898  6.28318531]

print(a[3]) # >>>3

上边的代码展示了创建数组的四种不同方式。最基本的方式是传递一个序列给 NumPy 的 array() 函数;你可以传给它任意的序列,不仅仅是我们常见的列表之类的。

注意,当输出的数组中的数值长度不一样的时候,它会自动对齐。这在查看矩阵的时候很有用。数组的索引和 Python 中的列表或其他序列很像。你也可以对它们使用切片,这里我不再演示一维数组的切片,如果你想知道更多关于切片的信息,查看这篇文章。

上边数组的例子给你展示了如何在 NumPy 中表示向量,接下来我将带你们领略一下怎么表示矩阵和多维数组。

# MD Array,

a = np.array([[11, 12, 13, 14, 15],[16, 17, 18, 19, 20],[21, 22, 23, 24, 25],[26, 27, 28 ,29, 30],[31, 32, 33, 34, 35]])print(a[2,4]) # >>>25

通过给 array() 函数传递一个列表的列表(或者是一个序列的序列),可以创建二维数组。如果我们想要一个三维数组,那我们就传递一个列表的列表的列表,四维数组就是列表的列表的列表的列表,以此类推。

注意二维数组是如何成行成列排布的(在我们的朋友—空格的帮助下)。如果要索引一个二维数组,只需要引用相应的行数和列数即可。

背后的数学知识

为了更好的理解这些,我们需要来看一下什么是向量和矩阵。

向量是一个有方向和大小的量,通常用来表示速度、加速度和动量等。向量能以多种方式书写,但是我们最有用的方式是把它们写在有 n 个元素的元组里边,比如(1, 4, 6, 9)。这就是它们在 NumPy 中的表示方式。

矩阵和向量很像,除了它是由行和列组成的;更像一个网格(grid)。矩阵中的数值可以用它们所在的行和列来表示。在 NumPy 中,可以像我们前面所做的那样,通过传递序列的序列来创建数组。

多维数组切片

多维数组切片比一维数组要复杂一点,同时它也是你在用 NumPy 的时候经常会用到的。

# MD slicing

print(a[0, 1:4]) # >>>[12 13 14]

print(a[1:4, 0]) # >>>[16 21 26]

print(a[::2,::2]) # >>>[[11 13 15]#     [21 23 25]#     [31 33 35]]

print(a[:, 1]) # >>>[12 17 22 27 32]

就像你看到的一样,多维数组切片就是要分别在每个维度上切片,并用逗号隔开。在二维数组中,第一个切片的含义是对行切片,第二个切片的含义是对列切片。

值得注意的是,你通过输入数字来指定行和列。上边第一个例子是从数组中选择第 0 行。(注:原文为第 0 列,应该是作者笔误)

下边的这幅图阐明了上边切片的例子的含义。

数组属性

在使用 NumPy 时,你会想知道数组的某些信息。很幸运,在这个包里边包含了很多便捷的方法,可以给你想要的信息。

# Array properties

a = np.array([[11, 12, 13, 14, 15],[16, 17, 18, 19, 20],[21, 22, 23, 24, 25],[26, 27, 28 ,29, 30],[31, 32, 33, 34, 35]])print(type(a)) # >>><class 'numpy.ndarray'>

print(a.dtype) # >>>int64

print(a.size) # >>>25

print(a.shape) # >>>(5, 5)

print(a.itemsize) # >>>8

print(a.ndim) # >>>2

print(a.nbytes) # >>>200

如你所看,在上边的代码中 NumPy 的数组其实被称为 ndarray。我不知道为什么它被称为 ndarray,如果有人知道请在下边留言!我猜测它是表示 n 维数组(n dimensional array)。

数组的形状(shape)是指它有多少行和列,上边的数组有五行五列,所以他的形状是(5,5)。

‘itemsize’ 属性是每一个条目所占的字节。这个数组的数据类型是 int64,一个 int64 的大小是 64 比特,8 比特为 1 字节,64 除以 8 就得到了它的字节数,8 字节。

‘ndim’ 属性是指数组有多少维。这个数组有二维。但是,比如说向量,只有一维。

‘nbytes’ 属性表示这个数组中所有元素占用的字节数。你应该注意,这个数值并没有把额外的空间计算进去,因此实际上这个数组占用的空间会比这个值大点。

使用数组

基本操作符

仅仅会赋值、取值和得到一些属性是不能满足你的需求的,有时候你还需要做一些数学运算。你可以利用基本的操作符实现这些,比如 +, -, /,等等。

# Basic Operators

a = np.arange(25)
a = a.reshape((5, 5))b = np.array([10, 62, 1, 14, 2, 56, 79, 2, 1, 45,                      4, 92, 5, 55, 63, 43, 35, 6, 53, 24,                       56, 3, 56, 44, 78])
b = b.reshape((5,5))print(a + b)
print(a - b)
print(a * b)
print(a / b)
print(a ** 2)
print(a < b)print(a > b)print(a.dot(b))

除了 dot() 之外,这些操作符都是对数组进行逐元素运算。比如 (a, b, c) + (d, e,  f) 的结果就是 (a+d, b+e, c+f)。它将分别对每一个元素进行配对,然后对它们进行运算。它返回的结果是一个数组。注意,当使用逻辑运算符比如 “<” 和 “>” 的时候,返回的将是一个布尔型数组,这点有一个很好的用处,后边我们会提到。

dot() 函数计算两个数组的点积。它返回的是一个标量(只有大小没有方向的一个值)而不是数组。

背后的数学知识

dot() 函数有时候也称为点积。理解这个函数的最好方法就是看下边它的计算过程。

数组的特定操作符

NumPy 还提供了一些其他很有用的操作符,用于处理数组。

# dot, sum, min, max, cumsum

a = np.arange(10)print(a.sum()) # >>>45

print(a.min()) # >>>0

print(a.max()) # >>>9

print(a.cumsum()) # >>>[ 0  1  3  6 10 15 21 28 36 45]

很明显就能看出 sum()、min() 和 max() 函数的功能:将所有元素加起来,找到最小值和最大值。

cumsum() 函数就不是那么明显了。它像 sum() 那样把所有元素加起来,但是它的实现方式是,第一个元素加到第二个元素上,把结果保存到一个列表里,然后把结果加到第三个元素上,再保存到列表里,依次累加。当遍历完数组中所有元素则结束,返回值为运行数组的总和的列表。

cystone: 这里作者说的比较拗口,其实 cumsum() 就是一个累加计算并且保存每次累加的结果,返回值就是包含所有累加结果的一个列表。比如 np.array([1, 2, 3, 4, 5]).cumsum() = [1, 3, 6, 10, 15]

高级索引

花俏的索引

“花俏的索引”是获取数组中我们想要的特定元素的有效方法。

# Fancy indexing

a = np.arange(0, 100, 10)
indices = [1, 5, -1]
b = a[indices]
print(a) # >>>[ 0 10 20 30 40 50 60 70 80 90]

print(b) # >>>[10 50 90]

如你所见,上边的例子中,我们用想获取的索引的序列作为索引。它返回了我们索引的元素。

布尔过滤(boolean masking)

布尔过滤是一个奇妙的特性,它允许我们根据指定条件获取数组中的元素。

# Boolean masking

import matplotlib.pyplot as plta = np.linspace(0, 2 * np.pi, 50)
b = np.sin(a)
plt.plot(a,b)
mask = b >= 0

plt.plot(a[mask], b[mask], 'bo')
mask = (b >= 0) & (a <= np.pi / 2)
plt.plot(a[mask], b[mask], 'go')
plt.show()

上边的代码展示了实现布尔屏蔽。你需要做的就是传递给数组一个与它有关的条件式,然后它就会返回给定条件下为真的值。

上边的例子将会生成下边这幅图:

我们用条件式选择了图中不同的点。蓝色的点(也包含图中的绿点,只是绿点覆盖了蓝点),显示的是值大于零的点。绿点显示的是值大于 0 小于 Pi / 2 的点。

缺省索引

缺省索引是从多维数组的第一维获取索引和切片便捷方法。例如,你有一个数组 a = [[1, 2, 3, 4, 5], [6, 7, 8, 9, 10]],那么 a[3] 将会返回数组第一维中索引值为 3 的元素,这里的结果是 4。

# Incomplete Indexing

a = np.arange(0, 100, 10)
b = a[:5]
c = a[a >= 50]
print(b) # >>>[ 0 10 20 30 40]

print(c) # >>>[50 60 70 80 90]

Where 函数

where() 函数是另外一个根据条件返回数组中的值的有效方法。只需要把条件传递给它,它就会返回一个使得条件为真的元素的列表。

# Where

a = np.arange(0, 100, 10)
b = np.where(a < 50)
c = np.where(a >= 50)[0]
print(b) # >>>(array([0, 1, 2, 3, 4]),)

print(c) # >>>[5 6 7 8 9]

这就是 NumPy,不算太难,对吧?当然,这些只是一些基础,NumPy 还有很多其他的功能,如果你已经熟悉了这些基础内容,你可以去探索一下。

使用Python进行科学计算:NumPy入门相关推荐

  1. 【转】5.3 Python的科学计算包 - Numpy

    numpy(Numerical Python extensions)是一个第三方的Python包,用于科学计算.这个库的前身是1995年就开始开发的一个用于数组运算的库.经过了长时间的发展,基本上成了 ...

  2. python科学计算模块有什么_Python科学计算—numpy模块总结(1)

    作为一个本科学数学专业,目前研究非线性物理领域的研究僧.用什么软件进行纯科学计算好,Fortran永远是第一位的:matlab虽然很强大,可以很容易的处理大量的大矩阵,但是求解我们的模型(有时可能是几 ...

  3. python科学计算—— numpy

    python科学计算-- numpy 1.模块导入 2. 数组的基本属性和操作 2.1 创建一维和二维数组 2.2 常用属性 2.3 调整数组的形状 2.4 将数组转化为list 2.5 numpy的 ...

  4. python科学计算基础教程pdf下载-用Python做科学计算 高清晰PDF

    用Python做科学计算一书介绍如何用Python开发科学计算的应用程序,除了介绍数值计算之外,我们还将着重介绍如何制作交互式的2D.3D图像:如何设计精巧的程序界面:如何和C语言所编写的高速计算程序 ...

  5. python科学计算基础教程pdf下载-用Python做科学计算 pdf版

    本书将介绍如何用Python开发科学计算的应用程序,除了介绍数值计算之外,我们还将着重介绍如何制作交互式的2D.3D图像:如何设计精巧的程序界面:如何和C语言所编写的高速计算程序结合:如何编写声音.图 ...

  6. python程序设计与科学计算pdf_用Python做科学计算 pdf版

    本书将介绍如何用Python开发科学计算的应用程序,除了介绍数值计算之外,我们还将着重介绍如何制作交互式的2D.3D图像:如何设计精巧的程序界面:如何和C语言所编写的高速计算程序结合:如何编写声音.图 ...

  7. python 科学计算设计_用Python做科学计算 高清晰PDF

    用Python做科学计算一书介绍如何用Python开发科学计算的应用程序,除了介绍数值计算之外,我们还将着重介绍如何制作交互式的2D.3D图像:如何设计精巧的程序界面:如何和C语言所编写的高速计算程序 ...

  8. python 科学计算设计_用Python做科学计算 pdf版

    本书将介绍如何用Python开发科学计算的应用程序,除了介绍数值计算之外,我们还将着重介绍如何制作交互式的2D.3D图像:如何设计精巧的程序界面:如何和C语言所编写的高速计算程序结合:如何编写声音.图 ...

  9. python可以做科学计算吗_用 Python 做科学计算之最小二乘

    前段时间帮@littlemorning做论文,要编程实现经济学的模型,其中主要用最小二乘拟合来估算一些函数的参数.科学计算的活一般来说都会用matlab,不过那样庞大的东西不是我所喜欢的.于是乎转向P ...

最新文章

  1. python 查找文件内容字符串位置_python 查找目录下 文件名中含有某字符串的文件...
  2. 03-背景音乐及广播
  3. android 常驻轮询服务,Android实现自动轮询的RecycleView
  4. 如何零基础入门FPGA?这篇文章让你吃透!
  5. VS Tools for AI全攻略(2)低配置虚拟机也能玩转深度学习,无需NC/NV系列
  6. 前端学习(649):编译和解释性语言的区别
  7. 数据库Oracle 11g的安装步骤
  8. 英文期刊论文翻译格式要求和文献要求
  9. MathType初级教程:怎么安装MathType
  10. 红警ol服务器维护中1003,红警OL频繁掉线怎们么办 网络断开连接解决办法
  11. premiere如何把多个视频放在同一个视频画面
  12. 计算机的发展各阶段使用的元器件是什么,计算机的发展经历了哪几个阶段?各阶段的主要特征是什么?...
  13. 招聘网站代码模板 mysql_招聘网站爬虫模板
  14. 天津理工大学计算机学院绩点,天津理工大学花宇杰:平均绩点4.0你该这般青春昂扬...
  15. 服务器被打了之后怎么办?
  16. C++判断素数(求素数)
  17. C#实现简单进销存管理系统EMS
  18. 使用RMAN实现异机备份恢复(WIN平台)
  19. OMNI USDT 0.12.0 环境部署
  20. jsp的taglib指令用法

热门文章

  1. (转)光照模型及cg实现
  2. gsea结果分析图怎么看_数据分析怎么做?看这篇就够了!
  3. 机器学习网站收集(to be continued)
  4. python中的类属性和类方法_python面向对象之类属性和类方法的使用和实例
  5. memset函数及其用法,C语言memset函数详解
  6. 【PC工具】大神级代码注释,漂亮实用的代码注释工具代码logo工具
  7. 【PC工具】数学公式编辑器MathType v7.4.4.516你懂的版本
  8. 【PC工具】更新简单好用绿色IP地址扫描工具,内部网络设备查看工具,内网ip查询ip扫描工具,电脑IP地址查看方法...
  9. deepin终端配置为英文
  10. Linux学习记录-11