Python稀疏矩阵

  • 1. 导入模块
  • 2. SciPy中的稀疏矩阵
    • 2.1 坐标列表格式 COO
    • 2.2 格式转换
    • 2.3 压缩列格式和压缩行格式 CSR/CSC
  • 3. 创建稀疏矩阵
    • 3.1 稀疏矩阵的可视化
    • 3.2 稀疏矩阵线性代数
    • 3.3 线性方程组
    • 3.4 LU分解
    • 3.5 特征值问题

数组和矩阵是数值计算的基础元素。目前为止,我们都是使用NumPy的ndarray数据结构来表示数组,这是一种同构的容器,用于存储数组的所有元素。

有一种特殊情况,矩阵的大部分元素都为零,这种矩阵被称为稀疏矩阵。对于稀疏矩阵,将所有零保存在计算机内存中的效率很低,更合适的方法是只保存非零元素以及位置信息。

假设存在一个神经网络,16个神经元分布在一个4×4的二维矩形网格上,其中只有最近邻的神经元是相连的。那么,神经网络的连接情况就可以表示为一个稀疏矩阵。

1. 导入模块


SciPy中提供了稀疏矩阵模块scipy.sparse,为稀疏矩阵的表示及其线性代数运算提供了丰富易用的接口。

import matplotlib.pyplot as plt
import matplotlib as mplimport numpy as npimport scipy.sparse as sp
import scipy.sparse.linalgimport scipy.linalg as la

2. SciPy中的稀疏矩阵


下方表格总结和比较了了SciPy的sparse模块中可用的稀疏矩阵表示法。

类型 Python类 描述 优点 缺点
坐标的列表 sp.coo_matrix 将非零值及其行列信息保存在一个列表 构造简单,添加元素方便 访问元素效率低下
列表的列表 sp.lil_matrix 将每行的非零元素列索引保存在一个列表,将对应值保存在另一个列表 支持切片操作 不方便进行数学运算
值的字典 sp.dok_matrix 将非零值保存在字典,非零值的坐标元组作为字典的键 构造简单,可快速添加删除元素 不方便进行数学运算
对角矩阵 sp.dia_matrix 矩阵的对角线列表 对于对角矩阵非常有效 不适用非对角矩阵
压缩列格式和压缩行格式 sp.csc_matrix 和 sp.csr_matrix 将值与行列索引的数组一起存储 对于矩阵的向量乘法很高效 构造相对复杂
块稀疏矩阵 sp.bsr_matrix 与CSR类似,用于具有稠密子矩阵的稀疏矩阵 对于此类特殊矩阵很高效 不适用一般矩阵

2.1 坐标列表格式 COO

例如,我们在SciPy对下面稀疏矩阵以COO格式进行初始化:

A=[0100000200304000]A = \begin{bmatrix}0 \ 1 \ 0 \ 0 \\ 0 \ 0 \ 0 \ 2 \\ 0 \ 0 \ 3 \ 0 \\ 4 \ 0 \ 0 \ 0 \end{bmatrix} A=⎣⎢⎢⎡​0 1 0 00 0 0 20 0 3 04 0 0 0​⎦⎥⎥⎤​

为了创建sp.coo_matrix对象,我们需要创建非零值、行索引以及列索引的列表或数组,并将其传递给生成函数sp.coo_matrix

values = [1, 2, 3, 4]
rows = [0, 1, 2, 3]
cols = [1, 3, 2, 0]
A = sp.coo_matrix((values, (rows, cols)), shape=[4, 4])
A


SciPy的sparse模块中稀疏矩阵的属性大部分派生自NumPy的ndarray对象,同时也包括nnz(非零元素数目)和data(非零值)等属性。

A.shape, A.size, A.dtype, A.ndim

A.nnz, A.data


对于sp.coo_matrix对象,我们还可以使用row和col属性来访问底层的行列坐标数组。

A.row, A.col

2.2 格式转换

稠密矩阵和稀疏矩阵,以及不同格式稀疏矩阵之间,可以很方便地进行格式转换。

A.todense()  # 转换为稠密矩阵

A.toarray()  # 转换为ndarray数组

A.tocsr()  # 转换为CSR格式


主要注意,不是所有的格式支持索引。

try:A.tobsr()[1]  # 块稀疏矩阵不支持索引
except NotImplementedError:print("NotImplementedError")

2.3 压缩列格式和压缩行格式 CSR/CSC

对于数值计算而言,SciPy的sparse模块中最重要的稀疏矩阵表示是CSR和CSC格式,因为它们非常适合进行有效的矩阵运算和线性代数运算。在准备好需要计算的稀疏矩阵后,可以使用toscr或者tocsc将其转换为CSR格式或者CSC格式。

A = np.array([[1, 2, 0, 0], [0, 3, 4, 0], [0, 0, 5, 6], [7, 0, 8, 9]])
A

A = sp.csr_matrix(A)
A.data  # 所有非零元素

A.indices # 非零元素列序号

A.indptr  # 每一行第一个非零元素在data中的起始序号


3. 创建稀疏矩阵


一种创建稀疏矩阵的方法是对普通矩阵进行格式转换。同时,sp.sparse模块提供了很多用于生成此类矩阵的函数。

sp.eye用于生成对焦矩阵,sp.kron用于计算两个稀疏矩阵的Kronecker张量积,bmatvstackhstack用于从稀疏块矩阵、垂直和水平堆叠矩阵来生成稀疏矩阵。

例如,我们重复调用sp.eye生成一个具有多个对角线的矩阵,其中使用了k参数设置相对主对角线的偏移量。

N = 10
A = -2 * sp.eye(N) + sp.eye(N, k=1) + sp.eye(N, k=-1)
print(type(A))
A.todense()


默认情况下,得到的是CSR格式的稀疏矩阵。使用format参数,可以指定任意其它稀疏矩阵格式。

A = sp.diags([1,-2,1], [1,0,-1], shape=[N, N], format='csc')
A


可以注意到,这个矩阵是离散空间下二阶微分操作(拉普拉斯算子)的矩阵表示。

d2fdx2=lim⁡h→0f(x−h)−2f(x)+f(x+h)h2\frac{d^{2} f}{d x^{2}}=\lim _{h \rightarrow 0} \frac{f(x-h)-2 f(x)+f(x+h)}{h^{2}}dx2d2f​=h→0lim​h2f(x−h)−2f(x)+f(x+h)​

d2fdx2=[−210…001−21…0001−2…00………………000…−21000…1−2][f(a)f(a+h)f(a+2h)…f(a+(n−2)h)f(b)]/h2=Lap⁡∣f⟩\frac{d^{2} f}{d x^{2}}=\begin{bmatrix}\begin{array}{ccccccc}-2 & 1 & 0 & \ldots & 0 & 0 \\ 1 & -2 & 1 & \ldots & 0 & 0 \\ 0 & 1 & -2 & \ldots & 0 & 0 \\ \ldots & \ldots & \ldots & \ldots & \ldots & \ldots \\ 0 & 0 & 0 & \ldots & -2 & 1 \\ 0 & 0 & 0 & \ldots & 1 & -2\end{array}\end{bmatrix}\begin{bmatrix}\begin{array}{c}f(a) \\ f(a+h) \\ f(a+2 h) \\ \ldots \\ f(a+(n-2) h) \\ f(b)\end{array}\end{bmatrix} / h^{2}=\operatorname{Lap}|f\rangle dx2d2f​=⎣⎢⎢⎢⎢⎢⎢⎡​−210…00​1−21…00​01−2…00​………………​000…−21​000…1−2​​⎦⎥⎥⎥⎥⎥⎥⎤​⎣⎢⎢⎢⎢⎢⎢⎡​f(a)f(a+h)f(a+2h)…f(a+(n−2)h)f(b)​​⎦⎥⎥⎥⎥⎥⎥⎤​/h2=Lap∣f⟩

3.1 稀疏矩阵的可视化

matplotlib提供的spy函数可以对稀疏矩阵进行可视化。

fig, ax = plt.subplots()
ax.spy(A)


稀疏矩阵经常和张量积空间相关。使用sp.kron函数,可以将多个较小的矩阵组成单个大的稀疏矩阵。

神经网络中的变换都可以简化为数值数据张量上的一些张量计算。

B = sp.diags([1, 1], [-1, 1], shape=[3,3])
B.todense()

C = sp.kron(A, B, format='csr')fig, (ax_A, ax_B, ax_C) = plt.subplots(1, 3, figsize=(12, 4))
ax_A.spy(A)
ax_B.spy(B)
ax_C.spy(C)

3.2 稀疏矩阵线性代数


稀疏矩阵的主要应用是在大型矩阵上进行线性代数运算。SciPy的sparse模块中包含的linalg子模块实现了很多线性代数运算。

稀疏线性代数模块scipy.sparse.linalg和稠密线性代数模块scipy.linalg的运算行为存在很多差异。例如,用于稠密问题的特征值求解器通常会计算返回所有的特征值和特征向量。对于稀疏矩阵而言,为了保证稀疏性和计算效率,它的特征值求解器通常只返回少量的特征值和特征向量,例如特征值最大或最小的部分。

当然,这种差异性在大部分场景不会影响稀疏线性代数模块的应用。因为很多时候我们只关心最小或者做大的部分特征值。例如求解薛定谔方程时,特征值(能量值)最低的结果是最重要的。

3.3 线性方程组

我们考虑Ax=bAx=bAx=b形式的线性方程组,以前面提到的三对角矩阵为例:

N = 10
A = sp.diags([1, -2, 1], [1, 0, -1], shape=[N, N], format='csc')
b = -np.ones(N)

首先使用SciPy提供的稀疏矩阵求解器:

x = sp.linalg.spsolve(A, b)
x


为了对比,我们也使用SciPy提供的稠密矩阵求解器:

B = A.todense()
x = la.solve(B, b)
x


为了对比两者的速度差异,我们可以尝试较大的矩阵:

N = 1000
A = sp.diags([1, -2, 1], [1, 0, -1], shape=[N, N], format='csc')
b = -np.ones(N)
B = A.todense()
%time x = sp.linalg.spsolve(A, b)

%time x = la.solve(B, b)


可以看到,当N很大时,稀疏矩阵的运算速度有很大优势。

# compare performance of solving Ax=b vs system size N,
# where A is the sparse matrix for the 1d poisson problemimport timedef setup(N):A = sp.diags([1,-2,1], [1,0,-1], shape=[N, N], format='csr')b = -np.ones(N)return A, A.todense(), breps = 10
N_vec = np.arange(2, 300, 1)
t_sparse = np.empty(len(N_vec))
t_dense = np.empty(len(N_vec))
for idx, N in enumerate(N_vec):A, A_dense, b = setup(N)t = time.time()for r in range(reps):x = np.linalg.solve(A_dense, b)t_dense[idx] = (time.time() - t)/repst = time.time()for r in range(reps):x = sp.linalg.spsolve(A, b, use_umfpack=True)t_sparse[idx] = (time.time() - t)/repsfig, ax = plt.subplots(figsize=(8, 4))
ax.plot(N_vec, t_dense * 1e3, '.-', label="dense")
ax.plot(N_vec, t_sparse * 1e3, '.-', label="sparse")
ax.set_xlabel(r"$N$", fontsize=16)
ax.set_ylabel("elapsed time (ms)", fontsize=16)
ax.legend(loc=0)
fig.tight_layout()

3.4 LU分解

一种替代spsolve接口的方法时使用sp.sparse.splusp.sparse.splu(不完全LU分解)。如果需要为多组向量bbb求解Ax=bAx=bAx=b,这将特别有用。

N = 1000
A = sp.diags([1, -2, 1], [1, 0, -1], shape=[N, N], format='csc')
b = -np.ones(N)%time lu = sp.linalg.splu(A)

lu.L, lu.U


进行LU分解之后,就可以使用lu对象的solve方法有效求解Ax=bAx=bAx=b了。

x = lu.solve(b)

3.5 特征值问题

可以分别使用sp.linalg.eigssp.linalg.svds函数来求解稀疏矩阵的特征值和奇异值问题。对于实数对阵矩阵或者复数Hermitian矩阵,也可以使用sp.linalg.eigsh函数来计算特征值和特征向量。

这些函数只会计算给定数量的特征值和特征向量(默认为6个)。使用关键词k,可以设置所需计算的特征值的数量。使用关键词which(例如,'LM’为绝对值最大,'SM’为绝对值最大),可以设置计算哪一部分的特征值。
例如,我们计算一维泊松问题(系统尺寸为10×10)中稀疏矩阵的最大模的四个特征值:

N = 10
A = sp.diags([1, -2, 1], [1, 0, -1], shape=[N, N], format='csc')evals, evecs = sp.linalg.eigs(A, k=4, which='LM')
evals


sp.linalg.eigs函数返回的是一个元组,其中第一个元素是特征值数组,第二个元素是特征向量数组。

我们期望A和特征向量之间的点积等于对应特征值对特征向量的缩放,下面将验证这一点:

np.allclose(A.dot(evecs[:,0]), evals[0] * evecs[:,0])  # 排除浮点数误差影响


我们下面将对比稀疏矩阵和稠密矩阵在计算大矩阵特征值问题上的速度差异:

N = 1000
A = sp.diags([1, -2, 1], [1, 0, -1], shape=[N, N], format='csc')
B = A.todense()
%time evals, evecs = sp.linalg.eigs(A, k=4, which='LM')

%time evals, evecs = la.eig(B)

参考文献来自桑鸿乾老师的课件:科学计算和人工智能

【Python稀疏矩阵】相关推荐

  1. python稀疏矩阵的存储与表示

    参考链接: https://blog.csdn.net/bitcarmanlee/article/details/52668477 https://blog.csdn.net/wangjian1204 ...

  2. Python稀疏矩阵(coo,csr)

    csr 或者coo .todense()返回矩阵 # data为csr matrix 或者是 coo matrix >>> print(data)(0, 0) -1.0(0, 1) ...

  3. 洪嘉振 计算多体系统动力学pdf_多体动力学演化python入门——quantum many-body scars 和稀疏矩阵后续...

    好久没更新了,肚子里也没什么货,就算python稀疏矩阵的最后一篇吧.之前的 路飞的哥哥:多体物理python入门--Ising模型和稀疏矩阵​zhuanlan.zhihu.com 计算了本征值,也就 ...

  4. 稀疏矩阵三元组 严蔚敏_Sparse稀疏矩阵主要存储格式总结

    在数据科学和深度学习等领域会采用矩阵来存储数据,但当矩阵较为庞大且非零元素较少时,运算效率和存储有效率并不高.所以,一般情况我们采用Sparse稀疏矩阵的方式来存储矩阵,来提高存储和运算效率.下面将对 ...

  5. Python使用scipy包将稀疏矩阵保存为Mtx格式和npz格式文件实战

    Python使用scipy包将稀疏矩阵保存为Mtx格式和npz格式文件实战 目录 Python将稀疏矩阵保存为Mtx格式和npz格式文件实战 #导入包和仿真数据

  6. 稀疏矩阵之python实现

          工程实践中,多数情况下,大矩阵一般都为稀疏矩阵,所以如何处理稀疏矩阵在实际中就非常重要. 1.sparse模块初探 python中scipy模块中,有一个模块叫sparse模块,就是专门为 ...

  7. python 的csr_python的高级数组之稀疏矩阵

    稀疏矩阵的定义: 具有少量非零项的矩阵(在矩阵中,若数值0的元素数目远多于非0元素的数目,并且非0元素分布没有规律时,)则称该矩阵为稀疏矩阵:相反,为稠密矩阵.非零元素的总数比上矩阵所有元素的总数为矩 ...

  8. 如何用三元组表表示下列稀疏矩阵_盘一盘 Python 系列特别篇21之:SciPy 稀疏矩阵...

    引言 和稠密矩阵相比,稀疏矩阵的最大好处就是节省大量的内存空间来储存零.稀疏矩阵本质上还是矩阵,只不过多数位置是空的,那么存储所有的 0 非常浪费.稀疏矩阵的存储机制有很多种 (列出常用的五种): C ...

  9. matlab产生一个稀疏向量,Matlab中的稀疏矩阵向量乘法比Python快吗?

    编辑:请参阅this question,在那里我学习了如何使用Numba在Python中并行化稀疏矩阵向量乘法,并能够与Matlab打交道.在 原题: 我发现在Matlab中稀疏矩阵向量乘法比Pyth ...

最新文章

  1. oracle case grouping,ORACLE GROUPING函數的使用
  2. docker image aarch64 x86_64_「docker」交叉编译适用于ARM平台的Docker源码
  3. Spring jdbc的搭建
  4. 前端学习(1803):前端调试之事件伪类练习二
  5. android 高德地图 sh1,百度、高德地图获取发布版(Release)SHA1
  6. FileInfo类 c# 1614533684
  7. ascii码java生成_Java 生成 ASCII 字符画 实现代码
  8. 雷达的正交波形设计matlab源码,雷达系统设计MATLAB仿真
  9. Jupyter Notebook——夏侯南溪常用的快捷键
  10. eclipse-java-2018-09-win32-x86_64配置tomcat(内含更新eclipse,如何解决添加时找不到最新tomcat版本)...
  11. python绘制wx+b_【教学分享】大数据博士教你用python玩转时空大数据
  12. 巴克码信号处理的计算机仿真,单码道绝对编码信号处理建模与仿真
  13. Atitit php pdo的api使用 目录 1.1. PHP PDO简介 1 1.2. 若要使用数据库长连接,:PDO::ATTR_PERSISTENT 1 2. 其他设置 2 2.1. )、P
  14. 如何设置程序默认“以管理员身份运行”
  15. iTunes只能装C盘吗_如何通过iTunes将iPhone备份到移动硬盘?
  16. 手机安全卫士------查询号码归属地
  17. HTML为标题栏添加图片
  18. Python实现FP树
  19. 周易六十四卦——震为雷卦
  20. 忙忙碌碌不过这碎银几两

热门文章

  1. 量化交易系统c++程序化接口代码
  2. java slider_java slider
  3. 【苹果iMessage相册推信息推】 重要用于安装背面必要安装的watchman
  4. html5游戏sdk开发,自用游戏HTML5 sdk技术设计手册
  5. 编程知识汇总--3D模型文件的通用格式:FBX
  6. windows10配置mysql数据源_将数据库添加为数据源
  7. 桥梁风工程与人工智能(综述)
  8. 链塔智库|区块链产业要闻及动态周报(2021年3月第4周)
  9. nofile和noproc
  10. Win7查看及打开端口命令