python 画风场 scipy_Python数据分析及可视化实例之Scipy
强大到没有朋友的科学计算库,不知道怎么介绍ta!
大牛张若愚出了厚本的《Python 科学计算》第二版
里面包罗万象,就不做搬运工了,尽快开工pandas。
来一弹在NLP自然语言处理中用到的稀疏矩阵处理:
# coding: utf-8
# # 稀疏矩阵
# `Scipy` 提供了稀疏矩阵的支持(`scipy.sparse`)。
#
# 稀疏矩阵主要使用 位置 + 值 的方法来存储矩阵的非零元素,根据存储和使用方式的不同,有如下几种类型的稀疏矩阵:
#
# 类型|描述
# ---|----
# `bsr_matrix(arg1[, shape, dtype, copy, blocksize])`| Block Sparse Row matrix
# `coo_matrix(arg1[, shape, dtype, copy])`| A sparse matrix in COOrdinate format.
# `csc_matrix(arg1[, shape, dtype, copy])`| Compressed Sparse Column matrix
# `csr_matrix(arg1[, shape, dtype, copy])`| Compressed Sparse Row matrix
# `dia_matrix(arg1[, shape, dtype, copy])`| Sparse matrix with DIAgonal storage
# `dok_matrix(arg1[, shape, dtype, copy])`| Dictionary Of Keys based sparse matrix.
# `lil_matrix(arg1[, shape, dtype, copy])`| Row-based linked list sparse matrix
#
# 在这些存储格式中:
#
# - COO 格式在构建矩阵时比较高效
# - CSC 和 CSR 格式在乘法计算时比较高效
# ## 构建稀疏矩阵
# In[1]:
from scipy.sparse import *
import numpy as np
# 创建一个空的稀疏矩阵:
# In[2]:
coo_matrix((2,3))
# 也可以使用一个已有的矩阵或数组或列表中创建新矩阵:
# In[4]:
A = coo_matrix([[1,2,0],[0,0,3],[4,0,5]])
print(A)
# 不同格式的稀疏矩阵可以相互转化:
# In[5]:
type(A)
# In[6]:
B = A.tocsr()
type(B)
# 可以转化为普通矩阵:
# In[7]:
C = A.todense()
C
# 与向量的乘法:
# In[8]:
v = np.array([1,0,-1])
A.dot(v)
# 还可以传入一个 `(data, (row, col))` 的元组来构建稀疏矩阵:
# In[9]:
I = np.array([0,3,1,0])
J = np.array([0,3,1,2])
V = np.array([4,5,7,9])
A = coo_matrix((V,(I,J)),shape=(4,4))
# In[11]:
print(A)
# COO 格式的稀疏矩阵在构建的时候只是简单的将坐标和值加到后面,对于重复的坐标不进行处理:
# In[13]:
I = np.array([0,0,1,3,1,0,0])
J = np.array([0,2,1,3,1,0,0])
V = np.array([1,1,1,1,1,1,1])
B = coo_matrix((V,(I,J)),shape=(4,4))
print(B)
# 转换成 CSR 格式会自动将相同坐标的值合并:
# In[15]:
C = B.tocsr()
print(C)
# ## 求解微分方程
# In[16]:
from scipy.sparse import lil_matrix
from scipy.sparse.linalg import spsolve
from numpy.linalg import solve, norm
from numpy.random import rand
# 构建 `1000 x 1000` 的稀疏矩阵:
# In[17]:
A = lil_matrix((1000, 1000))
A[0, :100] = rand(100)
A[1, 100:200] = A[0, :100]
A.setdiag(rand(1000))
# 转化为 CSR 之后,用 `spsolve` 求解 $Ax=b$:
# In[18]:
A = A.tocsr()
b = rand(1000)
x = spsolve(A, b)
# 转化成正常数组之后求解:
# In[19]:
x_ = solve(A.toarray(), b)
# 查看误差:
# In[20]:
err = norm(x-x_)
err
# ## sparse.find 函数
# 返回一个三元组,表示稀疏矩阵中非零元素的 `(row, col, value)`:
# In[22]:
from scipy import sparse
row, col, val = sparse.find(C)
print(row, col, val)
# ## sparse.issparse 函数
# 查看一个对象是否为稀疏矩阵:
# In[23]:
sparse.issparse(B)
# 或者
# In[24]:
sparse.isspmatrix(B.todense())
# 还可以查询是否为指定格式的稀疏矩阵:
# In[25]:
sparse.isspmatrix_coo(B)
# In[26]:
sparse.isspmatrix_csr(B)
胶水语言博大精深,
本主只得一二为新人带路,
新手可查阅历史目录:yeayee:Python数据分析及可视化实例目录zhuanlan.zhihu.com
最后,别只收藏不关注哈
python 画风场 scipy_Python数据分析及可视化实例之Scipy相关推荐
- python房价数据挖掘_Python数据分析及可视化实例之帝都房价预测
数据集下载易一网络科技 - 付费文章www.intumu.com 加载数据 import pandas as pd df=pd.read_csv("MYUNOI.csv") # ...
- python信用卡违约_Python数据分析及可视化实例之银行信用卡违约预测(24)
1.项目背景: 银行体系对于信用可违约进行预测,原始数据集如下: 2.分析步骤: (1)数据清洗(Data Cleaning) (2) 探索性可视化(Exploratory Visualization ...
- python 画风场 scipy_Python库之SciPy教程
SciPy函数库在NumPy库的基础上增加了众多的数学.科学以及工程计算中常用的库函数.例如线性代数.常微分方程数值求解.信号处理.图像处理.稀疏矩阵等等.由于其涉及的领域众多.本书没有能力对其一一的 ...
- python数据分析可视化实例_Python数据分析及可视化实例之基于Kmean分析RFM进行用户关怀...
系列文章总目录:Python数据分析及可视化实例目录 数据集下载 Python数据分析及可视化实例之全国各城市房价分析(含数据采集) Python数据分析及可视化实例之帝都房价预测 Python数据分 ...
- python信用卡违约预测分析_Python数据分析及可视化实例之银行信用卡违约预测(24)...
1.项目背景: 银行体系对于信用可违约进行预测,原始数据集如下: 2.分析步骤: (1)数据清洗(Data Cleaning) (2) 探索性可视化(Exploratory Visualization ...
- python从mongodb里取出数据进行可视化_Python数据分析及可视化实例之MongoDB增删改查...
1.MongoDB安装 有时候度娘还是给力的,相反一些博客的安装方法则显得凌乱: 最初使用Win7安装经常会出现意料不到的错误, 比如开机启动服务,服务器日志等. 上面链接安装步骤简单,没有炫技的成分 ...
- python数据预测案例_Python数据分析及可视化实例之疾病预测(分类)
Talk is cheap , show U the code. 该源码注释比较全面,需要对SKlearn有一定的了解, 当然,你也可以把它视作黑箱,做个调包侠也是大侠, 没错,本主用Bokeh进行可 ...
- python分析数据走势_Python数据分析及可视化实例之个股走势预测(26)
1.项目背景: 仅仅用来练手,个股走势如果真预测准确了,都就改行当操盘手了,哈哈! 但话又说回来,如果把数据曲线特征提取出来,再进行对比异常判断,也是可以的. 数据源,请关注微信公众号:海豹战队,回复 ...
- python数据分析实例_Python数据分析及可视化实例之爬虫源码(05)
1.背景介绍 (1)在注册了某网站之后,发现站内个人页面有个关于京杭大运河的征文.再加上之前,九寨沟地震第一时间机器人写了一篇通讯稿.于是我就在想,既然机器可以写通讯稿,那么是不是也可以用来写篇关于京 ...
最新文章
- 专访王田苗:机器人是“刚需”,市场正处于逆周期增长
- sql 根据多个ID删除表中多行数据
- 设置windows xp 调试
- android gradle 目录,Android Gradle:将目录列入文件
- 【Java】多线程相关复习—— 线程的创建、名字、运行情况以及顺序控制(join方法) 【一】...
- Winform中设置DevExpress的RadioGroup的items从配置文件中加载
- muduo学习笔记 - 第4章 C++多线程系统编程精要
- 逻辑建模与物理建模_架构层和建模域逻辑
- putc函数_C语言中的putc()函数与示例
- Qt工作笔记-使用SQL中的LIMIT进行数据分页
- Java Web学习总结(15)——JSP指令及使用相关总结
- 瞎折腾-CentOS 7.4 编译4.16.2版kernel 并安装
- win10设置mysql环境变量
- vue当前浏览器是否为ie_vue项目检测IE浏览器版本,版本太低给出提示
- 这只是起点 ——暨CSDN博客“我的2013”年度征文活动获得特等奖
- 大牛揭秘:如何快速在阿里云搭建视频直播平台
- Qt ERROR : The inferior stopped because it received a signal from the operating system.
- flink连接kafka报错
- Kotlin代码转换成Java代码
- [前端面试题][‘1‘,‘2‘,‘3‘].map(parseInt)
热门文章
- mfc点击按钮让对话框关闭_WinXP系统开始菜单中关机按钮消失的恢复教程
- 【转】DCMTK开源库的学习笔记3:dcmtk文件中数据元的修改
- c#中的BeginInvoke和EndEndInvoke 摘要
- [你必须知道的.NET]第十七回:貌合神离:覆写和重载
- 【Python CheckiO 题解】Feed Pigeons
- 使用 hexo-git-backup 插件备份你的 Hexo 博客
- 【Codeforces - 769D】k-Interesting Pairs Of Integers(暴力,统计,思维,数学,异或)
- *【CodeForces - 1150D】Three Religions(dp,预处理,思维)
- 【HDU - 2717】【POJ - 3278】Catch That Cow (经典bfs,类似dp)
- 11.Pipelines