财务大数据比赛有python吗-Python大数据与机器学习之NumPy初体验
本文是Python大数据与机器学习系列文章中的第6篇,将介绍学习Python大数据与机器学习所必须的NumPy库。
通过本文系列文章您将能够学到的知识如下:
应用Python进行大数据与机器学习
应用Spark进行大数据分析
实现机器学习算法
学习使用NumPy库处理数值数据
学习使用Pandas库进行数据分析
学习使用Matplotlib库进行Python绘图
学习使用Seaborn库进行统计绘图
使用Plotly库进行动态可视化
使用SciKit-learn处理机器学习任务
K-Means聚类
逻辑回归
线性回归
随机森林与决策树
自然语言处理与垃圾邮件过滤
神经网络
支持向量机
另外小编也会拥抱变化,根据评论中的需求情况增加其它有意义的内容。例如增加一些相关面试题等等。
什么是NumPy
NumPy是非常重要的Python数值计算扩展库,基本整个Python大数据生态都依赖它,并且由于绑定了C语言库,因此速度非常快。可以说我们要学好Python大数据,必须要学的就是NumPy库了。
安装NumPy
如果你根据之前的文章安装了anaconda,那么你已经默认安装了NumPy库了。如想单独安装请继续往下看。
使用conda安装的命令:
conda install numpy
使用pip安装的命令:
pip install numpy
NumPy array
本系列文章主要用到的是numpy的array(数组);
numpy array有两种基本形式:vector(向量)和matrics(矩阵)
vector是一维的,而matrics是二维的。
打开Jupyter,输入如下内容:
import numpy as np
my_list = [1,2,3]
arr = np.array(my_list)
arr
运行得到如下结果:
以上就是vector的一般形式
继续输入如下内容:
my_mat = [[1,2,3],[4,5,6],[7,8,9]]
np.array(my_mat)
运行得到如下结果:
以上就是二维matrics矩阵。
numpy有自己的range函数
np.arange(0,10)
运行结果如下:
还可以指定步长np.arange(0,10,2)
运行结果如下:
生成所有元素为0的向量np.zeros(3)
运行结果如下:
生成所有元素为0的矩阵np.zeros((5,5))
运行结果如下:
同样生成所有元素为1的向量和矩阵分表为np.ones(4),np.ones((2,3))
运行结果如下:
np.linspace(0,5,20)
第一个参数是起始点,第二个参数是结束点,第三个参数是从起点到终点距离分成多少份。
运行结果如下:
np.eye(4)生成4*4的主对角线为1的矩阵
运行结果如下:
np.random.rand(5)生成随机向量
运行结果如下:
np.random.rand(5,5)生成5*5的随机向量
运行结果如下:
np.random.randn(2)生成标准正态分布曲线。
运行结果如下:
np.random.randn(4,4)二维的标准正态分布曲线
运行结果如下:
提示:
在Jupyter输入框中按tab键可以提示联想菜单,按shift+tab可以提示函数用法
按tab键
按shift+tab键
np.random.randint(1,100)生成1个1到100之间的随机整数,不包含100
运行结果如下:
np.random.randint(1,100,10)生成10个1到100之间的随机整数,不包含100
运行结果如下:
array类型支持的一些函数:
reshape函数可以修改array的维数。例如:
arr = np.arange(25)
arr.reshape(5,5)
运行结果如下:
max函数:最大值
min函数:最小值
argmax函数:返回最大值的索引
argmin函数:返回最小值的索引
ranarr = np.random.randint(1,100,10)
ranarr.max()
ranarr.min()
ranarr.argmax()
ranarr.argmin()
运行结果如下:
shape函数,返回array的大小
dtype,返回数据类型
调用简化:
from numpy.random import randint
我们就可以直接使用randint了
randint(2,10)
运行结果如下:
财务大数据比赛有python吗-Python大数据与机器学习之NumPy初体验相关推荐
- 小猪的Python学习之旅 —— 13.文字识别库pytesseract初体验
小猪的Python学习之旅 -- 13.文字识别库pytesseract初体验 标签:Python 引言 度过了短暂的春节假期,又要开始继续搬砖了,因为还处于节后 综合征,各种散漫,不想看任何代码相关 ...
- 数据是企业的无价财富——爱数备份存储柜服务器的初体验(图文)
很早就像上这样一套数据备份系统,每天采用原来的软件备份加手动备份的方式,总有些不是太方便的地方.加上企业规模的不断扩大,系统的增多,业务数据也日显重要,容不得半点中断和数据丢失.这不,出于对系统数据的 ...
- 财务大数据比赛有python吗-【教改实验班简介】财务大数据分析班
原标题:[教改实验班简介]财务大数据分析班 西京学院会计学院欢迎你 财务大数据分析班简介 1. 项目简介 会计学院财务大数据分析教改实验班从2019级学生开始招生. 近年来,随着大数据,人工智能,区块 ...
- 财务大数据比赛有python吗-Python 适合大数据量的处理吗?
我很喜欢用python,用python处理数据是家常便饭,从事的工作涉及nlp,算法,推荐,数据挖掘,数据清洗,数据量级从几十k到几T不等,我来说说吧 百万级别数据是小数据,python处理起来不成问 ...
- 财务大数据比赛有python吗-大数据工作内容有哪些?老男孩Python数据培训
数据,想必对于大家来说都是非常熟悉的东西,也是我们生活之中不能够缺少的,数据的出现给我们带来了很大的帮助,但是说到大数据,可能很多人都存在疑问,是什么呢?大数据开发主要做什么? 根据大数据人才报告来说 ...
- Python课程设计大作业:获取比赛数据并进行机器学习智能预测NBA的比赛结果
前言 该篇是之前遗漏的大三上的Python课程设计.刚好今天有空就补发了一篇文章.全部的代码在最后附录中.爬虫类的代码直接全部放到一起了,读者可以自行研究.百度网盘可以私聊我进行获取. 一.课程设计项 ...
- python大数据和java大数据的区别-未来Java、大数据、Python哪个前景更好,薪资更高?...
都知道现在最火爆的是人工智能.大数据.而人工智能和大数据主要用的语言就是Java和Python.今天我们就来分析一下,当前java,python和大数据,哪个就业前景更好?自己该学哪一个? Java和 ...
- python处理excel大数据-当Excel遇到大数据问题,是时候用Python来拯救了
与从事分析工作的人交谈,他们会告诉你他们对Excel的爱恨情仇: Excel能做很多事情:当涉及到更大的数据集时,这简直是一种痛苦.数据需要很长时间才能加载,在你意识到机器的内存耗尽之前,整个事情就变 ...
- 用Python实现一个大数据搜索引擎
用Python实现一个大数据搜索引擎 搜索是大数据领域里常见的需求.Splunk和ELK分别是该领域在非开源和开源领域里的领导者.本文利用很少的Python代码实现了一个基本的数据搜索功能,试图让大家 ...
最新文章
- 解决svn working copy locked问题
- 你真的了解扩展方法吗?
- springboot整合rpc远程调用_SpringCloud—RPC远程调用
- 学会放松,是通向生命觉的醒必经之路
- selenium webdirver之ruby-开发ide乱码解决方案
- C#笔记03 运算符和分支结构
- 于的繁体字有几种写法_“二”的繁体字有几种写法
- 【第3版emWin教程】第14章 emWin6.x的2D图形库之基本绘图
- 电脑桌面显示计算机信息,在桌面背景图片上显示各种电脑信息BGInfo 4.28
- Golang之Shadowed Variables(幽灵变量)
- 修改STM32CuBeMX生成文件
- ofo千万人排队退超10亿元押金,被资本和市场抛弃的ofo如何熬过寒冬?
- 取消计算机关机,取消电脑自动关机
- 区块链为什么热衷开源?超级账本最有说服力!
- Unity调用USB摄像头开启与关闭
- Saturn Console部署踩坑总结
- 【获取数据表格(datagrid)中编辑器(editor)的值】
- 51单片机之程序下载
- Knative部署应用以及应用的更新、应用的分流(二)
- 中缀表达式To前缀表达式 (python实现)
热门文章
- Mysql游标循环遍历_MySQL数据库中,使用游标循环遍历
- RecyclerView IndexOutOfBoundException
- Evernote相关技术介绍——mysql+lucene+tomcat
- LevelDb简单介绍和原理——本质:类似nedb,插入数据文件不断增长(快照),再通过删除老数据做更新...
- javascript里的偏函数——本质函数式编程+闭包,返回函数
- EF CodeFirst数据迁移与防数据库删除
- ASP.NET Web API
- [转]python类型转换、数值操作
- keil中使用Astyle格式化你的代码的方法-keil4 keil5通用
- python小练习--模拟用户登录,(3次重试机会,登录成功展示登录账号密码)