本文是Python大数据与机器学习系列文章中的第6篇,将介绍学习Python大数据与机器学习所必须的NumPy库。

通过本文系列文章您将能够学到的知识如下:

应用Python进行大数据与机器学习

应用Spark进行大数据分析

实现机器学习算法

学习使用NumPy库处理数值数据

学习使用Pandas库进行数据分析

学习使用Matplotlib库进行Python绘图

学习使用Seaborn库进行统计绘图

使用Plotly库进行动态可视化

使用SciKit-learn处理机器学习任务

K-Means聚类

逻辑回归

线性回归

随机森林与决策树

自然语言处理与垃圾邮件过滤

神经网络

支持向量机

另外小编也会拥抱变化,根据评论中的需求情况增加其它有意义的内容。例如增加一些相关面试题等等。

什么是NumPy

NumPy是非常重要的Python数值计算扩展库,基本整个Python大数据生态都依赖它,并且由于绑定了C语言库,因此速度非常快。可以说我们要学好Python大数据,必须要学的就是NumPy库了。

安装NumPy

如果你根据之前的文章安装了anaconda,那么你已经默认安装了NumPy库了。如想单独安装请继续往下看。

使用conda安装的命令:

conda install numpy

使用pip安装的命令:

pip install numpy

NumPy array

本系列文章主要用到的是numpy的array(数组);

numpy array有两种基本形式:vector(向量)和matrics(矩阵)

vector是一维的,而matrics是二维的。

打开Jupyter,输入如下内容:

import numpy as np

my_list = [1,2,3]

arr = np.array(my_list)

arr

运行得到如下结果:

以上就是vector的一般形式

继续输入如下内容:

my_mat = [[1,2,3],[4,5,6],[7,8,9]]

np.array(my_mat)

运行得到如下结果:

以上就是二维matrics矩阵。

numpy有自己的range函数

np.arange(0,10)

运行结果如下:

还可以指定步长np.arange(0,10,2)

运行结果如下:

生成所有元素为0的向量np.zeros(3)

运行结果如下:

生成所有元素为0的矩阵np.zeros((5,5))

运行结果如下:

同样生成所有元素为1的向量和矩阵分表为np.ones(4),np.ones((2,3))

运行结果如下:

np.linspace(0,5,20)

第一个参数是起始点,第二个参数是结束点,第三个参数是从起点到终点距离分成多少份。

运行结果如下:

np.eye(4)生成4*4的主对角线为1的矩阵

运行结果如下:

np.random.rand(5)生成随机向量

运行结果如下:

np.random.rand(5,5)生成5*5的随机向量

运行结果如下:

np.random.randn(2)生成标准正态分布曲线。

运行结果如下:

np.random.randn(4,4)二维的标准正态分布曲线

运行结果如下:

提示:

在Jupyter输入框中按tab键可以提示联想菜单,按shift+tab可以提示函数用法

按tab键

按shift+tab键

np.random.randint(1,100)生成1个1到100之间的随机整数,不包含100

运行结果如下:

np.random.randint(1,100,10)生成10个1到100之间的随机整数,不包含100

运行结果如下:

array类型支持的一些函数:

reshape函数可以修改array的维数。例如:

arr = np.arange(25)

arr.reshape(5,5)

运行结果如下:

max函数:最大值

min函数:最小值

argmax函数:返回最大值的索引

argmin函数:返回最小值的索引

ranarr = np.random.randint(1,100,10)

ranarr.max()

ranarr.min()

ranarr.argmax()

ranarr.argmin()

运行结果如下:

shape函数,返回array的大小

dtype,返回数据类型

调用简化:

from numpy.random import randint

我们就可以直接使用randint了

randint(2,10)

运行结果如下:

财务大数据比赛有python吗-Python大数据与机器学习之NumPy初体验相关推荐

  1. 小猪的Python学习之旅 —— 13.文字识别库pytesseract初体验

    小猪的Python学习之旅 -- 13.文字识别库pytesseract初体验 标签:Python 引言 度过了短暂的春节假期,又要开始继续搬砖了,因为还处于节后 综合征,各种散漫,不想看任何代码相关 ...

  2. 数据是企业的无价财富——爱数备份存储柜服务器的初体验(图文)

    很早就像上这样一套数据备份系统,每天采用原来的软件备份加手动备份的方式,总有些不是太方便的地方.加上企业规模的不断扩大,系统的增多,业务数据也日显重要,容不得半点中断和数据丢失.这不,出于对系统数据的 ...

  3. 财务大数据比赛有python吗-【教改实验班简介】财务大数据分析班

    原标题:[教改实验班简介]财务大数据分析班 西京学院会计学院欢迎你 财务大数据分析班简介 1. 项目简介 会计学院财务大数据分析教改实验班从2019级学生开始招生. 近年来,随着大数据,人工智能,区块 ...

  4. 财务大数据比赛有python吗-Python 适合大数据量的处理吗?

    我很喜欢用python,用python处理数据是家常便饭,从事的工作涉及nlp,算法,推荐,数据挖掘,数据清洗,数据量级从几十k到几T不等,我来说说吧 百万级别数据是小数据,python处理起来不成问 ...

  5. 财务大数据比赛有python吗-大数据工作内容有哪些?老男孩Python数据培训

    数据,想必对于大家来说都是非常熟悉的东西,也是我们生活之中不能够缺少的,数据的出现给我们带来了很大的帮助,但是说到大数据,可能很多人都存在疑问,是什么呢?大数据开发主要做什么? 根据大数据人才报告来说 ...

  6. Python课程设计大作业:获取比赛数据并进行机器学习智能预测NBA的比赛结果

    前言 该篇是之前遗漏的大三上的Python课程设计.刚好今天有空就补发了一篇文章.全部的代码在最后附录中.爬虫类的代码直接全部放到一起了,读者可以自行研究.百度网盘可以私聊我进行获取. 一.课程设计项 ...

  7. python大数据和java大数据的区别-未来Java、大数据、Python哪个前景更好,薪资更高?...

    都知道现在最火爆的是人工智能.大数据.而人工智能和大数据主要用的语言就是Java和Python.今天我们就来分析一下,当前java,python和大数据,哪个就业前景更好?自己该学哪一个? Java和 ...

  8. python处理excel大数据-当Excel遇到大数据问题,是时候用Python来拯救了

    与从事分析工作的人交谈,他们会告诉你他们对Excel的爱恨情仇: Excel能做很多事情:当涉及到更大的数据集时,这简直是一种痛苦.数据需要很长时间才能加载,在你意识到机器的内存耗尽之前,整个事情就变 ...

  9. 用Python实现一个大数据搜索引擎

    用Python实现一个大数据搜索引擎 搜索是大数据领域里常见的需求.Splunk和ELK分别是该领域在非开源和开源领域里的领导者.本文利用很少的Python代码实现了一个基本的数据搜索功能,试图让大家 ...

最新文章

  1. 解决svn working copy locked问题
  2. 你真的了解扩展方法吗?
  3. springboot整合rpc远程调用_SpringCloud—RPC远程调用
  4. 学会放松,是通向生命觉‮的醒‬必经之路
  5. selenium webdirver之ruby-开发ide乱码解决方案
  6. C#笔记03 运算符和分支结构
  7. 于的繁体字有几种写法_“二”的繁体字有几种写法
  8. 【第3版emWin教程】第14章 emWin6.x的2D图形库之基本绘图
  9. 电脑桌面显示计算机信息,在桌面背景图片上显示各种电脑信息BGInfo 4.28
  10. Golang之Shadowed Variables(幽灵变量)
  11. 修改STM32CuBeMX生成文件
  12. ofo千万人排队退超10亿元押金,被资本和市场抛弃的ofo如何熬过寒冬?
  13. 取消计算机关机,取消电脑自动关机
  14. 区块链为什么热衷开源?超级账本最有说服力!
  15. Unity调用USB摄像头开启与关闭
  16. Saturn Console部署踩坑总结
  17. 【获取数据表格(datagrid)中编辑器(editor)的值】
  18. 51单片机之程序下载
  19. Knative部署应用以及应用的更新、应用的分流(二)
  20. 中缀表达式To前缀表达式 (python实现)

热门文章

  1. Mysql游标循环遍历_MySQL数据库中,使用游标循环遍历
  2. RecyclerView IndexOutOfBoundException
  3. Evernote相关技术介绍——mysql+lucene+tomcat
  4. LevelDb简单介绍和原理——本质:类似nedb,插入数据文件不断增长(快照),再通过删除老数据做更新...
  5. javascript里的偏函数——本质函数式编程+闭包,返回函数
  6. EF CodeFirst数据迁移与防数据库删除
  7. ASP.NET Web API
  8. [转]python类型转换、数值操作
  9. keil中使用Astyle格式化你的代码的方法-keil4 keil5通用
  10. python小练习--模拟用户登录,(3次重试机会,登录成功展示登录账号密码)