Numpy与Pandas基础
Numpy与Pandas基础
Cyczz
计算机小白
关注他
1 人赞同了该文章
本文包括:
- 一维数据分析
- 二维数据分析
一、一维数组
- Numpy的一维数组(array)
创建一个一维数组,参数传入的是一个一维列表[2,3,4,5]
注意:序号是从0开始
(1)三种访问一维数组元素的方法:
- 根据序号查询元素:a[0]
- 切片:三个参数 [start_index : stop_index : step]
start_index是切片的起始位置
stop_index是切片的结束位置(不包括)
step可以不提供,默认值是1,步长值不能为0,不然会报错ValueError
- 循环访问:
for i in a:
(2)查看数据类型:dtype()函数
(3)与列表list的区别
- 统计功能:
平均值函数mean():
标准差函数std():
- 向量化运算:
向量相加:即对位相加
向量乘以标量
- 注意:numpy中的元素必须是同一种数据类型,列表中的元素可以不是同一种数据类型。
2.Pandas的一维数组(series)
(1)创建一维数组:Series相较于Array多了索引,可以在定义的时候需要指定或忽视索引。
- 通过一维数组或者列表创建
- 通过字典的方式创建
(2)常用的获取描述统计信息函数
- 描述统计信息:describe()
- 根据索引获取值: iloc()
- 根据索引获取值:loc()
- 向量相加:
两向量s1和s2相加得s3
方法一:
方法二:
小结:在numpy和pandas这两个包中,都有表示一维数据的特殊数据结构。在pandas中,一维数据结构是Series。在numpy中,一维数据结构是数组Array。Series 的功能相对numpy的Array要更多,因为Series是建立在Numpy至上的
二、二维数组
- Numpy的一维数组(array)
定义一个二维数组:
所创二维数组如图所示,行号和列号都是从0开始计数
(1)常用的基本操作
- 查询元素
- 获取第一行(切片):
注意:第一行的行号为0
- 获取第一列(切片):
(2)Numpy数轴参数
- 轴:在numpy中可以理解为方向,使用0,1,2数字表示。对于一个一维数组,只有一个0轴,对于2维数组(shape(2,2))只有0轴和1轴,对于3维数组(shape(2,2,3))有0,1,2轴。意义:有了轴的概念后,我们计算会更加方便,比如计算一个2维数组的平均值,必须指定是计算哪个方向上面数字的平均值。
二维数组的轴:
当axis=1的时候,统计值按行来进行计算
当axis=0的时候,统计值按列来进行计算
- 常用计算:
平均值(mean)计算
2.Pandas二维数组(DataFrame)
创建一个有序二维数组:
(1)常见分析操作:
- iloc属性用于根据位置查询值:查询元素:变量名.iloc[元素所在的行,元素所在的列]
上图为:查询某一元素
上图为:查询某一行
上图为:查询某一列
- loc属性用于根据索引获取值:变量名.loc[元素所在的行,需查询的列名]
上图为:查询某一元素
上图为:查询某一行
上图为:查询某一列
(2)复杂查询:
- 切片功能
- 条件判断
筛选出销售数量大于1的药品
#通过条件判断筛选
#第1步:构建查询条件
querySer=salesDf.loc[:,'销售数量']>1
print(type(querySer))
print(querySer)
salesDf.loc[querySer,:]
(3)查看数据集描述统计信息
- 打印出前三行
- 查看数据大小
- 查看某一列的数据类型
- 查看每一列的统计数值
小结:在二维数组上,DataFrame相较于Array有两个优点:1.每列的数据可以是不同的类型。2.具有索引功能(类似于Series),每行和每列都有索引值
Numpy与Pandas基础相关推荐
- 【Python 数据科学】Numpy和Pandas基础
文章目录 一.Numpy基础简介 1.基础 2. 数组的加减乘除.切片与列表相同 二.Pandas 基础 1.series 1)基础 2)切片 2.dataframe 1).构造 2).切片 取行 取 ...
- 数据分析:numpy和pandas基础操作详解
数据处理基础 numpy基础 1.numpy创建数组及基础属性 2.数组的特点 3.创建常见数组 4.数组数据类型 5.生成随机数 6.一维数组索引 7.布尔索引 8. 多维数组的索引 9.实际问题 ...
- python怎么计算总值_python小白系列Day2—python基础以及pandas基础
最近恰逢过年期间,聚会太多,还有论文以及笔者年后的实习培训,时隔几天,笔者终于在第一天更文之后,继续写第二篇了. 打算写这个,主要是想记录自己从0到1的过程,欢迎拍砖. part one 思考部分 笔 ...
- 利用Python进行数据分析(7) pandas基础: Series和DataFrame的简单介绍 一、pandas 是什么 pandas 是基于 NumPy 的一个 Python 数据分析包,主
利用Python进行数据分析(7) pandas基础: Series和DataFrame的简单介绍 一.pandas 是什么 pandas 是基于 NumPy 的一个 Python 数据分析包,主要目 ...
- 【Python基础】101道Numpy、Pandas练习题,提升你的Python水平
无论是数据分析还是机器学习,数据的预处理必不可少.其中最常用.最基础的Python库非numpy和pandas莫属,很多初学者可能看了很多教程,但是很快就把用法忘光了. 光看不练假把式,今天向大家推荐 ...
- 数据挖掘课程笔记6 : Numpy、Pandas和Matplotlib包基础知识
#2018-03-22 10:23:16 March Thursday the 12 week, the 081 day SZ SSMR http://blog.csdn.net/eastmount/ ...
- 数据基础---numpy、pandas使用教程
数组对象 Numpy库 Numpy最重要的一个特点是就是其N维数组对象,即ndarray,ndarray是一个通用的同构数据多维容器,其中的所有元素必须是相同类型的.每个数组都有一个shape(一个表 ...
- Python数据分析之Numpy、Pandas与Matplotlib基础
Python在数据科学中的作用 Python之所以能够成为大数据分析的主要工具,主要是因为他有很多现成的数据分析以及机器学习的工具包(Python中称为库),比如Numpy库.Pandas库.Scik ...
- 【Python数据挖掘课程】六.Numpy、Pandas和Matplotlib包基础知识
前面几篇文章采用的案例的方法进行介绍的,这篇文章主要介绍Python常用的扩展包,同时结合数据挖掘相关知识介绍该包具体的用法,主要介绍Numpy.Pandas和Matplotlib三个包.目录: ...
最新文章
- 安装完之后设置动态ip地址
- 系统分析的几个好工具
- 资深数据产品经理陈家崑:如何从 0 到 1 构建埋点体系
- 【Redis学习】Transaction事务管理
- 面对枯燥的源码,如何才能看得下去
- 组策略:交互式登录:不显示最后的用户名
- bzoj 1009: [HNOI2008]GT考试(dp+kmp+矩阵快速幂)
- SURF算法之Opencv代码详解
- 2022-2028全球石油管材接头行业调研及趋势分析报告
- 浅谈对POW的认识和理解
- C/C++中的 void*
- 汇智网mysql_MySQL 入门
- Mac下常用工具软件
- MATLAB | 如何使用MATLAB绘制甘特图(gantt chart)
- 3dmax2014 uv用法_3DSMAX演示一个硬表面模型UV展开的方法
- java实现身份证号校验
- 揭开小额信贷业务系统的秘密
- 搭建树莓派 4B + intel movidius 神经元计算棒2代深度学习环境
- python神经网络算法pdf_高清图解:神经网络、机器学习、数据科学一网打尽|附PDF...
- 步进伺服电机加减速 及 位置速度控制关键程序
热门文章
- Mix3D:大规模三维场景的数据增强(3DV2021)
- 代码实战 | 用LeGO-LOAM实现地面提取
- YOLObile:面向移动设备的「实时目标检测」算法
- EPSON机器人的以太网通讯简单总结
- KerGNNs:结合Graph kernels的可解释GNN
- 关于自注意力机制的思考
- 哪个术语描述了服务器软件在专用计算机,计算机网络基础
- android布局共享,布局共享(如所有ACTIVITY拥有相同的布局部分,比如ACTIONBAR,在BASEACTIVITY中写入布局)...
- cytocape绘图(三)
- 零基础入门学习Python(12)-元组tuple