机器学习中常用的高级数据结构和数据分析包工具——pandas
https://www.toutiao.com/a6547880764996846087/
现在有一个csv文件,内部数据为:
使用pandas.read_cvs来读取cvs文件数据,其中food_info为DataFrame类型,这个是pandas的核心结构,food_info.dtypes可以看出来从文件中读取出来数据的类型,其中object为字符型
显示读取的数据,从头开始显示,和从尾开始显示
head(3)为重头开始显示3行,如果不指定显示几行那么默认显示五行,tail为从尾部开始显示,如果不指定则默认显示5行
也可以通过函数loc来获取指定行的数据
获取第三行数据,当然取数据也可以通过切片的方式来获取数据
通过切片获取第3行到第7行的数据,也可以取指定的多行,通过列表的方式指定索引,指定所要取的第几行
上面的读取是从行的角度,还可以从列的角度来读取一列数据,通过列名,DataFrame默认文件中最上面的一行为列名
可以看出通过列名NDB_No获取到了该列的数据,如果指获取一个列那么就只需要一个列明,如果想要获取多个列那么就可以通过列表传递多个列名,获取多个列的数据
获取所有列中单位以mg为单位的列
程序思想是,获取所有的列名,然后遍历,看哪一个是以mg结尾的,哪个是
food_info.columns.tolist()为获取所有的列名封装成一个列表
获取到列数据之后,除以一个数等于列中所有数据除以这个数,返回一个新的列
加减乘除一个数就是这个列的所有数据同时加减乘除这个数
两个相同样本维度的列相乘等于对应位置的相乘
两个相同样本维度的列的加减乘除等于对应位置的加减乘除
添加一个新的列,方法就是DataFrame[新列名]=列
上面可以看出我们添加了一个列名为37的列,其内容是Icon和Icon1这两个列的乘积,可以看出新的列添加完成之后,该DataFrame的列为37比之前的36多了一列
可以通过max()和min()方法,求出当前列的最值
排序
使用sort_values进行指定列的从小到大的排序,其中第一个参数为所要排序的列。第二个参数为inplace=“true”这个意思是排序之后的结果是否保存到当前的DataFrame中,默认为false,如果设置为true那就是保存到当前的DataFrame中,所以我们可以直接输出food_info看到排序之后的结果
默认是从小到大的排序,可以通过增加参数ascending=False来实现
ascending=False写的时候写成ascending=“False”没有效果,所以这种真假以后就全用首字母大写,且不加引号
机器学习中常用的高级数据结构和数据分析包工具——pandas相关推荐
- AI:人工智能概念之机器学习中常用算法的思维导图集合(非常经典、建议收藏)之详细攻略
AI:人工智能概念之机器学习中常用算法的思维导图集合(非常经典.建议收藏)之详细攻略 目录 机器学习算法的思维导图集合 1.ML算法思维图 2.ML算法思维导图 相关文章:ML/DL:关于算法模型的选 ...
- 机器学习中常用的优化算法:
http://blog.csdn.net/losteng/article/details/50993911 有知识点和代码的实现过程. 机器学习中常用的优化算法: 1.梯度下降法 2.牛顿法和拟牛顿法 ...
- 机器学习百页书:机器学习中常用到的一些数学符号
一本精简的机器学习入门手册.机器学习百页书<机器学习精讲>,人工智能的核心是机器学习,本书囊括机器学习的精髓,系统而精炼地讲解机器学习的基本原理.本书英文版一经推出,就长期位于亚马逊机器学 ...
- Dataset:机器学习中常用数据集下载链接集合之详细攻略
Dataset:机器学习中常用数据集下载链接集合之详细攻略 目录 机器学习中常用数据集下载链接集合之详细攻略 sklearn.datasets数据集所有csv文件集合 seaborn-data数据集所 ...
- 机器学习中常用的评价指标(Performance Measures)
机器学习中常用的评价指标 混淆矩阵 混淆矩阵也称误差矩阵,是表示精度评价的一种标准格式,用n行n列的矩阵形式来表示.具体评价指标有总体精度.制图精度.用户精度等,这些精度指标从不同的侧面反映了图像分类 ...
- 机器学习中常用的核函数
在机器学习中常用的核函数,一般有这么几类,也就是LibSVM中自带的这几类: 1) 线性: 2) 多项式: 3) Radial basis function: 4) Sigmoid: 举例:有一个一维 ...
- 机器学习中常用的基本概念
目录 1. 机器学习定义 2. 机器学习中的属性与特征 3.误差 4.过拟合与欠拟合 4.1 过拟合 4.2欠拟合 5.交叉验证 5.1交叉验证基本思想 5.2 交叉验证训练过程 6.调参 7. 机器 ...
- 数据分析---数据处理工具pandas(二)
文章目录 数据分析---数据处理工具pandas(二) 一.Pandas数据结构Dataframe:基本概念及创建 1.DataFrame简介 2.创建Dataframe (1)方法一:由数组/lis ...
- 入门|机器学习中常用的损失函数你知多少?
本文作者将常用的损失函数分为了两大类:分类和回归.然后又分别对这两类进行了细分和讲解,其中回归中包含了一种不太常见的损失函数:平均偏差误差,可以用来确定模型中存在正偏差还是负偏差. 机器通过损失函数进 ...
最新文章
- EntityCURD操作的参数和返回值
- vue vue-router vuex element-ui axios 的学习笔记(七)完善登录注册
- HTC推出新款VR头显,奇怪的是只在日本销售
- 《编码:隐匿在计算机软硬件背后的语言(美)》读书笔记三
- Git remote 修改源
- python flask框架教程_Flask框架从入门到实战
- 关于swiper的tab(选项卡)中设置了autoHeight没有效果解决
- 被关起来日子的流水帐
- 学一学番茄风控独创的体系内容
- 浏览器的不兼容,归纳几点html编码要素
- 目前最完整的前端框架 Vue.js 全面介绍
- mysql 查询一年中每个月份的数据量
- windows驱动安装卸载的实用小工具-InstDrv.exe
- linux下python网络编程框架-twisted安装手记,linux下Python网络编程框架-Twisted安装
- jacob将WORD转换成PDF文件(要装有Word另存为PDF文件的插件)
- Python 关键字(keyword)
- mysql虚拟列表_动态网页制作-官方版合集下载-多特
- 研究将有pid和id的ListMapString,Map组成树
- 盐城范围内野外钓鱼好去处(不是塘钓哟)
- Python Train_使用隐马尔可夫模型进行音乐流派分类的Python实现