https://www.toutiao.com/a6547880764996846087/

现在有一个csv文件,内部数据为:

使用pandas.read_cvs来读取cvs文件数据,其中food_info为DataFrame类型,这个是pandas的核心结构,food_info.dtypes可以看出来从文件中读取出来数据的类型,其中object为字符型

显示读取的数据,从头开始显示,和从尾开始显示

head(3)为重头开始显示3行,如果不指定显示几行那么默认显示五行,tail为从尾部开始显示,如果不指定则默认显示5行

也可以通过函数loc来获取指定行的数据

获取第三行数据,当然取数据也可以通过切片的方式来获取数据

通过切片获取第3行到第7行的数据,也可以取指定的多行,通过列表的方式指定索引,指定所要取的第几行

上面的读取是从行的角度,还可以从列的角度来读取一列数据,通过列名,DataFrame默认文件中最上面的一行为列名

可以看出通过列名NDB_No获取到了该列的数据,如果指获取一个列那么就只需要一个列明,如果想要获取多个列那么就可以通过列表传递多个列名,获取多个列的数据

获取所有列中单位以mg为单位的列

程序思想是,获取所有的列名,然后遍历,看哪一个是以mg结尾的,哪个是

food_info.columns.tolist()为获取所有的列名封装成一个列表

获取到列数据之后,除以一个数等于列中所有数据除以这个数,返回一个新的列

加减乘除一个数就是这个列的所有数据同时加减乘除这个数

两个相同样本维度的列相乘等于对应位置的相乘

两个相同样本维度的列的加减乘除等于对应位置的加减乘除

添加一个新的列,方法就是DataFrame[新列名]=列

上面可以看出我们添加了一个列名为37的列,其内容是Icon和Icon1这两个列的乘积,可以看出新的列添加完成之后,该DataFrame的列为37比之前的36多了一列

可以通过max()和min()方法,求出当前列的最值


排序

使用sort_values进行指定列的从小到大的排序,其中第一个参数为所要排序的列。第二个参数为inplace=“true”这个意思是排序之后的结果是否保存到当前的DataFrame中,默认为false,如果设置为true那就是保存到当前的DataFrame中,所以我们可以直接输出food_info看到排序之后的结果

默认是从小到大的排序,可以通过增加参数ascending=False来实现

ascending=False写的时候写成ascending=“False”没有效果,所以这种真假以后就全用首字母大写,且不加引号

机器学习中常用的高级数据结构和数据分析包工具——pandas相关推荐

  1. AI:人工智能概念之机器学习中常用算法的思维导图集合(非常经典、建议收藏)之详细攻略

    AI:人工智能概念之机器学习中常用算法的思维导图集合(非常经典.建议收藏)之详细攻略 目录 机器学习算法的思维导图集合 1.ML算法思维图 2.ML算法思维导图 相关文章:ML/DL:关于算法模型的选 ...

  2. 机器学习中常用的优化算法:

    http://blog.csdn.net/losteng/article/details/50993911 有知识点和代码的实现过程. 机器学习中常用的优化算法: 1.梯度下降法 2.牛顿法和拟牛顿法 ...

  3. 机器学习百页书:机器学习中常用到的一些数学符号

    一本精简的机器学习入门手册.机器学习百页书<机器学习精讲>,人工智能的核心是机器学习,本书囊括机器学习的精髓,系统而精炼地讲解机器学习的基本原理.本书英文版一经推出,就长期位于亚马逊机器学 ...

  4. Dataset:机器学习中常用数据集下载链接集合之详细攻略

    Dataset:机器学习中常用数据集下载链接集合之详细攻略 目录 机器学习中常用数据集下载链接集合之详细攻略 sklearn.datasets数据集所有csv文件集合 seaborn-data数据集所 ...

  5. 机器学习中常用的评价指标(Performance Measures)

    机器学习中常用的评价指标 混淆矩阵 混淆矩阵也称误差矩阵,是表示精度评价的一种标准格式,用n行n列的矩阵形式来表示.具体评价指标有总体精度.制图精度.用户精度等,这些精度指标从不同的侧面反映了图像分类 ...

  6. 机器学习中常用的核函数

    在机器学习中常用的核函数,一般有这么几类,也就是LibSVM中自带的这几类: 1) 线性: 2) 多项式: 3) Radial basis function: 4) Sigmoid: 举例:有一个一维 ...

  7. 机器学习中常用的基本概念

    目录 1. 机器学习定义 2. 机器学习中的属性与特征 3.误差 4.过拟合与欠拟合 4.1 过拟合 4.2欠拟合 5.交叉验证 5.1交叉验证基本思想 5.2 交叉验证训练过程 6.调参 7. 机器 ...

  8. 数据分析---数据处理工具pandas(二)

    文章目录 数据分析---数据处理工具pandas(二) 一.Pandas数据结构Dataframe:基本概念及创建 1.DataFrame简介 2.创建Dataframe (1)方法一:由数组/lis ...

  9. 入门|机器学习中常用的损失函数你知多少?

    本文作者将常用的损失函数分为了两大类:分类和回归.然后又分别对这两类进行了细分和讲解,其中回归中包含了一种不太常见的损失函数:平均偏差误差,可以用来确定模型中存在正偏差还是负偏差. 机器通过损失函数进 ...

最新文章

  1. EntityCURD操作的参数和返回值
  2. vue vue-router vuex element-ui axios 的学习笔记(七)完善登录注册
  3. HTC推出新款VR头显,奇怪的是只在日本销售
  4. 《编码:隐匿在计算机软硬件背后的语言(美)》读书笔记三
  5. Git remote 修改源
  6. python flask框架教程_Flask框架从入门到实战
  7. 关于swiper的tab(选项卡)中设置了autoHeight没有效果解决
  8. 被关起来日子的流水帐
  9. 学一学番茄风控独创的体系内容
  10. 浏览器的不兼容,归纳几点html编码要素
  11. 目前最完整的前端框架 Vue.js 全面介绍
  12. mysql 查询一年中每个月份的数据量
  13. windows驱动安装卸载的实用小工具-InstDrv.exe
  14. linux下python网络编程框架-twisted安装手记,linux下Python网络编程框架-Twisted安装
  15. jacob将WORD转换成PDF文件(要装有Word另存为PDF文件的插件)
  16. Python 关键字(keyword)
  17. mysql虚拟列表_动态网页制作-官方版合集下载-多特
  18. 研究将有pid和id的ListMapString,Map组成树
  19. 盐城范围内野外钓鱼好去处(不是塘钓哟)
  20. Python Train_使用隐马尔可夫模型进行音乐流派分类的Python实现

热门文章

  1. numpy meshgrid用法
  2. ORACLE EXP命令
  3. 图灵奖得主Geoffrey Hinton:脱缰的无监督学习,将带来什么
  4. 智源论坛 | 智能处理器探索(3月21日)
  5. 都说过了,它跟蛇没关系
  6. 一个数学系毕业的物理学家,是怎么拿到诺贝尔化学奖的?
  7. 深入理解神经网络之逻辑回归
  8. 他给女朋友做了个树莓派复古相机,算法代码可自己编写,成本不到700元
  9. 收藏 | 数据分析师最常用的10个机器学习算法!(附图解)
  10. Deepfake让罗伯特·德尼罗用流利的德语表演台词!差点忘了他是美国人