pandas–数据分析处理库
pandas是基于numpy构建的,为时间序列分析提供了很好的支持。pandas中有两个主要的数据结构,一个是Series,另一个是DataFrame。

  1. 导入pandas库,打开csv文件
    import pandas
    food_info = pandas.read_csv(“food_info.csv”)
    print(type(food_info)) —<class ‘pandas.core.frame.DataFrame’> #查看文件的格式
    #print(food_info.dtypes) #查看每一列数据的格式

  2. 使用函数head( m )来读取前m条数据,如果没有参数m,默认读取前五条数据;由于DataFrame包含了很多的行和列,Pandas使用省略号(…)来代替显示全部的行和列,可以使用colums属性来显示全部的列名;与Numpy一样,用shape属性来显示数据的格式。
    tail(n)-----读取数据后n行
    shape-----显示当前有多少样本,以及样本有多少个指标(列)
    first_rows = food_info.head()
    print(first_rows)
    print(food_info.head(3))
    print(food_info.columns)
    print(food_info.shape)

  3. Pandas使用loc[]方法来选择行的数据(当超出索引值,将报错)
    print(food_info.loc[0]) #取第一个数据
    print(food_info.loc[6]) #取第七个数据
    print(food_info.loc[8620]) #报错

  4. #object - For string values object----在pandas中就是string类型
    #int - For integer values
    #float - For float values
    #datetime - For time values
    #bool - For Boolean values
    print(food_info.dtypes) #输出所有列的字符类型

  5. 返回一个DataFrame,其中包含索引3、4、5和6处的行。
    print(food_info.loc[3:6]) #取第3,4,5,6行数据

    返回一个DataFrame,其中包含索引2、5和10处的行(两个方法可以实现)
    方法一:two_five_ten = [2,5,10]
    print(food_info.loc[two_five_ten])
    方法二:two_five_ten = [2,5,10]
    print(food_info.loc[[2,5,10]])

  6. 表示“NDB_No”列的Series对象
    ndb_col = food_info[“NDB_No”]
    print(ndb_col)
    或者,可以通过传入字符串变量来访问列。
    col_name = “NDB_No”
    ndb_col = food_info[col_name]
    print(ndb_col)

  7. 取指定两列的值
    columns = [“Zinc_(mg)”, “Copper_(mg)”]
    zinc_copper = food_info[columns]
    print(zinc_copper)

或者这样也可以实现
zinc_copper = food_info[[“Zinc_(mg)”, “Copper_(mg)”]]
print(zinc_copper)

  1. 可以使用tolist()函数转化为list
    print(food_info.columns) #输出所有列
    print(food_info.head(2)) #输出前两行

    col_names = food_info.columns.tolist() #输出所有列
    print(col_names)

  2. 输出所有以g结尾的列的前三行
    gram_columns = []

for c in col_names:
if c.endswith("(g)"):
gram_columns.append©
gram_df = food_info[gram_columns]
print(gram_df.head(3))

day6--pandas相关推荐

  1. 机器学习-数据科学库-day6

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 机器学习-数据科学库-day6 pandas学习 动手练习 pandas中的时间序列 生成一段时间范围 关于频率的更多缩写 在Data ...

  2. python学习_day7---数据分析matplotlib+pandas

    文章目录 一.matplotlib 1.柱状图 2.直方图 3.饼状图 4.雷达图 二.pandas 1.DataFrame 1>DataFrame的创建 2>Datafram的属性 2. ...

  3. Pandas 使用入门

    Pandas 简介 运行环境 jupyter notebook python 3.6 pandas '0.20.3' matplotlib '2.1.0' 学习目标: * 大致了解 pandas 库的 ...

  4. modin pandas 加速

    20211203 https://blog.csdn.net/BF02jgtRS00XKtCx/article/details/108988757 利用swifter加速apply Modin是一个P ...

  5. 利用pandas读写HDF5文件

    一.简介 HDF5(Hierarchical Data Formal)是用于存储大规模数值数据的较为理想的存储格式,文件后缀名为h5,存储读取速度非常快,且可在文件内部按照明确的层次存储数据,同一个H ...

  6. pandas dataframe 删除带空值的行 各种空值 (dropna()、isna()、isnull()、fillna())

    假设拿到一个10万行的数据后,通过isnull我们发现某列有几个空值,要把该列空值所在行删除怎么操作?用dropna()会删除所有有空值的行,请看下面实例. 区分 None,null,NULL,nan ...

  7. pandas以前笔记

    # -*- coding: utf-8 -*- """ Created on Sat Jul 21 20:06:20 2018@author: heimi "& ...

  8. pandas dataframe 字符映射为数字

    在机器学习中对于有序的类别型变量可以不采用onehot编码,直接使用有序数字代替即可,这个目的可以在pandas中使用map方法实现. import pandas as pd 创建数据框 raw_da ...

  9. pandas如何读取一个文件夹下的所有文件

    from os import walk import pandas as pd dataframe_list = [] #walk会返回3个参数,分别是路径,目录list,文件list,你可以按需修改 ...

  10. python pandas 如何找到NaN、缺失值或者某些元素的索引名称以及位置,np.where的使用

    我们在处理数据的时候,经常需要检查数据的质量,也需要知道出问题的数据在哪个位置.我找了很久,也尝试了很多办法,都没能找到一种非常直接的函数,本文所要介绍的是一种我认为比较方便的方法:np.where( ...

最新文章

  1. 虚拟机上安装ArchLinux笔记
  2. windows笔记-内存映射文件
  3. [Ynoi2019模拟赛]Yuno loves sqrt technology II
  4. 站长必看系列:完全揭密百度和谷歌收录规律
  5. C++基类和派生类的构造函数(一)
  6. 这个省到2025年,PUE>1.3存量大型数据中心将全部腾退关停!
  7. Python Selenium 常用方法总结
  8. 我们一定要有自立的飞秋觉悟
  9. 6.3.1遍历二叉树
  10. 计算机毕设 ai_2020年计算机人工智能方向保研经历分享(南大,复旦,中科院计算所)...
  11. 机器学习常用算法总结
  12. 用HTML写会员注册页面
  13. 计算机图形学的学习心得,计算机图形学学习心得
  14. 单片机备用电池供电电路_单片机usb供电电路原理图详解
  15. 什么是智能建筑,智能建筑系统主要有哪几部分组成?
  16. 时序逻辑领域的开拓者
  17. 10分钟入门Python,花5小时写了7个案例和这篇文章值得收藏
  18. Windows凭据管理器
  19. 卸载神器——IObit Uninstaller
  20. 辐射避难所ol服务器维护,辐射避难所Online8月3日更新内容 育普雷斯顿up卡池

热门文章

  1. json 转换 java odl_opendaylight:如何查看配置数据库
  2. 谷粒商城:06. 前端开发基础知识
  3. PS使用:解决图片使用PS打开提示无法完成请求,因为找到不知名的或无效的JPEG标志符类型
  4. Java关键字this与super的用法详解
  5. 深度学习笔记_基本概念_Depthwise卷积与Pointwise卷积
  6. 吴恩达教授机器学习课程学习【一】- 线性回归(1)
  7. 关于AfxMessageBox没有重载函数
  8. 用 C# 做人脸检测(基于EmguCV)
  9. 【Unity】Geometry Shader实现
  10. jackson的简单实用实例(json)