1、读取数据

import pandas
food_info = pandas.read_csv("food_info.csv")
print(type(food_info)) # <class 'pandas.core.frame.DataFrame'>

2、数据类型

3、数据显示

food_info.head() # 显示读取数据的前5行
food_info.head(3) # 显示读取数据的前3行
food_info.tail(3) # 显示读取数据的后3行
food_info.columns # 列名
food_indo.shape # 数据规格
food_info.loc[0] # 第0行数据
food_info.loc[3:6] # 第3-6行数据
food_info.log[83,"NDB_No"] # 读取第83行的NDB_No数据
food_info["NDB_No"] # 通过列名读取列
columns = ["Zinc_(mg)", "Copper_(mg)"]
food_info[columns] # 读取多个列# 读取单位为g的列
col_names = food_info.columns.tolist() # 列名
gram_columns = []
for c in col_names:if c.endswith("(g)"):gram_columns.append(c)
gram_df = food_info[gram_columns]

4、数据操作

# 对该列每一个值都除以1000,+-*同理
food_info["Iron_(mg)"] / 1000
# 维度相同的列对应元素相乘
water_energy = food_info["Water_(g)"] * food_info["Energ_Kcal"]
# 添加新的一列
iron_grams = food_info["Iron_(mg)"] / 1000
food_info["Iron_(g)"] = iron_grams
# 最大值
food_info["Energ_Kcal"].max()
# 排序 inplace-是否新生成一个DataFrame ascending-默认为True
food_info.sort_values("Sodium_(mg)", inplace=True, ascending=False)
# 将排序后的数据的索引值重置,生成新的索引
new_titanic_survival = titanic_survival.sort_values("Age",ascending=False)
new_titanic_survival.reset_index(drop=True)

5、缺失值处理

# 缺失值
pd.isnull(age)
titanic_survival["Age"].mean() # 去掉缺失值后的平均值#去掉含有缺失值的数据
titanic_survival.dropna(axis=1)    # 丢掉含有缺失值的列
titanic_survival.dropna(axis=0,subset=["Age", "Sex"]) # 丢掉"Age"与"Sex"中含有缺失值的行

6、简单的统计函数

# 统计在不同船舱中获救人数的平均值 aggfunc-默认为求均值
passenger_survival = titanic_survival.pivot_table(index="Pclass", values="Survived", aggfunc=np.mean)

7、自定义函数

# 返回行值
def hundredth_row(column):# Extract the hundredth itemhundredth_item = column.loc[99]return hundredth_item
hundredth_row = titanic_survival.apply(hundredth_row)# 置换列值
def which_class(row):pclass = row['Pclass']if pd.isnull(pclass):return "Unknown"elif pclass == 1:return "First Class"elif pclass == 2:return "Second Class"elif pclass == 3:return "Third Class"
classes = titanic_survival.apply(which_class, axis=1)

8、Series结构

from pandas import Series
series_custom = Series(rt_scores , index=film_names)
series_custom[['Minions (2015)', 'Leviathan (2014)']]

  

转载于:https://www.cnblogs.com/hgc-bky/p/9914207.html

python数据分析处理库-Pandas相关推荐

  1. 01、python数据分析与机器学习实战——python数据分析处理库-Pandas

    pandas介绍 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的. Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具. panda ...

  2. python数据分析库pandas-三、: python数据分析处理库-Pandas

    本节内容: Pandas数据读取 Pandas索引与计算 Pandas数据预处理实例 Pandas常用预处理方法 Pandas自定义函数 Series结构 1.Pandas数据读取 import pa ...

  3. Python数据分析扩展库pandas的DataFrame排序方法小结

    >>> import numpy as np >>> import pandas as pd # 创建DataFrame >>> df = pd. ...

  4. 3.python数据分析处理库pandas(学习笔记)

    1.数据的读取 import pandas food_info = pandas.read_csv("food_info.csv")#由于代码和数据是存在于同一文件夹下,所以不用指 ...

  5. python数据分析的钥匙——pandas库

    目录 系列文章目录 一. 关于pandas库: 二. pandas库的安装 三. pandas的两种基本数据结构--Series 与 DataFrame(附代码) 四. pandas库的应用(附代码) ...

  6. python数据分析第三方库是_python数据分析复盘——数据分析相关库之Pandas

    编辑推荐: 本文来源csdn,本文主要对Python的第三方库Pandas,进行高性能易用数据类型和分析. 1.Pandas 简介 1.1 pandas是什么 Pandas是Python第三方库,提供 ...

  7. Python数据分析入门之pandas基础总结

    Pandas--"大熊猫"基础 Series Series: pandas的长枪(数据表中的一列或一行,观测向量,一维数组...) Series1 = pd.Series(np.r ...

  8. Python 数据分析三剑客之 Pandas(九):时间序列

    CSDN 课程推荐:<迈向数据科学家:带你玩转Python数据分析>,讲师齐伟,苏州研途教育科技有限公司CTO,苏州大学应用统计专业硕士生指导委员会委员:已出版<跟老齐学Python ...

  9. Python 数据分析三剑客之 Pandas(一):认识 Pandas 及其 Series、DataFrame 对象

    CSDN 课程推荐:<迈向数据科学家:带你玩转Python数据分析>,讲师齐伟,苏州研途教育科技有限公司CTO,苏州大学应用统计专业硕士生指导委员会委员:已出版<跟老齐学Python ...

最新文章

  1. block用法(转)
  2. Linux常用命令(2)
  3. 【 Vivado 】在工程模式下通过jou文件来学习 Tcl 命令
  4. 学习Key与Value的集合hashtable
  5. Fragment 底部菜单栏
  6. linux 云主机 卡顿 排查过程
  7. IntelliJ IDEA 2017 注册方法
  8. shiro 散列加盐(salt) 次数的效果
  9. SVN在另类环境中实现自动提交的方法
  10. 一个小技巧,让您的ABAP OPEN SQL具有自描述效果
  11. 技术选型:Sentinel vs Hystrix
  12. 亲密接触VC6.0编译器
  13. jrtplib的编译方法
  14. Java线程之生命周期
  15. 使用简单的缓存提高程序执行速度
  16. java版spring cloud+spring boot+redis社交电子商务平台-docker-feign配置(五)
  17. FPGA(FIR)数字信号处理
  18. 优雅的监听软键盘隐藏
  19. ubuntu20.04 wps安装流程及问题解决
  20. 【Cocos Creator】 编辑器自定义 ——下拉列表属性、滑动条属性等

热门文章

  1. 使用docker安装mysql数据库(超简单)
  2. antv G2 折线图遇到的坑
  3. 东北大学 人机交互 复习笔记
  4. iReport 相关资料汇总
  5. 雨松MOMO 之 开始学习搭建界面自适应屏幕(一)
  6. 【动网论坛7.1 sp1 修改】-修改发帖所贴的图的大小
  7. aws python sns_手把手教你用Python抓取AWS的日志(CloudTrail)数据
  8. Oracle数据库中分区表的操作方法
  9. 通过matlab将二维图片序列进行三维立体重建(包含仿真录像)
  10. python36.dll下载_DWSPY36.dll,下载,简介,描述,修复,等相关问题一站搞定_DLL之家