python数据分析处理库-Pandas
1、读取数据
import pandas
food_info = pandas.read_csv("food_info.csv")
print(type(food_info)) # <class 'pandas.core.frame.DataFrame'>
2、数据类型
3、数据显示
food_info.head() # 显示读取数据的前5行
food_info.head(3) # 显示读取数据的前3行
food_info.tail(3) # 显示读取数据的后3行
food_info.columns # 列名
food_indo.shape # 数据规格
food_info.loc[0] # 第0行数据
food_info.loc[3:6] # 第3-6行数据
food_info.log[83,"NDB_No"] # 读取第83行的NDB_No数据
food_info["NDB_No"] # 通过列名读取列
columns = ["Zinc_(mg)", "Copper_(mg)"]
food_info[columns] # 读取多个列# 读取单位为g的列
col_names = food_info.columns.tolist() # 列名
gram_columns = []
for c in col_names:if c.endswith("(g)"):gram_columns.append(c)
gram_df = food_info[gram_columns]
4、数据操作
# 对该列每一个值都除以1000,+-*同理
food_info["Iron_(mg)"] / 1000
# 维度相同的列对应元素相乘
water_energy = food_info["Water_(g)"] * food_info["Energ_Kcal"]
# 添加新的一列
iron_grams = food_info["Iron_(mg)"] / 1000
food_info["Iron_(g)"] = iron_grams
# 最大值
food_info["Energ_Kcal"].max()
# 排序 inplace-是否新生成一个DataFrame ascending-默认为True
food_info.sort_values("Sodium_(mg)", inplace=True, ascending=False)
# 将排序后的数据的索引值重置,生成新的索引
new_titanic_survival = titanic_survival.sort_values("Age",ascending=False)
new_titanic_survival.reset_index(drop=True)
5、缺失值处理
# 缺失值
pd.isnull(age)
titanic_survival["Age"].mean() # 去掉缺失值后的平均值#去掉含有缺失值的数据
titanic_survival.dropna(axis=1) # 丢掉含有缺失值的列
titanic_survival.dropna(axis=0,subset=["Age", "Sex"]) # 丢掉"Age"与"Sex"中含有缺失值的行
6、简单的统计函数
# 统计在不同船舱中获救人数的平均值 aggfunc-默认为求均值
passenger_survival = titanic_survival.pivot_table(index="Pclass", values="Survived", aggfunc=np.mean)
7、自定义函数
# 返回行值
def hundredth_row(column):# Extract the hundredth itemhundredth_item = column.loc[99]return hundredth_item
hundredth_row = titanic_survival.apply(hundredth_row)# 置换列值
def which_class(row):pclass = row['Pclass']if pd.isnull(pclass):return "Unknown"elif pclass == 1:return "First Class"elif pclass == 2:return "Second Class"elif pclass == 3:return "Third Class"
classes = titanic_survival.apply(which_class, axis=1)
8、Series结构
from pandas import Series
series_custom = Series(rt_scores , index=film_names)
series_custom[['Minions (2015)', 'Leviathan (2014)']]
转载于:https://www.cnblogs.com/hgc-bky/p/9914207.html
python数据分析处理库-Pandas相关推荐
- 01、python数据分析与机器学习实战——python数据分析处理库-Pandas
pandas介绍 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的. Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具. panda ...
- python数据分析库pandas-三、: python数据分析处理库-Pandas
本节内容: Pandas数据读取 Pandas索引与计算 Pandas数据预处理实例 Pandas常用预处理方法 Pandas自定义函数 Series结构 1.Pandas数据读取 import pa ...
- Python数据分析扩展库pandas的DataFrame排序方法小结
>>> import numpy as np >>> import pandas as pd # 创建DataFrame >>> df = pd. ...
- 3.python数据分析处理库pandas(学习笔记)
1.数据的读取 import pandas food_info = pandas.read_csv("food_info.csv")#由于代码和数据是存在于同一文件夹下,所以不用指 ...
- python数据分析的钥匙——pandas库
目录 系列文章目录 一. 关于pandas库: 二. pandas库的安装 三. pandas的两种基本数据结构--Series 与 DataFrame(附代码) 四. pandas库的应用(附代码) ...
- python数据分析第三方库是_python数据分析复盘——数据分析相关库之Pandas
编辑推荐: 本文来源csdn,本文主要对Python的第三方库Pandas,进行高性能易用数据类型和分析. 1.Pandas 简介 1.1 pandas是什么 Pandas是Python第三方库,提供 ...
- Python数据分析入门之pandas基础总结
Pandas--"大熊猫"基础 Series Series: pandas的长枪(数据表中的一列或一行,观测向量,一维数组...) Series1 = pd.Series(np.r ...
- Python 数据分析三剑客之 Pandas(九):时间序列
CSDN 课程推荐:<迈向数据科学家:带你玩转Python数据分析>,讲师齐伟,苏州研途教育科技有限公司CTO,苏州大学应用统计专业硕士生指导委员会委员:已出版<跟老齐学Python ...
- Python 数据分析三剑客之 Pandas(一):认识 Pandas 及其 Series、DataFrame 对象
CSDN 课程推荐:<迈向数据科学家:带你玩转Python数据分析>,讲师齐伟,苏州研途教育科技有限公司CTO,苏州大学应用统计专业硕士生指导委员会委员:已出版<跟老齐学Python ...
最新文章
- block用法(转)
- Linux常用命令(2)
- 【 Vivado 】在工程模式下通过jou文件来学习 Tcl 命令
- 学习Key与Value的集合hashtable
- Fragment 底部菜单栏
- linux 云主机 卡顿 排查过程
- IntelliJ IDEA 2017 注册方法
- shiro 散列加盐(salt) 次数的效果
- SVN在另类环境中实现自动提交的方法
- 一个小技巧,让您的ABAP OPEN SQL具有自描述效果
- 技术选型:Sentinel vs Hystrix
- 亲密接触VC6.0编译器
- jrtplib的编译方法
- Java线程之生命周期
- 使用简单的缓存提高程序执行速度
- java版spring cloud+spring boot+redis社交电子商务平台-docker-feign配置(五)
- FPGA(FIR)数字信号处理
- 优雅的监听软键盘隐藏
- ubuntu20.04 wps安装流程及问题解决
- 【Cocos Creator】 编辑器自定义 ——下拉列表属性、滑动条属性等
热门文章
- 使用docker安装mysql数据库(超简单)
- antv G2 折线图遇到的坑
- 东北大学 人机交互 复习笔记
- iReport 相关资料汇总
- 雨松MOMO 之 开始学习搭建界面自适应屏幕(一)
- 【动网论坛7.1 sp1 修改】-修改发帖所贴的图的大小
- aws python sns_手把手教你用Python抓取AWS的日志(CloudTrail)数据
- Oracle数据库中分区表的操作方法
- 通过matlab将二维图片序列进行三维立体重建(包含仿真录像)
- python36.dll下载_DWSPY36.dll,下载,简介,描述,修复,等相关问题一站搞定_DLL之家