1、读取数据

import pandas
food_info = pandas.read_csv("food_info.csv")
print(type(food_info)) # <class 'pandas.core.frame.DataFrame'>

2、数据类型

类型 描述
object 字符串
int 整数
float 浮点数
datatime 时间
bool 布尔型
Series 数据读取进来后的其中一行或一列
DataFrame 数据读取进来的矩阵形式

3、数据显示

food_info.head() # 显示读取数据的前5行
food_info.head(3) # 显示读取数据的前3行
food_info.tail(3) # 显示读取数据的后3行
food_info.columns # 列名
food_indo.shape # 数据规格
food_info.loc[0] # 第0行数据
food_info.loc[3:6] # 第3-6行数据
food_info.log[83,"NDB_No"] # 读取第83行的NDB_No数据
food_info["NDB_No"] # 通过列名读取列
columns = ["Zinc_(mg)", "Copper_(mg)"]
food_info[columns] # 读取多个列# 读取单位为g的列
col_names = food_info.columns.tolist() # 列名
gram_columns = []
for c in col_names:if c.endswith("(g)"):gram_columns.append(c)
gram_df = food_info[gram_columns]

4、数据操作

# 对该列每一个值都除以1000,+-*同理
food_info["Iron_(mg)"] / 1000
# 维度相同的列对应元素相乘
water_energy = food_info["Water_(g)"] * food_info["Energ_Kcal"]
# 添加新的一列
iron_grams = food_info["Iron_(mg)"] / 1000
food_info["Iron_(g)"] = iron_grams
# 最大值
food_info["Energ_Kcal"].max()
# 排序 inplace-是否新生成一个DataFrame ascending-默认为True
food_info.sort_values("Sodium_(mg)", inplace=True, ascending=False)
# 将排序后的数据的索引值重置,生成新的索引
new_titanic_survival = titanic_survival.sort_values("Age",ascending=False)
new_titanic_survival.reset_index(drop=True)

5、缺失值处理

# 缺失值
pd.isnull(age)
titanic_survival["Age"].mean() # 去掉缺失值后的平均值#去掉含有缺失值的数据
titanic_survival.dropna(axis=1)    # 丢掉含有缺失值的列
titanic_survival.dropna(axis=0,subset=["Age", "Sex"]) # 丢掉"Age"与"Sex"中含有缺失值的行

6、简单的统计函数

# 统计在不同船舱中获救人数的平均值 aggfunc-默认为求均值
passenger_survival = titanic_survival.pivot_table(index="Pclass", values="Survived", aggfunc=np.mean)

7、自定义函数

# 返回行值
def hundredth_row(column):# Extract the hundredth itemhundredth_item = column.loc[99]return hundredth_item
hundredth_row = titanic_survival.apply(hundredth_row)# 置换列值
def which_class(row):pclass = row['Pclass']if pd.isnull(pclass):return "Unknown"elif pclass == 1:return "First Class"elif pclass == 2:return "Second Class"elif pclass == 3:return "Third Class"
classes = titanic_survival.apply(which_class, axis=1)

8、Series结构

from pandas import Series
series_custom = Series(rt_scores , index=film_names)
series_custom[['Minions (2015)', 'Leviathan (2014)']]

数据分析处理库——Pandas相关推荐

  1. 数据分析处理库-Pandas

    Pandas (数据分析处理库) Pandas:纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具.提供了大量能使我们快速便捷地处理数据的函数和方法. 1.Pandas数据读取 1 ...

  2. AI常用框架和工具丨2. 数据分析处理库Pandas

    数据分析处理库Pandas,AI常用框架和工具之一.理论知识结合代码实例,希望对您有所帮助. 文章目录 环境说明 一.Pandas简介 二. Pandas中的数据结构 2.1 Series 2.2 D ...

  3. 01、python数据分析与机器学习实战——python数据分析处理库-Pandas

    pandas介绍 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的. Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具. panda ...

  4. Python基础入门 (四数据分析处理库Pandas应用)

    1.Pandas简介 2.两种数据结构 3.相关操作(索引,查询,统计分析,SQL操作,对缺失值处理,excel的数据透视表功能,多层索引) 1.Pandas简介 Pandas是基于Numpy的一个开 ...

  5. Python数据分析扩展库pandas的DataFrame排序方法小结

    >>> import numpy as np >>> import pandas as pd # 创建DataFrame >>> df = pd. ...

  6. python数据分析处理库-Pandas

    1.读取数据 import pandas food_info = pandas.read_csv("food_info.csv") print(type(food_info)) # ...

  7. python数据分析库pandas-三、: python数据分析处理库-Pandas

    本节内容: Pandas数据读取 Pandas索引与计算 Pandas数据预处理实例 Pandas常用预处理方法 Pandas自定义函数 Series结构 1.Pandas数据读取 import pa ...

  8. 3.python数据分析处理库pandas(学习笔记)

    1.数据的读取 import pandas food_info = pandas.read_csv("food_info.csv")#由于代码和数据是存在于同一文件夹下,所以不用指 ...

  9. 数据分析处理库Pandas——merge操作

    有一列列名相同值也相同 有两列列名相同值也相同 按其中一列合并 按两列合并 有一列列名相同值也相同,有一列列名相同值不相同,按两列合并 列名相同值不相同的行删掉 保留所有行 保留所有行并显示合并后该值 ...

最新文章

  1. 为什么以太网帧的长度最短64字节,最长1518字节?
  2. vs中imshow函数报错_Win7下VS2010中配置Opencv2.4.4的方法(32位和64位都有效)(亲测成功)...
  3. 教程之怎样清理mac系统垃圾
  4. 【C++】 C++标准模板库(十) 双向队列
  5. 手机当电脑麦克风 linux,WO Mic让手机成为电脑的无线麦克风
  6. 可网管交换机的三种管理方式介绍
  7. 宝塔常用的命令大全(直接上官网)
  8. 云存储网关 > 常见问题 > 文件网关 > 文件网关的缓存有什么作用
  9. VSCode如何进入到终端中
  10. python爬取cctalk视频_新媒体编辑怎么批量爬取数据
  11. 最小二乘法、梯度下降法和两者区别
  12. 2000级2班同学聚会邀请函.doc
  13. Matlab 求不规则图形的 内切圆和外接圆 函数
  14. 软件测试缺陷密度的计算方法,如何计算缺陷密度?
  15. Word 2016怎么安装公式编辑器
  16. Promise面试题汇总
  17. 基于Scala设计简易的会员卡管理系统
  18. 耿丹CS16-2班第六次作业汇总
  19. 梅西:世界杯是我最重要的奖杯;很高兴斯卡洛尼能够续约
  20. 习题 4.6 有一个函数:。。。 写程序,输入x的值,输出y相应的值。

热门文章

  1. html实战-制作静态网页
  2. 柯尔特python_柯字取名的含义是什么
  3. 《童梦奇缘-梦幻般的羁绊》第六章-残月
  4. IDES翻译—采购流程中的Enjoy界面
  5. 完美世界《钢的琴》《失恋33天》台湾引关注_0
  6. 给开源社读者的一份信
  7. 《信号与系统》实验-使用 MATLAB 进行生成数字音乐、生成乐器音乐、音乐处理与添加音乐特效(题目)
  8. DNS服务器配置项目,项目3 DNS服务器配置.doc
  9. PAT1108 String复读机
  10. CPU GPU设计工作原理