1 ,pandas 主要作用 :

数据分析

2 ,pandas 底层 :

numpy

3 ,数据准备 : 食品信息

  1. 文件名 : food_info.csv
  2. 文件地址 :
    链接:https://pan.baidu.com/s/11urhuvTzjp5lsC9F3xnY1g
    提取码:a9w9
    复制这段内容后打开百度网盘手机App,操作更方便哦
  3. 数据样本 :
NDB_No,Shrt_Desc,Water_(g),Energ_Kcal,Protein_(g),Lipid_Tot_(g),Ash_(g),Carbohydrt_(g),Fiber_TD_(g),Sugar_Tot_(g),Calcium_(mg),Iron_(mg),Magnesium_(mg),Phosphorus_(mg),Potassium_(mg),Sodium_(mg),Zinc_(mg),Copper_(mg),Manganese_(mg),Selenium_(mcg),Vit_C_(mg),Thiamin_(mg),Riboflavin_(mg),Niacin_(mg),Vit_B6_(mg),Vit_B12_(mcg),Vit_A_IU,Vit_A_RAE,Vit_E_(mg),Vit_D_mcg,Vit_D_IU,Vit_K_(mcg),FA_Sat_(g),FA_Mono_(g),FA_Poly_(g),Cholestrl_(mg)
1001,BUTTER WITH SALT,15.87,717,0.85,81.11,2.11,0.06,0,0.06,24,0.02,2,24,24,643,0.09,0,0,1,0,0.005,0.034,0.042,0.003,0.17,2499,684,2.32,1.5,60,7,51.368,21.021,3.043,215
1002,BUTTER WHIPPED WITH SALT,15.87,717,0.85,81.11,2.11,0.06,0,0.06,24,0.16,2,23,26,659,0.05,0.016,0.004,1,0,0.005,0.034,0.042,0.003,0.13,2499,684,2.32,1.5,60,7,50.489,23.426,3.012,219

4 ,读数据 : 数据查看 ( head )

  1. 代码 : 默认查看前 5 条
import pandasdata = pandas.read_csv("food_info.csv")
data.head()
  1. 结果 :
  2. 代码 : 查看前 2 条
data.head(2)

5 ,数据类型 : DataFrame

  1. 代码 :
import pandasdata = pandas.read_csv("food_info.csv")
print(type(data))
  1. 结果 :
<class 'pandas.core.frame.DataFrame'>

6 ,元素类型 : 字符型是 ( object )

  1. 代码 :
import pandasdata = pandas.read_csv("food_info.csv")
print(data.dtypes)
  1. 结果 : 字符型 ( object )
NDB_No               int64
Shrt_Desc           object
Water_(g)          float64
Energ_Kcal           int64
Protein_(g)        float64
Lipid_Tot_(g)      float64
Ash_(g)            float64
  1. 所有数据类型 :
Pandas - Python
object - string
int    - integer
float  - float
bool   - Boolean

7 ,查看函数的基本用法 : 帮助

  1. 代码 :
help(pandas.read_csv)

8 ,数据查看 :

  1. 前 2 行 :
data.head(2)
  1. 后 2 行 :
data.tail(2)

9 ,获取所有列名 :

cnames = data.columns
print(cnames)结果 :Index(['NDB_No', 'Shrt_Desc', 'Water_(g)',.... 'Cholestrl_(mg)'],dtype='object')

10 ,获取数据形状 :

  1. 查看数据 : 几行几列
cnames = data.shape
print(cnames)结果 :(8618, 36)

11 ,取数据 : 第一条 ( local[0] )

  1. 代码 :
d = data.loc[0]
print(d)
  1. 效果 :

12 ,取数据 : (2,3,4) 条 ( local[2:4] )

  1. 代码 :
d = data.loc[2:4]
print(d)
  1. 效果 :

13 ,取数据 : 一列

d = data["NDB_No"]
print(d)

14 ,取数据 : 多列

d = data[["NDB_No","Shrt_Desc"]]
print(d)

15 ,小案例 : 找到指定的列

  1. 目的 :
    1 ,食品中有很多数据指标
    2 ,有的指标的单位是 g
    3 ,有些是 mg
    4 ,求 : 我只想看那些单位为 g 的指标
  2. 代码 :
# 获取所有列
arr = data.columns.tolist()
# 创建数组,用来存储我们的数据
brr = []
for c in arr:if c.endswith("(g)"):brr.append(c)
# 得到结果
res = data[brr]
print(res)
  1. 结果 :

16 ,小案例 : 数据计算 ( mg -> g )

  1. 先看看所有的 mg :
# 获取所有列
arr = data.columns.tolist()
# 数组,用来存储我们的数据
brr = []
for c in arr:if c.endswith("(mg)"):brr.append(c)
# 得到结果
res = data[brr]
print(res)
  1. 结果 :
  2. 将 mg 转换为 g : 操作 dataframe 就是操作其中的每一个元素
# 获取所有列
arr = data.columns.tolist()
# 数组,用来存储我们的数据
brr = []
for c in arr:if c.endswith("(mg)"):brr.append(c)
# 得到结果
res = data[brr] / 1000
print(res)
  1. 结果 :

17 ,增加列 : 增加数据维度

  1. 目的 :
    1 ,元数据 2 列,新数据 3 列
    2 ,col3 = col1 + col2
  2. 代码 :
arr = data[["Calcium_(mg)","Iron_(mg)"]]
col3 = data["Calcium_(mg)"] + data["Iron_(mg)"]
arr["col3"] = col3
print(arr)
  1. 效果 :
  2. 列数量检查 :
arr = data[["Calcium_(mg)","Iron_(mg)"]]
col3 = data["Calcium_(mg)"] + data["Iron_(mg)"]
print(arr.shape)
arr["col3"] = col3
print(arr.shape)结果 :(8618, 2)(8618, 3)

18 ,聚合函数 : 最小值,最小值,平均值

  1. 最大值,最小值 :
max = a.max()
min = a.min()
  1. 总条数 :
cnt = a.shape[0]
  1. 总和 :
sum = a.sum()
  1. 平均数 : 注意 ( 此函数,不补 0 )
avg = a.mean()
  1. 平均数的小问题 :
  2. 怎么解决 : 填补空缺值
  3. 填补 :
data = pandas.read_csv("sfl.csv")
a = data["a"]
print(a)
b = a.fillna(0)
print(b)
sum = b.sum()
cnt = b.shape[0]
avg = b.mean()print(sum)
print(cnt)
print(avg)
print(sum/cnt)
  1. 结果 :
0    1.0
1    2.0
2    3.0
3    NaN
Name: a, dtype: float64
0    1.0
1    2.0
2    3.0
3    0.0
Name: a, dtype: float64
6.0
4
1.5
1.5

07 ,pandas 基本使用 :读数据,查看数据,数据类型,帮助,列名,数据形状,数据计算,,填补空缺值相关推荐

  1. 数据去重 填补空缺值(拉格朗日)

    此时我是不是该喊一声"我胡汉三又回来啦!!!" 这篇博客容许我摸一下数据清洗的裤脚...... 1.首先. 这是在网上找的数据,一个心脏病的数据集,英文不好的默默打开翻译,被我悄悄 ...

  2. pandas数据清洗:案例详解 fillna函数 填补空缺值

    pandas数据清洗:fillna函数填补空缺值 1 fillna函数简介 2 填补空缺值3种方法 2.1 构建学习数据 2.2 填补特定值 2.3 用前一个非空缺值填充 2.4 用后一个非空缺值填充 ...

  3. 查看tcp 请求中的各个状态数据

    查看tcp请求中的各个状态数据 文章目录 查看tcp请求中的各个状态数据 查看tcp请求中的各个状态数据,如timewait netstat -n |awk '/^tcp/ {++S[$NF]} EN ...

  4. python查看dataframe数据类型_python pandas中DataFrame类型数据操作函数的方法

    python数据分析工具pandas中DataFrame和Series作为主要的数据结构. 本文主要是介绍如何对DataFrame数据进行操作并结合一个实例测试操作函数. 1)查看DataFrame数 ...

  5. pandas笔记(3)——DataFrame数据查看,缺失值,异常值,重复值预处理

    数据情况查看 预览数据前n行 Python中预览数据可以使用head()函数,该函数默认展示前5行. # 查看数据前2行 df.head(2) 查看数据末尾n行 可以使用tail()函数,查看数据末尾 ...

  6. 学习pandas全套代码【超详细】数据查看、输入输出、选取、集成、清洗、转换、重塑、数学和统计方法、排序

    大家早上好,本人姓吴,如果觉得文章写得还行的话也可以叫我吴老师.欢迎大家跟我一起走进数据分析的世界,一起学习! 感兴趣的朋友可以关注我的数据分析专栏,里面有许多优质的文章跟大家分享哦. 本篇博客将会给 ...

  7. 【Pandas学习】读、存excel数据

    目录 一.读数据 二.将df存为excel 1.pandas.DataFrame.to_csv() 函数语法 2.利用 import os 获取保存路径 3.产生新的数据,添加至上述csv文件中已有数 ...

  8. 读懂GSnet(一):pandas读取pkl格式的多维数组,可视化理解时空数据

    GSNet数据解读 原始数据 1. `all_data.pkl` 2. `risk_mask.pkl` 3. `risk_adj.pkl` 4. `road_adj.pkl` 5. `poi_adj. ...

  9. pandas用众数填充缺失值_【机器学习】scikit-learn中的数据预处理小结(归一化、缺失值填充、离散特征编码、连续值分箱)...

    一.概述 1. 数据预处理 数据预处理是从数据中检测,修改或删除不准确或不适用于模型的记录的过程 可能面对的问题有:数据类型不同,比如有的是文字,有的是数字,有的含时间序列,有的连续,有的间断. 也可 ...

最新文章

  1. 第一次创业失败的总结 - 产品设计
  2. 今天开始复习toefl,mark一下
  3. Hihocoer 1336 - Matrix Sum 二维树状数组
  4. 二维数组m的元素是4个字符组成的串_串、数组和广义表
  5. OpenCV4每日一练day8:模型投影函数projectPoints()
  6. SparkStreaming手动维护Kafka Offset的几种方式
  7. mysql 上级组织参数值_MYSQL组织结构设计构思(快速查上级和下级)
  8. 智能优化算法:猎食者优化算法-附代码
  9. 我的世界java营火如何合成_我的世界:营火在1.15版本中得到加强?它的六个用途别忘了!...
  10. 系统分析师教程(张友生)高清pdf下载
  11. 推荐几个更新比我勤快的优质产品号
  12. sharepoint如何解锁被用户锁定的文件?
  13. Java实现观察者模式
  14. 关于springboot微信点餐的错题集
  15. Arduino小白的学习历程
  16. 【坐标轴移位+主辅刻度设定】两年梳理一次性清晰的展示出来,大图解析学习超简单
  17. apple 密码 seeion has time out 无法再本机上重设密码
  18. 扫地机器人返充原理_全自动智能扫地机器人的工作原理分析
  19. 在谷歌上安装倍速播放的插件video-speed-controller
  20. Nginx 配置实现请求转发功能

热门文章

  1. 500拦截报错 axios_axios拦截设置和错误处理
  2. 马云:阿里巴巴必须成为国家和世界创新的发动机
  3. 作者:车品觉,现任阿里巴巴集团副总裁,浙江大学管理学院客座教授。
  4. php $_SERVER的参数与说明
  5. idea 正则取值替换
  6. 根据自己维护的工作日历表查询7个工作日后的日期
  7. YOLOv3训练自己的数据集
  8. Mahout算法集Taste
  9. 班尼机器人如何代理_班尼机器人加盟-班尼机器人加盟费多少钱-条件-怎么样-总部-优选创业加盟网...
  10. html 邮政编码格式,js与jquery正则验证电子邮箱、手机号、邮政编码的方法