文章目录

  • 5. dtype 数据类型
  • 6. Missing data 缺失值
    • 6.1 查找缺失值 pd.isnull(),pd.notnull()
    • 6.2 填补缺失值 fillna(),replace()
  • 7. Renaming and Combining 重命名、合并
    • 7.1 Renaming 重命名
    • 7.2 Combining 合并数据

learn from https://www.kaggle.com/learn/pandas

上一篇:Pandas入门2(DataFunctions+Maps+groupby+sort_values)

5. dtype 数据类型

  • print(wine_rev.price.dtype)float64
  • wine_rev.dtypes,整张表,需要加复数s!!!
country                   object
description               object
designation               object
points                     int64
price                    float64
province                  object
region_1                  object
region_2                  object
taster_name               object
taster_twitter_handle     object
title                     object
variety                   object
winery                    object
critic                    object
test_id                    int32
dtype: object
  • 字符串的数据类型为object
  • astype(),可以进行类型转换
  • wine_rev.points.astype('float64')
0         87.0
1         87.0
2         87.0
3         87.0
4         87.0...
129966    90.0
129967    90.0
129968    90.0
129969    90.0
129970    90.0
Name: points, Length: 129971, dtype: float64
  • wine_rev.index.dtype,索引的类型是dtype('int64')

6. Missing data 缺失值

6.1 查找缺失值 pd.isnull(),pd.notnull()

缺少值的条目将被赋予值NaN,是Not a Number的缩写。这些NaN值始终为float64 dtype。
要选择NaN条目,可以使用pd.isnull()pd.notnull()

  • wine_rev[pd.isnull(wine_rev.country)]

6.2 填补缺失值 fillna(),replace()

  • wine_rev.region_2.fillna('Unknown'),原始数据不改变
  • 还可以把缺失值填成之前出现的第一个非空值,称为回填策略
  • wine_rev.taster_twitter_handle.replace("@kerinokeefe", "@kerino"),把前者替换成后者

7. Renaming and Combining 重命名、合并

7.1 Renaming 重命名

  • 把名字改成我们喜欢的,更合适的,rename(),可以把索引名、列名更改
  • wine_rev.rename(columns={'points':'score'})
  • 更改indexwine_rev.rename(index={0:'michael',1:'ming'})index={字典}
  • rename_axis(),可以更改行索引、列索引名称
  • wine_rev.rename_axis("酒",axis='rows').rename_axis('特征',axis='columns')

7.2 Combining 合并数据

  • concat(),join() 和 merge()
canadian_youtube = pd.read_csv("../input/youtube-new/CAvideos.csv")
british_youtube = pd.read_csv("../input/youtube-new/GBvideos.csv")pd.concat([canadian_youtube, british_youtube])
left = canadian_youtube.set_index(['title', 'trending_date'])
right = british_youtube.set_index(['title', 'trending_date'])left.join(right, lsuffix='_CAN', rsuffix='_UK')

完成了课程+练习,获得证书一张,继续加油!

Pandas入门3(dtype+fillna+replace+rename+concat+join)相关推荐

  1. Pandas入门2(DataFunctions+Maps+groupby+sort_values)

    文章目录 3. Summary Functions and Maps 3.1 Summary Functions 数据总结函数 3.1.1 describe() 3.1.2 mean(),median ...

  2. python使用教程pandas-Python 数据处理库 pandas 入门教程基本操作

    pandas是一个Python语言的软件包,在我们使用Python语言进行机器学习编程的时候,这是一个非常常用的基础编程库.本文是对它的一个入门教程. pandas提供了快速,灵活和富有表现力的数据结 ...

  3. python数据分析df_Python数据分析pandas入门!(附数据分析资料)

    Python数据分析pandas入门!(附数据分析资料) 1.pandas数据结构之DataFrame+ 这是小编准备的python数据分析资料!进群:700341555即可获取! Python数据分 ...

  4. 【日常点滴012】python中pandas入门操作方法整理

    配套数据文件 链接:https://pan.baidu.com/s/1ngzaZygHOIQuNPHtYjpFfA 提取码:lang pandas 入门 1  series 1.1  series 创 ...

  5. pandas series取值_【小学生级】pandas入门到精通备查表——AI未来系列3

    在未来面前,每个人都是学生 江海升月明,天涯共此时,关注江时! 引 子 篇为AI未来系列第三篇,中阶部分开始.pandas的数据分析功能比excel强太多,基本上学会pandas,走遍天下都不怕.这是 ...

  6. pandas入门(六):数据清理

    在做数据分析时,在使用算法之前都需要对数据进行相应的处理,pandas 同样的自带了这个功能,里面的东西比较多,这里重点的介绍,数据重复和数据缺值. 数据重复 重复的数据在做数据处理的时候,会影响到数 ...

  7. python使用教程pandas-十分钟搞定pandas(入门教程)

    本文是对pandas官方网站上<10Minutes to pandas>的一个简单的翻译,原文在这里.这篇文章是对pandas的一个简单的介绍,详细的介绍请参考:Cookbook .习惯上 ...

  8. Pandas入门1(DataFrame+Series读写/Index+Select+Assign)

    文章目录 1. Creating, Reading and Writing 1.1 DataFrame 数据框架 1.2 Series 序列 1.3 Reading 读取数据 2. Indexing, ...

  9. pandas python2_Python随笔 | Pandas入门(二)

    #文章首发于公众号"如风起". 原文链接:Python随笔 | Pandas入门(二)​mp.weixin.qq.com​Pandas是Python的一个基于NumPy的数据分析包 ...

最新文章

  1. 4 关卡编辑器_虚幻引擎4与生存游戏产生化学反应,超真实开放世界手游诞生
  2. C enum(枚举)
  3. IE、FF的基本注意事项
  4. MySQL与Python交互入门
  5. DAS、SAN和NAS三种服务器存储方式
  6. OVM虚拟化平台安装成功后初始化配置方法!
  7. PostgreSQL数据目录深度揭秘
  8. Oracle数据库imp
  9. 自定义StartIO
  10. 微信小程序之----audio音频播放
  11. ib网卡无法启动,需要修改为以太网模式
  12. .mp4视频测试地址
  13. 坚果云WebDav示例
  14. java接口推送_推送API
  15. 房产|9月全国70城房价出炉!快来看看你的城市房价变化
  16. 提高APP用户粘性,你需要了解这些!
  17. QT疫情信息管理系统
  18. 第几代计算机有了硬件资源管理系统,从(??)计算机开始,在软件方面有了专门从事计算机软硬件资源管理的操作系统...
  19. t6 修改文件服务器地址,用友t6软件怎么改服务器地址
  20. 手机屏幕坏了怎么把数据导出来_手机屏幕密码忘了怎么办?这个方法轻松解除手机屏幕密码...

热门文章

  1. Qt 串口类QSerialPort 使用笔记
  2. 20165326 java第四周学习笔记
  3. 日志分析linux命令
  4. 【腾讯优测干货分享】从压测工具谈并发、压力、吞吐量
  5. Mysql中常用的函数汇总
  6. iOS 5.1.1 设备不能安装AdHoc问题版本号
  7. 零基础30分钟开启你的快速开发之旅
  8. POJ-3590 The shuffle Problem 置换+DP | DFS
  9. 在家过年这两天|多图
  10. 一文让你了解RT-Thread