Pandas入门3(dtype+fillna+replace+rename+concat+join)
文章目录
- 5. dtype 数据类型
- 6. Missing data 缺失值
- 6.1 查找缺失值 pd.isnull(),pd.notnull()
- 6.2 填补缺失值 fillna(),replace()
- 7. Renaming and Combining 重命名、合并
- 7.1 Renaming 重命名
- 7.2 Combining 合并数据
learn from https://www.kaggle.com/learn/pandas
上一篇:Pandas入门2(DataFunctions+Maps+groupby+sort_values)
5. dtype 数据类型
print(wine_rev.price.dtype)
,float64
wine_rev.dtypes
,整张表,需要加复数s
!!!
country object
description object
designation object
points int64
price float64
province object
region_1 object
region_2 object
taster_name object
taster_twitter_handle object
title object
variety object
winery object
critic object
test_id int32
dtype: object
- 字符串的数据类型为
object
astype()
,可以进行类型转换wine_rev.points.astype('float64')
0 87.0
1 87.0
2 87.0
3 87.0
4 87.0...
129966 90.0
129967 90.0
129968 90.0
129969 90.0
129970 90.0
Name: points, Length: 129971, dtype: float64
wine_rev.index.dtype
,索引的类型是dtype('int64')
6. Missing data 缺失值
6.1 查找缺失值 pd.isnull(),pd.notnull()
缺少值的条目将被赋予值NaN
,是Not a Number
的缩写。这些NaN
值始终为float64
dtype。
要选择NaN
条目,可以使用pd.isnull()
,pd.notnull()
wine_rev[pd.isnull(wine_rev.country)]
6.2 填补缺失值 fillna(),replace()
wine_rev.region_2.fillna('Unknown')
,原始数据不改变- 还可以把缺失值填成之前出现的第一个非空值,称为回填策略
wine_rev.taster_twitter_handle.replace("@kerinokeefe", "@kerino")
,把前者替换成后者
7. Renaming and Combining 重命名、合并
7.1 Renaming 重命名
- 把名字改成我们喜欢的,更合适的,
rename()
,可以把索引名、列名更改 wine_rev.rename(columns={'points':'score'})
- 更改
index
,wine_rev.rename(index={0:'michael',1:'ming'})
,index={字典}
rename_axis()
,可以更改行索引、列索引名称wine_rev.rename_axis("酒",axis='rows').rename_axis('特征',axis='columns')
7.2 Combining 合并数据
concat(),join() 和 merge()
canadian_youtube = pd.read_csv("../input/youtube-new/CAvideos.csv")
british_youtube = pd.read_csv("../input/youtube-new/GBvideos.csv")pd.concat([canadian_youtube, british_youtube])
left = canadian_youtube.set_index(['title', 'trending_date'])
right = british_youtube.set_index(['title', 'trending_date'])left.join(right, lsuffix='_CAN', rsuffix='_UK')
完成了课程+练习,获得证书一张,继续加油!
Pandas入门3(dtype+fillna+replace+rename+concat+join)相关推荐
- Pandas入门2(DataFunctions+Maps+groupby+sort_values)
文章目录 3. Summary Functions and Maps 3.1 Summary Functions 数据总结函数 3.1.1 describe() 3.1.2 mean(),median ...
- python使用教程pandas-Python 数据处理库 pandas 入门教程基本操作
pandas是一个Python语言的软件包,在我们使用Python语言进行机器学习编程的时候,这是一个非常常用的基础编程库.本文是对它的一个入门教程. pandas提供了快速,灵活和富有表现力的数据结 ...
- python数据分析df_Python数据分析pandas入门!(附数据分析资料)
Python数据分析pandas入门!(附数据分析资料) 1.pandas数据结构之DataFrame+ 这是小编准备的python数据分析资料!进群:700341555即可获取! Python数据分 ...
- 【日常点滴012】python中pandas入门操作方法整理
配套数据文件 链接:https://pan.baidu.com/s/1ngzaZygHOIQuNPHtYjpFfA 提取码:lang pandas 入门 1 series 1.1 series 创 ...
- pandas series取值_【小学生级】pandas入门到精通备查表——AI未来系列3
在未来面前,每个人都是学生 江海升月明,天涯共此时,关注江时! 引 子 篇为AI未来系列第三篇,中阶部分开始.pandas的数据分析功能比excel强太多,基本上学会pandas,走遍天下都不怕.这是 ...
- pandas入门(六):数据清理
在做数据分析时,在使用算法之前都需要对数据进行相应的处理,pandas 同样的自带了这个功能,里面的东西比较多,这里重点的介绍,数据重复和数据缺值. 数据重复 重复的数据在做数据处理的时候,会影响到数 ...
- python使用教程pandas-十分钟搞定pandas(入门教程)
本文是对pandas官方网站上<10Minutes to pandas>的一个简单的翻译,原文在这里.这篇文章是对pandas的一个简单的介绍,详细的介绍请参考:Cookbook .习惯上 ...
- Pandas入门1(DataFrame+Series读写/Index+Select+Assign)
文章目录 1. Creating, Reading and Writing 1.1 DataFrame 数据框架 1.2 Series 序列 1.3 Reading 读取数据 2. Indexing, ...
- pandas python2_Python随笔 | Pandas入门(二)
#文章首发于公众号"如风起". 原文链接:Python随笔 | Pandas入门(二)mp.weixin.qq.comPandas是Python的一个基于NumPy的数据分析包 ...
最新文章
- 4 关卡编辑器_虚幻引擎4与生存游戏产生化学反应,超真实开放世界手游诞生
- C enum(枚举)
- IE、FF的基本注意事项
- MySQL与Python交互入门
- DAS、SAN和NAS三种服务器存储方式
- OVM虚拟化平台安装成功后初始化配置方法!
- PostgreSQL数据目录深度揭秘
- Oracle数据库imp
- 自定义StartIO
- 微信小程序之----audio音频播放
- ib网卡无法启动,需要修改为以太网模式
- .mp4视频测试地址
- 坚果云WebDav示例
- java接口推送_推送API
- 房产|9月全国70城房价出炉!快来看看你的城市房价变化
- 提高APP用户粘性,你需要了解这些!
- QT疫情信息管理系统
- 第几代计算机有了硬件资源管理系统,从(??)计算机开始,在软件方面有了专门从事计算机软硬件资源管理的操作系统...
- t6 修改文件服务器地址,用友t6软件怎么改服务器地址
- 手机屏幕坏了怎么把数据导出来_手机屏幕密码忘了怎么办?这个方法轻松解除手机屏幕密码...