pandas怎么去除nan_pandas缺失值处理之——如何消去Nan值对数字型字符串数据类型的影响,让数字型字符串保持原始str类型,而不会自动变为float类型?...
在利用pandas处理表格时,往往有时我们用表格做的测试用例往往会设计考一些必填项*故意赋值为空(代表不输入)的测试用例,
比如说我们的手机号、身份证号码、社会统一信用代码等都是数字型字符串。如下所示:
pandas读取表格,会把表格中的空单元格置为float类型的Nan值,会导致数字型字符串列的数据类型从原始的str类型自动转换为float类型,如下图所示:
读取的效果:
从上图可看出,pandas读取excel时,遇到空白单元格会自动置为nan值,float型。
导致原始表格中的文本类型的social_code(社会信用代码)和 telno(手机号)从原始的本文str类型转变为了float类型,导致数据显示错误,不是我们想要的结果。
那如何将nan值全部置为空,并且还不会影响原始表格中的数字型字符串呢???
我们可以在读取表格时,就以字符串型读取,如下图所示:
效果如下:
这时,原始的数字型字符串数据就不会受到nan值的影响了。
如果需要对nan值进行替换,直接采用fillna()填充即可。
替换、填充效果:
这样就完成了~~~~
pandas怎么去除nan_pandas缺失值处理之——如何消去Nan值对数字型字符串数据类型的影响,让数字型字符串保持原始str类型,而不会自动变为float类型?...相关推荐
- pandas用众数填充缺失值_7步搞定数据清洗-Python数据清洗指南
脏数据就是在物理上临时存在过,但在逻辑上不存在的数据. 数据清洗是整个数据分析过程的第一步,就像做一道菜之前需要先择菜洗菜一样.数据分析师经常需要花费大量的时间来清洗数据或者转换格式,这个工作甚至会占 ...
- pandas中read_csv的缺失值处理方式
今天遇到的问题是,要将一份csv数据读入dataframe,但某些列中含有NA值.对于这些列来说,NA应该作为一个有意义的level,而不是缺失值,但read_csv函数会自动将类似的缺失值理解为缺失 ...
- pandas用众数填充缺失值_python数据分析包|Pandas-02之缺失值(NA)处理
本篇详解pandas中缺失值(Missing data handling)处理常用操作. 缺失值处理常用于数据分析数据清洗阶段:Pandas中将如下类型定义为缺失值: NaN: '', '#N/A', ...
- pandas用众数填充缺失值_【机器学习】scikit-learn中的数据预处理小结(归一化、缺失值填充、离散特征编码、连续值分箱)...
一.概述 1. 数据预处理 数据预处理是从数据中检测,修改或删除不准确或不适用于模型的记录的过程 可能面对的问题有:数据类型不同,比如有的是文字,有的是数字,有的含时间序列,有的连续,有的间断. 也可 ...
- Python中pandas库实现数据缺失值判断isnull()函数
[小白从小学Python.C.Java] [Python全国计算机等级考试] [Python数据分析考试必会题] ● 标题与摘要 Python中pandas库实现数据缺失值判断 isnull()函数 ...
- Pandas 替换 NaN 值
替换Pandas DataFram中的 NaN 值 问题 NaN 代表 Not A Number,是表示数据中缺失值的常用方法之一.它是一个特殊的浮点值,不能转换为 float 以外的任何其他类型.N ...
- pandas使用replace函数和正则表达式移除dataframe字符串数据列中头部指定模式字符串(Removing leading substring in dataframe)
pandas使用replace函数和正则表达式移除dataframe字符串数据列中头部指定模式字符串(Removing leading substring in dataframe) 目录
- pandas使用replace函数和正则表达式移除dataframe字符串数据列中尾部指定模式字符串(Removing trailing substring in dataframe)
pandas使用replace函数和正则表达式移除dataframe字符串数据列中尾部指定模式字符串(Removing trailing substring in dataframe) 目录
- pandas使用pct_change函数计算数据列的百分比变化:计算当前元素和前一个元素之间的百分比变化(包含NaN值的情况以及数据填充方法)
pandas使用pct_change函数计算当前元素和前一个元素之间的百分比变化:默认情况下pct_change函数计算与紧邻前一行相比的百分比变化.计算当前元素和前一个元素之间的百分比变化(包含Na ...
最新文章
- Linux 中 7 个判断文件系统类型的方法
- 【工业控制】学习喷墨打印技术 怎么能不知道波形
- 使用动态代理解决网站字符集编码问题:(之前通过拦截器)
- 2021年中国机器视觉市场研究报告
- C#算法设计查找篇之04-斐波那契查找
- Linux容器间共享内存,C++容器模板在共享内存中的使用
- Python Cookbook(第3版)中文版:15.18 传递已打开的文件给C扩展
- Hadoop概念学习系列之Hadoop 是什么?(一)
- expdp —— XDB SGA initialization
- 大数据和人工智能属于什么专业 - 学大数据和人工智能出来做什么
- Linux内存管理专题
- SpringBoot关于文件上传配置的几种方式
- 两台虚拟机互相ping通(互相通讯)
- adguard和adblock哪个好_AdGuard过滤规则分享
- C++ 堆和栈的联系与区别
- ​QGIS Cloud 一个基于云的 GIS 平台
- thinkpad X61风扇控制
- 利用Matlab 由发动机map数据制作逆发动机map图
- 网站安全监测系统软件平台分享 、网站安全监控平台有哪些
- 织梦后台样式php,织梦系统(DEDECMS)后台模板修改