在利用pandas处理表格时,往往有时我们用表格做的测试用例往往会设计考一些必填项*故意赋值为空(代表不输入)的测试用例,

比如说我们的手机号、身份证号码、社会统一信用代码等都是数字型字符串。如下所示:

pandas读取表格,会把表格中的空单元格置为float类型的Nan值,会导致数字型字符串列的数据类型从原始的str类型自动转换为float类型,如下图所示:

读取的效果:

从上图可看出,pandas读取excel时,遇到空白单元格会自动置为nan值,float型。

导致原始表格中的文本类型的social_code(社会信用代码)和 telno(手机号)从原始的本文str类型转变为了float类型,导致数据显示错误,不是我们想要的结果。

那如何将nan值全部置为空,并且还不会影响原始表格中的数字型字符串呢???

我们可以在读取表格时,就以字符串型读取,如下图所示:

效果如下:

这时,原始的数字型字符串数据就不会受到nan值的影响了。

如果需要对nan值进行替换,直接采用fillna()填充即可。

替换、填充效果:

这样就完成了~~~~

pandas怎么去除nan_pandas缺失值处理之——如何消去Nan值对数字型字符串数据类型的影响,让数字型字符串保持原始str类型,而不会自动变为float类型?...相关推荐

  1. pandas用众数填充缺失值_7步搞定数据清洗-Python数据清洗指南

    脏数据就是在物理上临时存在过,但在逻辑上不存在的数据. 数据清洗是整个数据分析过程的第一步,就像做一道菜之前需要先择菜洗菜一样.数据分析师经常需要花费大量的时间来清洗数据或者转换格式,这个工作甚至会占 ...

  2. pandas中read_csv的缺失值处理方式

    今天遇到的问题是,要将一份csv数据读入dataframe,但某些列中含有NA值.对于这些列来说,NA应该作为一个有意义的level,而不是缺失值,但read_csv函数会自动将类似的缺失值理解为缺失 ...

  3. pandas用众数填充缺失值_python数据分析包|Pandas-02之缺失值(NA)处理

    本篇详解pandas中缺失值(Missing data handling)处理常用操作. 缺失值处理常用于数据分析数据清洗阶段:Pandas中将如下类型定义为缺失值: NaN: '', '#N/A', ...

  4. pandas用众数填充缺失值_【机器学习】scikit-learn中的数据预处理小结(归一化、缺失值填充、离散特征编码、连续值分箱)...

    一.概述 1. 数据预处理 数据预处理是从数据中检测,修改或删除不准确或不适用于模型的记录的过程 可能面对的问题有:数据类型不同,比如有的是文字,有的是数字,有的含时间序列,有的连续,有的间断. 也可 ...

  5. Python中pandas库实现数据缺失值判断isnull()函数

    [小白从小学Python.C.Java] [Python全国计算机等级考试] [Python数据分析考试必会题] ● 标题与摘要 Python中pandas库实现数据缺失值判断 isnull()函数 ...

  6. Pandas 替换 NaN 值

    替换Pandas DataFram中的 NaN 值 问题 NaN 代表 Not A Number,是表示数据中缺失值的常用方法之一.它是一个特殊的浮点值,不能转换为 float 以外的任何其他类型.N ...

  7. pandas使用replace函数和正则表达式移除dataframe字符串数据列中头部指定模式字符串(Removing leading substring in dataframe)

    pandas使用replace函数和正则表达式移除dataframe字符串数据列中头部指定模式字符串(Removing leading substring in dataframe) 目录

  8. pandas使用replace函数和正则表达式移除dataframe字符串数据列中尾部指定模式字符串(Removing trailing substring in dataframe)

    pandas使用replace函数和正则表达式移除dataframe字符串数据列中尾部指定模式字符串(Removing trailing substring in dataframe) 目录

  9. pandas使用pct_change函数计算数据列的百分比变化:计算当前元素和前一个元素之间的百分比变化(包含NaN值的情况以及数据填充方法)

    pandas使用pct_change函数计算当前元素和前一个元素之间的百分比变化:默认情况下pct_change函数计算与紧邻前一行相比的百分比变化.计算当前元素和前一个元素之间的百分比变化(包含Na ...

最新文章

  1. Linux 中 7 个判断文件系统类型的方法
  2. 【工业控制】学习喷墨打印技术 怎么能不知道波形
  3. 使用动态代理解决网站字符集编码问题:(之前通过拦截器)
  4. 2021年中国机器视觉市场研究报告
  5. C#算法设计查找篇之04-斐波那契查找
  6. Linux容器间共享内存,C++容器模板在共享内存中的使用
  7. Python Cookbook(第3版)中文版:15.18 传递已打开的文件给C扩展
  8. Hadoop概念学习系列之Hadoop 是什么?(一)
  9. expdp —— XDB SGA initialization
  10. 大数据和人工智能属于什么专业 - 学大数据和人工智能出来做什么
  11. Linux内存管理专题
  12. SpringBoot关于文件上传配置的几种方式
  13. 两台虚拟机互相ping通(互相通讯)
  14. adguard和adblock哪个好_AdGuard过滤规则分享
  15. C++ 堆和栈的联系与区别
  16. ​QGIS Cloud 一个基于云的 GIS 平台
  17. thinkpad X61风扇控制
  18. 利用Matlab 由发动机map数据制作逆发动机map图
  19. 网站安全监测系统软件平台分享 、网站安全监控平台有哪些
  20. 织梦后台样式php,织梦系统(DEDECMS)后台模板修改

热门文章

  1. 10个最好的 Node.js MVC 框架
  2. 开源公司黄页之 Twitter 开源软件推荐
  3. OpenEphyra学习笔记1
  4. 【鲁棒控制】平面2R型机器人的鲁棒逆推跟踪控制(matlab实现)
  5. shell for 循环_linux之shell编程(三)
  6. 如何避免学习linux必然会遇到的几个问题
  7. centos6 pip install python-ldap报错
  8. 【t063】最聪明的机器人
  9. js,css压缩工具
  10. 一个很奇特的异常 tmpFile.renameTo(classFile) failed