Python超实用小技巧:统计每列缺失值的占比
代码
def missing_percent(df):nan_percent = 100*(df.isnull().sum()/len(df))# df.isnull().sum()统计每一列的缺失值数量# 再除上len()得到每一列的缺失值比例——小数形式# *100得到百分数nan_percent = nan_percent[nan_percent > 0].sort_values()# 得到每列的缺失值的占比,升序排序# >0是为了筛掉没有缺失值的列,只返回有缺失值的return nan_percentprint(missing_percent(train))
结果将输出回train数据每列的缺失值占比(如果缺失值为0则不显示)
结果示例
Embarked 0.224467Age 19.865320dtype: float64
Embarked列缺失值为0.22%
Age列缺失值为19.8%
Python超实用小技巧:统计每列缺失值的占比相关推荐
- Python超实用小技巧:添加新列——两列之间运算得到第三列
目的:表亲+近亲+自己,统计孤身一人和非孤身一人的信息 for dataset in full_data:dataset['FamilySize'] = dataset['SibSp'] + data ...
- Python超实用小技巧:分类变量转化为哑变量(附哑变量详解)
代码示例 features = ["Pclass", "Sex", "SibSp", "Parch"]# 筛选出分类变量 ...
- 零基础入门学习Python,这13个Python惯用小技巧一定要收藏
Python的小技巧很多,入门容易精通难!在进阶的路上,有没有什么好的技巧和好的方法,就是不断总结,不断记笔记!尤其是好的用法,就像写作文一样,好的名言警句要多背诵一些,写作的时候,肚子里的墨水多了才 ...
- pythonencoding etf-8_etf iopv python 代码30个Python常用小技巧
1.原地交换两个数字x, y =10, 20 print(x, y) y, x = x, y print(x, y) 10 20 20 10 2.链状比较操作符n = 10 print(1 print ...
- 值得玩味儿的14个Python编程小技巧
全文共394个字,1张图,预计阅读时间5分钟. 最近的工作中经常使用Python编写一些基本解决一些NLP的小问题,在自己的工作日记里面也记录了不少的python编程中常用的小"Trick& ...
- python dict 合并同类项_零基础入门学习Python,这13个Python惯用小技巧一定要收藏...
原标题:零基础入门学习Python,这13个Python惯用小技巧一定要收藏 Python的小技巧很多,入门容易精通难!在进阶的路上,有没有什么好的技巧和好的方法,就是不断总结,不断记笔记!尤其是好的 ...
- Python数据分析小技巧:如何在Pandas中实现数据透视表?
Python数据分析小技巧:如何在Pandas中实现数据透视表? 数据透视表是数据分析中非常有用的工具,可以帮助我们快速了解数据的结构.关联和趋势.在Pandas中,我们可以使用pivot_table ...
- Python常用小技巧(五)——批量读取json文件
Python常用小技巧(五)--批量读取json文件 前言:其实Python能够批量读取很多文件,这里,本人以json文件为例(json是标注图片时生成的文件,记录有标注的坐标和标签,友情推荐标注图片 ...
- python常用小技巧(四)——批量图片改名
python常用小技巧(四)--批量图片改名 前言:在日常使用中我们需要批量修改图片名字,使用Python的话就可以很快地完成这个目标 一.材料准备 - os 二.程序编写 # -*- coding: ...
最新文章
- php udp发送和接收_php socket通信(tcp/udp)实例分析
- Mongo报如下类似错误时的修改方法Cannot natively represent the long 1396367483000 on this platform...
- SVN 放弃修改或撤销删除
- memset()函数介绍
- 《系统集成项目管理工程师》必背100个知识点-77配置审计的功能
- 如何打造不怕被嗅探的3389登陆
- 看完这个你还不理解右值引用和移动构造 你就可以来咬我(下)
- power bi 日期计算_PowerBI 动态计算周内日权重指数
- mysql 主从 keepalived_MySQL之双向主从加keepalived高可用
- redis-数据类型一览
- kafka专题:kafka的总控制器Controller、消费者重分配策略等核心设计原理详解
- tracepro杂散光分析例子_AES分析中的干扰效应及校正,你知道吗?
- java考前复习之Scanner 类
- Linux学习笔记二:Ubuntu启用root用户、更改软件源以及安装vim
- [原创]怎样尽可能多地发现缺陷,避免遗漏缺陷?
- 基于java的房屋销售管理系统设计(含源文件)
- SpringDataJpa原理及使用
- 新浪十年路 新浪的触角 新浪成年
- 单体架构与微服务架构的区别
- 图像算法五 —— EM算法
热门文章
- 原生js实现可切换式导航栏
- 自动给服务器装linux,Linux全自动PXE无人值守安装服务器配置 | 旺旺知识库
- 自体脂肪填充苹果肌硬块多久消
- 中科院30m地表精细土地利用数据Arcgis预处理——入门(二)
- vvebo源码学习(一)
- 风车动漫服务器维修要多长时间,风车动漫APP是什么样的软件?风车动漫APP出现打不开的具体处理方法...
- 论文笔记:Object Detection in 20 Years: A Surve(目标检测20年研究综述)
- MacBook Pro设置外接显示器竖屏显示,2k 字体小
- java 解析 svg文件_java – 如何加载和解析SVG文档
- 锚定品质,金科走出清晰的“产品主义”路径