假设拿到一个10万行的数据后,通过isnull我们发现某列有几个空值,要把该列空值所在行删除怎么操作?用dropna()会删除所有有空值的行,请看下面实例。



区分 None,null,NULL,nan, “null”, " “, “”, ‘’, , b’’, u”" 1.Python 中 None 是 NoneType, 没有长度, 表示空值, 布尔值为False, 即 None.bool() == False 2. null 和 NULL 表示数据库中的空值, python中不存在这两者。 3.在pandas 中 NaN 是缺失值的意思。 NaN 在python 中 导入用 from numpy import nan 或者 from numpy import NaN, 类型用 type() 判断为 float, 值可以用math.isnan(),numpy.isnan(),pandas.isna(), pandas.isnull()判断。在python3.7 中NaN和None都可以是float类型,都可以和数值做加法运算。 3. “null” 表示长度为4,由字母null组成的字符串 4. “” 和’’ 都表示空字符串,长度为0 5. " “表示长度为1的空格字符 6. 反引号在linux 命令中可以传递变量的值,`` 在linux中表示空变量
7. b’’ 表示 bytes 字节编码空字符串
8. u”" 表示unicode 类型空字符串

附图中代码在python3.7 中运行


Python之pandas:pandas中缺失值与空值处理的简介及常用函数(dropna()、isna()、isnull()、fillna())


pandas中缺失值与空值处理的简介

data_df['col01'].isnull()
data_df[data_df['col02'].notnull()]
data_df['col01'].fillna(value=0)
data_df['col01'].dropna() data_df.set_index(['time', 'user'], inplace=True)
data_df.sort_index(inplace=True)

1、缺失值统计并缺失率可视化

#统计缺失字段的缺失率
from DataScience.DataVisualize_Functions import NullValueCountAndPlot,NullValueCountRatio_AndPlot
NullValueCountAndPlot('',data_X)
NullValueCountRatio_AndPlot('',data_X)

dropna()、isna()、isnull()、fillna()使用案例

import pandas as pd
import numpy as npcontents={"name": ['Bob',        'LiSa',                     'Mary',                       'Alan'],"ID":   [1,              2,                           3,                           None],   # 输出 NaN"age":  [np.nan,        28,                           38 ,                          '' ],   # 输出 "born": [pd.NaT,     pd.Timestamp("1990-01-01"),  pd.Timestamp("1980-01-01"),        ''],   # 输出 NaT"sex":  ['男',          '女',                        '女',                        None,],   # 输出 None"hobbey":['打篮球',     '打羽毛球',                   '打乒乓球',                    '',],   # 输出 }
data_frame = pd.DataFrame(contents)
data_frame.to_excel("data_Frame.xls")
print(data_frame)#dropna 函数:自动删除空值(np.nan、pd.Na、'')所在行的数据
data_frame_temp=data_frame
res01= data_frame_temp.dropna()
print('dropna():','\n',res01)#  去掉包含缺失值的任何一行
data_frame_temp.dropna(how='any')      #表示去掉所有包含缺失值的行#isna 函数:
res01=data_frame.isna()
print('isna():','\n',res01)#isnull 函数:
res01= data_frame.isnull()
print('isnull():','\n',res01)#fillna 函数:用0填充
res01= data_frame.fillna(0)
print('fillna():','\n',res01)


pandas中缺失值与空值处理的常用函数(dropna()、fillna()、isnull()、isna())

1、dropna() 删除缺失值

DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)[source]




2、isna()显示缺失值、notna() #isna的布尔逆


3、isnull() 检测缺失值


4、fillna() 填充缺失值




https://blog.csdn.net/qq_41185868/article/details/108504178

20201215

csv里面是空值 读出来就是这样
df.dropna() 可以删除带有nan值的任意行


左边的空值对应 右边的表现形式
df.dropna() 不能删除上述形式的空值


df!=’’ 可以直接找出所有的‘’的空值 或者 按列查找出对应的行索引


isnull() 只能找出对应 nan 的空值 ‘’ 这种不能找出

pandas dataframe 删除带空值的行 各种空值 (dropna()、isna()、isnull()、fillna())相关推荐

  1. pandas nan判断_【跟着stackoverflow学Pandas】 删除带有NaN的行

    How to drop rows of Pandas DataFrame whose value in certain columns is NaN - 删除带有NaN的行 在用 pandas 处理数 ...

  2. pandas dataframe删除空行或者空列dropna,一般删除指定行或者列drop

    dropna参见https://blog.csdn.net/roamer314/article/details/84816171 df[~(df['col'].isnull())] #删掉空行 df. ...

  3. pandas Dataframe删除缺失值

    更多内容请参考官网的DOC:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.dropna.htm ...

  4. pandas.DataFrame删除/选取含有特定数值的行或列实例

    import pandas as pd import numpy as npa=np.array([[1,2,3],[4,5,6],[7,8,9]]) df1=pd.DataFrame(a,index ...

  5. pandas:dataframe删除某些不为non的行

    遇到一个需求,现在假设有一个这样的df,c是金额,d是月份 C Dnan 321323 0 3132 0 nannan nan 有两个规则:1.金额不能为nan     2.金额为0月份的时候如果月份 ...

  6. [转载] Python中pandas dataframe删除一行或一列:drop函数

    参考链接: Python | Pandas 数据 DataFrame 用法:DataFrame.drop(labels=None,axis=0, index=None, columns=None, i ...

  7. Python Pandas DataFrame 删除缺失值 None Nan drop dropna 替换缺失值 fillna 重复值删除 duplicate 数值替换 replace apply

    一.获取缺失值. 二.剔除缺失值. 三.缺失值补全. 四.重复值剔除(按照行和列). 五.数值转换. 原始数据展示.数据下载链接 https://download.csdn.net/download/ ...

  8. Python中pandas dataframe删除一行或一列:drop函数

    用法:DataFrame.drop(labels=None,axis=0, index=None, columns=None, inplace=False) 参数说明: labels 就是要删除的行列 ...

  9. Pandas.DataFrame删除指定行和列(drop)

    https://blog.csdn.net/qq_18351157/article/details/105785367

最新文章

  1. 利用eigen库简单实现矩阵功能
  2. CTFshow 爆破 web24
  3. 数据库死锁_死锁荔枝_解决方法
  4. 基于知识图谱的问答系统实践
  5. c++语言iso标准,C++20标准 (ISO/IEC 14882:2020) 正式发布
  6. react antd select默认选中第一项
  7. python 打包exe(包含把资源文件打进包)
  8. 错过等一年!物流与交通的先锋碰撞,点击进入这场大佬云集的学术盛宴
  9. bmob php,Bmob 简单API使用(一)
  10. 数据库启动报ORA-03113错误
  11. Python记录键盘鼠标敲击次数
  12. 1481: 考试排名(一)(结构体专题)
  13. Linux 中power supply软件架构和相关API
  14. 《zw版·Halcon-delphi系列原创教程》 zw版-Halcon常用函数Top100中文速查手册
  15. 华为HG522无线路由猫破解开启路由功能
  16. 【Linux】无线网络的连接设置
  17. 扫描仪连续扫描提示有一个问题阻值扫描该文档。请重试,错误的解决办法
  18. 【Python】Matplotlib画图(二)——根据函数公式画图
  19. 电压互感器和电流互感器的区别
  20. 数据库修改字段类型但是有旧数据处理步骤

热门文章

  1. 2022-2028年中国超韧尼龙行业市场调查分析及未来前景分析报告
  2. Redis 高级特性(1)—— 事务 过期时间 排序
  3. 二叉树的前序、中序、后序非递归遍历 python实现
  4. Tensorflow会话
  5. SpringBoot配置文件YAML配置注入(详解)
  6. 自动驾驶解决方案架构
  7. YOLOV4知识点分析(一)
  8. 半导体群聚、虚拟垂直、整合
  9. java vector search_java.util.Vector.retainAll()方法实例
  10. Ubuntu 系统通过终端打开AndroidStudio工具