Python中找出dataframe中的重复的行 DataFrame.duplicated()方法
● 选择题
以下关于DataFrame.duplicated()函数说法错误的是:
A 该函数用于标记dataframe中内容重复的行
B 该函数返回值是一个序列,True表示重复
C 行内容被判定重复时,该行各列的值一定都重复
D keep参数默认取值为"first"
● 问题解析
1.DataFrame.duplicated(subset = None,keep ='first')函数用于找出dataframe的重复行。返回可以正确表示是否为重复行的布尔序列(即非重复项标记为False,重复项标记为True)。则A,B正确。
2.subset参数:列标签(可以是一列,也可以是多列,默认是所有列),可选,仅考虑某些列来标识重复项,默认情况下考虑所有列来标记重复项。C错误,既可以考虑所有列来判断是否重复,也可以只考虑某些列来判断是否重复。
3.keep参数:参数取值包括{'first','last',False},默认为'first'。若取值为first,表示若有重复项,将第一个出现的重复项标记为False,并将其余相同的项标记为True。若取值为last,表示若有重复项,将最后一个出现的重复项标记为False,并将其余相同的项标记为True。若取值为False,表示若有重复项,将所有重复项标记为True。D正确。
● 附图
图1 DataFrame.duplicated()函数不同参数取值对比(1)
图2 DataFrame.duplicated()函数不同参数取值对比(2)
图3 DataFrame.duplicated()函数不同参数取值对比(3)
● 附图代码
import pandas as pd
from pandas import DataFrame
df = pd.DataFrame({'col1': ['一', '一', '二', '二', '三', '四','四'],
'col2': [ 1 , 2 , 1 , 1 , 1 , 1 ,1],
'col3':['AA','BB','CC','DD','EE','FF','FF']})
df
df.duplicated()#取默认参数,基于所有列,keep取first
df.duplicated('col1') #基于col1,keep取first
df.duplicated('col1',keep='last') #基于col1,keep取last
df.duplicated('col1',False) #基于col1,keep取False
df.duplicated(['col1','col2'])#基于col1,col2,keep取first
● 正确答案
C
欢迎大家转发,一起传播知识和正能量,帮助到更多人。期待大家提出宝贵改进建议,互相交流,收获更大。辛苦大家转发时注明出处(也是咱们公益编程交流群的入口网址),刘经纬老师共享知识相关文件下载地址为:http://liujingwei.cn
● 温馨期待
期待大家提出宝贵建议,互相交流,收获更大,助教:zx
Python中找出dataframe中的重复的行 DataFrame.duplicated()方法相关推荐
- Python数据分析 找出数组中每行(或每列)中指定的百分位数 numpy.percentile()
[小白从小学Python.C.Java] [Python-计算机等级考试二级] [Python-数据分析] Python数据分析 找出数组中每行(或每列) 中指定的百分位数 numpy.percent ...
- python输入英文句子、找最长单词_在输入fi中找出句子中的最大和最小单词数
我有一个问题,要求我找出文本文件中单词的最小和最大数量.我已经完成了五个问题中的三个,剩下的两个是关于最小值和最大值的问题,我对此没有任何解决办法.以下是我的代码:感谢您的帮助lines, blank ...
- python查找字符串出现次数_Python 中找出字符串中出现频率最高的字母
发现一个学Python的好网站 https://py.checkio.org 第一题大概意思就是找出一个字符串中出现频率最高字母 我的思路也是直接,弄个字典,遍历字符串,将键值对填进字典里,健就是字母 ...
- python怎么找出列表中的重复数据_python – 如何在列表中找到重复项并使用它......
要删除重复项,请使用set(a).要打印重复项,例如: a = [1,2,3,2,1,5,6,5,5,5] import collections print [item for item, count ...
- 剑指offer python版 找出数组中重复的数字
def aa(nums):if not nums:return Falsehashes={}ret=[]for s in nums:hashes[s]=hashes[s]+1 if hashes.ge ...
- js判断数组中重复元素并找出_JavaScript判断数组重复内容的两种方法(推荐)
前言 一般,我们可能会给数组去重,这个操作并不复杂,执行一个循环就是了.现在,我要做的是,判断数组中是否有重复的内容,如果有,返回 true 否则,返回 false. 思路 把数组变成字符串 循环原数 ...
- python消找出img中的src标签_使用beautifulsoup从img标签获取src
这是我最后一次求救帮助我正在尝试使用我的不和机器人进行一些很酷的嵌入,唯一的问题是我无法从网站获取img到任何人都可以帮忙吗?大部分情况下,这是其他人告诉我使用的代码,这里找到的代码不起作用.使用be ...
- python查找数列中重复数字_在数组中找出重复的数字(异或法)
购买本课程后,可以加51CTO学院李宁老师官方交流群:550369460注意,该群只允许购买李宁老师课程的学员进行技术交流,加群时需要提供在51CTO购买李宁老师课程的订单编号(任何一个课程的订单编号 ...
- 【菜鸡新手 - 剑指offer 03】[2021/1/17一刷] 找出数组中重复的数字 -三种解法|| 物归原主,测试碰撞法 || hash表测试碰撞法 || 排序+遍历法 ||python
文章目录 题目解读 A. 书籍推荐解法:我起名为" 物归原主,测试碰撞"法 B. 基础尝试1:hash表 + 碰撞测试 (效果还行) C. 基础尝试2:排序+遍历 (效果差) C. ...
- 找出数组中任一重复的数字
找出数组中任一重复的数字 找出数组中任一重复的数字 在一个长度为 n 的数组 nums 里的所有数字都在 0-n-1 的范围内.数组中某些数字是重复的,但不知道有几个数字重复了,也不知道每个数字重 ...
最新文章
- 理解图像中卷积操作的含义
- 打印show attend and tell的编码器网络结构
- Matlab中 pdist 函数详解
- 百度指数可视化_可视化指数
- 247. Segment Tree Query II
- linuxcnc 多轴联动_科学网—【LinuxCNC】开源机床Linux操作系统 - 刘洋的博文
- angularjs外部文件中的控制器使用
- 《时代》评出50个最酷网站
- 开发自己的DJI四旋翼无人机(A3飞控Onboard SDK和Mobile SDK介绍)
- AutoCAD使用技巧集锦
- 骁龙660和骁龙835之间的差距到底有多大?
- Linux修仙之路——RAID技术
- 【Git\GitHub\GitLab学习笔记】版本控制 Git 视频教程全集(62P)| 6 小时从入门到精通(P27-P41)
- 4gl的内建函数和操作符简介
- 魔兽地图编辑器触发器中功能函数里各种单位的含义
- 使用MongoDB 可视化工具Robomongo(Robo 3T)查看数据
- 【 在线音乐平台(onlinemusic) 】
- 初试Axure 做Web 界面原型
- OICQ服务器系统通讯协议
- Java原生调用apktool反编译及再次打包源码
热门文章
- eversync safari_EverSync app下载-浏览器书签收藏夹同步备份EverSync下载v1.11.1 安卓版-西西软件下载...
- 三星Galaxy S20:打开手势并更改导航栏按钮顺序
- Jenkins 用户角色权限管理
- 分享Python 的十个小技巧
- windows验证和SQLSERVER验证有什么区别?--混合认证
- 反编译工具ILSpy
- 创业失败后的他们,是怎么找工作的?
- DialogFragment设置不可取消
- uniapp小程序开发自定义相机、拍照、上传
- VC中三种常见中文内码的转换方法(GB2312/GBK/BIG5)