● 选择题

以下关于DataFrame.duplicated()函数说法错误的是:

A 该函数用于标记dataframe中内容重复的行

B 该函数返回值是一个序列,True表示重复

C 行内容被判定重复时,该行各列的值一定都重复

D keep参数默认取值为"first"

● 问题解析

1.DataFrame.duplicated(subset = None,keep ='first')函数用于找出dataframe的重复行。返回可以正确表示是否为重复行的布尔序列(即非重复项标记为False,重复项标记为True)。则A,B正确。

2.subset参数:列标签(可以是一列,也可以是多列,默认是所有列),可选,仅考虑某些列来标识重复项,默认情况下考虑所有列来标记重复项。C错误,既可以考虑所有列来判断是否重复,也可以只考虑某些列来判断是否重复。

3.keep参数:参数取值包括{'first','last',False},默认为'first'。若取值为first,表示若有重复项,将第一个出现的重复项标记为False,并将其余相同的项标记为True。若取值为last,表示若有重复项,将最后一个出现的重复项标记为False,并将其余相同的项标记为True。若取值为False,表示若有重复项,将所有重复项标记为True。D正确。

● 附图

图1 DataFrame.duplicated()函数不同参数取值对比(1)

图2 DataFrame.duplicated()函数不同参数取值对比(2)

图3 DataFrame.duplicated()函数不同参数取值对比(3)

● 附图代码

import pandas as pd

from pandas import DataFrame

df = pd.DataFrame({'col1': ['一', '一', '二', '二',  '三', '四','四'],

'col2': [ 1 , 2 , 1 , 1 , 1 , 1 ,1],

'col3':['AA','BB','CC','DD','EE','FF','FF']})

df

df.duplicated()#取默认参数,基于所有列,keep取first

df.duplicated('col1') #基于col1,keep取first

df.duplicated('col1',keep='last') #基于col1,keep取last

df.duplicated('col1',False) #基于col1,keep取False

df.duplicated(['col1','col2'])#基于col1,col2,keep取first

● 正确答案

C
————————————————
版权声明:本文为CSDN博主「刘经纬老师」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/liujingwei8610/article/details/122795570

[转]Python中找出dataframe中的重复的行 DataFrame.duplicated()方法相关推荐

  1. Python数据分析 找出数组中每行(或每列)中指定的百分位数 numpy.percentile()

    [小白从小学Python.C.Java] [Python-计算机等级考试二级] [Python-数据分析] Python数据分析 找出数组中每行(或每列) 中指定的百分位数 numpy.percent ...

  2. python输入英文句子、找最长单词_在输入fi中找出句子中的最大和最小单词数

    我有一个问题,要求我找出文本文件中单词的最小和最大数量.我已经完成了五个问题中的三个,剩下的两个是关于最小值和最大值的问题,我对此没有任何解决办法.以下是我的代码:感谢您的帮助lines, blank ...

  3. python查找字符串出现次数_Python 中找出字符串中出现频率最高的字母

    发现一个学Python的好网站 https://py.checkio.org 第一题大概意思就是找出一个字符串中出现频率最高字母 我的思路也是直接,弄个字典,遍历字符串,将键值对填进字典里,健就是字母 ...

  4. python怎么找出列表中的重复数据_python – 如何在列表中找到重复项并使用它......

    要删除重复项,请使用set(a).要打印重复项,例如: a = [1,2,3,2,1,5,6,5,5,5] import collections print [item for item, count ...

  5. 剑指offer python版 找出数组中重复的数字

    def aa(nums):if not nums:return Falsehashes={}ret=[]for s in nums:hashes[s]=hashes[s]+1 if hashes.ge ...

  6. python消找出img中的src标签_使用beautifulsoup从img标签获取src

    这是我最后一次求救帮助我正在尝试使用我的不和机器人进行一些很酷的嵌入,唯一的问题是我无法从网站获取img到任何人都可以帮忙吗?大部分情况下,这是其他人告诉我使用的代码,这里找到的代码不起作用.使用be ...

  7. js判断数组中重复元素并找出_JavaScript判断数组重复内容的两种方法(推荐)

    前言 一般,我们可能会给数组去重,这个操作并不复杂,执行一个循环就是了.现在,我要做的是,判断数组中是否有重复的内容,如果有,返回 true 否则,返回 false. 思路 把数组变成字符串 循环原数 ...

  8. 盘点一个使用Python实现Excel中找出第一个及最后一个不为零的数,它们各自在第几列

    一.前言 前几天在Python交流群中遇到一个问了一个使用Python实现Excel中找出第一个及最后一个不为零的数,它们各自在第几列的问题,觉得还挺有用的,这里拿出来跟大家一起分享下. 数据截图如下 ...

  9. python将大于输出列表_python找出列表中大于某个阈值的数据段示例

    该算法实现对列表中大于某个阈值(比如level=5)的连续数据段的提取,具体效果如下: 找出list里面大于5的连续数据段: list = [1,2,3,4,2,3,4,5,6,7,4,6,7,8,5 ...

  10. Python找出列表中出现次数最多的元素三种方式

    通过三种方式给大家介绍,具体详情如下所示: 方式一: 原理:创建一个新的空字典,用循环的方式来获取列表中的每一个元素,判断获取的元素是否存在字典中的key,如果不存在的话,将元素作为key,值为列表中 ...

最新文章

  1. curl linux 数组参数_Linux系统调用原理
  2. 【IM】关于参数模型和核模型的理解
  3. AI:2020年6月21日北京智源大会演讲分享之20:05-20:25陶建华《人工智能学科设置与人才培养》、雷明《企业对人工智能人才的要求以及对人工智能人才培养的建议》
  4. 利用SOS扩展库进入高阶.NET6程序的调试
  5. java map统计学生名单_Java含自己的总结:集合,学生,遍历,ArrayList,Set,Map,泛型,班级,发牌—诗书画唱...
  6. uniDBGrid导入数据库(转红鱼儿)
  7. 远程连接linux的mysql_【Linux开启mysql远程连接的设置步骤】 mysql开启远程连接
  8. Nokia Imaging SDK滤镜使用入门
  9. 后端向前端返回图片URL,并向后端传递base64格式URL
  10. 斑马Revit:“BIM等级考试证书”究竟要不要考?
  11. linux steam大屏幕模式,Steam 大屏幕模式 - Steam Support
  12. 找不到网络其他计算机名,电脑找不到无线网名称怎么办?找不到无线网名称解决办法...
  13. travis java,关于java:在成功构建之后使travis-ci压缩我的项目并将其推送到github
  14. cup过高是什么意思_铁蛋白升高是什么原因?
  15. iOS逆向重签名(三):微信重签名
  16. 群晖php7.0,群晖新版操作系统DSM 7.0下载
  17. ftl转word,word转pdf记录
  18. SICP-Notes-Lecture 21 SQL I
  19. android7.1.1 文件管理,华为手机文件管理器(com.huawei.hidisk) - 10.11.11.301 - 应用 - 酷安...
  20. Nginx+Lua脚本+Redis 实现自动封禁访问频率过高IP

热门文章

  1. 银河麒麟操作系统开机进入grub提示符界面
  2. Linux:系统进程---->查看命令【ps:静态查看进程】【top:动态查看进程】
  3. MAGIC文件格式解析
  4. session-based recommendation的两个模型对比NARM, STAMP
  5. 基于Java语言的语法分析器
  6. TPM密钥管理、使用
  7. swoole-redis连接池的问题总结
  8. STM32 UART DMA实现未知数据长度接收(转自amoBBs)
  9. [c++]-uint8_t,uint16_t,uint32_t,uint64_t代表含义及其标准定义
  10. 渭城曲 / 送元二使安西