有时候处理数据的时候会遇到这样的情况,尽管两列合在一起后表达的意思一样,但无法直接把他们去重

因此我们可以在去重前多进行一步,把两列数据合并成 list 后去重,再把他们分开

# 1.合并数据,转换成 list
df['ls'] = list(map(lambda x,y:[x,y],df['a_attr_single'],df['b_attr_single']))
# 2.对 list 里的数据进行排序处理
df['ls'] = df['ls'].apply(lambda x:','.join(sorted(x)))
# 3. 删除被合并的两列
df.drop(columns=['a_attr_single', 'b_attr_single'], inplace=True)
# 4. 去重
df = df.drop_duplicates()
# 分开list里的数据值
df['attr1'], df['attr2'] = df['ls'].str.split(',', 1).str

Output

Dataframe两列值去重相关推荐

  1. pandas计算dataframe两列数据值相等的行号、取出DataFrame中两列值相等的行号

    pandas计算dataframe两列数据值相等的行号.取出DataFrame中两列值相等的行号 目录 pandas计算dataframe两列数据值相等的行号.取出DataFrame中两列值相等的行号

  2. sql 数据库前两列值乘_Sql语句常用关键字

    最近接触sql比较多,发现自己已经遗忘的也差不多,要用到的时候迟迟拿不出来,今天开始会在知乎上纪录一些sql语句学习的内容,内容重在说明查询语句的用法. 一.sql查询语句的初始介绍 1.查询语句的一 ...

  3. sql 数据库前两列值乘_SQL | SQL 必知必会笔记 (一 )

    原文:SQL | SQL 必知必会笔记 (一 ) 作者: PyStaData 基本概念 一些规则 多条 SQL 语句必须以分号分隔. SQL 不区分大小写,但一般习惯关键字用大写,列名和表名使用小写. ...

  4. pandas dataframe 两列转字典

    在数据处理时,时常需要将数据表的两列转化为字典映射形式 df[['A','B']] -----> dict(key:A, value:B) 方法一:使用zip d = dict(zip(df[' ...

  5. sql 数据库前两列值乘_与开发battle有点虚?小白都能看懂的数据库知识来了

    文末领取[SQL面试题及答案] 随着近几年AI智能,大数据的发展,"产品经理是是否需要懂技术?""产品经理应该对技术理解到什么程度?"诸如此类的问题又再次出现在 ...

  6. python中where函数_如何在python中基于Where函数获取两列值

    问题是: 基于user_id列,我想得到rating和{}列的值.可能有多个条目具有相同的用户标识.我希望获取具有rating和product_id列值的所有用户记录,但对于用户未对电影进行评级的电影 ...

  7. sql 数据库前两列值乘_懂EXCEL就会SQL,从此查数不求人

    小白如何学习SQL语言? 大部分的文章都是先从意义原理开始讲,再讲环境搭建.还没看到怎么操作就放弃了. 大部分人学习SQL的需求是什么? 而且,大多数人的使用场景是数据库是现成的,这就不涉及数据库的安 ...

  8. df 取某两列值不一致的行

    例如我要取df_external的df_external['label'] != df_external['groundtruth'] 的行 必须保证 作比较的这两列的数据类型一样 也就是label ...

  9. sql 数据库前两列值乘_数据库的基本概念:

    数据库的相关概念: 数据-data: 1.描述事物的符号 2.多种表现形式:文本,图形,音频,视频. 数据库-Database,DB 1.粮库,车库 2.存放数据的仓库在计算机中,按照一定的格式存放, ...

最新文章

  1. 4种方法可以缓解网络瓶颈
  2. C++多线程编程以及epoll处理socket通信时多端口问题
  3. 【BZOJ】3224: Tyvj 1728 普通平衡树
  4. linux下puppet的“资源”管理
  5. boost::copy_graph用法的测试程序
  6. 登陆时不显示上一次登陆的用户名
  7. 纪中C组模拟赛总结(2019.7.9)
  8. Git 忽略编译后文件
  9. 安全多方计算新突破!阿里首次实现“公开可验证” 的安全方案
  10. python实现代码_python感知机实现代码
  11. Linux环境下查看CPU资源的命令
  12. Hp Dell服务器硬件监控
  13. 阿里云技术专家张城:SLS可观测与AIOps的整体架构
  14. 【MySQL数据库】----保姆级MySQL驱动包安装+JDBC编程
  15. 共享没有计算机网络连接不上去,苹果usb共享给电脑连接不上怎么办
  16. AIS数据修复-三次样条插值法(Cubic spline interpolation)
  17. 共享单车调度_原来共享单车是这样调度的
  18. 对应win10的服务器系统,我的系统变成win10远程服务器系统
  19. 初学者备战蓝桥杯历程(大学编程学习历程记录,题目思路献给需要备考蓝桥杯的同学)
  20. FPGA入门:QuartusⅡ实现半加器,全加器,四位全加器

热门文章

  1. matlab读Excel表格数据画图,matlab读Excel表格数据画图-如何利用matlab根据excel表格里面的数据画图...
  2. 郑州大学计算机系王院长,郑州大学徐明亮教授、北京航天航空大学牛建伟教授来校开展学术交流...
  3. 【Paper】2017_Consensus of linear multi-agent systems with exogenous disturbance generated from hetero
  4. 224除以10为什么等于22c语言,C语言 编程练习22
  5. Minesweeper-Java
  6. 上班第一天,人工智能的各路“谈资”已为你备好
  7. python+opencv-12 黑帽和礼帽运算
  8. 湖南湘中计算机学校历任校长,2005学年度湖南省中等职业学校.doc
  9. 程序员的理想桌面装备,少不了一台2K高清的专业显示器
  10. 响应式织梦模板齿轮设备类网站