Hi,好久不见,我还是那颗翻滚的老鼠屎。处理数据时想求两个表格求不相交的部分,或许是对知识的匮乏限制了我的想象力,并未找到直接求的方法,在这里介绍老鼠屎技己使用的方法,希望对读者会有帮助。

阴影部分为所要求的部分(但是前提是A、B两个集合都是无重复内容的集合)

首先先造两个DataFrame来做示例。

import pandas as pd
a0={"number":range(10),"letter":["a","a","b","b","c","f","f","e","h","w"]}
a=pd.DataFrame(a0)
b0={"number":range(15),"letter":["b","a","t","b","r","f","g","e","j","w","t","h","i","y","u"]}
b=pd.DataFrame(b0) 

看一下两个DataFrame的样子

       

a                      b

关于差集,我们是要去除两个DataFrame中公共的部分,因此我的想法是:

(1)先将两个DataFrame融合为一个DataFrame;

(2)去掉当中公共的部分(使用drop_duplicates去重)。

下面来看一下代码:

c=a.append(b)
c.drop_duplicates(keep=False,inplace=True)
c.reset_index()

这里想要说明的是,drop_duplicates当中的参数keep=False,意为重复项全部删除,它还有keep="first"与keep="last",分别对应在有多项重复时,保留第一项(或最后一项)。具体可参考官方文档。

得到的效果是虽然过程很简单,但是很好用。

同样的道理可用来求差集,在此不做赘述。

后记

还有一点点时间下班,其实有很多感慨。不长的人生里,很开心会在这所学校遇到一个和我很契合的人。然而毕业季也是别离季。尚未准备好的我们,就要在这郁郁葱葱满是绿意本该还有太多美好的季节匆匆话别。他有他的憧憬,我有我的不舍。在一起时不懂得珍惜,即将分别分外难过。

只愿所爱隔山海,山海亦可平。愿在将来不在彼此身边的日子,我们都可以成长。再次相遇时,都会成为更好的人。

pandas求两个表格不相交的集合相关推荐

  1. Pandas实现两个表格内容模糊匹配

    目录 一.方法2 1. 导入库 2. 构建关键词 3. 构建句子 4. 建立统一索引 5. 表连接 6. 关键词匹配 二.方法2 1. 构建字典 2. 关键词匹配 3. 结果展示 4. 匹配结果展开 ...

  2. python基于pandas使两个表格之间匹配某一属性

    import pandas as pd import numpy as np #编码距离,用于匹配最相近的中文字符串 def edit_distance(word1, word2):len1 = le ...

  3. Python语言学习:利用pandas对两列字段元素求差集(对比两列字段所有元素的异同)

    Python语言学习:利用pandas对两列字段元素求差集(对比两列字段所有元素的异同) 目录 利用pandas对两列字段元素求差集(对比两列字段所有元素的异同) 输出结果 实现代码 利用pandas ...

  4. excel取差集_求两个excel表格的差集方法

    求两个excel表格的差集方法(适用于第二个表格是第一个表格的子集),会在第一个表格中标注出第二个表格中已有的. 复制并用运时"*/ /*"之间的文字为说明文字,必须删除 使用时点 ...

  5. 求两个集合是否有交集 c语言_高中数学:集合与函数概念知识点总结

    我们为你准备了以下12个优质公众号,让你在这里一网打尽高中高考.教育教学哪些事儿,敬请点对应名称关注. 高中生学习库 高中全球通 人教部编课本 高考志愿 高中文科 高中理科 高中语文 高中数学 高中英 ...

  6. java求两个集合的交集和并集,比较器

    求连个集合的交集: import java.util.ArrayList; import java.util.List; public class TestCollection {public sta ...

  7. 如何用python计算excel两行之间的差值_excel表格求两列数据差值-怎样在EXCEL表格中求两列数的差?...

    怎样在EXCEL表格中求两列数的差? 1.双击打开需行求差的Excel表格,Excel表格. 2.在进入Excel表格后,使用鼠标需差的单元格,先选中其中一行即可. 3.在选中一行后,在单元格内输入& ...

  8. 计算机表格 求差,EXCEL表格中两列怎么计算差/2个excel表格数据求差

    怎样在EXCEL表格中求两列数的差? A\B列为数据,在C1输入公式=A1-B1,选中C1之后,并双击右下角黑点向下填充. 算A列和与B列和的差值,用公式=SUM(A:A)-SUM(B:B)即可. 怎 ...

  9. C++求两个集合的交集

    建立一个类Intersection求两个整数集合的交集,具体要求如下: (1)私有数据成员 int set[20];用数组空间set存储集合 int len:表示该集合中元素的个数 (2)公有成员函数 ...

最新文章

  1. C# 动态添加SEO 信息,不和静态页面重复和叠加
  2. spoj Favorite Dice(概率dp+期望)
  3. wxpython界面切换_wxpython实现按钮切换界面的方法
  4. 指尖上的艺术——如何运用代码发挥无限创意
  5. WPF 列表虚拟化时的滚动方式
  6. linux用mame玩游戏,Ubuntu下用kxmame运行精彩的街机游戏
  7. python可以操作word吗_python实现在windows下操作word的方法
  8. Java研发知识图谱
  9. ajax----serialize()方法注意事项
  10. 摘自网络上总结出的一些开源的技术
  11. Cisdem PDF Converter OCR使用教程:在 Mac 上将PDF 转换为 Word
  12. 小程序30分钟倒计时
  13. 高等数学学习笔记(1)——微分方程解法公式
  14. 二维线段树(线段树套线段树)
  15. 电压源和电流的关联参考方向_在大学《电路原理》中,电流源和电压源如何判断关联参考方向和非关联参考方向?...
  16. Gentoo USE参数清单中文详解{转}
  17. 校招潜规则,泄密太多我担心大厂HR封杀我
  18. kubernetes ingress更改日志格式
  19. SSM启动时js或者css文件显示404问题
  20. 解决暴风影音播放rmvb的插件

热门文章

  1. 处理el获取session值:严重: Servlet.service() for servlet [LoginServlet] in context with path [/LDMS]...
  2. 抖音创作规范_干货:抖音内容规范,运营抖音的十五条经验!
  3. SAP MM ME56不能为审批后的PR分配货源? 2
  4. 433芯片的基本原理和对应优缺点理解
  5. 以业务管理信息化系统建设推动施工企业数字化转型
  6. NRF52832 BSP使用分析
  7. uboot什么意思(uboot fastboot)
  8. oracle 根据sid psid,windows 获取当前用户的sid
  9. SpringCloud Admin监控界面解释
  10. Drupal Views教程