pandas求两个表格不相交的集合
Hi,好久不见,我还是那颗翻滚的老鼠屎。处理数据时想求两个表格求不相交的部分,或许是对知识的匮乏限制了我的想象力,并未找到直接求的方法,在这里介绍老鼠屎技己使用的方法,希望对读者会有帮助。
阴影部分为所要求的部分(但是前提是A、B两个集合都是无重复内容的集合)
首先先造两个DataFrame来做示例。
import pandas as pd
a0={"number":range(10),"letter":["a","a","b","b","c","f","f","e","h","w"]}
a=pd.DataFrame(a0)
b0={"number":range(15),"letter":["b","a","t","b","r","f","g","e","j","w","t","h","i","y","u"]}
b=pd.DataFrame(b0)
看一下两个DataFrame的样子
a b
关于差集,我们是要去除两个DataFrame中公共的部分,因此我的想法是:
(1)先将两个DataFrame融合为一个DataFrame;
(2)去掉当中公共的部分(使用drop_duplicates去重)。
下面来看一下代码:
c=a.append(b)
c.drop_duplicates(keep=False,inplace=True)
c.reset_index()
这里想要说明的是,drop_duplicates当中的参数keep=False,意为重复项全部删除,它还有keep="first"与keep="last",分别对应在有多项重复时,保留第一项(或最后一项)。具体可参考官方文档。
得到的效果是虽然过程很简单,但是很好用。
同样的道理可用来求差集,在此不做赘述。
后记
还有一点点时间下班,其实有很多感慨。不长的人生里,很开心会在这所学校遇到一个和我很契合的人。然而毕业季也是别离季。尚未准备好的我们,就要在这郁郁葱葱满是绿意本该还有太多美好的季节匆匆话别。他有他的憧憬,我有我的不舍。在一起时不懂得珍惜,即将分别分外难过。
只愿所爱隔山海,山海亦可平。愿在将来不在彼此身边的日子,我们都可以成长。再次相遇时,都会成为更好的人。
pandas求两个表格不相交的集合相关推荐
- Pandas实现两个表格内容模糊匹配
目录 一.方法2 1. 导入库 2. 构建关键词 3. 构建句子 4. 建立统一索引 5. 表连接 6. 关键词匹配 二.方法2 1. 构建字典 2. 关键词匹配 3. 结果展示 4. 匹配结果展开 ...
- python基于pandas使两个表格之间匹配某一属性
import pandas as pd import numpy as np #编码距离,用于匹配最相近的中文字符串 def edit_distance(word1, word2):len1 = le ...
- Python语言学习:利用pandas对两列字段元素求差集(对比两列字段所有元素的异同)
Python语言学习:利用pandas对两列字段元素求差集(对比两列字段所有元素的异同) 目录 利用pandas对两列字段元素求差集(对比两列字段所有元素的异同) 输出结果 实现代码 利用pandas ...
- excel取差集_求两个excel表格的差集方法
求两个excel表格的差集方法(适用于第二个表格是第一个表格的子集),会在第一个表格中标注出第二个表格中已有的. 复制并用运时"*/ /*"之间的文字为说明文字,必须删除 使用时点 ...
- 求两个集合是否有交集 c语言_高中数学:集合与函数概念知识点总结
我们为你准备了以下12个优质公众号,让你在这里一网打尽高中高考.教育教学哪些事儿,敬请点对应名称关注. 高中生学习库 高中全球通 人教部编课本 高考志愿 高中文科 高中理科 高中语文 高中数学 高中英 ...
- java求两个集合的交集和并集,比较器
求连个集合的交集: import java.util.ArrayList; import java.util.List; public class TestCollection {public sta ...
- 如何用python计算excel两行之间的差值_excel表格求两列数据差值-怎样在EXCEL表格中求两列数的差?...
怎样在EXCEL表格中求两列数的差? 1.双击打开需行求差的Excel表格,Excel表格. 2.在进入Excel表格后,使用鼠标需差的单元格,先选中其中一行即可. 3.在选中一行后,在单元格内输入& ...
- 计算机表格 求差,EXCEL表格中两列怎么计算差/2个excel表格数据求差
怎样在EXCEL表格中求两列数的差? A\B列为数据,在C1输入公式=A1-B1,选中C1之后,并双击右下角黑点向下填充. 算A列和与B列和的差值,用公式=SUM(A:A)-SUM(B:B)即可. 怎 ...
- C++求两个集合的交集
建立一个类Intersection求两个整数集合的交集,具体要求如下: (1)私有数据成员 int set[20];用数组空间set存储集合 int len:表示该集合中元素的个数 (2)公有成员函数 ...
最新文章
- C# 动态添加SEO 信息,不和静态页面重复和叠加
- spoj Favorite Dice(概率dp+期望)
- wxpython界面切换_wxpython实现按钮切换界面的方法
- 指尖上的艺术——如何运用代码发挥无限创意
- WPF 列表虚拟化时的滚动方式
- linux用mame玩游戏,Ubuntu下用kxmame运行精彩的街机游戏
- python可以操作word吗_python实现在windows下操作word的方法
- Java研发知识图谱
- ajax----serialize()方法注意事项
- 摘自网络上总结出的一些开源的技术
- Cisdem PDF Converter OCR使用教程:在 Mac 上将PDF 转换为 Word
- 小程序30分钟倒计时
- 高等数学学习笔记(1)——微分方程解法公式
- 二维线段树(线段树套线段树)
- 电压源和电流的关联参考方向_在大学《电路原理》中,电流源和电压源如何判断关联参考方向和非关联参考方向?...
- Gentoo USE参数清单中文详解{转}
- 校招潜规则,泄密太多我担心大厂HR封杀我
- kubernetes ingress更改日志格式
- SSM启动时js或者css文件显示404问题
- 解决暴风影音播放rmvb的插件
热门文章
- 处理el获取session值:严重: Servlet.service() for servlet [LoginServlet] in context with path [/LDMS]...
- 抖音创作规范_干货:抖音内容规范,运营抖音的十五条经验!
- SAP MM ME56不能为审批后的PR分配货源? 2
- 433芯片的基本原理和对应优缺点理解
- 以业务管理信息化系统建设推动施工企业数字化转型
- NRF52832 BSP使用分析
- uboot什么意思(uboot fastboot)
- oracle 根据sid psid,windows 获取当前用户的sid
- SpringCloud Admin监控界面解释
- Drupal Views教程