python dataframe dropna_在Python中使用熊猫在两个DataFrame之间进行值...
嗨,我有两个像下面的DataFrames
DF1
Alpha | Numeric | Special
and | 1 | @
or | 2 | #
lol ok | 4 | &
DF2 with single column
Content
boy or girl
school @ morn
pyc LoL ok student
Chandra
我想搜索DF1列中的任何人是否在DF2内容列中的任何关键字,并且输出应该在新的DF中
`df11 = (df1.unstack()
.reset_index(level=2,drop=True)
.rename_axis(('col_order','col_name'))
.dropna()
.reset_index(name='val_low'))
df22 = (df2['Content'].str.split(expand=True)
.stack()
.rename('val')
.reset_index(level=1,drop=True)
.rename_axis('idx')
.reset_index())`
df22['val_low'] = df22['val'].str.lower()
df = (pd.merge(df22, df11, on='val_low', how='left')
.dropna(subset=['col_name'])
.sort_values(['idx','col_order'])
.drop_duplicates(['idx']))
df = (pd.concat([df2, df.set_index('idx')], axis=1)
.fillna({'col_name':'Other'})[['val','col_name','Content']])
但它没有考虑大声笑之间的空格
expected_output_DF
val col_name Content
0 or Alpha boy or girl
1 @ Special school @ morn
2 lol ok Alpha pyc LoL ok student
3 NaN Other Chandra
有人帮我这个
python dataframe dropna_在Python中使用熊猫在两个DataFrame之间进行值...相关推荐
- 如何利用计算机计算天数,如何应用Win10系统电脑中的计算器计算两个日期之间的天数?...
如何应用Win10系统电脑中的计算器计算两个日期之间的天数? 相信很多小伙伴都有在使用windows10系统的电脑,其中的计算器如何才能用来计算两个日期之间的天数呢?方法很简单,下面小编就来为大家介绍 ...
- python读取数据库数据类型_Python中从SQL型数据库读写dataframe型数据
Python的pandas包对表格化的数据处理能力很强,而SQL数据库的数据就是以表格的形式储存,因此经常将sql数据库里的数据直接读取为dataframe,分析操作以后再将dataframe存到sq ...
- python画点连线_python matplotlib 在指定的两个点之间连线方法
python matplotlib 在指定的两个点之间连线方法 为了找到matplotlib在两个点之间连线的方法真是费了好大功夫,最后还是决定用简单的 plt.plot 来解决.如果有好多对点,则可 ...
- python日期间隔天数_Python编程题5--计算两个日期之间相隔的天数
题目 已知任意两个日期,计算出两个日期之间相隔的天数. 实现思路1 这里我们运用 Python 里面内置模块 time 来处理问题. 已知2个日期,格式为 yyyy-mm-dd 通过 time.str ...
- mysql中日期怎样求差_在Sql语句中怎样计算出两个日期的差值
展开全部 sql语句中计算两个日期的差值用32313133353236313431303231363533e4b893e5b19e31333365643662datediff函数. 工具:sqlser ...
- python 执行shell 事务_python中执行shell的两种方法总结
一.使用python内置commands模块执行shell commands对Python的os.popen()进行了封装,使用SHELL命令字符串作为其参数,返回命令的结果数据以及命令执行的状态: ...
- python模块相互引用_python中如何相互引用两个包中的模块
包名为New_Start #!/usr/bin/python #-*- encoding: utf-8 -*- ''' Created on 2014年10月11日 @author : Adminis ...
- 采用邻接表存储结构,编写一个判别无向图中任意给定的两个顶点之间是否存在一条长度为k的简单路径的算法。
以邻接表存储的有向图中是否存在有顶点Vi到Vj顶点的路径(i!=j). 问题描述:试基于图的深度优先搜索策略编写一程序,判别以邻接表存储的有向图中是否存在有顶点Vi到Vj顶点的路径(i!=j). 输入 ...
- Java中实现多线程的两种方式之间的区别
Java提供了线程类Thread来创建多线程的程序.其实,创建线程与创建普通的类的对象的操作是一样的,而线程就是Thread类或其子类的实例对象.每个Thread对象描述了一个单独的线程.要产生一个线 ...
最新文章
- AI和机器学习如何改善用户体验?
- 尺取法——POJ3061
- Cookie工具类-cookieUtil.js
- jboss、weblogic介绍
- python方法测试怀孕_在Python中测试私有方法(例外)
- 常用的高光谱遥感影像数据集(详细介绍+下载链接)
- Google Guice依赖注入框架使用
- 文件分配方式-索引分配
- 保研经历总结--天津大学
- 2019电商数据分析师实战项目教程 电商数据分析报告 电商运营数据分析 电商数据分析流程
- PHP修改图片颜色(生成彩色二维码)
- 适用于 Windows 操作系统的远程服务器管理工具 (RSAT)
- 巨斧砍大树-sdut
- Android 11.0 进入recovery模式(等待用户选择recovery模式界面)进入自动恢复出厂设置模式
- debian安装java
- char *str1 和 char str2[]的详解
- 自回归AR模型、移动平均MA模型与自回归移动平均ARMA模型的比较分析
- Snort 入侵检测系统简介
- 41.Java HashMap有序集合
- 封神台——第一关:为了女神小芳
热门文章
- 2021年中国LED驱动器(LED照明驱动器)市场趋势报告、技术动态创新及2027年市场预测
- 中国魔笛痛改前非做好准备 国足不能失去传奇大师
- 全网首发!马士兵内部共享—1658页《Java面试突击核心讲》
- QuickBooks 2007 All-in-One Desk Reference For Dummies
- 22岁B站主播之死:有很多人,过着我们想象不到的人生
- java xsd校验xml文件
- 英语计算机工程师求职信,计算机工程师英文求职信范文
- 刘启轩-毫米波雷达的特性及应用
- 看来不止一次的电影(电影经典给你好看准备下载下来,免得以后收费了)
- Windows环境下通过SSH登录新浪云