pandas聚合dataframe某一列的值中的所有元素
数据:
one | two | |
---|---|---|
0 | a;b | 4.2 |
1 | b;c | 0.03 |
2 | a | 0 |
使用merge_column()
函数即可:
import pandas as pddef merge_column(dataframe, column, seq=';') -> set:merge_sentence = set()all_sentences = dataframe[column].values.tolist()for s in all_sentences:if not pd.isna(s):for i in s.split(seq):merge_sentence.add(i)return merge_sentenceif __name__ == '__main__':df: pd.DataFrame = pd.DataFrame([['a;b', 4.2],['b;c', 0.03],['a', 0]], columns=['one', 'two'])print(merge_column(df, column='one', seq=';'))
pandas聚合dataframe某一列的值中的所有元素相关推荐
- python 根据判断产生新列_pandas DataFrame 根据多列的值做判断,生成新的列值实例...
环境:Python3.6.4 + pandas 0.22 主要是DataFrame.apply函数的应用,如果设置axis参数为1则每次函数每次会取出DataFrame的一行来做处理,如果axis为1 ...
- pandas基于dataframe字符串数据列不包含特定字符串来筛选dataframe中的数据行(rows where values do not contain substring)
pandas基于dataframe字符串数据列不包含(not contains)特定字符串来筛选dataframe中的数据行(rows where values do not contain subs ...
- pandas使用extract函数根据正则表达式从dataframe指定数据列的字符串中抽取出数字并生成新的数据列(extract numbers from column)
pandas使用extract函数根据正则表达式从dataframe指定数据列的字符串中抽取出数字并生成新的数据列(extract numbers from column and generate n ...
- pandas基于dataframe特定数据列的指定阈值将原dataframe分割成两个dataframe(split dataframe based on column value threshold
pandas基于dataframe特定数据列的指定阈值将原dataframe分割成两个子dataframe(split dataframe based on column value threshol ...
- pandas基于dataframe字符串数据列包含(contains)特定字符串来筛选dataframe中的数据行(rows where values contain substring)
pandas基于dataframe字符串数据列包含(contains)特定字符串来筛选dataframe中的数据行(rows where values contain substring) 目录
- pandas使用extract函数根据正则表达式从dataframe指定数据列的字符串中抽取出数字(设置expand=false之后返回的为series)、将series转化为dataframe
pandas使用extract函数根据正则表达式从dataframe指定数据列的字符串中抽取出数字(设置expand=false之后返回的为series).把pandas series转化为panda ...
- pandas将dataframe日期数据列的日期转化为日期当月第一天(每月1号)的日期并生成新的数据列(Setting date to beginning of month in dataframe)
pandas将dataframe日期数据列的日期转化为日期当月第一天(每月1号)的日期并生成新的数据列(Setting date to beginning of month in dataframe) ...
- pandas对dataframe的数据列进行随机抽样(Random Sample of Columns)、使用sample函数进行数据列随机抽样
pandas对dataframe的数据列进行随机抽样(Random Sample of Columns).使用sample函数进行数据列随机抽样 目录
- pandas对dataframe的数据列进行随机抽样(Random Sample of Columns):使用sample函数进行数据列随机抽样(有放回的随机抽样,replacement)
pandas对dataframe的数据列进行随机抽样(Random Sample of Columns):使用sample函数进行数据列随机抽样(有放回的随机抽样,replacement) 目录
最新文章
- Angular使用@Input和@Output实现父子组件互相传参(类似Vue的props和this.emit)
- (1)虚拟机管理——在微软云Azure新门户创建虚拟机
- 秒秒钟揪出张量形状错误,这个工具能防止ML模型训练白忙一场
- TypeScript VS JavaScript 深度对比
- asp.net模版页面的高级应用
- 正则表达式(Regular Expressions)
- embed中 src属性动态更改。
- Eyoucms代理授权统计插件源码
- UITableView 编辑和删除行
- codeforces 690D2 D2. The Wall (medium)(组合数学)
- 再聊如何通过基金定投达到十年十倍?
- ANSYS Workbench16教程学习01
- android 9.0 xposed,EdXposed管理器(安卓9.0专用)
- minikube 部署
- Android陀螺仪传感器
- 利用MeGUI实现批量转换视频
- 一项研究调查了采用Masimo Rad-G™搭配RRp(R)实现自动呼吸频率测量的影响
- c语言与编程语言的区别,C语言与其他编程语言的区别
- 我的世界手机版javaui材质包_我的世界手机版幸运方块2.1
- 一个简单的仓库管理系统