场景:按 A 列去重,保留 B 列中 最小的一行数据。

# -*- coding: utf-8 -*-
'''
@author: user
'''
import pandas as pddata = [[1,1,1,2,3,3], [0.2,0.3,0.4,0.1,0.2,0.4]]
data = pd.DataFrame(data)
data = [[1,1,1,2,3,3], [0.2,0.3,0.4,0.1,0.2,0.4]]
data = pd.DataFrame(data).T
data.columns=['A', 'B']
print (data)
#按 A 列去重,保留 B 列中 最小的一行数据。
#方法一:
print (data.groupby('A', as_index=False)['B'].min())
#方法二:
print(data.pivot_table(index='A', columns=None, values='B', aggfunc=min) )
#方法三:
data.sort_values(by=['B'],ascending=True)
print (data.drop_duplicates(['A']))

【数据平台】pandas按条件去重相关推荐

  1. pandas基于条件判断更新dataframe中所有数据列数值内容的值(Conditionally updating all values in pandas Dataframe )

    pandas基于条件判断更新dataframe中所有数据列数值内容的值(Conditionally updating all values in pandas Dataframe ) 目录

  2. pandas基于条件判断更新dataframe中特定数据列数值内容的值(Conditionally updating values in specific pandas Dataframe )

    pandas基于条件判断更新dataframe中特定数据列数值内容的值(Conditionally updating values in specific pandas Dataframe ) 目录

  3. Excel 单表单列、单表多列、多表单列数据的条件去重罗列

    文章目录 前言 一.应用场景 二.核心内容 2.1.if() 2.2.countif() 2.3.row(),column() 2.4.text() 2.5.主函数 三.使用步骤 3.1.单表单列.单 ...

  4. Kafka集群在马蜂窝大数据平台的优化与应用扩展

    导读 Kafka 是当下热门的消息队列中间件,它可以实时地处理海量数据,具备高吞吐.低延时等特性及可靠的消息异步传递机制,可以很好地解决不同系统间数据的交流和传递问题. Kafka 在马蜂窝也有非常广 ...

  5. TableStore发布多元索引功能,打造统一的在线数据平台

    什么是NoSQL "NoSQL"一词最早出现在1998年,距今刚好二十年.站在今天回头看的话,很少有人能想到在关系型数据库成熟发展了三十年,已经在数据存储领域占据了不可动摇的的地位 ...

  6. kafka 可视化工具_Kafka集群在马蜂窝大数据平台的优化与应用扩展

    Kafka 是当下热门的消息队列中间件,它可以实时地处理海量数据,具备高吞吐.低延时等特性及可靠的消息异步传递机制,可以很好地解决不同系统间数据的交流和传递问题. Kafka 在马蜂窝也有非常广泛的应 ...

  7. 大数据平台架构技术选型与场景运用

    内容来源:2017年5月6日,大眼科技CTO张逸在"魅族技术开放日第八期--数据洞察"进行<大数据平台架构技术选型与场景运用>演讲分享.视频地址:https://mp. ...

  8. 行进中换轮胎——万字长文解析美团和大众点评两大数据平台是怎么融合的

    点击上方"公众号"可以订阅哦 本文根据作者在2017年ArchSummit的分享记录整理而成. 背景 互联网格局复杂多变,大规模的企业合并重组不时发生.原来完全独立甚至相互竞争的两 ...

  9. Kafka 集群在马蜂窝大数据平台的优化与应用扩展

    Kafka 是当下热门的消息队列中间件,它可以实时地处理海量数据,具备高吞吐.低延时等特性及可靠的消息异步传递机制,可以很好地解决不同系统间数据的交流和传递问题. Kafka 在马蜂窝也有非常广泛的应 ...

最新文章

  1. Painting A Board --POJ 1691
  2. EmbeddedWebBrowser(EmbeddedWB)不显示图片
  3. vmware virtualization software
  4. Java Integer类lowerOneBit()方法与示例
  5. 力扣645.错误的集合
  6. 口碑饿了么融合一周年 城市生活服务为何变得更"立体"了
  7. Java泛型你了解多少
  8. mysql 种子表_mysql之3种子查询
  9. mysql数据库操作类
  10. IMP 导入数据报错 OCI-21500 OCI-22275
  11. MyEclipse里自制JSP模板
  12. Java IO流使用过程中乱码问题总结
  13. 2021年安全员-A证(江西省)报名考试及安全员-A证(江西省)考试平台
  14. RFC5869翻译 HMAC-based Extract-and-Expand Key Derivation Function (HKDF)
  15. CentOS安装Eclipse,Eclipse启动时报错
  16. 比较经典的位字段例题(颜色三原色)
  17. 编程珠玑——取样总结
  18. 深入理解Linux进程描述符task_struct结构体
  19. 【直通BAT】BAT后端开发36题:Redis、Nosql、Mysql、秒杀题目!含面试经验总结!(优知学院公众号)
  20. 北湖挖坑 | 感受算法的魅力

热门文章

  1. Python基础数据类型之字符串(二)
  2. inline-block什么意思中文_css中inline-block是什么?inline-block布局的使用
  3. office上下滑动滚轮特别卡_滚轮及部件|自动扶梯和自动人行道
  4. 如何将qmainwidget 客户区坐标_滋补品行业营销感悟之:如何将同行变成客户?
  5. windows服务与网页交互_戴尔高级主动式触控笔-PN579X评测:Windows也有好触控
  6. C#多态性的小记,父类,子类,虚方法,接口
  7. Android基础教程pdf
  8. http://offlineinstallersofts.com/
  9. c#window服务程序
  10. sql 把多列内容合并