快速数据筛选

  • 问题场景
  • 实现方法

问题场景

当需要对excel数据根据不同的条件进行筛选,可以利用pandas快速实现。例如筛选出一张表格里来自不同网站的数据,每个网站的数据不超过20条。示例如下:

实现方法

import pandas as pddef select_data():raw_df = pd.read_excel('./check_data/原始数据.xlsx')selected_df = pd.DataFrame(columns=raw_df.columns.values) # 直接获取原DataFrame列标签website_dict = {}for ind, row in raw_df[:10].iterrows():website_id = row['websiteId']if website_id not in website_dict.keys():website_dict[website_id] = 1selected_df = selected_df.append(row) # 直接添加一条数据elif website_dict[website_id] < 20:website_dict[website_id] += 1selected_df = selected_df.append(row)selected_df.to_excel('./check_data/筛选数据.xlsx')if __name__ == '__main__':select_data()

该方法不需要新建DataFrame的列索引,同时在添加数据时直接添加原Series,不需要额外做字段对应,高效而且避免对应出错。

pd.DataFrame()快速筛选数据相关推荐

  1. Excle中如何快速筛选数据

    目录 Excle中如何快速筛选数据 一.如何进行筛选数据 第一步:选中需要筛选的整行或列 (如:鼠标放在方框B位置选中整列) 第二步:找到"开始"菜单栏中的"排序和筛选& ...

  2. 在excel中如何筛选重复数据_Excel – 几个快速筛选数据表的技巧

    筛选数据表,是非常基础的 Excel 操作,相信大部分人都会. 不过今天我要教大家几组快速筛选的方法,不用通过筛选按钮就能实现. 案例 1:筛选出姓名为"赵铁锤"的所有行 解决方案 ...

  3. 快速筛选数据集中某列特征符合某种规律的所有数据集

    我们常常有这样的需要: 如果某条数据的特征card1的取值在某个列表里面,就提取出来. 所有上述数据输出得到新的数据集. 那么sql怎么操作呢? 1.统计犯罪信用卡设计的卡号card1有哪些取值. s ...

  4. pandas dataframe使用query进行多个条件快速筛选

    对于dataframe格式的数据,使用多个筛选条件筛选时,建议使用query(): 使用query关键词不会产生新的空间开销,可以更加节省内存 在小样本下效率低于传统方法(比如q1_2),但是在大样本 ...

  5. python dataframe 列筛选_pandas系列之DataFrame 行列数据筛选实例

    一.对DataFrame的认知 DataFrame的本质是行(index)列(column)索引+多列数据. 为了简化理解,我们不妨换个思路- 现实中,为了简化对一件事物的描述,我们会选择几个特征. ...

  6. dataframe之按时间筛选数据

    对原始数据集进行筛选操作,条件是:客户号.queryreason.querier三个相同的时候,开始计算querydate按从大到小排序,14内出现的删除 功能描述 对数据集中具有相同key的记录,按 ...

  7. pandas基于dataframe字符串数据列不包含特定字符串来筛选dataframe中的数据行(rows where values do not contain substring)

    pandas基于dataframe字符串数据列不包含(not contains)特定字符串来筛选dataframe中的数据行(rows where values do not contain subs ...

  8. pandas基于dataframe字符串数据列包含(contains)特定字符串来筛选dataframe中的数据行(rows where values contain substring)

    pandas基于dataframe字符串数据列包含(contains)特定字符串来筛选dataframe中的数据行(rows where values contain substring) 目录

  9. R语言对dataframe进行行数据筛选(row selection)多种方案:使用R原生方法、data.table、dplyr等方案

    R语言对dataframe进行行数据筛选(row selection)多种方案:使用R原生方法.data.table.dplyr等方案 目录

最新文章

  1. 【BZOJ 1095】 1095: [ZJOI2007]Hide 捉迷藏 (括号序列+线段树)
  2. 聚类分析matlab检验,「matlab聚类分析」聚类分析的Matlab 程序—系统聚类(附有案例分析) - 金橙教程网...
  3. Task Schedule
  4. 打开VMware的系统出错
  5. 开发Android应用 提升性能的小技巧
  6. VMware Pro 14 安装 Ubuntu 18.04 详细教程
  7. 七年级上册计算机重点知识点,初一上册数学重点知识点
  8. 支付宝基金收益灰色是什么意思?
  9. 计蒜客——学生成绩查找系统
  10. 目前主流的数据库有哪些?
  11. 七日年化收益率计算器_定投收益率该怎么算?
  12. 命令行字符界面与图形界面切换
  13. Semaphore释疑
  14. 网站流量模型(1)介绍
  15. vue3后台管理系统(https://github.com/noob-Jp/my-admin-vue3)
  16. 学前端到了CSS阶段,你一定要掌握这9大防御式开发技能
  17. 技术宅教你如何煎一个特别牛逼且装逼的牛排
  18. 康耐视智能相机Insight内置FTP存图
  19. 廖雪峰Git教程笔记与总结 -- Git简介、常用命令、分支管理
  20. 流行的邮件系统--extmail

热门文章

  1. 图像相似度计算-kmeans聚类
  2. android手表密码忘了咋办,忘记解锁密码?教你如何重置Android手机的解锁密码
  3. 生活随记 - 5G时代安卓手机性能可以媲美苹果手机
  4. 分析报告_问题界定篇
  5. 腾讯云5000亿元、阿里云2000亿元,都是投的啥?
  6. 高屋建瓴脚踏实地 洗心革面重新做人
  7. 计算机是如何读懂高级语言的——编译过程简述
  8. STM32网址大全(快速定位网址查找资料)
  9. Windows 7 Windows10 纯净正版下载
  10. 华为鸿蒙系统深圳,鸿蒙操作系统面世 华为称“把不可能变为可能”