公众号:尤而小屋
作者:Peter
编辑:Peter

写过很多Pandas的文章,主要讲解了常用的操作和函数的用法。今天自制了一份水果订单和销售的数据(模拟数据,仅供学习),主要是用来加深理解下如何灵活且快速使用Pandas来完成我们的需求。

Pandas文章

推荐几篇文章:

30个Pandas高频使用技巧

图解Pandas的轴旋转函数:stack和unstack

图解Pandas的groupby机制

创建DataFrame:10种方式任你选

数据讲解

1、模拟的第一份数据有5个字段:订单号、下单人、商品、价格、数量

  • 订单号:每个订单的订单号,一个订单号中存在一个或者多个商品

  • 下单人:一个人可能下1个或者多个订单,比如张三只下了一个订单,李四下了多个订单

  • 商品:同一个商品可能在多个订单中出现

  • 价格:每个订单中每个商品的价格,不同的订单中,同一个商品的价格都可能是不同的,比如SOD订单中苹果是10,但是在DFH订单中却是9.8

  • 数量:每个订单中每个商品的销售数量

2、模拟的第二份数据中就两个字段:商品和产地

同时我们可以看到:这两份数据是存在不同的sheet中的,存储成为xlslx文件,并且没有任何的缺失值数据。

需求1:不同的方式读取数据

存在同一个Excel中的不同sheet中,我们采取不同的方式来读取:

方式1:同时指定文件和sheet的名称

import pandas as pd  # 先导入包

方式2:指定文件名和sheet的索引号,索引从0开始

需求2:两份数据的合并

可以看到两个sheet中的数据是通过“商品”这个字段进行关联的,我们使用pandas中的merge函数,并且保留第一份(左边left)表格中的全部信息。

merge函数是一个非常重要的函数,可以灵活地处理Pandas中的数据合并问题。

接下来的各种需求都是针对上面合并的数据进行处理的

需求3:订单量、客户量、商品量

订单量:这份数据总共下了多少个订单

unique:中文是独特的意思,就是订单号这个字段有多个独特、唯一的信息。总共是7个订单

同样的道理:可以得到多少个下单用户、销售了多少种商品?

需求4:每个用户的下单量

就是求每个用户下了多少个订单:使用groupby进行分组统计每个下单人的订单量。

  • 先使用groupby函数进行分组

  • 再使用聚合函数nunique,统计每个“订单号”的个数(去重统计)

  • 最后再索引重置下

看到李四下了3张订单,是最多的

需求5:每个用户的总消费金额

1、先增加一列:总额

2、两种不同方式的分组再聚合

需求6:不同产地的订单量、销量、销售总额

需求7:每个订单中价格最高的商品

找出每个订单中价格最高的商品,比如:SOD订单中价格最高的就是葡萄

方式1:第一种实现的方式如下:

  • 先整体通过降序排列

  • 再根据订单号来分组,取出第一条first数据即可

方式2:实现方式如下

1、先实现每个订单号根据价格降序排列

方式2:多个函数的混合使用,可分开运行查看每步骤的结果

df.groupby("订单号").apply(lambda x: x.sort_values("价格",ascending=False)).reset_index(drop=True).groupby("订单号").first().reset_index()

方式3:分组的时候使用groupby_keys参数

需求8:每个订单中价格最高的前2位

取出每个订单中价格最高的前2位,若只有一位取出一位即可。

上面是取出分组后最高的数据,即第一条first。在这个需求中我们使用head函数,可以取出任意的n条数据:Top-N

需求9:每个商品的笔单价(保留2位小数)

我们来拆解题意:

  • 每个商品:确定了分组的元素是groupby="商品"

  • 笔单价:先求每个商品的总销售额,在求每个商品的订单数,最后相除

如何对上面的商品笔单价保留两位小数呢?两种方法来实现:

往期精彩回顾适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
AI基础下载黄海广老师《机器学习课程》视频课黄海广老师《机器学习课程》711页完整版课件

本站qq群851320808,加入微信群请扫码:

【Pandas】这份Pandas练习题,必须成功拿下~相关推荐

  1. 从小白到大师,这里有一份Pandas入门指南

    点击上方"AI派",选择"设为星标" 最新分享,第一时间送达! 作者:Rudolf Höhn 机器之心编译 参与:李诗萌.张倩 在本文中,作者从 Pandas ...

  2. pandas plot label_Python+Pandas | 分析比特币与股票市场的关系

    - 点击上方"中国统计网"订阅我吧!- 我们通过使用Python和Pandas技术进行分析,我们将能够在本文中回答该问题.首先,我们将使用免费的API检索过去几年的比特币和股票价格 ...

  3. 从简历被拒,到 Android 面试。二本如何在 359 天成功拿下 offer

    免费福利 此份文档详细记录了千道面试题与详解:  !     私信我回复[03]即可免费获取 二.面试背景 自从去年被头条笔试的算法凌辱和被头条的前辈指教了之后对头条没啥好感了,也感觉进不去,所以后面 ...

  4. pandas笔记(pandas Data Structures)

    pandas笔记(pandas Data Structures) 生信start_site已关注 32020.06.15 03:02:37字数 766阅读 509 pandas包含数据结构和数据操作工 ...

  5. 利用Python进行数据分析(7) pandas基础: Series和DataFrame的简单介绍 一、pandas 是什么 pandas 是基于 NumPy 的一个 Python 数据分析包,主

    利用Python进行数据分析(7) pandas基础: Series和DataFrame的简单介绍 一.pandas 是什么 pandas 是基于 NumPy 的一个 Python 数据分析包,主要目 ...

  6. Python之Pandas:利用Pandas函数实现对表格文件的查之高级查询(类似sql,分组查询等)之详细攻略

    Python之Pandas:利用Pandas函数实现对表格文件的查之高级查询(类似sql,分组查询等)之详细攻略 目录 利用Pandas函数实现对表格文件的查之高级查询(类似sql) 1.分组查询

  7. Python之pandas:对pandas中dataframe数据中的索引输出、修改、重命名等详细攻略

    Python之pandas:对pandas中dataframe数据中的索引输出.修改.重命名等详细攻略 目录 对pandas中dataframe数据中的索引输出.修改.重命名等详细攻略 知识点学习 输 ...

  8. Py之pandas:利用pandas工具输出每行的索引值、及其对应的行数据

    Py之pandas:利用pandas工具输出每行的索引值.及其对应的行数据 目录 利用pandas工具输出每行的索引值.及其对应的行数据 输出结果 实现代码 利用pandas工具输出每行的索引值.及其 ...

  9. Python之Pandas:利用pandas实现行数据添加,即将字典格式的数据,按照行数据,从头开始循环添加到dataframe中

    Python之Pandas:利用pandas实现行数据添加,即将字典格式的数据,按照行数据,从头开始循环添加到dataframe中e中 目录 利用pandas实现行数据添加,即将字典格式的数据,按照行 ...

  10. c++输出txt格式循环一组数据后换行再循环一次_numpy、pandas以及用pandas做数据分析的案例...

    本文也是秦路老师python教程的学习笔记.这篇也是发给超哥看的:很多人说python很简单很好学,也有很多人说python没有java和c的功能强大.但是这都不重要,重要的是我们想学了,想画图也好做 ...

最新文章

  1. php页面在线人数,也谈php网站在线人数统计
  2. 百度蜘蛛动态网页ajax,百度SEO优化百度蜘蛛可读内容
  3. 担保债务凭证(Collateralized Debt Obligation,简称CDO) CLO/CBO
  4. h5活动是什么意思_深度|场景赋能H5,365天让保险线上拓客更广更容易
  5. Java并发编程实战~Worker Thread模式
  6. Socket中常见的几个转换函数(htonl,htons,ntohl,ntohs,inet_addr,inet_ntoa)
  7. 终于等到你:国内***团队360Vulcan公布iOS 12.1越狱漏洞细节
  8. Vue+flvjs 实现视频播放
  9. linux实训4文件系统管理,实训项目2 Linux文件系统管理
  10. 计算机动画推导,AE表达式实现逼真弹性动画
  11. java实现两张图片合并起来。
  12. SpringBoot整合screw生成数据库文档
  13. 阿里20周年升级价值观:新六脉神剑与它的变革时代
  14. c语言程序设计知到网课答案,C语言程序设计(山东联盟)2020知到网课答案
  15. 信用卡怎么付款给PayPal?
  16. 关于MAC下的SSH工具的推荐及SSH如何连接本地的小教程
  17. 张鑫溢:9.28黄金原油走势分析及操作建议指导.
  18. 计算机音乐谱子 追光者,岑宁儿《追光者》简谱
  19. 3D打印机T3升级corexy  制作过程(三)
  20. oracle用delete删除数据所需时间测试

热门文章

  1. unity3d Vector3.Lerp解析
  2. PHP (20140519)
  3. 3D Object Classification With Point Convolution —— 点云卷积网络
  4. 教你禁用右键,也教你如何破解
  5. 重载操作符与转换(上)
  6. 允许Android随着屏幕转动的控制自由转移到任何地方(附demo)
  7. 服务器事件刷新消息,Windows Server 2003 中的 DNS 事件消息 1616 到 6702
  8. mysql 数据库编程_MySQL数据库编程(C++语言)
  9. crt上传数据_用SecureCRT来上传和下载数据
  10. 跟着这篇柳叶刀的文章来学会重复测量方差分析