1. 理解、整理数据

首先要做的是观察表内都有哪些数据,分别是什么含义;然后将不好理解的列名修改一下,不需要的列隐藏起来,让表看上去更加整洁明了。

这个表共有18250条数据,14列,第一行是表头,标明下面数据的内容。

我们看上图2个红框的位置:

第一列的列名为空,经过观察我发现第一列下面的数字表示一年的第几周,所以给它添加列名为Week;

4046、 4225、 4770 三个数字不知道什么意思,网上搜索后我了解到这些是贴在牛油果身上的代码,叫“价格查找代码”,英文为“Pricelook-upcodes”,简称PLU码,是为了方便超市跟踪查询产品的种类、大小以及价格等信息。这个号码的分配是没有规律的,一般一个品种申请号码。我们把它们当做三种不同的牛油果就可以了,为方便理解加上前缀PLU。

这个表的数据非常干净整齐,没有重复值和缺失值,也没有异常值,数据类型也很整齐,我们几乎不用做什么数据整理和清洗的工作。处理后的表变成下面这样

新表包含14列,分别为第几周,日期,单个牛油果的平均价格,牛油果销售总量,PLU-4046的销售个数,PLU-4225的销售个数,PLU-4770的销售个数,袋装牛油果的销售总量,小袋牛油果销售个数,大袋牛油果销售个数,超大袋牛油果销售个数,牛油果类型,年份,地区。

其中牛油果销售总量Total Volume 包含了3种牛油果 PLU-4046,PLU-4225, PLU-4770 单个出售量 和 按袋出售的牛油果个数 Total Bags。

Total Bags为以袋为单位出售的牛油果的总个数,包含小袋Small Bags,大袋Large Bags和超大袋XLarge Bags三种不同规格。

类型Type标明牛油果是普通的还是有机的。

地区Region表示美国不同地区的牛油果销售量,包含部分城市、西部、东北部等地区和全美总体数据。

2. 用数据透视表分析数据,及数据可视化处理

分析数据时,我们一般会将各组数据间的关系用合适的图表表现出来。图表易于展示且方便理解,能将我们的分析结果更好的表达出去。下面我们练习将用数据透视表分析数据关系,并选择合适的图表类型,看看可以得出什么结论。

Excel的数据透视表功能强大且简单好用。通过选取不同的内容到行和列,可以快速的找出各元素之间的联系,还可以按照不同时间段进行分组数据,可以将数据分组进行计数、求和、求平均值等,非常方便。

1)各大区域牛油果均价走势

首先我们来观察2015-2018年间牛油果平均价格的变化趋势,选择几个主要地区和全美总体的平均价格,时间按照季度划分。

整体来看,从2015年到2018年之间,各大地区的牛油果均价均显现出不同程度的增长趋势,在2017年第三季度前后出现了峰值,其中West地区的增长幅度最大。

整体价格来看,Northeast地区均价几乎一直高于其他地区,而SouthCentral相较其他地区均价最低。

同时,年内价格出现季节性波动,每年的第一二季度价格较低,第三四季度价格偏高,这种周期性的变化可能与牛油果的成熟季节有关。

2)牛油果分地区年度销量走势

依旧选择各大地区,选取牛油果的总销量,时间间隔选择季度,我们来观察各地区2015-2018年牛油果总销量的走势。

牛油果在2015年的销量明显低于后三年,从2015年到2018年各地区销量有轻微上升趋势,总体来看没有太明显的增长,但2018年一季度似乎呈现出强于往年的增长势头。

其中Midsouth地区销量一直低于其他区,之前我们看到Midsouth的牛油果价格也偏高,也许是因为这个地区本身牛油果产量少,需要从周边地区引进,导致价格较高,销量较小;

West和SouthCentral地区的销量最大,而在上一个图表中我们也看到SouthCentral和West地区的牛油果均价是最低的,这有多种可能,也许这两个地区本身的牛油果产量非常大,人口较多,人们也很喜欢食用牛油果。

同时可以看到销量在季度间也有周期性的变化,一二季度销量较大,三四季度销量开始下滑,这与上一图的价格趋势刚好相反,也比较符合我们的预期。

3)各城市牛油果年销量排行

我们再来看一下各个城市的牛油果销量情况。由于城市数目太多,图表的内容过于拥挤,我们只选出销量最多的前10个城市来具体分析。

California销量遥遥领先,几乎是排名第二的GreatLakes区域的二倍之多,第五名开始的6个城市销量相差不大,都在50million上下。

从2015年到2018年,各个城市的年销量几乎都有所增加。如果再结合人口数据,我们可以进一步判断销量的增加,更多受居民的人数增加影响还是受居民的购买力增强影响;我们还可以计算人均牛油果消费量来观察各地区居民对牛油果的喜好程度等。但这个表内并没有包含城市的人口数量,所以我们无法获得更多信息。

4)有机牛油果销量和价格的变化

近些年来,有机食品愈加受到人们的喜爱,人们越来越重视更健康的饮食方式。我们来看一下有机牛油果的价格和销量有没有显示出相应的趋势,依旧选取季度数据。

有机牛油果价格始终高于普通牛油果,差值保持在0.6美元左右,两种牛油果价格的变化趋势大致相同。

从2016年第二季度,牛油果价格开始上涨,到2017年三季度时到达峰值,接着便呈现出持续的下降趋势。

从上图我们能够很明显的看出,顾客的购买选择还是以普通牛油果为主。

有机牛油果的销量只占非常小的一部分,但是数值呈现出非常明显的增长趋势,以2018年一季度的数据与2015年一季度相比,有机牛油果的销量翻了一番还多。

结合上图中2017年三季度后牛油果价格呈现的下降趋势,这似乎可以说明人们在能接受价格的条件下,越来越重视饮食的健康,开始更多的选择有机牛油果。

5)牛油果袋装和单卖的比例变化

Total Bags表示以袋出售的牛油果销量,Total Volume表示单个卖和按袋卖的牛油果销量之和。单买牛油果可能表名顾客是独居,或是食用牛油果的频率较低;买袋装牛油果可能表名顾客是为家庭采购,或是食用频率较高,所以一次会购买多个。

为了观察袋装牛油果的销售情况,我新增了一列来表示以袋出售的牛油果销量占总销量的百分比,记为Percentage-Bags。

2015年袋装牛油果的销量很少,只占总销量的四分之一,2015年四季度开始,袋装牛油果的销量占比开始稳步上升,到2018年一季度,袋装牛油果销量占比已接近55%,且仍表现出良好的上升趋势。

越来越多的顾客会一次性购买多个牛油果,这或许与近几年的牛油果热潮有关,人们开始关注健身和饮食,牛油果作为一种健康的脂肪来源,逐渐变成高端、健康、营养的代名词,受到人们的追捧。


3. 制作商业分析报告

分析处理完数据后,我们通常需要将分析结果做成PPT进行汇报演示。

报告常使用 总-分-总 的结构,先表明分析的背景与目的,再分别列出各个图表和分析,最后总结,得出结论。现在我将上面做出的图表和分析整理,适当排版,做成一个PPT文件。

Excel数据分析实例—牛油果销售分析相关推荐

  1. Excel数据分析实例——各省人口数量及增长

    数据如下: 分析图表: 容易看出,排名前5的人口大省为:广东.山东.河南.四川.江苏(人口多,不代表经济强哦) 人口增长最快的5个省份是:北京.天津.上海.广东.浙江(都是发达地区啊) 人口增长绝对数 ...

  2. Excel数据分析:美国牛油果销售分析

    Excel数据分析:美国牛油果销售分析 数据来源 https://www.kaggle.com/neuromusic/avocado-prices kaggle平台注册账号的时候,会出现不显示验证码的 ...

  3. 动手学Excel数据分析与可视化

    前 言 为什么编写这本书? 当今时代,学习数据分析的人越来越多,对于Excel.SQL.Power BI.SPSS.Python等众多的数据分析工具,Excel仍然还是最常用,也是最容易上手的工具.E ...

  4. 索骥馆-OFFICE系列之《EXCEL数据分析之道:让你的数据更有说服力》扫描版[PDF]

    结合大量的具有实用价值的实际案例,来介绍利用excel快速制作各种统计分析报表和图表的基本方法和技巧,可使您的excel使用水平提升到一个新的层次,使您的分析报告更加具有说服力,更加引人注目. 本书介 ...

  5. java数据透视表插件_纯前端表格控件SpreadJS:新增数据透视表插件等,完美呈现强大的Excel数据分析能力...

    SpreadJS是一款基于 HTML5 的纯前端电子表格控件,兼容 450 种以上的 Excel 公式,凭借其 "高性能.跨平台.与 Excel 高度兼容"的产品特性,备受以华为. ...

  6. python excel 数据分析统计服_数据分析从入门到进阶(透彻讲解EXCEL.SQL.TABLEAU、PYTHON四项数据分析必会工具.免费提供1GB数据集...

    透彻讲解Excel.SQL.Tableau.Python四项数据分析必会工具,数据分析工作者的案头推荐工具书.系统介绍数据分析的策略.方法(数据分析之道):实例讲解引导.快速掌握数据分析工具(数据分析 ...

  7. 算法数据分析实例—城市气候与海洋关系数据分析—[线性回归:y=w*x+b]

    算法数据分析实例-城市气候与海洋关系数据分析-[线性回归:y=w*x+b] 1. 导入包 1.1 安装 NumPy 1.2 安装 Pandas 1.3 安装数据可视化matplotlib.pyplot ...

  8. Pandas数据分析⑥——数据分析实例(货品送达率与合格率/返修率/拒收率)

    Pandas系列目录如下: Pandas数据分析①--数据读取(CSV/TXT/JSON) Pandas数据分析②--数据清洗(重复值/缺失值/异常值) Pandas数据分析③--数据规整1(索引和列 ...

  9. 【山河送书第五期】:《码上行动:利用Python与ChatGPT高效搞定Excel数据分析》参与活动,送书三本!!

    <码上行动:利用Python与ChatGPT高效搞定Excel数据分析> 前言 内容提要 本书亮点 购买链接 参与方式 往期赠书回顾: 前言 在过去的 5 年里,Python 已经 3 次 ...

最新文章

  1. linux修改mysql密码sa_如何修改SA口令,数据库SA密码怎么改?
  2. CVPR2020 | 利用NAS搜索针对对抗攻击的鲁棒神经网络结构
  3. android Binary XML file line #1: Binary XML file line #1: Error inflating class x 问题详解
  4. linux 程序定时重启tomcat,linux下实现tomcat定时自动重启
  5. .net访问PostgreSQL数据库发生“找不到函数名”的问题追踪
  6. 华为android怎样隐藏软件,华为怎么打开隐藏应用功能
  7. python2精确除法
  8. ChannelHandler揭秘(Netty源码死磕5)
  9. 服务器 通知系统设计,组列表管理服务器的设计与实现
  10. 袖珍电子书,雄心壮志永不变
  11. 四旋翼无人机飞行原理
  12. 实验吧:欢迎来到地狱
  13. Java就业面试问题大全
  14. 云上PDF怎么删除页眉页脚_Word文档如何删除页眉页脚横线?如何取消文档页眉横线?...
  15. Windows 2000/xp/2003 常用补丁下载
  16. 角度与弧度之间的转换
  17. 使用opencv的viz模块显示3d点云
  18. 字符串常量和变量是什么?
  19. 对于超大型SQL SERVER数据库执行DBCC操作
  20. 省市区三级行政区代码(包含港澳台)sql1

热门文章

  1. windows注册表修改大全
  2. Openssl加密库
  3. 问题 G: 21级期末机试-谍影寻踪(10分)
  4. python简单实现pdf格式转换器
  5. docker镜像原理基础与dockerfile部署springboot项目
  6. 如何零基础入门仿真 - version 2
  7. 如何管理归档文件和归档目录
  8. matlab autocorr说明,matlab中的xcorr和autocorr_matlab培训
  9. codevs 2830 蓬莱山辉夜
  10. 一步一步学区块链(5)智能合约