用Power BI对超市数据进行分析
注:这里使用的是某家在线商店的数据集。这个数据集包含销售家具、办公用品和科技产品在内的订单编号、订单/发货日期、客户信息、产品信息、总销售额、利润……
现在假设营销部门带着这个数据集来找我们,他们想知道我们对现有数据的看,并提出了以下问题:
- 我们能否就数量、销售额或利润确定出最佳产品/子类别/类别?
- 什么物品一般是一起卖的?
- 你还能为我们提供哪些有用的建议?
- 你能帮我们监控这些 KPI 吗?
营销部门的需求收到了,下面我将用 Power BI 来回答他们的问题!
1、导入数据
首先,我们需要导入并理解数据集:
在 Power BI 中,一旦连接到源数据(传统 CSV 文件、SQL Server、API、电子表格……),我们就会得到这个视图,它会为我们提供有关数据质量的信息。
在这里,我们可以看到缺少一些行,该列包含数值与分类值,按列列出的不同值的数量,每列的最小值/最大值......
2、数据清洗
- 首先,在需要时更改列的数据类型:数据类型对于创建计算、比较数据非常关键。
- 日期当前是文本(字符串)格式,我们需要将它格式标准化,把类型更改为日期类型。
- 用“,”替换数字列中的每个“。”
- 删除错误行,可以用列的平均值或最常见的值替换缺失值,或者干脆删除不完整的行。
当前数据集没有显示单位值(价格、利润率、%利润率),所以我们需要添加这些列:
- 产品价格
- 产品利润率
- % 利润
最后,一旦将原始日期定义为日期类型,我们将添加日期列:日订单、月订单、年订单……(这将有助于我们分析最佳销售时间)。
3、探索性数据分析
数据清理完毕后,我们可以进入下一层分析环节,首先使用简单的数据可视化:
从下面的图片中可以看到:
- 一些城市在销售和利润方面表现更好
- 3个品类在销量上比较接近,但在销量和利润率上不相近
- 销售额和利润每年都在增长
- 我们针对3个客户群,采用不同的销售模式
- 销售情况在每月的 9 日至 13 日期间表现最佳。每个月的第一天比较低。最好的销售月份是 11/9/12 …
一些城市正在亏损,我们需要更深入地了解原因。
当深蓝色在左侧时,商店实际上是在亏损。
一些子公司也在赔钱,我们放大看看到底是哪些产品正在亏损。
左侧的深蓝色表示该产品子类别正在亏损
4、问题1:从销量、利润、销售额来看,什么产品最好卖?
销量:
首先创建一个简单的条形图,按类别/子类别/产品来可视化数量。这里使用 Power BI 的“drill down”功能,以避免创建过多的图表:
该公司销售 3 种产品,把颜色添上以轻松识别不同类别:
添加自定义颜色:
添加一列“category_number”,应用于有关类别标签的数字。家具 = 1,办公室 = 2 ...
在 power bi 查询中,它应该是这样的:
= Table.AddColumn(#”Renamed Columns”, “Category_number”, each if [Category] = “Furniture” then 1 else if [Category] = “Technology” then 2 else if [Category] = “Office Supplies” then 3 else空值)
在图表上,可以像这样创建一个条件格式:
利润:
有些产品的利润率为负
我们可以深入研究并检查产品利润率。该公司正在销售数百种产品,要在条形图上可视化所有这些产品并不容易。
销售额 :
产品销量和子类别销量
由于我们有不同的产品/价格/数量和利润,所以不能把这些值放在一起比较。
所以这里就要运用到产品组合效应来帮助我们了解哪些产品对公司利润的贡献最大。
我们在数据集中添加 3 列:对总销售额的贡献、利润、利润 × 对总销售额的贡献:
5、问题2:哪些产品一起卖得最多
了解哪些产品有助于我们销售其他产品
发展交叉销售
决定我们是否保留低利润产品
以下一种聚合和排序产品集的方法:
复制数据框以获取需要的列:订单 ID 和产品名称。
- 按产品名称排序
仅保留“订单 ID”列中的重复值
按订单 ID 分组:
4. 使用自定义查询将新合并的表拆分为 1 列:
= Table.AggregateTableColumn(#"Grouped Rows", "Count", {{"Product Name", each Text.Combine(List.Transform(_, (x) => Text.From(x)), " — , — “), “期望的结果”}})
5. 最后将数据绘制在条形图上,以可视化重新分区:
在实际工作中,我们会得到类似的结果:
6、问题3:如何创建一个可视化仪表板?
前 :
后 :
我们可以删除仪表板中不必要的表格,如果需要还能用 UI 进行更深入的研究:
这里的小条形图可以展开,也可以显示对应的表格。
在这个分析中,我们执行了标准且简单的数据操作来理解和分析数据集。但在现实世界中,数据分析通常需要在客户和数据分析师之间进行多次迭代。我们需要回答在探索性分析过程中发现的每一个额外问题,一旦所有上述问题都得到回答,可能还有更多需要分析的主题。
用Power BI对超市数据进行分析相关推荐
- Power BI 如何获取数据做可视化
获 取 数 据 l 获取数据 Power BI Desktop 可连接到种类广泛的多种数据源,包括本地数据库.Excel 工作表和云服务等. 它可帮助清理数据和设置数据格式,以使数据更为有用,包括拆 ...
- 赠送300家门店260亿销售额的零售企业Power BI实战示例数据
焦棚子的文章目录 一背景 2022年即将到来之际,笔者准备在Power BI中做一个实战专题,作为实战专题最基础的就是demo数据,于是我们赠送大家一个300家门店,260亿+销售额,360万行+的零 ...
- Power BI 将商业智能数据转换为数据理解
l 研究数据 在本部分中你要了解各种知识,并且积极的互动和进行 Power BI 共享在这一部分至关重要. Power BI 服务简介 Power BI 服务是 Power BI Desktop 的 ...
- Power BI矩阵行数据平铺及列数据排序
众所周知,Power BI中矩阵通常由三部分属性组成,分别是行.列以及值.各属性添加不同数据组合后,矩阵会呈现出不同的样式,有时我们需要对样式进行灵活调整,比如将行属性的多级数据平铺展示以及列属性数据 ...
- Power BI产品帕累托分析
效果图一: 说明: 1.x轴为每个产品的销售金额,按照从大到小排序 2.y轴为这些产品累积的销售金额占比,也就是 到产品的累积销售金额 除以 所有产品总的销售金额 3.红色框部分表示,累积销售金额占比 ...
- 基于Power BI的终端产品销售ABC分析
一.原理 ABC分析,是由帕累托法则演化而来,一般认为A类产品带来70%的收入,B类产品带来20%的收入,C类产品带来10%的收入,所以ABC分析又称70/20/10分析. 二.数据源 某终端< ...
- Power Bi:零售数据可视化
文章目录 理解数据含义 确定需要解决的问题 根据问题新建度量值 确定背景.主题.字体及字体大小 结果展示 理解数据含义 本次可视化共有四张表,根据数据说明文档选择自己需要的特征,不需要的数据列隐藏. ...
- Power BI数据查询编辑
数据导入 使用Power BI Desktop进行数据分析,需要先获取数据,Power BI Desktop支持从文件.数据库.Power Platform等多种数据源获取数据.为了方便练习,我们选择 ...
- Power BI之函数
DAX:分析表达式 目的:数据导入后的分析.创建度量值/新建列,对已经导入到Power BI中的数据进行提取,加工,筛选,整理等. DAX实际上是对数据在M语言处理过的基础上进行近一步加工.可以理解为 ...
最新文章
- Win7编译volley成jar包
- 根据字符出现频率排序
- 推荐10个安全又有实力的办公软件,极大提升办公效率
- Apache 2,4版本 编译与安装 RedHat enterprises 6.2
- struts2的OGNL表达式理解(一)
- eclipse中快捷键
- 详解CSS三大特性之层叠性、继承性和重要性——Web前端系列学习笔记
- Newbe.Claptrap 框架入门,第一步 —— 开发环境准备
- 实现多线程Callable接口
- 封装属性_「Python基础学习」之封装大法
- python使用kafka原理详解真实完整版_史上最详细Kafka原理总结
- java中字节码_Java字节码执行图示
- python临时笔记
- mybatis批量删除和插入
- 关于float的内部结构
- java输入输出流实例代码
- WebService原理
- 提前三天教你们python制作万能抢购神器,学不会就准备过光棍节吧
- java水彩画效果滤镜,PS通过滤镜给照片制作水彩画效果
- openwrt 做二级路由 同网段无线桥接教程 relayd