《十周成为数据分析师》笔记——业务线 第八节 常见互联网业务的数据分析报告的制作及用户分层模型
互联网业务数据分析报告及用户分层模型
- 一、业务逻辑回顾及互联网相关指标
- 1、实战项目与业务逻辑回顾
- 数据报表(数据源)→用户画像(数据分析)→数据化运营(决策指导)→商业分析(宏观判断)→分析报告(结论梳理)
- (1)日常型分析报告
- (2)调研型分析报告
- (3)展示型分析报告
- 2、常用的数据统计指标
- 3、电子商务运营中统计指标拆解
- 4、互联网产品的指标体系(以AARRR模型为例)
- 二、不同数据指标解读方法及RFM模型相关应用
- 1、用户数据指标
- 2、行为数据指标
- 3、业务数据指标
- 4、什么是RFM模型
- 5、如何构建RFM模型
- 6、RFM模型实战案例讲解
- 课后思考
一、业务逻辑回顾及互联网相关指标
1、实战项目与业务逻辑回顾
数据报表(数据源)→用户画像(数据分析)→数据化运营(决策指导)→商业分析(宏观判断)→分析报告(结论梳理)
- 数据报表——内部数据(直接调取、后台下载)、爬虫程序、数据采集器、第三方工具
- 用户画像——通过标签体系对用户信息汇总统计,经过可视化统计处理得到用户画像体系。结合用户画像,可以进行价格歧视、价格调整、精细化选品、精细化运营、评估不同店铺的产品定位和运营能力等。
- 数据化运营——四象限分析法解决多维度数据比较问题(如多广告组优化)、结合产品生命周期实现精细化+数据化运营(引入期低价占据市场份额、成长期尝试调整价格逐步提升利润、成熟期不断调整价格保证利润积累数据资产、衰退期通过营销等方式进入下一个生命周期)
- 商业分析——例如,通过分析6种渠道发售策略下不同因素对电子书销量的影响决定发售策略
- 分析报告——日常型分析报告
(1)日常型分析报告
- 表一:主站下滑少,新版首页下滑多,说明新版首页用户有很多非主站典型用户,通过对减少UV的UID进行统计分析来验证
- 表二:[金刚位(会员购首页搜索框下面的固定分类选项),feed流(随着页面下滑可以看到商品的刷新),banner(左上自动弹跳界面),豆腐块(手机端前四个曝光的产品)]做产品点击汇总,有助于产品经理对上一周的产品进行汇总及迭代(例如每周采用不同的素材曝光方式,通过环比波动变化等数据分析统计发现更好的一个统一的曝光方法),帮助产品经理分析分析使用部分版位的人是越来越多还是越来越少,发现用户对各个版位的点击偏好,对部分版位进行针对性地优化
- 表三:用户发现越来越多优秀产品,手办模型点击率上升;疫情等原因演出减少,故漫展演出点击率减小
- 表四:点击环比都是上升的,说明前面的分析都是正确的,反映了用户的点击偏好范围
- 表五:内容点与产品点的汇总,分析整体趋势,曝光均下降,与表一一致,用户量下降曝光自然也会下降;点击有些是上升的(美图、资讯、弹幕),可能是短期现象,也可能是产品经理在培养用户习惯,希望用户更多地去点击这几个板块,需要结合更多的数据报表来验证;点击占比,商品卡片和弹幕属于主流分析思路,结合点击占比和点击趋势进行分析,弹幕增长明显,可以优化弹幕体验
该表展现了更宏观的数据汇总。会员购商品新客数下降,可以考虑供给端是否提供了更多商品,需求端商品是否满足用户需求
关键点汇总、意外/临时性情况、数据说明了什么/如何使用这个数据/如何指导决策
日常型分析报告思路:首先是整体的汇总,结合不同的产品位、不同的类目、细节功能点以及详细功能属性的点击汇总,然后进行用户数据汇总(分新客、老客→可以分析用户增长和用户黏性),提出关键点,再单独分析最近的特殊状况,并针对这些临时性状况提出优化建议。
(2)调研型分析报告
- 组成:1.分析背景 2.分析目的 3.分析思路 4.分析内容 5.结论 6.建议;
- 目标:1.展示分析结果 2. 验证分析质量 3.提供决策参考;
- 形式:1.数据分析报告或文章;2.PPT制作数据分析报告;
主要用于咨询、金融、投资行业
例如,2018年中国服饰数字化零售研究报告的分析报告框架:服饰行业概述、服饰零售数字化、数字化案例分析、服饰零售趋势展望
①分析背景
中国服饰行业发展现状→市场规模发展历史→细分类目现状→品牌电商渠道发展历史→服饰行业未来发展趋势(社交电商/传统品牌/服务商)
②分析目的与分析思路
行业消费特征→数字化零售定义→数字化供应链定义→数字化运营定义→数字化运营/渠道/营销/工具定义
③分析内容
优衣库案例分析→绫致案例分析→影儿案例分析→都市丽人案例分析→奥康案例分析→黑鲸/马威案例分析 (他们做了什么,取得了什么效果)
④结论及建议
数字化成为行业基础建设设施→大规模个性化定制成为主流→品牌商逐步提升对产业链话语权→有望诞生中国时尚品牌巨头→服饰社交电商将进一步革新升级(主要是社交电商)
(3)展示型分析报告
①数据动图/视频
常用于反映数据的趋势变化情况或规律。相比静态图表,动图的呈现方式更加直观而形象。
例如,《美国性别年龄结构趋势图》——Pew Research、《新闻资讯平台MAU变化趋势》——QuestMobile
②数据地图/仪表板
通过地图/仪表板等作为背景呈现数据,使读者更加直观感受到数据分布。
例如《中国酒量地图》、疫情分布图
③数字具象化
通过更加具体形象的图形(如实物、表情等)来表单相应的数据内容,丰富数据意义。
2、常用的数据统计指标
标准分通常在质量控制中的应用:如果生产一套有标准尺寸的组件,将所有生产的产品的实际尺寸进行统计,计算标准差,计算某一个意外产品距平均值的距离有6西格玛,说明工艺存在问题。
3、电子商务运营中统计指标拆解
- GMV(总类目+分类目)+流量(PV)+对应用户(UV)+客单价+新老用户(支付)+转化率+周/月/季度变化+不同渠道贡献
- 父用户(上游)+子用户(下游),例如第一层甲是b站会员购用户,第二层乙是非b站会员购用户,一级一级不停营销裂变
- 跳出率:某一个页面的数据,衡量一个页面对用户的吸引力,用户没有点击行为就是跳出
- ARPU(平均每个用户能产生多少收益):在电商领域里不是很常见,电商一般都是客单价,ARPU一般是用在游戏领域
- 付费频率与付费率:付费频率看用户价值,付费率是看产品价值
4、互联网产品的指标体系(以AARRR模型为例)
获取用户阶段关注的指标:获客成本(CAC:Customer Acquisition Cost) 。
提高活跃度阶段关注的指标:日活(DAU)、月活(MAU)、使用时长、启动次数。
提高留存时需要关注的指标:魔法数字(Magic Number)。
获取收入,关注的指标是ARPU(平均用户收入),ARPPU(平均每付费用户收入);ARPPU高,ARPU不一定高,还要考虑付费用户比例。
自传播,主要使用K因子(k-factor)作为衡量指标,K = (每个用户向其朋友们发出的邀请的数量) * (接收到邀请的人转化为新用户的转化率)。当K>1时,用户群就会像滚雪球一样增大。当K<1时,那么用户群到某个规模时就会停止通过自传播增长。
以日韩美疫情新闻网站为例,AARRR模型的应用:
产品网页:日韩美三大模块,展现截至中国时间的确诊与死亡情况、疫情日报/求助信息
拉新:内容+渠道——知乎APP视频引流(公域流量)、bilibili APP视频引流(公域流量)、微信公众号文章引流(私域流量)
激活/提升微信用户粘性:网站提升微信用户的留存方式(窗口化)、微信公众号可以提升微信用户的留存率
宣传:通过网站海报提升传播推荐效果
提升自传播效率:通过内容形式与质量的创新提升传播推荐几率、通过“在看”评判传播效果
二、不同数据指标解读方法及RFM模型相关应用
1、用户数据指标
普通用户数据指标:
- PV (Page View):浏览量。门户资讯时代,编辑为了完成PV任务,将图集分成几十页,每页一张图的常见办法。因此PV太容易注水,这个指标的参考意义有限。
- UV(Unique Visitor):独立访问用户,但是UV无法识别出共用电脑(家庭、网吧)背后的不同的用户。
- 注册用户(Register Users):注册用户也可以注水,只是成本高了一些。
活跃用户数据指标:
- 每日活跃用户数DAU(Daily Active Users/DAU)、每月活跃用户数MAU(Monthly Active Users/MAU)以及季度、年度活跃用户数:DAU 和 MAU为衡量一个网站或者App的核心指标。
- 活跃用户定义标准:在某时间段内,使用了(登录/访问/完成规定操作)该网站或者应用的用户。
- 活跃用户变化趋势指标:新增日活、新增月活、留存率(新增加的用户里,有多少用户留下来)。
B站会员购 核心用户定义:3单及3单以上;会员购商品老客数-左:定金+现货 右:补款
2、行为数据指标
- 访问深度系数=页面浏览次数/买家访问次数=PV/UV:买家在页面内访问次数越多,所花费的时间就越长,购买意愿也越高。
- 跳出率:跳出率=只访问一个页面就离开网站的访问次数/总访问次数,其一般用来衡量某一个页面对用户吸引力大小,用户没有点击行为就是跳出。
- 点击率:点击率=点击量/展现量,用来体现创意的吸引力。
- 平均访问时长:平均访问时长=总访问时长/访问次数。
- 转化率:转化率=转化次数/访问次数。
3、业务数据指标
商业化业务数据指标:
- GMV(Gross Merchandise Volume):指成交金额,其中付款金额和未付款。
- ARPU(Average Revenue Per
User):分母一般包括所有用户,有时候也只统计活跃用户。分母也可以只是产生了付费的用户,即ARPPU(Average Revenue Per Paying User) ——平均每付费用户贡献的收入。 - SKU( Stock Keeping Unit ):库存进出计量的基本单元,可以是以件,盒,托盘等为单位。
- 付费人数:付费UV的数量大小,其体现着产品的绝对价值。
- 付费率:付费率=付费UV/整体UV,其体现着产品的相对价值。
- 付费频次:付费频率是用户在限定的期间内所购买的次数,其体现着用户价值。
衡量电商入驻商GMV变化——折线图、衡量电商入驻商GMV周趋势分析指标——周权重指数、衡量电商入驻商不同SKU仓储备货的分析方法——数学仿真法
4、什么是RFM模型
RFM模型是衡量客户价值和客户创利能力的重要工具。该模型通过一个客户的近期购买行为(最近消费时间)、购买的总体频率(消费频率),以及花了多少钱(消费金额)3项指标来描述该客户的价值状况。
5、如何构建RFM模型
- 最近一次消费 (Recency):最近一次消费意指上一次购买的时间——用户上一次是什么时候下的单、用户上一次是什么时候订购的服务,或在线下门店中用户上一次进店购买是什么时候。
- 消费频率 (Frequency) :消费频率是顾客在限定的期间内所购买的次数。一般而言,最常购买的用户,也是满意度/忠诚度最高的顾客,同时也是对品牌认可度最高的用户。
- 消费金额 (Monetary):消费金额是电商相关业务数据库的支柱,也可以用来验证“帕雷托法则”——公司80%的收入来自20%的顾客。M值带有时间范围,指的是一段时间(通常是1年)内的消费金额。对于一般电商店铺而言,M值对客户细分的作用相对较弱(因为客单价波动幅度不大)。
6、RFM模型实战案例讲解
某餐饮店铺的用户RFM数据→线下门店私域流量的RFM标签设置
数据consumption_data(共941条):
采用K-Means聚类算法进行分析:
代码:
import pandas as pdinputfile = './consumption_data.xls' # 销量及其他属性数据
outputfile = './data_type.xls' # 保存结果的文件名k = 3 # 聚类的类别
iteration = 500 # 聚类最大循环次数
data = pd.read_excel(inputfile, index_col = 'Id') # 读取数据
data_zs = 1.0*(data - data.mean())/data.std() # 数据标准化Z-Scorefrom sklearn.cluster import KMeans
model = KMeans(n_clusters = k, n_jobs = 4, max_iter = iteration,random_state=1234) # 分为k类,并发数4
model.fit(data_zs) # 开始聚类# 简单打印结果
r1 = pd.Series(model.labels_).value_counts() # 统计各个类别的数目
r2 = pd.DataFrame(model.cluster_centers_) # 找出聚类中心
r = pd.concat([r2, r1], axis = 1) # 横向连接(0是纵向),得到聚类中心对应的类别下的数目
r.columns = list(data.columns) + ['类别数目'] # 重命名表头
print(r)# 详细输出原始数据及其类别
r = pd.concat([data, pd.Series(model.labels_, index = data.index)], axis = 1) # 详细输出每个样本对应的类别
r.columns = list(data.columns) + ['聚类类别'] # 重命名表头
r.to_excel(outputfile) # 保存结果def density_plot(data): # 自定义作图函数import matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号p = data.plot(kind='kde', linewidth = 2, subplots = True, sharex = False)[p[i].set_ylabel(u'密度') for i in range(k)]plt.legend()return plt
pic_output = './pd' # 概率密度图文件名前缀
for i in range(k):density_plot(data[r[u'聚类类别']==i]).savefig(u'%s%s.png' %(pic_output, i))
聚类算法输出结果:
将三个分群的R F M三个维度的密度分布可视化:
分群1的R值大,表明分群1的用户已经很久不来门店消费的用户;
分群2的属于高频消费用户,消费金额有高有低;
分群3的消费频次最低,消费金额也偏低,属于一个低频低消费的用户群。
Tips:在企业的RFM模型实战中,可能给到的数据没有时间范围,需要自己去划定时间设置变量值——做RFM分析时,首先要划定时间点,确定R值,再设定往前的时间范围,确定F值和M值。结果展示最好直接展示各个分群的密度分布,在业务实战时根据需要设置分群数,但需要一定的数据量基础。
课后思考
如果你是一家餐饮机构的负责人,现在已经通过RFM模型对用户进行了聚类分析,那么如何在微信私域流量池中对不同分群的用户制定精细化运营策略呢?
《十周成为数据分析师》笔记——业务线 第八节 常见互联网业务的数据分析报告的制作及用户分层模型相关推荐
- 《十周成为数据分析师》笔记——业务线 第三节 不做只懂技术不懂业务的“工具人”
项目案例 bilibili站内CPC广告优化 1.bilibili广告系统相关背景及数据介绍 2.CPC广告投放系统的要素介绍--广告投放营销漏斗转化模型 (1)曝光量(展示量)涉及要素 (2)点击量 ...
- 《十周成为数据分析师》笔记——业务线 第五节 用户画像体系
项目二 亚马逊平台入驻商订单报表分析 1.互联网电商平台入驻商数据分析的一般思路 (1)获取数据 (2)分析业务需求 (3)产生数据结果 2.亚马逊平台入驻商相关数据 3.入驻商用户画像体系介绍 (1 ...
- 《十周成为数据分析师》笔记——业务线 第四节 电商平台订单报表分析
项目一 B站会员购订单数据分析 1.bilibili会员购平台业务背景介绍 2.平台相关数据介绍 3.订单数据的数据分析方法 (1)订单数据的数据分析思路 (2)相关python知识点讲解 (3)b站 ...
- 《十周成为数据分析师》笔记——业务线 第六节 以数据分析为导向的运营体系搭建
项目三 以数据分析为导向的运营体系搭建 1.流量运营案例:如何用数据分析的思路解决广告优化问题 (1)电商入驻商广告业务简介及传统分析链路数据分析 (2)漏斗模型的搭建与入驻商相关广告应用 (3)多广 ...
- [学习笔记]B站视频:磨剑之作,七周成“师”!【七周成为数据分析师】- 第一周
[学习笔记]B站学习视频:七周成为数据分析师-第一周 序 数据思维 结构化 公式化 业务化 数据分析的思维技巧 象限法 多维法 假设法 指数法 二八法 对比法 漏斗法 如何在业务时间锻炼数据分析思维 ...
- 如何成为python 数据分析师_如何七周成为数据分析师20:了解和掌握Python的函数...
本文是<如何七周成为数据分析师>的第二十教程,如果想要了解写作初衷,可以先行阅读七周指南.温馨提示:如果您已经熟悉Python,大可不必再看这篇文章,或只挑选部分. Python之所以灵活 ...
- python数据分析要学多久_如何七周成为数据分析师18:Python的新手教程
本文是<如何七周成为数据分析师>的第十八篇教程,如果想要了解写作初衷,可以先行阅读七周指南.温馨提示:如果您已经熟悉Python,大可不必再看这篇文章,或只挑选部分. Python是近年来 ...
- 转:《七周成为数据分析师》总结
本文转自: https://blog.csdn.net/weixin_39722361/article/details/79522111 个人公众号:数据路 知乎:无小意. 百日计划第一周总结 1. ...
- (秦路)七周成为数据分析师(第三周)—— Excel
文章目录 1 文本清洗函数 2 关联匹配类 2.1 LOOKUP和VLOOKUP 2.2 INDEX和MATCH 2.3 ROW和COLUMN 2.4 OFFSET 2.5 HYPERLINK 3 逻 ...
最新文章
- RecycleView的notifyItemRemoved使用注意
- 美多商城之验证码(短信验证码1)
- 利用Wireshark和OSS的API文档简单实现上传和下载
- 33.Linux系统介绍
- 应用程序下载地址汇总
- DevExpress组件之——TreeList组件
- 面试指南|GO高性能编程精华PDF
- vsftp 无法启动,500 OOPS: bad bool value in config file for: anonymous_enable
- web后端开发学习路线_学习后端Web开发的最佳方法
- Dynamics 365 CRM 开发架构简介
- IFIX 6.0 安全登录
- [绝对原创]从VS2003(.net1.1)升级到vs2005(.net2.0)全程跟踪记录
- 黑马程序员_java之反射
- 毕业论文酒店管理系统java,基于J2EE酒店管理系统设计与实现
- R语言source命令使用过程中遇到的某些错误的解决方法
- cos(a-b)=cosa*cosb+sina*sinb的推导过程
- Jmeter前置处理器和后置处理器的使用
- php 睡眠,win10睡眠是什么意思
- UE4 游戏窗口前台后台监听
- 2017百度之星资格赛1003 度度熊与邪恶大魔王(完全背包)
热门文章
- GitHub 狂飙 30K+star 面试现场, 专为程序员面试打造, 现已开源可下载
- HDOJ 1859 最小长方形
- 云开发(微信-小程序)笔记(十四)---- 收藏,点赞(上)
- python大数据读取分析_python 大数据读取
- 微信公众号开发之(21)视频
- uniCloud开发公众号:一、接收、解析、组装xml消息
- MTK VILTE预研文档
- [!] CocoaPods was not able to update the `xxx` repo. If this is an unexpected issue and persists
- 规格中的OR\DR\DS\RR\IR\PB\SF\SR\AR\CR
- 分享几个免费高清图片素材网站---已解决