工作中对数据分析思路的一点思考
工作中,经常会遇到产品、运营等各方人员对某个数据的疑问,或者各种各样的数据需求和数据问题。对于数据从业者,我越来越意识到我们不仅仅需要掌握必要的编程基础和专业知识,也需要掌握一些常见的数据分析思路,进而提高自己的数据敏感度。以下内容是自己在工作中总结出来的一些数据分析思路。
解决数据问题的通用框架
通常,解决数据问题可以分为以下五步进行:
1、明确目标
1.1明确分析对象:确定分析对象,定义该对象,确定该对象的衡量标准;
1.2明确分析目的:为什么分析它?是否有更本质的问题?它的目标受众是什么?它的最终受益人又是谁?
1.3明确分析目标:解决该问题,是为了原因定位?还是为了方案调整?
2、界定问题
2.1准确描述问题
2.2结构化梳理问题:结构化梳理问题,可以采用5w2h的方法,具体内容如下:
5w2h | 现状如何 | 为什么 | 能否改善 | 如何改善 |
---|---|---|---|---|
对象 | 研究什么 | 为什么是这种产品 | 能否是别的产品 | 到底是何种产品 |
目的 | 什么目的 | 为什么是这个目的 | 有无其他目的 | 应该是什么目的 |
场景 | 什么场景?在哪里 | 为什么是这个场景 | 能否是别的场景 | 应该是什么场景 |
时间 | 什么时候? | 为什么是这个时间? | 能否是其他时间 | 应该什么时候做 |
谁 | 目标用户是谁? | 为什么是这类人? | 能否是其他人群 | 应该是什么用户群 |
方式方法 | 怎么做? | 为什么这么做? | 有无其他方法 | 应该用什么方法 |
程度 | 做到什么程度 | 为什么做到这个程度 | 能否更高或更低 | 应该做到什么程度 |
3、提出假设
3.1将问题拆至最小:将问题拆到最小后,最小问题之间,应该符合‘相互独立,完全穷尽’的原则。将问题拆分的方法,常见的有逻辑树分析法和公式拆解法。
逻辑树分析法(以次日留存率下降分析为例) | ||
---|---|---|
时间 | 某日表现?还是某个时间段表现? | |
渠道 | 全部渠道?还是某个渠道表现? | |
转化漏斗 | 哪个环节下降影响? | |
用户质量 | 具体是哪类用户变差? | |
…… |
公式拆解法法(以GMV为例) | ||
---|---|---|
GMV=下单数*客单价 | 下单数 | 下单数又可以分为:DAU=sum(新用户+各日留存率)、用户下单转化率 |
GMV=下单数*客单价 | 客单价 | 客单价又可以分为:人均单量*复购率、笔单价 |
3.2确定主要问题:即将问题判定优先级,将主要精力投放到主要问题上。
4、验证假设
4.1收集信息数据
4.2构建分析框架
4.3选择分析方法:常见的分析方法包括象限法、二八法、漏斗法、对比法、SWOT法等。
对比分析 | 时间、空间、特定标准(经验)、计划标准 |
---|---|
数值 | GMV、平均数、众数、最大值、最小值、绝对值 |
比例值 | 活跃度、注册转化率 |
环比 | 与当前时间范围相邻的上一个时间范围对比 |
同比 | 与历史同时期相比较 |
统计模型 | |
---|---|
回归分析 | 一段时间内,某一个维度的信息 |
分类分析 | 分析影响活动的因素 |
聚类分析 | 细分用户 |
关联分析 | 哪个产品同时购买概率最大 |
5、输出结论
5.1背景说明:这一部分,可遵循“背景-冲突-疑问-回答”的顺序展开;
5.2结论输出:结论输出时,可遵循的原则包括:结论先行、上下对应、分析清晰、逻辑递进;
5.3执行方案:也就是输出科学数据报告(可视化)的过程。
常用的分析指标
1、用户数据
用户数据 | ||
---|---|---|
存量用户规模 | DAU、MAU | |
增量 | 新用户 | |
健康程度 | 留存率、复购率 | |
来源渠道 |
2、行为数据
行为数据 | ||
---|---|---|
频率 | pv、uv、访问深度 | |
路径走通流程 | 转化率 | |
时间 | 时长 | |
质量 | 跳出率 |
3、业务数据
业务数据 | ||
---|---|---|
总量 | GMV、访问时长 | |
人均 | 人均GMV、人均访问时长 | |
人数 | 下单人数 |
工作中对数据分析思路的一点思考相关推荐
- renpy 如何执行2个action_如何解决工作中遇到问题丨2个思考方式、2个技巧和1个解决系统...
2020年我遇到两次工作中出现了很麻烦的问题,第一次我是感觉到似乎天都要塌了,这要是解决不了我该怎么办呢?焦虑的情绪比问题还要更难解决,我不止一次流泪想着要是解决不了怎么办啊?我闺蜜说你一个老师,再大 ...
- 菜鸟网工工作中对Linux系统的一点体会
2019独角兽企业重金招聘Python工程师标准>>> 又到了毕业季,看着朋友圈上学弟学妹的动态,也让我想起了去年毕业时的场景.我在大学时读的是通信工程专业,大四时为了找工作,自学了 ...
- WPF中显示CAD图形的一点思考
文章目录 1.GIS图形的显示 2.CAD图形显示 3.思考 项目中使用WPF做了一个GIS图形和CAD详图的关联工具,为了让用户在关联的过程中能更准确的识别要关联的CAD图形和GIS图形,做了一个图 ...
- [转]对C#泛型中的new()约束的一点思考
对于new()约束,大家可能有一个误解,以为使用了new约束之后,在创建对象时与非泛型的版本是一致的: public class Tester<T> where T:new() { pub ...
- 《谁说菜鸟不会数据分析》学习笔记 第一章总览 第二章数据分析思路
网上的信息太琐碎了,根本没搞懂什么是数据分析方法什么是数据分析方法论,所以找了一本比较简单的书来系统学习一下,本来打算粗略看完,但是觉得这本书知识还是不错的,所以决定在未来一周把这本书用心学一下. 这 ...
- 产品工作中的金字塔原理
本文有PMCAFF 原创作者 咸鱼 原创发布于pmcaff.com 金字塔原理是国外一个慈祥的老太太(巴巴拉·明托)提出的一个方法论,主要是帮助我们清晰的思考.表达和写作的思维方式. 一. 什么是金字 ...
- 如何在工作中保持稳定的情绪?——打工人必看!
身为一名社畜,工作中最难得可贵的品质是什么?是稳定的情绪啊.拿破仑有句话说得好:"能控制好自己情绪的人,比能拿下一座城池的将军更伟大."无论在生活中还是工作中,我们可能因为一点小挫 ...
- 关于提BUG的一点思考以及工作中总结的规范
在测试的工作中,提BUG是日常工作. 以前自己为了省事,省时,仅仅是截图,在图片上注明一下问题,就放到BUG库中了. 现在发现这样会造成开发的时间的浪费,增加了沟通成本. 对于BUG,当发现了异常时, ...
- 成长的思考:如何在工作中保持高速的自我成长
之前在跟一位正在读博士的同学交流之后,我意识到了自己成长的危机.那么如果我选择了不去读博士,那么我又该如何保持快速的自我成长呢?如何保持与博士同学们的思维层次和眼界在同一个水平上呢?如何在相同的时间内 ...
最新文章
- Ubuntu18.04 显卡驱动安装
- ibatis动态查询条件
- h5的formData 上传文件及.net后台
- elastic 修改map_Amazon Elastic Map Reduce使用Apache Mahout计算建议
- php实现文字向左跑马灯,js实现文字跑马灯效果
- 收藏 | 深度学习检测小目标常用方法
- ggplot2 | 使用小提琴图+箱形图+抖动图展示数据分布情况
- javascript提醒
- BeautifulSoup([your markup]) to this: BeautifulSoup([your markup], lxml) 解决未设置默认解析器的错误...
- php 万能密码,万能密码漏洞利用
- 高德地图怎么测量面积_高德地图如何测量海拔
- 阻容感基础02:电阻器原理(1)-电阻器模型
- Digital Twin 数字孪生 工业4.0 SCADA 物联网
- telnet 和 ping的区别
- Nature子刊 | 褚海燕组-土壤生物多样性与城市绿地生态系统功能(朱永官/韦革宏点评)...
- 王爽 汇编语言 实验七
- CSS预处理器-Sass、Less和Stylus-介绍和使用
- Python数据可视化seaborn(五) -- 分类统计图
- 工作的驱动力——成就感
- 王多鱼噩梦:MIT的机器狗学会守门了,拦截率87.5%,比顶尖运动员还高!
热门文章
- GitHub上9款美观大气的后台管理系统,基于但不限于vue、react、Angular、Bootstrap框架
- 发自肺腑深入肌肤 —— 一位武汉老程序员的自白
- 高压直流电源系统(直流ups)有哪些特点?
- 【C语言习题】两素数之差为2,则称该两素数为双胞胎数。求出[2,300]内双胞胎数。
- 如何跟领导说话,会让领导喜欢并器重你?
- 验证座机号码(中国 如:010-XXXXXXXX)
- Canvas 贪吃蛇大作战
- 这才是21 世纪的 API 文档该有的样子
- c语言规定对于一个正常运行的c程序,下列叙述中正确的是,对于一个正常运行的C语言程序,以下叙述中正确的是()。A.程序的执行总是从main函数开始,在main函...
- Regsvr32和Regasm注册DLL COM组件