来源:中国统计网

“Why-What-How”在讲解概念和执行上是个不错的思维模型,本文依例按此框架来拆分数据分析。很多小白可能还没有数据分析的思路,这里权且从个人的角度进行梳理,以资参考。为了帮助大家更好地理解本文,先贴出一张思维导图:

一、WHY:为什么要做数据分析

个人的理解, 数据分析是为了能以量化的方式来分析业务问题并得出结论,其中有两个重点词语:量化和业务。

量化是为了统一认知,并且确保路径可回溯,可复制。除「量化」之外,另外一个重点词语是「业务」。只有解决业务问题分析才能创造价值,价值包括个人价值和公司价值。

那么,如何站在业务方的角度思考问题呢,总结起来就是八个字「忧其所虑,给其所欲」:

  • 沟通充分
  • 结论简明
  • 提供信息量及可落地建议
  • 寻求反馈

在沟通上,确定业务方想要分析什么,提出更合理专业的衡量和分析方式,同时做好节点同步,切忌一条路走到黑。举例来讲,业务方说要看页面停留时长,但他实际想要的,可能是想衡量用户质量,那么留存率、目标转化率才是更合适的指标。

在阐述分析结果上,要记得结论先行,逐层讲解,再提供论据。因为业务方或管理层时间都是有限的,洋洋洒洒一大篇邮件,未看先晕,谁都没心思看你到底分析了啥。

在提供信息量及可落地建议上,先要明白什么叫信息量:提供了对方不知道的信息。太阳明天从东方升起不算信息量,从西方升起才是。

二、WHAT:什么是数据分析

数据分析的本质是抓住变与不变。“变”是数据分析的基础,如果一个业务每天订单是 10000 单,或者每天都是以 10% 的速度稳步增长,那就没有分析的必要了。而若想抓住变,得先形成“不变”的意识。

因此,我建议新手要形成习惯,每天上班第一时间查看数据:实时&日周月报;记录关键数据(榜单&报告)

在“不变”的基础上,便能逐渐培养出指标敏感性,即意识指标偏离的能力。这主要是通过各种日环比,周月同比的监控以及日常的好奇心来保持。我们从一个 Questmobile 榜单上,来简单看下「指标偏离」是怎么应用到日常的分析上的:

这里先跟大家分享下怎么看这种榜单:

  • 看整体排行:看哪些 APP 排在前方是出乎你意料之外的
  • 分行业看排行:看行业里排行及其变动
  • 看增长率:哪些 APP 增长比较快
  • 看使用时长等其他指标

数据分析的定义,还有国外一本商务分析的书籍的定义作为注脚:

三、HOW:怎么进行数据分析

任何数据分析都是“细分,对比,溯源”这三种行为的不断交叉。最常见的细分对比维度是时间,我们通过时间进行周月同比,发现数据异常后,再进行维度或流程上的细分,一步步拆解找到问题所在。

1、细分

在细分方式上,主要有以下三种方式

  • 横切:根据某个维度对指标进行切分及交叉分析
  • 纵切:以时间变化为轴,切分指标上下游
  • 内切:根据某个模型从目标内部进行划分

横切

横切上,我们对维度和指标做做了分类和交叉,当某一类的指标出现问题时,我们便知道该从什么维度进行分析。在进行横切分析时,经常需要多个维度交叉着使用。

纵切

纵切上,有目的有路径,则用漏斗分析。无目的有路径,则用轨迹分析。无目的无路径,则用日志分析。

内切

内切上,主要是根据现有市面上常见的分析模型,RFM,Cohort 和 Segment等方式进行分析。RFM 即最近购买时间,频率及金额三个指标综合来判定用户忠诚度及粘性。

2、对比

对比主要分为以下几种:

  • 横切对比:根据细分中的横切维度进行对比,如城市和品类
  • 纵切对比:与细分中的纵切维护进行对比,如漏斗不同阶段的转化率
  • 目标对比:常见于目标管理,如完成率等
  • 时间对比:日环比,周月同比;7天滑动平均值对比,7天内极值对比

3、溯源

经过反复的细分对比后,基本可以确认问题所在了。这时候就需要和业务方确认是否因为某些业务动作导致的数据异常,包括新版本上线,或者活动策略优化等等。

如果仍然没有头绪,那么只能从最细颗粒度查起了,如用户日志分析、用户访谈、外在环境了解,如外部活动,政策经济条件变化等等

4 、衍生模型

在「细分对比」的基础上,可以衍生出来很多模型。这些模型的意义是能够帮你快速判断一个事情的关键要素,并做到不重不漏。这里列举几个以供参考:

  • Why-How-What
  • 5W1H
  • 5Why
  • 4P模型(产品,价格,渠道,宣传)
  • SWOT 模型(优势,劣势,机会,威胁)
  • PEST 模型(政治,经济,社会,科技)
  • 波士顿矩阵

四、How:数据分析如何落地

以上讲的都偏「道术技」中的「术」部分,下面则通过汇总以上内容,和实际工作进行结合,落地成「技」部分。

1、数据分析流程和场景

根据不同的流程和场景,会有些不同的注意点和「术」的结合

2、数据分析常见谬误

控制变量谬误:在做 A/B 测试时没有控制好变量,导致测试结果不能反映实验结果。或者在进行数据对比时,两个指标没有可比性。

样本谬误:在做抽样分析时,选取的样本不够随机或不够有代表性。举例来讲,互联网圈的人会发现身边的人几乎不用「今日头条」,为什么这 APP 还能有这么大浏览量?

定义谬误:在看某些报告或者公开数据时,经常会有人鱼目混珠。「网站访问量过亿」,是指的访问用户数还是访问页面数?

比率谬误:比率型或比例型的指标出现的谬误以至于可以单独拎出来将。一个是每次谈论此类型指标时,都需要明确分子和分母是什么。

因果相关谬误:会误把相关当因果,忽略中介变量。比如,有人发现雪糕的销量和河溪溺死的儿童数量呈明显相关,就下令削减雪糕销量。其实可能只是因为这两者都是发生在天气炎热的夏天。

辛普森悖论:简单来说,就是在两个相差较多的分组数据相加时,在分组比较中都占优势的一方,会在总评中反而是失势的一方。

总结

数据准确性是第一位的,站在业务方的角度思考问题:忧其所虑,予其所欲,定义「变」与「不变」,细分,对比,溯源。

写给数据分析小白:一种通用的数据思维相关推荐

  1. 一种通用的数据仓库分层方法

    0x00 概述 数据分层是数据仓库设计中十分重要的一个环节,优秀的分层设计能够让整个数据体系更易理解和使用.而目前网络中大部分可以被检索到相关文章只是简单地提及数据分层的设计,或缺少明确而详细的说明, ...

  2. 写给数据分析入门者:一种通用的数据分析思路

    数据分析是一个庞大的工程,有的时候过于抽象且依赖经验.本文是笔者对学习和实践数据分析的一个总结,希望提供一种通用的数据分析思路,并在分析思路的每个步骤中介绍相关的分析算法及其应用场景,对于算法只做浅层 ...

  3. Makefile之大型工程项目子目录Makefile的一种通用写法

    原创作品,转载时请务必以超链接形式标明文章原始出处:http://blog.csdn.net/gqb666/article/details/8902133,作者:gqb666 管理Linux环境下的C ...

  4. 数据清洗的基本流程_数据分析小白学习之路(三)——Excel多练熟能生巧

    谈到数据分析,我们可能第一时间想到python.SQL.Tableau.帆软.R等,但是这些软件.语言要入门掌握.系统学习起来耗时较长.这时候不得不提到excel这个"平平无奇数分小能手&q ...

  5. excel取整函数_数据分析小白学习之路(三)——Excel多练熟能生巧

    谈到数据分析,我们可能第一时间想到python.SQL.Tableau.帆软.R等,但是这些软件.语言要入门掌握.系统学习起来耗时较长.这时候不得不提到excel这个"平平无奇数分小能手&q ...

  6. 【自己动手写神经网络】小白入门连载(二)--机器人时代必须得有人工神经(不是神经病)...

    2019独角兽企业重金招聘Python工程师标准>>> [自己动手写神经网络]小白入门连载(一) 在上一章中,我们已经介绍了神经网络的基本概念.思想,并提及了有关人工神经元模型的部分 ...

  7. mybatis case when_MyBatis 几种通用的写法

           阅读本文约需要8分钟  大家好,我是你们的导师,我每天都会在这里给大家分享一些干货内容(当然了,周末也要允许老师休息一下哈).上次老师跟大家分享了下SpringBoot 2.3 新特性之 ...

  8. python在线考试系统设计csdn下载_一种通用的网页相似度检测算法

    如果我们需要在海量的结构未知的网页库中找到和指定的网页相似度比较高的一些网页,我们该怎么办呢?本文提出的"一种通用的网页相似度检测算法"就是专门解决这个问题. 算法如下: 1.提取 ...

  9. [机器学习] focal loss:解决样本不平衡的一种通用方案

    文章目录 focal loss 提出的场景和针对的问题 focal loss 提出的场景:目标检测 focal loss 针对的问题:类别不平衡 如何处理目标检测下的类别不平衡 如何理解目标检测场景下 ...

最新文章

  1. pythoning ——3、数据类型(字符串)
  2. 【Android】3.19 示例19--全景图HelloWorld
  3. python常用知识点总结-Python常用知识点汇总
  4. 从零开始Code Review
  5. go build和go install的区别
  6. Qt的元对象(Meta-Object)系统简介(转)
  7. 移动设备的界面设计尺寸
  8. mysql 批量添加更新_mysql 批量添加 更新
  9. rocketmq模块架构图
  10. 【博主推荐】html好看的拼图验证码(附源码)
  11. 【每天一个 Linux 命令】ssh 命令
  12. 对比汇新云和猪八戒?
  13. matlab中sumf,使用SUMIF函数根据日期区间统计的方法
  14. 【译】UI 的黑暗面!暗色背景的优势
  15. 聊天功能,实现:每增加一条消息整体往上移动,滚动查看聊天记录
  16. IT项目管理:项目前期研究报告
  17. 微信小程序渗透测试技巧
  18. 《软件工程之美》打卡第七周
  19. 网站建设需要多少钱 开发一个网站有哪些费用
  20. 使用css绘制弹幕,实现弹幕效果的方法总结(css和canvas)

热门文章

  1. sql语句中case_SQL中的CASE语句
  2. Visual Studio Code(VS Code)入门
  3. 使用SQL视图和存储过程限制和监视SQL Server数据访问
  4. 【转载】如何知道自己适合做什么
  5. Python学习 Day7 Python3 函数
  6. CentOS 服务器搭建 mediawiki
  7. Knockout.js 初探
  8. dubbo源码-服务发现
  9. 接口类的多继承以及抽象类的单继承
  10. LoadRunner安装