总目录

课程地址https://www.bilibili.com/video/BV1ZM4y1u7uF/?spm_id_from=333.337.search-card.all.click&vd_source=9ddee47105d74cb0e3521e3b8ff974de

第一讲:系统认识数据分析

第二讲:Excel基础操作

第三讲:Tableau数据可视化与仪表盘搭建

第四讲:SQL从入门到实践

第五讲:Python


目录

前言

1. 什么是数据分析

2. 重新认识数据分析

3. 观测

3.1 观察:采集数据、储存数据、展示数据

3.1.1 采集数据

3.1.2 储存数据

3.1.3 展示数据

3.2 测量:设定标准、发现异常、研究关系

3.2.1 分析数据的目的是什么?

3.2.2 数据是客观统一的:有统一的认知才能有共同的目标

4. 实验-提出假设,然后验证假设

4.1 设计A/B测试获取数据(没有数据时的检验假设方法)

4.2 现实问题​​​​​​​

5. 应用-如何应用数据创造价值

5.1 基于数据反馈不断迭代产品和业务策略

5.1.1 基本流程

5.1.2 拆解目标

5.1.3 实际应用-将数据应用于业务

5.2 基于数据训练算法,让机器自动化地完成工作

5.2.1 实际应用-将数据应用于算法

小结

参考目录


前言

本文详细记录了b站“戴戴戴师兄”的数据分析课程第一讲的授课内容,主要内容包括:数据分析的基本概念、数据分析的流程、及现实应用,并对课程中提到的九种实际工作中常用的目标拆解方法进行了详细的补充。


1. 什么是数据分析

  • 观测
  • 实验
  • 应用

2. 重新认识数据分析

  • 观测:对事物形成客观量化的认知(报表、图表、仪表盘)
  • 实验:发现规律、验证假设(科学研究、A/B测试)
  • 应用:不断基于数据反馈迭代产品

3. 观测

3.1 观察:采集数据、储存数据、展示数据

3.1.1 采集数据

① 采集数据:解析系统日志

② 采集数据:埋点获取新数据

如果不存在所需要的数据,可以通过自定义来记录新的数据,如IP地址

③ 采集数据:通过传感器采集

如天气数据,心率血氧手环中的数据

④ 采集数据:爬虫

解析网站->抓取数据,正规公司不会讲爬虫作为主要获取数据的手段

⑤ 采集数据:API (Application Programming Interface)

API 平台文档、用API 获取数据

3.1.2 储存数据

① 储存数据:各类类型的数据库

hive、MySQL、PostgreSQL、SQL Server、presto、impala(数据工程师)

② 储存数据:连接数据库取数

3.1.3 展示数据

① 展示数据:可视化高效传达信息(数据可视化)

如使用Tableau

3.2 测量:设定标准、发现异常、研究关系

3.2.1 分析数据的目的是什么?

  1. 及时发现异常

  2. 找到数据之间的因果关系

3.2.2 数据是客观统一的:有统一的认知才能有共同的目标

  1. 设定标准(Benchmark)+发现异常

  2. 研究关系:可视化查看相关性、建模推导相关性

4. 实验-提出假设,然后验证假设

观测到差评率飙升->假设由恶劣天气引起->通过天气数据验证假设

* 所有未经过事实数据验证的想法都是假设

4.1 设计A/B测试获取数据(没有数据时的检验假设方法)

实验目标、实验假设、实验打分、实验指标、实验观众、实验版本、开发验收、实验结果、实验分析、后续计划

4.2 现实问题

① 如何在业务只有少量数据时设计数据实验?

② 如何在无法同时测试两个版本时比较数据?

5. 应用-如何应用数据创造价值

5.1 基于数据反馈不断迭代产品和业务策略

5.1.1 基本流程

明确业务的目标->拆解目标->得到标准值

5.1.2 拆解目标

* 拆解只要符合mece法则即可

MECE法则:

MECE是(Mutually Exclusive Collectively Exhaustive)的缩写,指的是“相互独立,完全穷尽”的分类原则。通过MECE方法对问题进行分类,能做到清晰准确,从而容易找到答案

① 流程拆解法

流程法就是按照事情发展的时间、流程、顺序,对过程进行逐一的拆解。
如:进行拆解用户购买商品的流程环节:看到广告–>点进商品–>点击购买–>完成支付–>订单量下降
类似于漏斗分析法,是一套流程分析,适用于流程长,环节较多,并且随着环节的进行,留存率越来越少的场景。

② 二分法

二分法虽然叫二分法,但其实是一种泛指,指的是同一纬度可以穷举的拆分方法。

二分法是所有拆解方法中最简单的,但也是上限最高的一种拆分方法。使用的时候只要注意符合MECE原则就行了。比如,性别维度可以分成男、女,年龄维度可以分成80后、90后。

二分法的上限在于,当同时使用两种或三种不同的二分法时,基本就是四象限分析(见象限拆解法)。比如,重要不重要和紧急不紧急构成的重要紧急四象限法。

③ 象限拆解法

通过横纵坐标,将所要分析的内容分成四个象限,由高到低进行分析。
1.有利于找到问题的共性原因:通过象限分析法,将有相同特征的事件进行归因分析,总结其中的共性原因。
2.建立分组优化策略:针对投放的象限分析法,可以针对不同象限建立优化策略。

④ 杜邦分析法

杜邦分析法是用来综合分析企业竞争能力以及如何进行改善的方法。

杜邦分析公式:ROE = 销售净利率 * 资产周转率 * 权益乘数

销售净利率 = 净利润/销售额

资产周转率 = 销售额/总资产,衡量的是营运的效率

权益乘数 = 总资产/所有者权益,又叫做杠杆率,衡量企业负债经营的情况

相对应的,我们可以几乎把所有上市公司的分为:追求更高销售净利率的茅台模式、追求更快资产周转率的沃尔玛模式、追求更高杠杆的银行模式

⑤ AARRR

AARRR是增长黑客的经典模型,也可以称为用户增长模型,或者海盗法则,本质上是一个流量漏斗模型。

AARRR即Acquisition(获取)、Activation(活跃)、Retention(留存)、Revenue(收益)、Refer(传播),分别对应的是产品用户生命周期中的5个重要环节,每个环节的转化都会带来用户流失,但相应的用户价值也会提高。AARRR模型的提出者认为:所有创新型、成长型的企业都应该按照这个模型来做增长。

1. Acquisition获取用户

获取用户一般需要评估的维度有:渠道的获客数量、获客质量等。渠道数量和质量的指标包括:每日新增、累积新增、启动次数、首次交易户、首绑交易户、一次性用户数、平均使用时长等。

具体的获取用户的方式,线上方面主要是:网站SEO,SEM,app市场首发、ASO等方式,另外还包括运营活动的H5页面,以及自媒体推广等方式。线下方面主要通过地推形式以及传单形式进行获取。

2. Activation提高活跃度

获取用户之后,利用价格优惠、内容编辑等方法来提高用户的活跃度,让用户使用产品的核心功能,体验到产品的价值。内容多,商品好,价格优惠,但也必须要注意成本。

通过活跃度指标数据,我们可以更清晰的了解到用户的体验,有利于提高用户粘性。

3. Retention提高留存率

留存率指标一般包括:次日、3日、7日、30日留存。通常来说,次日留存>3日留存>7日留存>次月留存。用户的留存量刚开始会下降的比较严重,到了后期会逐渐稳定在一个数量级上。稳定下来的这些用户,基本上就是产品的目标用户了。通过日留存率、周留存率、月留存率等指标监控应用的用户流失情况,并采取相应的手段在用户流失之前,激励这些用户继续使用应用。运营上,采用内容,相互留言等社区用户共建UCG,摆脱初期的PCG模式。电商通过商品质量,O2O通过优质服务提高留存。这些都是业务层面的提高留存。产品模式上,通过会员机制的签到和奖励的机制去提高留存。包括app推送和短信激活方式都是激活用户,提高留存的产品方式。

4. Revenue获取收入

获取收入是应用运营最核心的一块。收入来源主要包括三种:付费应用、应用内付费、以及广告。在国内目前付费应用的接受程度很低,包括Google Play Store在中国也只推免费应用。开发者的收入来源主要是广告,而应用内付费目前在游戏行业应用比较多。

无论是哪种付费方式,收入都直接或间接来自用户。这也就意味着,我们前面的提高活跃度、提高留存率,对获取收入来说,是必需的基础。用户基数大了,收入才有可能上量。

5. Refer自传播

以之前的运营模型来说,通常到第四个层次,获取收入就结束了。但是随着社交网络的兴起,运营又增加了一个层次,这就是基于社交网络的病毒式传播,目前已经成为获取用户的一个新途径。而且这种方式的成本很低,效果好,但前提是产品自身要有足够好的质量和口碑。

⑥ PEST

PEST分析法就是,从政治(Politics)、经济(Economic)、社会(Society)、技术(Technology)四个方面,基于公司战略的眼光来分析企业外部宏观环境的一种方法,公司战略的制定离不开宏观环境,而PEST分析法能从各个方面比较好的把握宏观环境的现状及变化的趋势,有利于企业对生存发展的机会加以利用,对环境可能带来的威胁及早发现避开。

政治环境:
是指一个国家或地区的政治制度,体制,方针政策,法律法规等方面,这些因素常常影响着企业的经营行为,尤其是对企业长期额度投资行为有着较大的影响。

经济环境:
指企业在制定战略过程中须考虑的国内外经济条件,宏观经济政策,经济发展水平等多种因素。

社会环境:
主要指组织所在社会中成员的民族特征,文化传统,价值观念,宗教信仰,教育水平以及风俗习惯等因素。

技术环境:
是指企业业务所涉及国家和地区的技术水平,技术政策,新产品开发能力以及技术发展的动态等。

示例:

⑦ RFM

RFM模型是网店衡量当前用户价值和客户潜在价值的重要工具和手段。RFM是Rencency(最近一次消费),Frequency(消费频率)、Monetary(消费金额),三个指标首字母组合。

RFM分析过程:

1、确定RFM三个指标的分段和每个分段的分值

2、计算每个客户RFM三个指标的得分

3、计算每个客户的总得分,并且根据总得分筛选出优质的客户

客户价值细分及营销策略:

⑧ SWOT

SWOT 分析会从内部和外部的角度列出企业的优点和缺点,其方法是确定企业的:

  • Strengths 优势
  • Weaknesses 劣势
  • Opportunities 机会
  • Threats 威胁

优势和劣势主要集中在当前,而机会和威胁主要集中在未来。正在发生的和可能发生的。

优势和劣势都在你的掌控之中。虽然可能很难,但你可以随着时间的推移改变它们。示例包括:

  • 公司文化
  • 声誉
  • 顾客名单
  • 地理
  • 员工
  • 合作伙伴
  • 知识产权
  • 资产

相反,机会和威胁通常是你无法控制的。你可以试着针对它们制定计划或影响积极的变化,但归根结底,这并不取决于你。示例包括:

  • 法规
  • 供应商
  • 竞争对手
  • 经济
  • 市场规模
  • 趋势
  • 融资
  • 天气

示例:

⑨ 5W1H

5W1H分析法也叫六何分析法,是一种思考方法,也可以说是一种创造技法。在企业管理、日常工作生活和学习中得到广泛的应用。1932年,美国政治学家拉斯维尔提出“5W分析法”,后经过人们的不断运用和总结,逐步形成了一套成熟的“5W+IH”模式。

5W+1H:是对选定的项目、工序或操作,都要从原因(何因Why)、对象(何事What)、地点(何地Where)、时间(何时When)、人员(何人Who)、方法(何法How)等六个方面提出问题进行思考。

⑩ 补充-实际应用整合

举例:本周产品投放带来的收入下降了,就可以先拆一下渠道(二分法)看看是单独渠道再降还是所有渠道都在降,然后拆一下转化公式(公式法)看看是单独某一环节出了问题还是每个环节都在降。接着可以复现一下用户路径(流程法)看看是不是有页面加载或点击的bug,等等。

5.1.3 实际应用-将数据应用于业务

5.2 基于数据训练算法,让机器自动化地完成工作

5.2.1 实际应用-将数据应用于算法

① 为算法设定明确的业务目标

② 为算法提供高质量的数据

③ 判断算法是否真的创造了实际价值

④ 帮助业务更好地使用算法


小结

基于数据和算法的竞争,无时无刻不在互联网行业上演;基于数据训练算法,让机器自动化地完成工作

参考目录

本文参考了以下几篇文章或使用了文章中的插图,特此感谢。

[1] 九大数据分析方法:Mece法

[2] 数据分析拆解方法

[3] 分析师常用的四种拆分方法

[4] 如何通俗易懂地解释「杜邦分析法」

[5] 商业分析必须要了解的AARRR漏斗模型)

[6] PEST模型的绘制技巧

[7] 数据分析,最详细的RFM模型讲解

[8] SWOT 分析:找到竞争优势的简单方法)

[9] 5W1H分析法

戴戴戴师兄-数据分析课程笔记(第一讲)相关推荐

  1. 戴戴戴师兄-数据分析课程笔记(第二讲)

    总目录 课程地址http://xn--https-my2iwds253at07a//www.bilibili.com/video/BV1ZM4y1u7uF/?spm_id_from=333.337.s ...

  2. 从零开始学习VIO笔记 --- 第一讲:基础知识(四元数,李代数)

    从零开始学习VIO笔记 --- 第一讲:基础知识(四元数,李代数) 一. 向量的内积与外积 二. 旋转与平移 2.1 旋转表示 --- 旋转矩阵R 2.2 平移向量 2.3 变换矩阵T与齐次坐标 2. ...

  3. 惯性导航系统学习笔记——第一讲

    惯性导航系统学习笔记 第一讲 惯性导航系统概述 一.惯性导航基本概念 二.惯性导航基本原理 三.惯性导航应用与发展 四.小结 第一讲 惯性导航系统概述 本文为学习朱家海教授<惯性导航系统> ...

  4. Apollo星火计划学习笔记——第一讲 使用Apollo学习自动驾驶

    引言 如何学习自动驾驶? 自动驾驶是集车辆.计算机.电子电气.人工智能.通信等多学科应用为一体的的复杂系统.针对自身专业背景结合自动驾驶发展进行学习: 自动驾驶是通过智能系统来驾驶汽车从而取代了驾驶员 ...

  5. 计算机课进制笔记,初学Python课程笔记-第一课(计算机基本概念+进制+环境变量)...

    这是我第一次写博客,简单地聊聊当下的感受.其实,早在大学期间就有过把自己所学的一些知识点记录在某个平台,可供日后自己复习.只是本人并非计算机专业出身,平时写代码写得不是不多.直到毕业参与工作,从事软件 ...

  6. 视觉SLAM十四讲学习笔记-第一讲

    第一讲:预备知识 SLAM介绍 SLAM 是 Simultaneous Localization and Mapping 的缩写,中文译作"同时定位与地图构建".它是指搭载特定传感 ...

  7. 视觉SLAM十四讲笔记 -- 第一讲

    ​ 第一讲:课后习题 有线性方程 Ax = b,若已知 A,b,需要求解x,该如何求解? 这对 A 和 b 有哪些要求? [提示:从A的维度和秩角度来分析] 答:可以利用大学时候学的非齐次方程组的方法 ...

  8. 戴戴戴师兄《系统认识数据分析》——笔记整理2

    一.数据可视化 ---------------------------------- ------------------ 数据可视化分类有哪些? --艺术流:旨在探索更多的数据表达方法,相当于用数据 ...

  9. 戴戴戴师兄《系统认识数据分析》——笔记整理0

    一.什么是数据分析 观测.实验.应用 二.重新认识数据分析 观测:对事物形式客观量化的认知(报表.图表.仪盘表) 实验:发现规律.验证假设(A/B实验) 应用:不断基于数据反馈迭代产品 三.观测 观察 ...

最新文章

  1. Ubuntu9.10 server 安装配置 vsftpd2.2.0 ftp服务器 并且 解决 putty 登陆 sshd 显示中文乱码
  2. 零基础学Java需要先具备的三项技能
  3. 2019年第十届蓝桥杯 - 省赛 - C/C++大学B组 - A. 组队
  4. 计算机二级1605错误,word 出现windows installer 1605错误
  5. html旋转代码_付费?是不可能的!20行Python代码实现一款永久免费PDF编辑工具
  6. 原创《如何用vue来轻松的驾驭 html5 webapp的页面体验》
  7. A1136 | 字符串处理、大整数运算
  8. idea中build project不能用_Java语言编程第40讲——如何在一个项目中组织多个SpringBoot服务
  9. 深度学习界明星:生成对抗网络与Improving GAN
  10. 高斯滤波程序编写 opencv C++ CSU
  11. 简约竞聘个人简历自我介绍PPT模板
  12. win10无线投屏_原来小米的投屏功能,如此强大,每天都偷偷用,秒杀4k电视
  13. html文件svchost,解决html文件的DropFileName = svchost.exe木马
  14. hive  explode(split(split_feild,‘split_char‘)) split_feild为null 整条数据会丢掉
  15. Vue 2.x折腾记 - (15) 捣鼓一个中规中矩loading组件
  16. yum 安装没有公钥_CentOS7.7中使用yum安装进,提示尚未安装任何 GPG 公钥的解决办法...
  17. JS面试题汇总(八)
  18. dockers容器基础及基础命令(一)
  19. 深度学习框架PyTorch入门与实践:第九章 AI诗人:用RNN写诗
  20. 如何使用 Python 开发一个【抖音视频下载神器】

热门文章

  1. 手机DIY自制现身南瓜网
  2. 加密货币涨跌的原理到底是什么?
  3. GNU GRUB 2.02系统启动项管理设置
  4. 海康威视监控推流自建服务器实现网页端无插件1-2秒低延迟实时监控
  5. 用Python做了个图片识别系统(附源码)
  6. 菜鸟教程中的面试题总结
  7. 生态型协同共建,智能家居平台建设新思路
  8. [转] Photoshop教程8000例
  9. 行列式【线性代数系列(一)】
  10. 再生龙备份还原linux系统