(转载来自):https://blog.csdn.net/is_badboy/article/details/104520461

数据分析的流程


在介绍数据分析方法论和思路之前,我们还是先不厌其烦地看一下数据分析的流程,简单来说分为以下六个步骤:

1、明确分析的目的,提出问题。只有弄清楚了分析的目的是什么,才能准确定位分析因子,提出有价值的问题,提供清晰的指引方向。

2、数据采集。收集原始数据,数据来源可能是丰富多样的,一般有数据库、互联网、市场调查等。具体办法可以通过加入“埋点”代码,或者使用第三方的数据统计工具。

3、数据清洗。对收集到的原始数据进行数据加工,主要包括数据清洗、数据分组、数据检索、数据抽取等处理方法。

4、数据转换。通过探索式分析检验假设值的形成方式,在数据之中发现新的特征,对整个数据集有个全面认识,以便后续选择何种分析策略。

5、数据分析。数据整理完毕,就要对数据进行综合分析和相关分析,需要对产品、业务、技术等了如指掌才行,常常用到分类、聚合等数据挖掘算法。Excel是最简单的数据分析工具,专业数据分析工具有FineBI、Python等。

6、数据可视化。借助可视化数据,能有效直观地表述想要呈现的信息、观点和建议,比如金字塔图、矩阵图、漏斗图、帕累托图等,同时也可以使用报告等形式与他人交流。

7、撰写分析报告。通过分析得出结论,并给出明确意见。

数据分析方法论

数据分析的方法论很多,其中六种比较常见的理论。 PEST分析法,5W2H分析法、SWOT分析法、4P营销理论、逻辑树法、AARRR模型

1、PEST分析法

PEST,也就是政治(Politics)、经济(Economy)、社会(Society)、技术(Technology),能从各个方面把握宏观环境的现状及变化趋势,主要用户行业分析

宏观环境又称一般环境,是指影响一切行业和企业的各种宏观力量。

对宏观环境因素作分析时,由于不同行业和企业有其自身特点和经营需要,分析的具体内容会有差异,但一般都应对政治、经济、技术、社会,这四大类影响企业的主要外部环境因素进行分析。

政治环境:政治体制、经济体制、财政政策、税收政策、产业政策、投资政策等。

经济环境:GDP 及增长率、进出口总额及增长率、利率、汇率、通货膨胀率、消费价格指数、居民可支配收入、失业率、劳动生产率等。

社会环境:人口规模、性别比例、年龄结构、生活力式、购买习惯、城市特点等。

技术环境:折旧和报废速度、技术更新速度、技术传播速度、技术商品化速度等。

2、5W2H分析法

            

5W2H,即为什么(Why)、什么事(What)、谁(Who)、什么时候(When)、什么地方(Where)、如何做(How)、什么价格(How much),主要用于用户行为分析、业务问题专题分析、营销活动等

该分析方法又称为七何分析法,是一个非常简单、方便又实用的工具,以用户购买行为为例:

Why:用户为什么要买?产品的吸引点在哪里?

What:产品提供的功能是什么?

Who:用户群体是什么?这个群体的特点是什么?

When:购买频次是多少?

Where:产品在哪里最受欢迎?在哪里卖出去?

How:用户怎么购买?购买方式什么?

How much:用户购买的成本是多少?时间成本是多少?

3、SWOT分析法

         

SWOT分析法也叫态势分析法,S (strengths)是优势、W (weaknesses)是劣势,O (opportunities)是机会、T (threats)是威胁或风险。可用于行业分析。

SWOT分析法是用来确定企业自身的内部优势、劣势和外部的机会和威胁等,通过调查列举出来,并依照矩阵形式排列,然后用系统分析的思想,把各种因素相互匹配起来加以分析。

运用这种方法,可以对研究对象所处的情景进行全面、系统、准确的研究,从而将公司的战略与公司内部资源、外部环境有机地结合起来。

4、4P营销理论

4P即产品(Product)、价格(Price)、渠道(Place)、推广(Promotion),在营销领域,这种以市场为导向的营销组合理论,被企业应用最普遍。

可以说企业的一切营销动作都是在围绕着4P理论进行,也就是将:产品、价格、渠道、推广。通过将四者的结合、协调发展,从而提高企业的市场份额,达到最终获利的目的。

产品:从市场营销的角度来看,产品是指能够提供给市场,被入们使用和消费并满足人们某种需要的任何东西,包括有形产品、服务、人员、组织、观念或它们的组合。

价格:是指顾客购买产品时的价格,包括基本价格、折扣价格、支付期限等。影响定价的主要因素有三个:需求、成本与竞争。

渠道:是指产品从生产企业流转到用户手上全过程中所经历的各个环节。

促销:是指企业通过销售行为的改变来刺激用户消费,以短期的行为(比如让利、买一送一,营销现场气氛等等)促成消费的增长,吸引其他品牌的用户或导致提前消费来促进销售的增长。广告、宣传推广、人员推销、销售促进是一个机构促销组合的四大要素。

5、逻辑树法(问题树、演绎树、分解树)

                     

逻辑树又称问题树、演绎树或分解树等。

它是把一个已知问题当成“主干”,然后开始考虑这个问题和哪些相关问题有关,也就是“分支”。逻辑树能保证解决问题的过程的完整性,它能将工作细分为便于操作的任务,确定各部分的优先顺序,明确地把责任落实到个人。

逻辑树的使用必须遵循以下三个原则:

要素化:把相同的问题总结归纳成要素。

框架化:将各个要素组织成框架。遵守不重不漏的原则。

关联化:框架内的各要素保持必要的相互关系,简单而不独立。

6、AARRR模型

          

AARRR模型是所有运营人员都要了解的一个数据模型,从整个用户生命周期入手,包括获取(Acquisition)、激活(Activition)、留存(Retention)、变现(Revenue)和传播(Refer)。可用于运营分分析。

每个环节分别对应生命周期的5个重要过程,即从获取用户,到提升活跃度,提升留存率,并获取收入,直至最后形成病毒式传播。

数据分析思路

数据分析方法论主要是从宏观角度介绍如何进行数据分析,它就像是一个数据分析的前期规划,搭建一个清晰的数据分析框架。那么对于具体的业务场景问题,就要靠具体的分析方法来支撑了,下面小编就介绍几种常用的数据分析思路。

1、趋势分析

最简单、最常见的数据分析方法,一般用于核心指标的长期跟踪,比如点击率、GMV、活跃用户数。可以看出数据有那些趋势上的变化,有没有周期性,有没有拐点等,继而分析原因。

2、多维分解

也就是通过不同的维度对于数据进行分解,以获取更加精细的数据洞察。举个例子,对网站维护进行数据分析,可以拆分出地区、访问来源、设备、浏览器等等维度。

3、用户分群

针对符合某种特定行为或背景信息的用户,进行特定的优化和分析,将多维度和多指标作为分群条件,有针对性地优化供应链,提升供应链稳定性。

4、漏斗分析

按照已知的转化路径,借助漏斗模型分析总体和每一步的转化情况。例如将漏斗图用于网站关键路径的转化率分析,不仅能显示用户的最终转化率,同时还可以展示每一节点的转化率。

5、留存分析

留存分析是一种用来分析用户参与情况/活跃程度的分析模型,考察进行初始行为的用户中,有多少人会进行后续行为。衡量留存的常见指标有次日留存率、7日留存率、30日留存率等。

6、A/B 测试

A/B测试是为了达到一个目标,采取了两套方案,通过实验观察两组方案的数据效果,判断两组方案的好坏,需要选择合理的分组样本、监测数据指标、事后数据分析和不同方案评估。

7、对比分析

分为横向对比(跟自己比)和纵向对比(跟别人比),常见的对比应用有A/B test,A/B test的关键就是保证两组中只有一个单一变量,其他条件保持一致。

8、交叉分析

交叉分析法就是将对比分析从多个维度进行交叉展现,进行多角度的结合分析,从中发现最为相关的维度来探索数据变化的原因。

(转载)数据分析方法论(6种方法,8个思路)相关推荐

  1. 数据分析常用三种方法

    数据分析常用三种方法:趋势分析.对比分析.细分分析 1. 趋势分析 趋势分析般而言,适用于产品核心指标的长期跟踪,比如,点击率,GMV,活跃用户数等.做出简单的数据趋势图,并不算是趋势分析,趋势分析更 ...

  2. t–sql pl–sql_T-SQL for DBA –使用T-SQL进行快速数据分析的三种方法

    t–sql pl–sql 背景 (Background) As a database administrator, sometimes you need to identify details abo ...

  3. 数据产品-数据分析方法论和分析方法介绍

    作为数据产品,前期的数据分析工作是必不可少的,只有经历过足够多的数据分析小活,对业务的认知和对底层数据的熟悉度才能够足够深入,足够支撑我们将底层的需求提升成为数据产品层面上的需求.而数据分析的方法层出 ...

  4. 大数据分析有几种方法

    大数据分析六种方法:数字和趋势.维度分解.用户分群.转化漏斗.行为轨迹.留存分析.看数字及趋势是最基础进行展示相关数据管理信息的方法,对于谁符合一定的行为或背景资料,分类处理用户. 大数据分析方法如下 ...

  5. 大数据分析的几种方法

    大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据.适用于大数据的技术,包括大规模并行处理(MPP)数据库.数据挖掘.分布式文件系统.分布式数据库.云计算平台.互联网和可扩展的存储系统.回首 ...

  6. 【三节课数据分析】ch3.数据分析的九种方法

    文章目录 01 对比分析 比什么? 02 多维度拆解 案例说明 数据涨跌如何处理 03 漏斗观察 案例 常见的渠道划分方式 渠道质量跟踪 04 分布情况 常见的群体划分 05 用户留存的分析方法 一般 ...

  7. 对论文进行数据分析的几种方法总结(个人总结)

    以下分析方法排名不分先后,这里重点记录自己实验得到的值与参考解之间的数据对比. 绝对误差分布云图,可以直观看到误差分布,并通过颜色区分误差较大和误差较小区域. 相对误差分布云图,与上述相同,只不过绝对 ...

  8. js类数组转化为数组的5种方法【附思路】

    arrayLike为要转化的类数组,适合有点基础的小伙伴. 1.扩展运算符...     console.log([...arrayLike]) 2.Array.form     console.lo ...

  9. 简洁经常使用权限系统的设计与实现(一):构造权限菜单树的N(Ngt;=4)种方法

    权限系统.Web开发常见标准子系统之中的一个.结合自己的一些思考和实践,从本篇開始权限系统的设计与实现之路. 近期,重构了项目的权限菜单构造过程,向前端返回json格式的权限树. 这一篇.仅仅是大致介 ...

最新文章

  1. QTP 中 通过 Test Setting 设置 function libraries 与 test 的关联
  2. C++实现类不可复制
  3. 用计算机进行频谱分析时,实验四-利用FFT对信号进行频谱分析1112
  4. 如何在IDEA中搭建SpringMVC?
  5. html中 DPlayer 播放m3u8文件【方式二】
  6. oracle里每年第一天,SQL和Oracle获取每周、每月、每年第一天和最后一天
  7. python 比对两个excel表数据_Python第17课:两个数据表如何比对碰撞?(二)
  8. $timeout、$interval和$watch用法
  9. 宇宙简史——星光中有什么秘密?
  10. iHRM 人力资源管理系统_第7章 POI报表的入门
  11. 地图上的两点,计算出两点之间的角度
  12. ICLR 2022 | 商汤提出cosFormer:在注意力中重新思考Softmax
  13. No valid Maven installation found.
  14. 用c语言简单办法做一个字典_如何用c语言做一个简单的英语词典
  15. 从零开始的Nginx详解(3)【Nginx-Https服务配置详解】
  16. 云米美国上市雷军系持股40% 陈小平:重新定义家的未来
  17. vn.py项目安装经验分享
  18. “框架效应”--如何说话让人喜欢?
  19. linux服务器 使用教程
  20. 计算机人文素养教案,小学信息技术课堂中人文素养的教学探究

热门文章

  1. HTML之图像、表格
  2. SQL达梦数据库复制表数据和表结构[当前模式下]
  3. 关系代数、ALPHA语言和QBE语言
  4. 国考省考行测:资料分析,两年复合增长率
  5. 称重传感器的工作原理和组成材料
  6. 称重传感器在电子皮带秤上的应用
  7. 陶哲轩:ChatGPT已加入我的数学工作流
  8. mysql小数类型字段_mysql小数类型字段,float,double
  9. 基于STM32的BMP图片解码灰度化以及缩放
  10. linux环境下blastn命令怎么用,Linux下BLAST的安装与使用