数据分析正在渗入到各行各业的商业活动中以及各种细小决策中,判断一个人了是否有数据思维,最核心的因素是看他有没有通过数据分析做决策的习惯。

一个合格的数据分析师要掌握各种数据分析模型和算法以及熟悉SAS、R、Python等统计工具。有些人可能会说,数据分析的门槛太高了,其实除了数据工作相关产品经理和分析师,并非所有产品经理都需要熟悉数据分析模型和工具,日常大部分数据分析都能够通过Excel分析出来,如果是比较复杂的数据,产品经理可以通过自己了解业务知识与数据分析师有效的协作,做出有数据依据的决策。

但是每个产品经理都需要了解数据分析思维的重要性,以及熟悉数据分析思维工作流程。

数据分析思维的由来

过去人们做决策主要靠定量分析,定量分析的决策依据来自于决策者的经验和直觉,这种决策的缺点主要在于决策结果的不可确定性,决策失误的概率很大。

随着互联网的不断发展和物联网设备的不断普及,人们活动的各种数据被有意识的存储下来了,数据的收集,让我们可以通过定量分析数据,利用数据实现更好的决策制定。

比如像很多互联网公司都成立了大数据团队,收集用户的社交、电商、搜索行为等数据,通过所搜集的大数据来制定商业决策依据,以及通过数据挖掘形式,找到创新产品的机会。

大的互联网公司在满足自己内部决策需求的同时,也成了了大数据部门给其它公司进行赋能,比如蚂蚁金服的数据产品芝麻信用,不仅能够成为蚂蚁内部各种金融产品的信用审核依据,也开放给了很多行业如出行、金融、共享服务公司等,极大提高了基于信用服务的门槛和便捷性。

熟悉NBA的球迷都知道,勇士队曾长期以来一直是联盟里的鱼腩球队。但是自从来自硅谷风险投资者拉科布收购勇士之后,把数据分析的思想充分融入到了球队的训练之中,他们雇佣了许多数据分析师,为球队提供咨询帮助,并最先在球馆中引入球馆录像和分析系统,为了更好地监测球员的健康状况。

同时他们根据团队对历年来NBA比赛的统计,发现NBA最有效的进攻是眼花缭乱的传球和准确的投篮,而不是看似观赏性很强的突破和扣篮。在这个思想的指导下,勇士队开创性的发明了小球战术,以三分作为主要进攻手段,开创了四年夺三冠的王朝伟绩。

数据分析流程分为发现问题、数据的收集和加工、数据分析、解决对策四个步骤。

发现问题

在工作中并不是所有的事物都需要用到数据分析,只有出现了问题才需要用到数据分析。一类问题是对现状的不满意,另一类问题是对未来的预测。

在数据分析中,发现现状问题有一个万能的公式,即问题=预期和现状之间的差距,比如当商品广告投入和产品质量没有变化的情况下,本月用户的平均消费金额下降了。如果广告和产品质量没有变化,正常的情况是本月用户的平均消费金额不变才对,现状却是本月用户的平均消费金额减少,那么我们就认为这里有问题需要被挖掘,利用数据分析的方法,去发掘问题背后的原因。

那么如何找到预期和现状之间的差距呢?

有两个办法找到预期和现状之间不符的情况下背后的原因。分别是:将数据分解后观察和将数据比较后观察

1. 将数据分解后观察

一般一个预期结果由多因素决定,可以将现状的数据分解后进行观察什么因素对结果的影响。对数据分析来讲,比较有效的数据分解方式是因素分解方式,即对数据结果进行四则运算分解。

比如:本月平均消费金额=本月消费总额/本月消费人数。

所以本月平均消费金额减少,要么是本月消费总额减少,要么是本月消费人数增加了。接着我们可以去深挖为什么本月平均消费金额减少或者本月消费人数增加,直到找到最根本的原因。

如果数据不能由公式进行分解,那么需要讨论数据结果的所有决定因素,以及每种决定因素影响的大小,然后分析有变化的决定因素。比如产品本月用户满意度降低了,满意度并不能通过因素分解,那么可以分析满意度所有的决定因素,比如涉及满意度的因素可能有售前和售后服务效率、产品质量、品牌影响力等因素,看看是否有因素发生了变化,如果有因素发送了变化,那极有可能是影响满意度的决定因素。

2. 将数据比较后观察

将数据比较后观察指的是发生问题的数据和未发生问题的数据进行比较,从而找到问题的原因。数据比较的方式比较多,比如按时间序列进行比较,比如昨天和今天的比较、上月和本月的比较、上周和本周的比较、去年和今年的比较,以及同一个活动上次和本次的比较等。

也可以空间进行横向比较,比如和竞争对手的数据进行比较,公司内部不同部门之间的数据比较等。

还有一种重要的方式是按照用户的属性数据进行比较,常用的用户属性有用户性别、用户来源、用户操作系统类型、用户手机类型、用户年龄、用户地域、用户偏好等。

数据比较看似原理比较简单,但是解释了为什么我们做的报表和数据分析经常要做比较,因为只有比较才能发现问题。

数据的收集和加工

不管是现状问题还是对未来的预测,数据收集和加工的过程是非常重要的,数据的收集和加工是整个数据分析过程的“原材料”。如果没有丰富的“原材料”,那么“巧妇也难为五米之炊”。

1. 数据收集

一个有数据思维的产品经理,在产品设计阶段就会尽量把数据提前收集,做数据埋点和数据校验,保证数据的精准性和完整性。比如设计一个APP的埋点包括启动次数、页面访问时间、功能点击次数等。

数据校验也很重要,千万不要想着功能先做上去就好了,数据校验可以慢慢做,这样造成的影响就是在数据统计的没有校验的数据统计价值不高。比如下图中的

系统中,在录入车辆品牌的时候,直接是录入操作,而不是品牌选择,这意味着没有做数据校验。

没有做数据校验的字段意味着用户可以随意填写该字段,如下图:

在做数据收集的时候,同样一个车辆型号,有多行记录,在数据收集和分析的时候,就需要去额外的投入去判断哪些数据其实是一个数据。

今日头条作为一款成功的新闻推荐产品,能做到信息推荐的千人千面,这得益于他们数据收集的完整性,完整性体现在头条把用户数据分为人的特征、环境特征、文章特征等。每个特征又分为很多更细化的特征,如文章特征又分为文章时效性、文章热度、相似文章、停留时间、阅读的细节行为等。

头条甚至能通过数据了解用户什么地方快速划过、什么地方仔细阅读过等数据,完整的数据收集为头条众多的算法策略提供了数据原料。

在数据收集时,从数据的获得成本来讲,代价最低的是收集已经保存的数据,所以产品经理在设计产品的时候,就需要考虑数据保存。

代价最高的是从外部去购买数据,比如在互联网金融中,很多平台会从第三方大数据机构中购买反欺诈名单、黑名单、多头借贷等数据,外部购买的数据一般是按每笔收费。

2. 数据加工

数据收集完成之后就是数据加工,大部分数据都零散的存放在数据库中或者文件里面,所以数据加工首先需要将数据整合在一块,如果数据保存在数据库中那么需要用SQL整理,如果数据保存在文件中那么就用Excel或者R语言整理。

数据加工的目标是为了得到数据指标的结果,数据指标是我们日常工作的数据化表现,比如我们上面讲到本月消费总额和本月消费人数。越是数据驱动的产品,数据指标越多,指标越精细,比如上面今日头条的基于人、环境、文章等非常精细的数据指标。

除了常规的数据指标,在数据加工的时候还需要对一些连续数据进行指标离散化,在数据加工阶段,为了在数据分析的时候,方便采取更准确的决策,我们可以把一些连续数值的数据离散化。

阿里巴巴有了用户的历史消费行为、消费能力、支付数据等数据之后,在数据加工阶段,可以把按风险把用户分为不同的层级。如下是网商银行对外输出的客户风险评级:

  • A为1-3层用户,属于最优质人群;

  • B为4-6层用,属于良好用户;

  • C为7-8层,属于风险较高用户,C1为第七层,C2为第八层;

  • Other,为拒绝用户。

定义好离散化的数据指标之后,那具体哪些用户属于什么评级呢,这就是数据分析阶段需要做的事情了。

数据分析

在数据分析中,根据问题的难易程度可以用到“决策支持”和“系统优化”的分析方法。

1. 决策支持

决策支持是通过简单的求和以及易于理解的分析模型,帮助用户做出决策,比如对比本月同比和环比用户平均消费金额,从而决定通过什么决策活动来提高本月的用户平均消费金额。比如建立一个广告投入因素和新增用户的关系模型,就能够预测投入多少广告额,能带来多少新增用户。

简单的关系模型产品经理是能通过Excel表格分析出来的,如柱状图、折线图等。

如果一项因素引发问题的因素很复杂,则需要建立一个由多个因素组成的预测模型。通过这个模型,我们可以观察模型中某个因素对整体结果造成的影响。预测模型需要用到的统计方法有交叉列表统计、统计学假设检验 、多元回归分析等,这个阶段大部分产品经理都需要求助数据分析师的帮助了。

2. 系统优化

系统优化指的是帮助用户构建让计算机执行的方案算法,常用的系统优化方法有机器学习。

相比简单模型的决策模型,系统通过机器学习方法分析出系统中更详细的因素,比如系统优化能分析出广告投入多少金额,能带来新用户的快速增长,以及广告投放中具体什么投放渠道,效果最好。

机器学习的优势在于能从数据中学习出其本身包含的模式和规律,并以此来建立模型。比今日头条,就是通过分析我们过去浏览的记录,利用机器学习建立模型,从而给我们推荐类似的内容。系统优化用到的统计方法有逻辑回归分析、聚类、主成分分析、决策树分析等。

解决对策

对于数据分析中决策支持的得出的结果,我们可以通过决策结果直接决定做或者不做某事,对于数据分析中系统优化得出的结果,我们可以在计算机上执行解决问题的决策算法。

无论什么决策结果,都需要评估执行决策结果的成本以及决策风险。

为了评估成本和风险,在做决策的时候,我们可以通过把预估的数据代入到决策模型中,进行模拟仿真,从而得出可能出现的结果。

与此同时,我们还需要不断的和周围的人传达我们整个数据分析的流程,告诉他们我们的决策是有数据依据的,这样有助于推进决策结果的推进。

如果你喜欢这篇文章,欢迎关注上面的公众号

今天晚上8点半视频号直播,分享面试官是如何面试产品经理的?主要考察哪些点?可点击下方按钮预约。

最后,我建立了各大城市的产品交流群,想进群小伙伴加微信:yw5201a1  我拉你进群。

视频号推荐

关注微信公众号:产品刘 可领取大礼包一份。

··················END··················

今日研报:新浪财经发布《2021年信用卡行业发展报告》下载报告去公众号:硬核刘大  后台回复“ 信用卡”,即可下载完整PDF文件。

申明:报告版权归 新浪财经 独家所有,此处仅限分享学习使用,如有侵权,请联系小编做删除处理。

RECOMMEND

推荐阅读

夸克、QQ浏览器、简单搜索竞品分析报告

手把手教你做产品经理

产品战略规划十步法

面试题,产品经理岗位的哪些特点最吸引你?

点击“阅读原文”

查看更多干货

数据思维,让决策更精准相关推荐

  1. 发散大数据思维 橱柜企业更能掌握准确“情报”

    大数据可以投入商业运用 目前,各大互联网公司,如腾讯.阿里巴巴等,都组建了自己的数据挖掘团队.而银行.保险.电网等拥有大量行业数据的公司,也纷纷在这方面布局.由此看来,大数据似乎即将无孔不入了,但橱柜 ...

  2. 数据治理:数据治理之道-数据文化-数据思维融入企业文化

    参考<一本书讲透数据治理>.<数据治理>等 大数据的根本价值在于从数据的不确定性中发现规律,获得确定性.想要在繁杂的大数据中快速找到价值数据,并依靠数据发现.分析.解决.跟踪问 ...

  3. 如何把数据思维应用到业务经营中

    来源:木木自由   作者:木兮 我们在实际的工作和学习接触中,会发现一个比较统一的问题,那就是:随着数据在企业生产经营中的广泛应用,我们究竟该如何借助数据分析的能力,去提升公司业务的运营效率,为企业降 ...

  4. 从数据到智慧,TOOM舆情监测系统让你的决策更加精准!

    当今社会信息化程度日益提高,网络平台已成为人们获取最新信息的主要途径,无论是个体还是组织.政府还是企业,都需要通过各种手段及时了解社会舆情,把握市场动态,调整经营策略.而舆情监测系统无疑是这些手段中最 ...

  5. 【金猿投融展】观远数据——让业务用起来 让决策更智能

    ‍ 投融资项目·观远数据 本项目由观远数据投递并参与"数据猿年度金猿策划活动--<2022大数据产业最具投资价值企业>榜单/奖项"评选. ‍数据智能产业创新服务媒体 - ...

  6. 计算机视觉怎样实现自我超越?更大规模更精准的数据

    最新发布的<2021中国人工智能应用趋势报告>强调,数据.算力和算法是支撑人工智能发展的"三驾马车",为模型训练提供基本资料的「数据」,是人工智能的根基. 随着互联网. ...

  7. 智慧医疗时代的数据标注如何更精准?

    随着我国经济的不断增长,以及生命科学的迅速发展,国人预期寿命有了显著的提升.2019年,国人预期寿命达到了77.3岁,比1960年提高了33岁.人们的健康需求在人口老龄化等一系列因素的影响下持续增长, ...

  8. 「五度易链」大数据 让招商更精准

    随着数字经济的发展,大数据被广泛应用,众多领域因此而掀起变革的巨浪,招商工作也不例外,传统的活动.人脉.感情.短利等招商模式正走向末途,大数据推动了招商的新趋势. 大数据 让招商更精准! 五度易链区域 ...

  9. 全新升级版动作捕捉系统:捕捉更精准、数据更稳定、功能更完善

    ​动作捕捉系统 VDMocap Studio动捕系统,是一款由广州虚拟动力研发的,配套VIRDYN系列动捕设备专用的高级版动作捕捉软件,具有数据精准稳定.实时可视化.轻松回放和高效处理运动捕捉数据等功 ...

最新文章

  1. linux centos7 yum 报错 Public key for *.rpm is not installed 解决方法
  2. WARN RestSubmissionClient: Unable to connect to server spark://master:
  3. 服务器是多用户服务的计算机,Win10权限管理与多用户远程登录(多方案)
  4. 微服务架构下,大型银行数据库应用实践
  5. 使用ping -a 无法得到 主机名字 hostnames 相关信息的原因
  6. 微信私人心情录小程序源码
  7. LogMeIn Pro 试用简介!
  8. 大事务的处理方式对比
  9. 站长付个人微信支付宝收款系统如何对接?
  10. Java入门第116课——向List中插入和删除元素
  11. 00 C++ UML类图详解
  12. ui动画_ui后效动画指南
  13. 让你分分钟学会qt视频播放器
  14. 2020保研夏令营回顾--清华网研院+清华深研院
  15. Linux系统安装时报错,Linux安装软件时报错解决方法
  16. VB6导出Excel - 引用“Microsoft Excel 16.0 Object Library”时找不到该引用-解决方法
  17. Deno不只是个Javascript运行时
  18. android电视盒配置自启动,电视盒子怎么开机自启动软件?巧用当贝市场,一招轻松搞定...
  19. iPhone4最新降级教程(iOS5.1.1)
  20. 拦截机制中Aspect、ControllerAdvice、Interceptor、Fliter之间的区别详解

热门文章

  1. 山东大学 2020级数据库系统 实验二
  2. java类中自定义函数的调用_关于方法:自定义类中对函数的未解析引用
  3. typescript 接口 java_Typescript基础(4)——接口
  4. 花瓣长度和花瓣宽度散点图鸢尾花_基于python的鸢尾花简单聚类模型分析
  5. python4发布_Python 3.4.1 发布
  6. ModelCoder国产化解决方案已逐步代替国外软件Matlab/Simulink
  7. linux 针对目录空间配额,linux磁盘配额quota
  8. circle loss代码实现_Python全栈之路-23-使用Python实现Logistic回归算法
  9. mysql使用navicat(建表前与建表后)添加时间戳(创建时间、自动更新时间)
  10. 2018-2019-1 20165221 《信息安全系统设计基础》第一周学习总结