大数据和分析法的质量,不如分析的目的来得重要。最有趣的紧张态势和争论,始终围绕着组织是否会因使用分析法而获得最大报酬,以使既有的流程行为(process behavior)更完善。

  数据其实是非常的客观的,但是数据本身并不会告诉你多少有价值的东西,其中蕴涵的内容才是我们应该去发掘的。

  我们通过数据分析将现实中的问题简化成数字问题,从而得到解决问题的建议。

  需要注意的是,数据分析只是工具,不是目的。我们进行数据分析是为了让分析结果能反映现阶段的情况,并对下一步计划产生指导意义,所以千万不要为了分析而分析。

  一、明确目标

  一切分析的基础都是需要明确目标,在此之前,不要开始任何分析,因为那很可能是无用功。

  一般来说,目的主要有以下三种。

  1.分析现状,反映目前的状况,并且帮助我们制定下一步计划。

  2.分析问题,针对出现的问题,分析其中的原因并找到解决办法。

  3.分析变化,当产品的情况出现变化时反映变化的情况,并找出原因,有针对性的进行下一步行动。

  二、明确分析范围

  因为数据的量和维度都非常的多,我们在明确目标后,就必须选定我们分析的范围,明确的分析范围能避免分析报告内容太多,而且不深入。

  需要注意的是,确定范围后我们就需要进行数据采集了,但是具体要采集什么样的数据,不是我们平常的“自然语言”描述就可以实现的,需要抽象成“数学语言”表达出来。

  三、数据采集

  确定了范围后,我们就可以采集数据了,需要采集哪些数据也是有讲究的,它也是需要我们用“数学语言”来表达的。一般来说,需要采集的数据分为以下3类,这是最基础的:名称、数量和转化率。

  1.名称:某些数据的结果不是以数字形式展现的,比如某某功能

  2.数量:这个比较简单,比如:某某功能的点击次数

  3.转化率:有些数据单独的看,是不能说明问题的,例如:光看一个功能的点击次数,我们不能得出这个功能是否吸引人,是否需要改进,我们还需要看完成这个功能的人数。然后将两个数据相除后得到这个功能的转化率。

  以上都是一个分析中最基础的指标,在实际数据分析中,还会有更多更细致的维度。比如:用户点击这个功能后,停留时间,退出的数量,在中途放弃的数量等等。

  四、数据清洗

  采集数据后,这些数据并不是直接就可以用的。因为可能会有一部分“脏数据”会污染我们的数据,进而影响我们的分析结果。这就需要进行数据清洗,将不符合要的“脏数据”清洗掉。

  比如,某个用户一直在点击某个功能,每秒固定点击1次,然后退出,那么这个“用户”很可能是个机器,而不是人。这些数据是不能用的。

  一般“脏数据”有以下几个类型。

  1.频率异常:正常用户的使用一个功能的频率一般会保持在一定范围内,不会太频繁。

  2.总数异常:比如某一个用户一个人就拉高了整个数据的水平,让某个功能点击率陡然上升。

  3.行为异常:这个就比较复杂了,对应不同的业务有不同的理解。比如:比如一个购物APP,一个用户的多次的下单,然后退货,这类数据就是应该排除的。

  五、数据整理

  收集完成后,我们需要对收集到的原始数据进行整理。因为收集出来的数据必然是比较乱的,不能直接拿来分析。整理分析分为汇总和拆分两种。

  (1)汇总

  有些数据比较杂乱无章,我们要按照某个维度汇总才能进行效果的观察。比如:我们需要观察某个功能上线后用户行为的变化,就可以按照上线前和上线后的用户行为数据进行分类汇总,然后通过两份数据的对比来得到结论。

  (2)拆分

  有些原始数据并不足够细致,需要我们依据数据的关系进行数据拆分。例如,一个功能的入口可能有多个,我们就需要确认每个入口的量,甚至完成整个功能的量,这些数据会让我们更加了解我们的用户行为。

  六、数据对比

  整理完数据后,我们要进行数据对比。这也是数据分析中非常重要的步骤,因为数据分析的结果绝大多数都来自于对数据的对比。比如:一个功能改进前和改进后的转化率,肯定要经过对比才能知道我们的改进是不是有效的,有效多少。通常对比方法有以下几种。

  1.时间对比。通过时间节点前后进行对比数据。例如:某个营销活动,促进注册、活跃等,我们就可以得出这个营销活动能够带动日活的结论。

  2.空间对比。在我们生活的世界中,因为人们所存在的空间不同,会有不同的行为。比如:通过数据分析,我们会发现,东北的羽绒服效率比海南高,于是我们就可以判断羽绒服在东北更加畅销。

  3.人群属性对比。在用户画像中也提高过。不同的年龄层对于不同事物的看法不同,会导致某个功能在不同人群中的差异性。

  依据分析目的灵活地选定对比范围,能让我们从数据中挖掘到我们想要的东西

  七、原因探寻

  数据,通过对比呈现出来,能够反映一定的现象,但是造成这些现象的原因还需要我们来寻找。

  原因的分析方法有很多,可以正推导、反推导。我们可以结果,那假设原因,再去求证。或者通过某个功能的整个流程进行梳理和复盘,结合数据来分析每一步发生这种情况的原因。

  或者通过数据来复盘某一个活动,来分析活动输出的这种数据或好的或坏的原因是什么。

  八、展现结果

  完成上面的7步,我们的数据分析报告也就差不多了,当然我们必须形成一个比较完整的文档来反馈给相关人员。

  我们可以把报告分成以下3部分。

  1.数据分析背景:向大家交代分析的背景与原因。

  2.主要结论:给出主要结论,方便不需要了解细节的人阅读,或领导。

  3.具体分析过程:向大家说明分析的步骤并展示具体数据。

  大数据技术其实是我们的畅想而已,而且人工智能也离不开大数据分析的支撑,但是大数据怎么去分析呢,如何才能做好大数据分析?一般需要对数据进行获取、打通、整合、找到规律,以及立即决策。

大数据如何更好进行分析相关推荐

  1. 大数据陷阱:谁有权享有大数据,谁有权分析大数据

    既要保持数据的自由流动性,又要维护每个主体在数据上的权益,这是个空前的法律难题.而创制和维护这样的数据利用秩序却是大数据应用的前提,是大数据战略得以实施的根本保证 中国信息通信研究院在第十六届中国互联 ...

  2. 大数据时代的全能日志分析专家--Splunk安装与实践

    大数据时代的全能日志分析专家 --Splunk安装与实践 0.背  景 随着大家对网络安全意识的提高,企业网管理人员,必须对IT基础设置进行监控及安全事件的管理,管理数据的数量和种类非常巨大,那么就需 ...

  3. 大数据岗位更看重学历还是工作经验?

    回答这个问题之前还是让我们看一段真实对话: Q:请问从事大数据这行,硕士学历有必要么? A:如果有条件,最好可以上到硕士,但不是说必须如此,大数据相关职位对行业知识和项目经验也比较看重,如果家庭经济情 ...

  4. 大数据背景下网络信息安全分析探讨

    大数据背景下网络信息安全分析探讨 刘松溢 (华北理工大学 河北省唐山市曹妃甸区华北理工大学063210) 摘要:在经济快速发展的今天,大数据技术已被广泛地运用于社会生活中,这些技术的应用给人类的生产和 ...

  5. 大数据·实战个例“宏”分析

    大数据·实战个例"宏"分析 MBA教育体系最成功之处,就在于导入了科学的个案分析. Ps,二战最伟大的技术成功,不是原子弹.导弹.喷气机,而是流水线.流水线提供的生产力,比二战所有 ...

  6. 大数据营销更需要消费者洞察

    2013年10月17日,独立商业趋势观察家,知名中国消费趋势研究专家,数字营销专家肖明超先生,应凤凰网的邀请参加了凤凰网在广州举办的"营销人的幸福梦"主题沙龙活动,并与凤凰网副总裁 ...

  7. Hadoop大数据平台开发与案例分析

    关于举办"Hadoop大数据平台开发与案例分析 "高级工程师 一.课程介绍 1. 需求理解 Hadoop 设计之初的目标就定位于高可靠性.高可拓展性.高容错性和高效性,正是这些设计 ...

  8. Qlik潘应麒:大数据时代下的现代分析学

    文章讲的是Qlik潘应麒:大数据时代下的现代分析学,大数据时代的来临同时意味着我们将进入人工智能化的时代.我们所面对的数据容量,数据种类,数据变化的数据同之前都大不相同.但是,在面对这样庞大的数据量多 ...

  9. 2019你必须了解的大数据就业指导:前景分析和学习方法!

    大数据广泛应用于电网运行.经营管理及优质服务等各大领域,并正在改变着各行各业,也引领了大数据人才的变革.大数据就业前景怎么样? 01 大数据人才需求及现状分析 随着国家重视大数据,政府扶持大数据,大数 ...

最新文章

  1. 工信部:中国4G基站规模超200万个 4G用户数破5亿
  2. 算法学习:后缀数组(SA)
  3. android点击隐藏控件,Android编程实现点击EditText之外的控件隐藏软键盘功能
  4. MyBatis-学习笔记10【10.JNDI扩展知识】
  5. 【统计学习方法】感知机笔记
  6. idea2021部署maven+javaweb项目到jboss(diy)
  7. 测试用例又双叒叕失败了,NLP帮你
  8. java 解析docx_java解析xlsx和docx 文件 | 学步园
  9. Android进阶——Android无障碍服务之AccessibilityService实现微信抢红包插件
  10. 《一本书读懂中国税》- 笔记
  11. php包含大马执行,对于某个PHP大马的分析
  12. 数据库中了勒索病毒,怎么办?
  13. mis是商科还是计算机专业,MIS是什么?管理信息系统MIS和计算机科学CS有什么区别?...
  14. csgo如何练习枪法?
  15. 去除取消WPS的广告推送、WPS热点以及推荐软件等骚扰功能
  16. 阿里云通过链接下载附件
  17. 如何设计可靠性UDP传输协议?
  18. 水果店刚起步要怎么做,一家水果店要准备什么
  19. 赋能开发者,开放原子全球开源峰会期待你的声音!
  20. 2023CUPT第十四题 射流的折射 思路与解法

热门文章

  1. 仅此一文让你明白ASP.NET MVC原理
  2. MongoDB聚合(二)
  3. 敏捷开发基础篇(一)-流程与角色基本概念
  4. 数据库返回刚插入记录的ID
  5. vbox黑苹果10.6.5升级无法进入系统(解决)
  6. 高斯过程回归(Gaussian Process Regression) 粗理解
  7. ubuntu 中 notepad 安装
  8. Linux mysqladmin 命令
  9. js正则表达式——数字校验
  10. python-3高级特征