大数据分析平台实时采集、治理、存储、查询、展示数据,并搭载数据智能引擎,高效积累数据资产,赋能业务应用场景,助力企业构建扎实的数据根基,实现数字化经营。

  数据其实是非常的客观的,但是数据本身并不会告诉你多少有价值的东西,其中蕴涵的内容才是我们应该去发掘的。

  我们通过数据分析将现实中的问题简化成数字问题,从而得到解决问题的建议。

  需要注意的是,数据分析只是工具,不是目的。我们进行数据分析是为了让分析结果能反映现阶段的情况,并对下一步计划产生指导意义,所以千万不要为了分析而分析。

  一、明确目标

  一切分析的基础都是需要明确目标,在此之前,不要开始任何分析,因为那很可能是无用功。

  一般来说,目的主要有以下三种。

  1.分析现状,反映目前的状况,并且帮助我们制定下一步计划。

  2.分析问题,针对出现的问题,分析其中的原因并找到解决办法。

  3.分析变化,当产品的情况出现变化时反映变化的情况,并找出原因,有针对性的进行下一步行动。

  二、明确分析范围

  因为数据的量和维度都非常的多,我们在明确目标后,就必须选定我们分析的范围,明确的分析范围能避免分析报告内容太多,而且不深入。

  需要注意的是,确定范围后我们就需要进行数据采集了,但是具体要采集什么样的数据,不是我们平常的“自然语言”描述就可以实现的,需要抽象成“数学语言”表达出来。

  三、数据采集

  确定了范围后,我们就可以采集数据了,需要采集哪些数据也是有讲究的,它也是需要我们用“数学语言”来表达的。一般来说,需要采集的数据分为以下3类,这是最基础的:名称、数量和转化率。

  1.名称:某些数据的结果不是以数字形式展现的,比如某某功能

  2.数量:这个比较简单,比如:某某功能的点击次数

  3.转化率:有些数据单独的看,是不能说明问题的,例如:光看一个功能的点击次数,我们不能得出这个功能是否吸引人,是否需要改进,我们还需要看完成这个功能的人数。然后将两个数据相除后得到这个功能的转化率。

  以上都是一个分析中最基础的指标,在实际数据分析中,还会有更多更细致的维度。比如:用户点击这个功能后,停留时间,退出的数量,在中途放弃的数量等等。

  四、数据清洗

  采集数据后,这些数据并不是直接就可以用的。因为可能会有一部分“脏数据”会污染我们的数据,进而影响我们的分析结果。这就需要进行数据清洗,将不符合要的“脏数据”清洗掉。

  比如,某个用户一直在点击某个功能,每秒固定点击1次,然后退出,那么这个“用户”很可能是个机器,而不是人。这些数据是不能用的。

  一般“脏数据”有以下几个类型。

  1.频率异常:正常用户的使用一个功能的频率一般会保持在一定范围内,不会太频繁。

  2.总数异常:比如某一个用户一个人就拉高了整个数据的水平,让某个功能点击率陡然上升。

  3.行为异常:这个就比较复杂了,对应不同的业务有不同的理解。比如:比如一个购物APP,一个用户的多次的下单,然后退货,这类数据就是应该排除的。

  五、数据整理

  收集完成后,我们需要对收集到的原始数据进行整理。因为收集出来的数据必然是比较乱的,不能直接拿来分析。整理分析分为汇总和拆分两种。

  (1)汇总

  有些数据比较杂乱无章,我们要按照某个维度汇总才能进行效果的观察。比如:我们需要观察某个功能上线后用户行为的变化,就可以按照上线前和上线后的用户行为数据进行分类汇总,然后通过两份数据的对比来得到结论。

  (2)拆分

  有些原始数据并不足够细致,需要我们依据数据的关系进行数据拆分。例如,一个功能的入口可能有多个,我们就需要确认每个入口的量,甚至完成整个功能的量,这些数据会让我们更加了解我们的用户行为。

  六、数据对比

  整理完数据后,我们要进行数据对比。这也是数据分析中非常重要的步骤,因为数据分析的结果绝大多数都来自于对数据的对比。比如:一个功能改进前和改进后的转化率,肯定要经过对比才能知道我们的改进是不是有效的,有效多少。通常对比方法有以下几种。

  1.时间对比。通过时间节点前后进行对比数据。例如:某个营销活动,促进注册、活跃等,我们就可以得出这个营销活动能够带动日活的结论。

  2.空间对比。在我们生活的世界中,因为人们所存在的空间不同,会有不同的行为。比如:通过数据分析,我们会发现,东北的羽绒服效率比海南高,于是我们就可以判断羽绒服在东北更加畅销。

  3.人群属性对比。在用户画像中也提高过。不同的年龄层对于不同事物的看法不同,会导致某个功能在不同人群中的差异性。

  依据分析目的灵活地选定对比范围,能让我们从数据中挖掘到我们想要的东西

  七、原因探寻

  数据,通过对比呈现出来,能够反映一定的现象,但是造成这些现象的原因还需要我们来寻找。

  原因的分析方法有很多,可以正推导、反推导。我们可以结果,那假设原因,再去求证。或者通过某个功能的整个流程进行梳理和复盘,结合数据来分析每一步发生这种情况的原因。

  或者通过数据来复盘某一个活动,来分析活动输出的这种数据或好的或坏的原因是什么。

  八、展现结果

  完成上面的7步,我们的数据分析报告也就差不多了,当然我们必须形成一个比较完整的文档来反馈给相关人员。

  我们可以把报告分成以下3部分。

  1.数据分析背景:向大家交代分析的背景与原因。

  2.主要结论:给出主要结论,方便不需要了解细节的人阅读,或领导。

  3.具体分析过程:向大家说明分析的步骤并展示具体数据。

  无论数据分析的结论积极还是负面,都是产品价值映射,必须投以客观的态度。数据分析是验证产品设想的最具说服力的工具,但忽略数据分析背后的人性和商业思考,那么数据分析也就在根本上失去了意义。

如何针对数据进行分析相关推荐

  1. EMR StarRocks 极速数据湖分析原理解析

    简介:数据湖概念日益火热,本文由阿里云开源大数据 OLAP 团队和 StarRocks 数据湖分析团队共同为大家介绍" StarRocks 极速数据湖分析 "背后的原理. [首月9 ...

  2. 阿里云强力贡献:如何让 StarRocks 做到极速数据湖分析

    作者 阿里云 EMR 开源大数据 OLAP 团队 StarRocks 社区分析湖团队 StarRocks 是一个强大的数据分析系统,主要宗旨是为用户提供极速.统一并且易用的数据分析能力,以帮助用户通过 ...

  3. 技术内幕 | 阿里云EMR StarRocks 极速数据湖分析

    作者:阿里云智能技术专家 周康,StarRocks Active Contributor 郑志铨(本文为作者在 StarRocks Summit Asia 2022 上的分享) 为了能够满足更多用户对 ...

  4. 第二篇:智能电网(Smart Grid)中的数据工程与大数据案例分析

    前言 上篇文章中讲到,在智能电网的控制与管理侧中,数据的分析和挖掘.可视化等工作属于核心环节.除此之外,二次侧中需要对数据进行采集,数据共享平台的搭建显然也涉及到数据的管理.那么在智能电网领域中,数据 ...

  5. 机器学习的第一个难点,是数据探索性分析

    作者 | 陆春晖 责编 | 寇雪芹 头图 | 下载于视觉中国 当我们在进行机器学习领域的学习和研究时,遇到的第一个难点就是数据探索性分析(Exploratory Data Analysis).虽然从各 ...

  6. 数据与分析领域的十大技术趋势

    来源:人工智能与大数据 近日,Gartner发布了数据与分析领域的十大技术趋势,为数据和分析领导者的新冠疫情(COVID-19)响应和恢复工作提供指导,并为疫情后的重启做好准备. 数据和分析领导者如果 ...

  7. pcap文件解析工具_【免费毕设】PHP网络数据包分析工具的设计与开发(源代码+论文)...

    点击上方"蓝字"关注我们目录 系统设计 网络数据包分析系统的设计 整个网络数据报分析工具采用模块化的设计思想,原因是许多程序太长或太复杂,很难写在单一单元中.如果把代码分为较小的功 ...

  8. 这些大酒店用大数据和分析技术对我们做了什么?

    酒店和酒店服务业每天在接待数以百万计的旅客,每一个旅客在办理入住手续时自然都抱有不同的期望.满足这些期望是让客人成为回头客的关键,如今酒店和休闲设施运营商日益借助先进的分析解决方案,了解如何做到让客人 ...

  9. 数据湖分析如何面向对象存储OSS进行优化?

    简介:最佳实践,以DLA为例子.DLA致力于帮助客户构建低成本.简单易用.弹性的数据平台,比传统Hadoop至少节约50%的成本.其中DLA Meta支持云上15+种数据数据源(OSS.HDFS.DB ...

最新文章

  1. canvas上的像素操作(图像复制,细调)
  2. python list除以_扫描器篇(三)之python编写基于字典的网站目录探测脚本
  3. ES业界优秀实践案例汇总
  4. Time(sdutoj2272)_JAVA
  5. TensorFlowIO操作(一)----线程和队列
  6. 微软发布 Microsoft SoftGrid 4.1 SP1 及 4.2 累计更新补丁
  7. PowerDesigner概念模型详解
  8. Error: Another program is already listening on a port that one of our HTTP servers is configured to
  9. PDH光端机的原理_PDH光端机的作用优点
  10. Kotlin的Lambda表达式以及它们怎样简化Android开发(KAD 07)
  11. QSharedMemory共享内存实现进程间通讯(IPC)及禁止程序多开
  12. C++---vector剖析与模拟实现
  13. 2020年11月连云港计算机考试,2019年江苏省连云港市下半年全国计算机等级考试考务通知...
  14. java创建一个单链表,接受输入的数据,并输出
  15. Windows添加系统桌面常用图标
  16. 8.找出链表环的入口结点
  17. hdu 2502月之数
  18. 《赐我》-一只白羊 同步歌词
  19. BlinkOn9 - Layered APIs
  20. Hall定理及其充要性证明

热门文章

  1. cobbler之详细配置
  2. Android 内存监测工具 DDMS -- Heap
  3. Camel In Action 读书笔记 (8)
  4. Trie树---前缀最相似匹配
  5. 3D数学基础:图形与游戏开发
  6. 第四篇 NumPy基础:数组和⽮量计算
  7. BZOJ 2560(子集DP+容斥原理)
  8. 创建ASP.NET Core MVC应用程序(3)-基于Entity Framework Core(Code First)创建MySQL数据库表
  9. DOM元素的大小和位置
  10. 记一次艰辛的vsftpd搭建,排错过程