互联网产品总监的经验总结:从0-1为你讲明白BI与数据可视化
现在都说,是大数据时代,可是百度了,也不能给我一个通俗易懂的答案:到底什么是大数据,为什么会出现这种情况,怎么处理呢?
起初,数据量很少的时代,通过表格工具、mysql等关系型数据库(二维表数据库,数据逐行插入)就能够解决数据存储的问题。
但是,随着互联网的飞速发展,产品以及用户的激增,产生了海量的数据。
考虑到长足发展,公司会对产品、用户相关的原生数据、埋点数据等进行分析,传统的关系型数据库就无法满足需要,只能通过行式、分布式等数据库来存储这些数据(HBASE、hive等,能够实现集群化,及分配到多台主机上同时计算)。
当数据量大了,光秃秃的数字就难免让人产生困意,所以就出现了由数据向图表的转变,也就是我们说的数据可视化。
认识数据可视化
有了数据之后,对数据分析就是成了最关键的环节,我公司的分析师就曾对我说过一句话:数据分析主要对整体分析,而不执着于特殊的个体数据,这样才能够给产品提供宏观、有效的参考价值。
海量的数据让用户通过逐条查看是不可行的,图像化才是有效的解决途径。少量的数据可以通过表格工具生成图表、透视表的方式进行分析,但是大数据的分析就需要借助专门的可视化工具了,常见的可视化工具包括:Tableau、FineBI等。
大部分商用数据可视化工具的计算、图表展示虽然比较强大,但是却无法做到实时数据快速生成,数据也多为push(固定的范围)的方式,有时候数据还需要二次加工满足可视化产品的规则(商用产品多考虑通用性,无法适用于所有企业的数据规范)。
除此之外,现在很多图表插件的开源化(如:Echart、GoogleChart),以及行业内对数据安全性等的考虑,越来越多的公司也开始进行数据可视化的私有化部署。
数据可视化的类型
1、探索性可视化
探索性可视化需求一般集中在数据分析场景中的数据探索场景。在分析数据的时候需要对数据进行探索,最后才能得出结论。
但是为啥我们需要使用可视化的方式去探索数据呢?使用统计学的方式不就能得出结论了吗?其实并不是,最典型的案例就是安斯库姆四重奏。四组数据的平均数、方差以及相关系数都一样,你可能会觉得这些数据的分布应该也会很像。
但,当你使用数据可视化的方式去看这些数据时,你会发现他们的分布都不一样:
从流程来看,探索性可视化是这样的:
2、解释性可视化
解释性可视化需求一般集中在完成了数据探索,并且形成一定数据洞察后的 story-telling 场景。大家在网上看到的一些「一张图搞懂 XXX 」、「一张图了解 XXX」就属于解释性可视化。所以解释性可视化的流程是这样的:
国内的可视化步骤一般是这样的:
用户导入数据到产品,然后进行一些可视化的探索,或者直接将数据进行可视化的表达。
但是,基于我对目前的用户样本量的理解,我发现这种偏业务型的产品框架,并不太适合国内市场。因为这类产品面向的用户基本上是专业用户(数据分析师),而忽略了一个事实——大部分中国企业并没有设立专门的数据分析岗位。
有能力配备数据分析师的企业一般都是中大型企业以及互联网企业,他们付费能力可能比较强,但是也意味着用户量会较少。用户样本集中在以下两大块:
专业用户对应的是数据分析师,而半专业用户则对应的是类似财务、销售、HR 等,在业务上专业但数据分析上不专业的用户。在企业里面,其实半专业用户远大于专业用户。而这类用户的日常工作又一般集中在解释性可视化上面,比如年终总结、年度规划、每月汇报中都需要利用到数据可视化。所以这类用户的流程是这样的:
用户导入数据,无需太复杂的操作,即可直接生成图表。(为什么少了数据化探索呢?其实是因为在半专业用户中,又以中小型企业的用户为主,他们的业务相对单一,且交易、财务数据都不会太大。当然了还有一些是靠 erp 数据分析的,这里就不展开细谈了。)
然后根据图表,补充自己的洞见,就可以制成报告给到老板。
数据可视化的实现
数据可视化产品(系统)的结构框架主要分为三层:数据存储层、数据计算层、数据展示层。
1. 数据存储层
数据存储层在开头已经和大家说过了,在数据可视化产品(系统)中,既支持常规数据(MySQL、CSV等)可视化,也支持大数据(hive、HBASE等)的可视化,满足日常分析人员定性、定量的分析。
在考虑到数据安全的因素,数据存储还会与权限管理相结合,实现不同角色的人只能访问指定的数据。
2. 数据计算层
这里的计算不是平时所说的聚合、排序、分组等计算,解释之前我们先了解一下数据分析的工作流程吧:
- 产品/运营人员提出数据需求,如“APP一周留存 ”;
- 分析师确认需求后需要明确本次分析需要的字段及分析方式;
- 数仓人员提供整理后的表格(数据模型,多张表join后合成的中间表);
- 分析师基于数据模型进行可视化分析。
数仓提供的数据模型主要分为增量、全量数据,不能直接对某个较长范围的数据进行分析,举个例子1月1日、1月2日两天都产生了数据,增量、全量的数据存储方式效果如下:
3. 数据展示层
可以给很多人看,数据分析师,业务人员,IT人员,还有管理层。
总结
我想未来的 BI 的产品不能将自己定位为「工具」,而是应该定位为「服务」。
这里的「服务」不是说从原来的买断式收费,转变为按年收服务费,这只是商业模式的转变。我理解的转变是要从产品理念上做文章,BI 产品不能只是一个工具,而应该是一个服务平台,连接企业内外部数据之外,并且更重要的是,需要连接企业内外部的业务。比如连接供应链的数据,连接财务数据,连接审批数据等等。
比如,对于一家生产鱼丸的企业,当系统发现制作鱼丸的原材料库存不足,但是又快到销售的旺季,是不是能提前预警,并且快速将此信息发到供应商那,直接订货。再比如,当一家企业的现金流并不是非常健康时,系统能否能推荐企业一些「财务顾问」服务,甚至「现金贷款」服务?
我相信总归是有办法的。
互联网产品总监的经验总结:从0-1为你讲明白BI与数据可视化相关推荐
- 幕课网产品总监:教你从0到1打造600W下载量的爆款APP
本期嘉宾:张国政,慕课网产品总监,前腾讯高级产品经理,目前主要负责慕课网APP产品线的整体战略规划.设计.产品团队组建. 首先介绍一下慕课网,简单来说就是一个IT技能学习或者在线教育平台,我们的定位也 ...
- 终于有人把Web 3.0和元宇宙讲明白了
导读:元宇宙的终极形态势必是去中心化的,而现在的网络生态并不能完全满足元宇宙去中心化的需求.一些人认为,即将到来的Web 3.0时代和元宇宙需要的网络生态高度重合.Web 3.0或许能够成为人类迈向元 ...
- GPT4.0一句话实现各类图表制作,让数据可视化变得更简单!类图、流程图、ER图.....
不知道大家有没有被ER建模工具复杂的操作按钮给困扰过.在作者学习ER建模时,曾希望能直接画出类图,但最终还是不得不学习繁琐的操作流程.然而,随着GPT的出现,AI现在也可以绘制UML图了!今天要向大家 ...
- 互联网产品设计进阶(11)产品设计师的职责
产品经理或者产品设计师到底是一个什么样的角色?为了找到这个答案,先看看几个典型的招聘广告吧. 一.分析几则招聘广告 1.第一则产品经理招聘广告 1.根据公司的业务规划和特点,开发有质量的新业务,并制定 ...
- 产品设计——互联网产品设计
产品设计有三种层次的水平:本能水平的设计,行为水平的设计和反思水平的设计. 本能水平的设计,涉及产品外形的初始效果; 行为水平的设计,用户使用产品的经验,约等于 用户体验; 反思水平的设计,包括产品给 ...
- 1【源码】数据可视化:基于 Echarts +Java SpringBoot 实现的动态实时大屏范例-互联网企业数据分析
目录 效果展示 1.首先看动态效果图 2.再看实时分片数据图 一. 需求确认 1.确定产品上线部署的屏幕LED分辨率 2.功能模块 3.部署方式 二.整体架构设计 三.开发环境搭建 1.Java开发环 ...
- 【产品能力深度解读】连续入围Gartner魔力象限的Quick BI有何魔力?
简介: 国际权威分析机构Gartner发布2021年商业智能和分析平台魔力象限报告,阿里云Quick BI再度入选,并继续成为该领域魔力象限唯一入选的中国企业. Quick BI凭借在增强分析能力上的 ...
- 后台产品的数据可视化图表产品设计
前些天,做后台的数据子系统的时候,需要用到一些可视化的数据图表,我用到了一个自认为效果比较好,而且比较方便的方式来实现. 在网上巴拉巴拉地找了一番,目前用到这种方法来做数据图表的人并不多,我给身边的朋 ...
- PMCAFF微课堂 | 积木盒子产品总监 杨帆:互联网金融撮合交易的本质
分享嘉宾:杨帆,积木盒子产品总监,连续创业者,投身金融.支付.互联网行业超过10年.第一个真正意义的银行p2p托管系统(民生银行托管系统)设计者之一,互联网金融流程和传统信贷流程结合的倡导者,互联网个 ...
最新文章
- IDEA上安装和使用checkstyle,findbugs,visualVM,PMD插件
- 腾讯面试题 TCP/IP协议四个层次
- 一位互联网老兵分享,社会化运营案例解析(宜信内部干货)
- getContentResolver().query()方法selection参数使用详解(转)
- 学生管理系统服务器端设计,学生信息管理系统设计与实现
- 今日奇葩事件,一位不懂技术,却来管理技术团队的领导
- OpenShift 4 - 在集群节点用crictl对Pod/Image/Container进行操作
- python字典数据类型笔记_python笔记--数据类型--字典
- Samba使用大全(转
- php vc14的版本,VC6_VC9_VC11_VC14的介绍PHP各版本如何选择
- 2021最新关于点云配准的全面综述
- 计算机视觉CV目标检测综述
- Python链家租房信息爬虫和高德地图展示
- 现场总线CAN和工业以太网EtherCAT详解
- (译)Xposed Helpers
- 百度 BAE 项目部署
- 批处理中的删除命令:del
- 街舞元年的角逐:“热血街舞团”和“这就是街舞”谁能胜出?
- 10种常用的分析模型 数据分析必看
- java租车_Java 哒哒租车系统(控制台)
热门文章
- alwayson高可用组_了解AlwaysOn可用性组上的备份-第2部分
- dmf nmf_SQL Server 2019 –新的DMF sys.dm_db_page_info
- 浅谈在基本数据包装类中使用'=='与equals的区别
- 线程同步 -事件Event、临界区对象CriticalSection
- as5 samba 图形配置
- CMU Database Systems - Concurrency Control Theory
- 2015年上海现场赛重现 (A几何, K暴力搜索)
- NODE安装N管理出错
- Java实现求二叉树的路径和
- [mysql]三种方法为root账户指定密码