摘要:数据可视化有很高的弹性,很多产品公司了解到客户的需求以后,首先评估,然后设计开发流程。然而有时客户对自己的需求并不明确,因此如何用非常短的时间去表达客户的业务理念和把客户提供的信息用格式化方式展现出来,以及去探明客户的需求,是非常重要的。讲师以自身经历讲解了一系列运用大数据所遇到的问题以及解决方案。

本次直播视频精彩回顾,戳这里!
以下内容根据演讲嘉宾视频分享以及PPT整理而成。

新的一次认知革命

大数据加上今年非常火热的AI带来了新的一次认知革命,在历史地位上可能和人类发明文字一样重要,改变了人们的认知方式。传统的认知方式,一个组织会有很多的部门,包括业务、销售,运营等部门,并且所有的部门可能会有多套不同的系统。在传统的认知领域当中,所有的数据聚在一起,由于使用不同的系统、数据和业务,里面会有大量的领域知识,这些领域知识要耗费人类的大量智慧去处理。随着技术的发展,如今发生了以下三大变化:

1.分布式架构、网络、云计算的发展,意味着技术能力无限;

2.深度学习的发展,意味着模型的解知能力无限;

3.移动互联网和完善的基础设施的发展,意味着可用来分析的数据也是无限的。

这一切都推动着大数据和人工智能的发展,因此,理想状态下,所有的数据会经由一套系统,然后会以统一的口径和统一的模型交给决策者。这个过程是没有人参与的,因此大大缩短了学习和决策周期。

当我们做一个决策的时候,做决策的循环在现阶段是非常普遍存在的,做出决策的快慢与好坏从一定程度上是影响到你的竞争对手,理想状态下,循环通常会有以下几个步骤:

1.观察:多数据来源、快递的处理链路、更为可信;

2.理解:模式识别、相关性分析、交叉分析;

3.决策:决策支持、模拟(what if);

4.行动:直观的计划和明确的指令。

大数据应用和解决方案

现实是骨感的,真正在做数据应用的时候你会发现有很多坑,例如:

1.数到用时方恨少:数据有很多,业务系统的东西也很多,然而要用的时候,能用的好像并不多。

2.要什么?不知道;什么时候要?现在要!客户或者领导的需求其实并不明确,他就是希望你能现在就给他一些建议,像魔术师一样变出一些他想要的东西。

3.现实世界VS报表世界:虽然很多业务都在信息系统上了,但并不是所有的现实世界发生的事情都被采集到信息系统内。

4.关键数据缺失;数据虽多但不存在完整的资料和文档。

5.链路跑通只是噩梦的开始;当链路终于跑通时,又会遇到以下三个问题:数据准确吗?模型可信吗?能做的比业务专家更好吗?

6.像十九世纪的伦敦烟卤工;为什么说是十九世纪的伦敦烟卤?很多传统的业务会有很多独立的系统,每一个业务部门和业务需求都是独立招标的。

以上是我们在实际运用中会碰到的坑,甚至是无法避免的,我有以下几点建议:

1.尊重现实,尊重业务,至少在项目初期,保持学习者的心态。

2.快速跑通,尽可能把你跑通的数据用可视化的形式展现出来,告诉组织内部的决策者,这样做是为BOSS建立可信的信息来源。

3.避免使用传统架构:云服务已经提供了太多很好的选择,例如数据集成、DATA IDE、流式计算、日志服务、弹性搜索和数据开发管理等。因为数据化下的工程大部分都是CEO工程,信息系统的整合往往意味着流程的再造,所以你要争取非常好的内部的合作心态。更多的为业务部门提供一个展示成绩的渠道,帮助业务部门解决实际问题或给他们以推动问题解决的帮助。

4.搭建一个合理的数据链路和逻辑:将大部分数据源在数据接口层原样复制,经过一定清洗之后得到基础数据层和描述事实的数据层,再根据客户的多维需求形成想要的维度,从而形成应用层。只有链路+逻辑都是正确,数据才会正确,因此链路方面我们可以通过自动的校验机制基于规则和统计来保证链路是正确的,逻辑数据则要花很多时间去理解业务,形成一个知识,这个知识就在处理逻辑的可溯源的《血缘文档》或《血缘管理》里面,这在多个数据源和复杂数据是必须要做的。

5.数据可视化:首先要尽可能快的给出第一版内容,然后给客户指引,了解到他要什么,中间再经过不停的修改,最后将可视化项目整合到数据集成。最好的可视化,是不用解释而客户就能很自然地可以看懂态势。有两种常见的可视化解决方案,最简单的方案是直接在系统和数据已经结构化了之后形成数据可视化,较为复杂的方案则需要数据链路+权限控制,再形成数据可视化。

商业智能分析

最后谈一下关于大数据在商业智能上面的话题,当给客户做应用或者是提供服务和解决方案的时候,很重要的一点是要知道客户的效率和生产率,对于销售人员而言,如果在网上通过销售渠道去做,那么需要提高的效率是点击率了。而对于线下的销售而言,用同样的方案就没用了。关于商业智能算法的应用主要有两方面,在竞争性业务场景主要是营销互联网方面,会加速OODA的循环——甩开对手或者不被对手甩开,更快的投放广告采取精准的营销方式。而另一方面,对于效率性的业务场景,主要是生产类的。因为在做工业优化或者说产线优化的时候,停产线去实验新的技术,成本是非常高的,所以更多的是从历史数据中寻找优化方式,看能不能从过去的生产供应参数和环境的波动去寻找出一些特定的模式出来,把这些作为接下来的实验指导,去降低探索新的工艺的门槛。

大数据踩坑之旅: 从数据可视化到商业智能相关推荐

  1. 大数据的淘金之旅,数据治理之数据资产管理

    写在前面: 这是一个系列文章,沉淀了我在数据治理领域的一些实践和思考.共分为5篇.分别是: 一.大数据治理:那些年,我们一起踩过的坑 主要讲讲数据治理工作中常见的一些误区. 二.要打仗,你手里先得有张 ...

  2. 使用Java读取 “Python写入redis” 的数据踩坑记录

    https://my.oschina.net/u/2338224/blog/3061507 使用Java读取 "Python写入redis" 的数据踩坑记录 https://seg ...

  3. 重装win10系统+Ubuntu16.04的踩坑之旅(联想拯救者r720)

    重装win10系统+Ubuntu16.04的踩坑之旅(联想拯救者r720) 碎碎念:原本双系统用得很开心的,在手贱删了Ubuntu系统的某些隐藏文件之后导致Ubuntu系统不能正常使用,在某种程度强迫 ...

  4. python 同花顺thstrader_Python 踩坑之旅进程篇其三pgid是个什么鬼 (子进程\子孙进程无法kill 退出的解法)...

    代码示例支持 平台: Centos 6.3 Python: 2.7.14 1.1 踩坑案例 pid, ppid是大家比较常见的术语, 代表进程号,父进程号. 但pgid是个什么鬼? 了解pgid之前, ...

  5. Vue踩坑之旅(一)—— 数组、对象的监听

    作为一个接触 vue 才一个多月的小白,马上就接手基于 vue 的大型商城项目,其间真是跌跌撞撞踩了好多坑(o(╥﹏╥)o).在此写下自己的踩坑之旅,希望给跟我一样还在自学 vue 的同学一些帮助,另 ...

  6. 微信开发踩坑之旅 之 开发准备及服务器配置

    在工作和兴趣的机缘巧合之下,我开始接触微信开发.在这里简单记述自己的微信开发踩坑之旅. 首先,由于本人标准的理工科生,记述的语言有所不足,我尽量说明准确和详细点. 本文记述主线 ·申请公众号 ·公众号 ...

  7. VR制作中必须踩的坑365之037(oculus2、UE4、UE5、VR记录一年的踩坑之旅)Maya / ZBrush / Substance Painter倒来倒去

    VR制作中必须踩的坑365之037(oculus2.UE4.UE5.VR记录一年的踩坑之旅)Full 3D GAME ASSET workflow ( Maya / ZBrush / Substanc ...

  8. VR制作中必须踩的坑365之044(oculus2、UE4、UE5、VR记录一年的踩坑之旅)拳击VR小游戏红绿灯

    VR制作中必须踩的坑365之043(oculus2.UE4.UE5.VR记录一年的踩坑之旅)拳击VR制作起来,拳击动画人物 How to create box minigame in VR (UE4 ...

  9. VR制作中必须踩的坑365之045(oculus2、UE4、UE5、VR记录一年的踩坑之旅)iclone8来来来告诉你剁手坑

    VR制作中必须踩的坑365之045(oculus2.UE4.UE5.VR记录一年的踩坑之旅) iClone 8 Work in Progress - Part One: Dramatically Si ...

  10. Android google翻译踩坑之旅

    # Android google翻译踩坑之旅   最近由于工作需求,需要为游戏Android平台接入Google翻译的SDK,由于关于翻译的文章非常少,访问官方文档又需要翻墙,更可气的是找到的博客写了 ...

最新文章

  1. 使用Python,OpenCV实现简单的场景边界/拍摄转换检测器
  2. Linux下程序时间消耗监控与统计
  3. linux 内存交换参数,Ubuntu Linux:处理交换内存和内存使用情况
  4. defer和async属性详解
  5. MFC界面编程新思路--模仿MATLAB式的界面
  6. 人工智能领域开展标准化研究
  7. 使用@Async进行异步调用详解
  8. 算法工程师面试备战笔记5_下面哪个不属于数据的属性类别
  9. 求职历程之-----我的求职信
  10. 问世 20 多年的 PHP 还是最好的编程语言吗?
  11. linux timerfd_settime函数,Linux的timerfd分析
  12. 【华为OJ】按单词将句子逆序
  13. codeblock调试
  14. 『单片机原理』程序存储器的结构
  15. 2022高级Java笔试总结,阿里P8重点推荐的火爆全网MySQL路线笔记
  16. C++11多线程:thread头文件
  17. 欣瑞达一分钟教程,如何接RS232/RS485线
  18. win7系统鼠标指针乱动怎么办?
  19. qq空间、微信好友、邮件、短信分享
  20. 电力行业信息系统的尖,峰,平,谷的英文翻译

热门文章

  1. HashMap的实现
  2. 为什么都不想去二次开发_为什么现在的一些大学生都不想处理各种人际关系了?...
  3. php 获取url中的参数
  4. 找不org.apache.commons.lang3.builder.EqualsBuilder和commons-lang下载链接
  5. 泰山OFFICE适配龙芯新架构(loongarch64)UOS初步完成
  6. LINUX(CENTOS)下载编译nload
  7. LINUX下载编译zrtp
  8. LINUX下载编译FriBidi
  9. TensorRT:AttributeError: 'module' object has no attribute 'Logger'
  10. 深度学习框架间互操作的工具:MMdnn