作者是业界资深的数据分析师,人工智能投资人,他在文章里给我们介绍了什么是大数据的来源,目前在数据领域的初创公司与现有巨头的竞争现状,各自在数据领域所采取的不同做法,数据分析工作的外包,为什么有关大数据的项目总是会失败?

在本章节中,我想试着描述、分享一下大数据在公司商业运营情境当中所扮演的角色。

大数据的能力是从何处而来?

首先,我想先花一点时间来谈谈有关数据的价值,数据所发挥的作用,它是从何处而来的。

之前我说过,「企业专家中心「(Centre Of Excellence) 这个部门非常之重要,它作为最前沿的公司职能部门,负责将数据的角色引入到公司,并将其功能放大化。它的主要职能就是对跨部门的工作进行协调,具体包括了下面这几项内容:

1. 对企业的技术架构进行维护和升级,

2. 决定应该收集什么样的数据,从哪个部门来收集这些数据,

3. 推动人才招募计划,

4. 制定「关于从数据中获取真相」的流程环节以及战略,并制定有关隐私、合法合规性、以及行业道德规范标准的政策制度。

但是,除此之外还存在其他的管理架构和形式。也许对你现有的商业模式来说,还存在匹配程度更高的管理架构和形式,数据分析、组织结构模式.

其实,在商业模式和数据分析基础的结合上,存在着好多种组合方式。商业单元(BU)各自独立,各自为战是一种法子,相互独立的 BU 为了某些具体的项目相互协作也是一种法子,企业内部治理(公司治理的金字塔顶端)是一种途径,外部中心(企业专家中心)也是一种途径。

数据初创公司与数据垄断型公司的对决

到底是数据初创公司胜出?还是数据垄断型公司胜出?这个答案不可能清楚地给出,里面有太多需要考虑到的变量,尤其跟公司本身所处的行业,还有所持有的竞争优势有关。最重要的一点是,商业策略的制定,跟公司处于哪个成长阶段有着莫大的关系。

尽管从历史经验上我们可以看出:很多小公司在结构上比大公司要有着明显的优势(就比如说一些初创公司在管理数据上面比大型药品公司要做的出色的多),但是这并不能说:公司越是初期,在数据处理和应用上的成熟度更高。

更准确的说法是:因为小公司本身的灵活性,它们在这方面行动会非常迅速,而且因为本身基数小,所以很容易在增长比例上大幅超越大公司。

在这里,我想要强调的重点是:初创公司和大公司,在面对数据问题,尽管目标一样,但是采取的路径和方式方法是截然不同的。我将这两种方法分别称之为:回溯型方式和前瞻型方式。

前瞻型方式:一般适用于小型初创公司,更准确的说,是那些刚刚进入行业不久,短期内还无法产出大量的数据,但是很快就会实现。正因为这一点,决定了它们从一开始就要制定一个高效实用数据的战略。

回溯型方式:更适合于已经在行业里扎根多年的大公司,它手上握有海量数据,但是它们不知道怎么使用,比如如何将数据向某个中心枢纽集中。

前瞻型方式

采取这种方式的初创公司不拘泥于过去既定的任何组织架构,而且从一开始,为了某种长期的愿景,它就制定出非常严格的数据政策,以避免未来在数据领域出现任何的突发状况。而且,它一开始就投入大量的资源和时间,如果做对了的话,那么它会绕开接下来运营发展中的种种不便。

一开始就制定好一个完善的数据政策,能够很好地满足初创公司在接下来发展中,处于各个不同发展阶段时的需要。更重要的是,年轻的公司所受的约束较少,这种约束不仅体现在内部,比如官僚层级还没有形成;更体现在外部,比如政策法规上面扶持鼓励远远多过约束限制。而且它们往往对风险的接受度较高,使得它们愿意去测试和应用很多前沿科技,它们更愿意关注高质量的数据,而不是追求数据量的积累以便获得研发的基础。

回溯型方式(已有的大公司)

大公司往往会遇到下面的两个问题:

1. 它拥有的数据量确实非常大,但是它们不知道该如何是好。

2. 它们手里有数据,而且头脑中已经存在着明确的目的,但是因为数据质量达不到标准,数据整合方式上面并不完善,以及配套技能上不过关,它们连启动这个项目都做不到。

先说第一种情况。这样的公司往往是刚试着转型到数据驱动领域,它是有数据,但是不知道如何从中提取出有价值的东西出来。鉴于很多大公司的工作岗位要求都很明确,工作任务都被塞的很满,要求也比较高,所以某些时候它是无法做到公司内部进行创新的,也就是说,它们太忙了,根本抽不出时间。有些行业,比如银行业、金融科技行业,这个问题体现的尤其明显。

关于这个问题,我认为一开始就要聘请一名专门在商业想法、战略上做创新的领导人进来。这个人富有经验,能够成为「数据驱动」理念的传道者,哪怕他不具备非常强大的计算机技术背景,他也能够为整个公司带来非常宝贵的建议和想法。

有了这样一个角色的存在之后,再去考虑找一名合格的数据分析师。

让我们再来看第二种情况。他们手上有数据,也有明确的目的,但是不知道如何利用它们。我认为这存在着两种解决方案:

1. 公司从「一张白纸」出发,建立某种全新的数据平台,团队,以及以数据为核心的文化;

2. 公司直接将数据分析工作以及与数据有关的问题外包出去。

第一种方式如果一切进展如预期一样,肯定会带来更加稳健强劲的发展,但是成本也比较高。所以这个时候决策者是需要权衡成本收益谁大谁小的。

第二种方式是数据分析工作的外包。大公司一般倾向于选择某些大学作为数据分析工作的外包方。理由很简单:大学一般来说都比较缺钱,也需要数据来进行一些研究,从而方便最终形成论文报告。一般它们的报价也比专注于做数据分析的初创公司要低很多,更何况大学机构中不缺人才,不缺时间,不缺意愿,有足够多的理想条件来收拾整理一堆乱七八糟的数据。

相比之下,初创公司以盈利为目标,选择它就意味着较高的成本,但是它也是有优势的。往往这样的公司里聚集着世界最顶尖的数据分析人才,而它本身就掌握着很多非常有价值的应用研究案例和数据库,这些东西都是大学机构所比拟不了的。

但无论你是选择大学机构还是初创公司,都存在着一个绕不开的问题:数据的隐私安全性。你需要问下面的这些问题:公司外包出去的数据都是什么?第三方机构是如何保证这些数据的安全性的?它们是怎么存储数据,决策机制又是怎样的?

除了这两种办法之外,其实还有一些「旁门左道」,能够让你近乎于免费的得到数据分析结构。这就是科技圈里日趋流行起来的黑客马拉松和某些行业内聚会。你在这其中可以看到很多人有数据分析的才能,也能通过公开自己的数据,免费地拿到数据分析结果。

为什么大数据项目很容易失败?

原因来自各个方面:

  • 缺少商业目标和规划;

  • 无法正确的找出需要解决的问题,缺少解决方案规模化的路径;

  • 缺少 C 级管理人员或者高管的认可及支持;

  • 过度投入大量时间和金钱,尤其是队伍中人才组成不合理,这一点尤其常见;

  • 不合理的预期;

  • 公司内部的屏障:比如存在很多数据走不出来的 “深坑”,团队内部糟糕的沟通机制,基础设施问题等等;

  • 将这项工作看作是一时的项目,而不是持续性的学习过程;

  • 数据管理、保护、隐私方面做的不到位。

看完本文有收获?请转发分享给更多人


欢迎关注“互联网架构师”,我们分享最有价值的互联网技术干货文章,助力您成为有思想的全栈架构师,我们只聊互联网、只聊架构,不聊其他!打造最有价值的架构师圈子和社区。

本公众号覆盖中国主要首席架构师、高级架构师、CTO、技术总监、技术负责人等人 群。分享最有价值的架构思想和内容。打造中国互联网圈最有价值的架构师圈子。

  • 长按下方的二维码可以快速关注我们

  • 如想加群讨论学习,请点击右下角的“加群学习”菜单入群

如何转型成为一家真正发挥大数据作用的 “数据驱动型公司”?相关推荐

  1. 如何成为一家真正发挥大数据作用的 “数据驱动型公司”?

    在本章节中,我想试着描述.分享一下大数据在公司商业运营情境当中所扮演的角色. 大数据的能力是从何处而来? 首先,我想先花一点时间来谈谈有关数据的价值,数据所发挥的作用,它是从何处而来的. 我认为「企业 ...

  2. 发挥大数据及其产业在推动发展方式转变上的作用

    大数据时代的到来,互联网成为基础设施,数据变成重要资源,这不仅意味着海量.多样.快速的数据处理和技术创新,更为重要的是改变了传统要素的组合方式.这种变化客观上要求必须转变传统的经济增长方式,实现创新驱 ...

  3. 如何才能最大限度发挥大数据的价值?

    大数据,数据科学,以及分析的发展与演变在今年的Strata数据会议上得到全面展示,其中包含了一个重要的信息:人们需要获取大数据的价值.正如在一个数字表演节目中,人们选定的数字是83,认为这会难倒魔术师 ...

  4. 大数据时代,如何才能发挥大数据在智慧城市建设中的重要作用?

    随着移动互联网.物联网.云计算等新一代信息技术的不断成熟与普及,产生了海量的数据资源,人类社会进入大数据时代.大数据不仅增长迅速,而且已经渗透到各行各业,发展成为重要的生产要素和战略资产,蕴含着巨大的 ...

  5. 关于大数据学习,实战型的书籍

    关于大数据学习,实战型的书籍,如果是基础性的学习和了解,在大量的书本中,我推崇这本书,这本书是理论和实践的结合,有代码,有项目,讲得透彻.适合初级入门也适合熟练

  6. 华院数据宣晓华:传统零售商转型电商需攻克大数据三关

    现在电商发展起来的节奏,使得大众更相信马云所言"五年内将没有线下销售"的可信度.面对这样的转变最该紧张的似乎是传统零售商了,日前在中美创新链接--大数据专题研讨会上,华院数据创始人 ...

  7. 厦华电子:转型迎来新征程 打造大数据领军企业

    收购切入大数据产业,转型迎来新征程传统业务跌至冰点,有效转型迫在眉睫;大手笔收购数联铭品,拥抱大数据产业. 大数据产业处于高速成长期,数联铭品优势明显1)大数据产业处于高速成长期,金融大数据前景广阔. ...

  8. 发挥大数据价值 精准用户画像如何练成

    1.关键技术 在给用户打标签的过程中,人工手段显然是难以大规模开展的,因此,在实际中,我们一般采用机器学习算法,辅助少量人工的方式来实现.接下来对这其中用到的技术架构.技术难点等展开描述. 1.1 技 ...

  9. 【区块链108将】微数链林道坤:区块链有助于更好的发挥大数据价值

    未来全球商业生活与智能化生产将建构在浩瀚的数据基础上,大数据将是产业变革与商业文明演化的推进剂.以前数据更多产生于在互联网上的搜索.消费.社交等线上活动,现在随着移动设备.物联网.人工智能.AR和VR ...

  10. 2017全球大数据产业八领域典型公司盘点分析

    来源:黑科技数据 概要:从微观视角细分领域分析大数据行业. 今天带大家从微观视角细分领域分析大数据行业. 大数据分析 大数据可视化 BI商业智能分析 大数据检索 产品大数据分析 大数据预测.咨询 大数 ...

最新文章

  1. Linux中断处理驱动程序编写【转】
  2. 为什么建议使用你 LocalDateTime ,而不是 Date?
  3. java hashtable排序_java中哈希表中有迭代器模式的实现,可以认为其是顺序表吗?...
  4. 9. Leetcode 27. 移除元素 (数组-同向双指针-快慢指针)
  5. spring AOP策略模式使用
  6. python最长回文子串leetcode_Python版LeetCode5. 最长回文子串
  7. onnx 测试_ONNX 现场演示教程
  8. mysql数据库熟悉表空间数据文件_Oracle表空间和数据文件
  9. Java 面试题全梳理
  10. Matlab常用函数:rand,randi和randn区别
  11. html中不支持什么元素,html5新元素和html不支持的元素
  12. 练习:将从表读出来的时间戳除以1000(java读时间戳会多出3个000)用jackson包 实现...
  13. 微信公号DIY:一小时搭建微信聊天机器人
  14. USB驱动之常规usb鼠标驱动
  15. mysql bak文件怎么打开_如何打开数据库备份文件(.bak)
  16. Wifi网络共享----Connectify 使用
  17. Ice飞冰页面配置菜单配置日志打印环境配置《六》
  18. REST ful风格
  19. html实现鼠标悬停效果实现
  20. latex怎么看论文字数_LaTeX | 为学术论文排版而生【公式篇】

热门文章

  1. get_posts 函数 | wordpress
  2. java 多线程(生产者消费者)
  3. CSV用excel打开乱码
  4. 如何排查即时通讯互动开发平台AnyChat的故障信息
  5. 单/多文档的窗体类属性修改(VC_MFC)
  6. FLEX与JAVA不通讯错误与解决方法(转)
  7. 企业管理的实质和核心是人的管理
  8. Lightroom Classic 教程,如何在 Lightroom 中创建黑色电影效果?
  9. 移动磁盘故障,如何在Mac修复?
  10. 苹果Mac定制化App开发神器:​​​​FileMaker