看中国科技企业发展,先看BAT。

三家公司各自占据自己的领域,成为了无数小公司叹为仰止的高山,在大数据的领域里,又尤以BAT最为耀眼。

在前不久的一次公开会议上,李彦宏、马云、马化腾又对数据的应用产生了公开分歧,三者分别认为数据的价值在于算法、数据量、场景化,这其实是暗合了三家公司的经营方向与理念。百度掌技术,阿里重规模,腾讯把持着社交与游戏,是妥妥的三种企业文化,三个经营方向。

今天就来讲讲三者的交叉与区别。

百度大数据——到底是半壁江山还是黄埔军校?


百度公司是一家妥妥的工程师文化公司,素来就有“数据为重,不为上”的传统。


百度大数据产品

作为BAT三家中数据量最大的公司,百度的大数据其实起步是最晚的,自2014年4月24日起,百度正式宣布对外开放“大数据引擎”,包括开放云、数据工厂、百度大脑三大组件在内的核心大数据能力开放,通过大数据引擎向外界提供大数据存储、分析及挖掘的技术能力,将面向多个传统领域逐步开放。同年8月18日,联合国与百度宣布启动战略合作,共建大数据联合实验室(bdl)。据悉,联合国开发计划署与百度大数据联合实验室的目标是探索利用大数据解决全球性问题的创新模式。

百度在开发和运营一整套自主研发的大数据引擎系统,包括数据中心服务器设计、数据中心规划和设计、大规模机器学习、分布式存储、超大规模集群自动化运维、数据管理、数据安全、机器学习(特别是深度学习)、大规模GPU并行化平台等方面,百度“大数据引擎”具有先进性和安全性。

现在的百度从大数据出发,在2012年余凯先生(已离职)的提议下,成立了深度学习实验室(IDL),后历经数位大牛操刀,已经成为了国内AI技术的标杆实验室,并成为了李彦宏未来蓝图中百度的重要押宝方向。

目前驱动中国人工智能向前发展的领导者中,只有寥寥数人出身于高校和研究机构,绝大部分都来自中国顶尖的科技公司,其中中国互联网三巨头BAT(百度、阿里、腾讯)几乎包揽了剩下的名额。而在这些人里,百度占据了近一半的名额,说百度撑起了中国人工智能领军人物的半壁江山并不为过。

可以说若论AI人才储备,百度就是中国AI中的霸王,对于中国AI而言的百度,最近网上有人戏称之为“中国AI黄埔军校”。

这个说法自然有些戏谑,但毫不夸张。

《福布斯》也在今年初发布的另一份报告中指出,百度将自我学习、神经元网络技术融入了核心的搜索业务之中,实现经营方式的创新,也许会成为新的增长点。

百度基于自己的搜索引擎,其数据具有广而不精的特点,与现有技术相结合,目前被百度拿来盈利,最多的是“凤巢”系统的精准营销。

阿里巴巴大数据——电商是其魂,云为其灵


照常理说,BAT中,论大数据,唯独是谈不到阿里的,因为阿里起初的技术基因是最弱的,也不是数据量最大的。但现在若论云计算,偏偏阿里又是最强的。马云先生和王坚博士的高瞻远睹,甚至逐渐让人嗅出了一丝论老练能强于贝佐斯的味道。(日前,Amazon已经成为了世界第一大云服务商,阿里位列第四)。


阿里大数据产品

早在2014年时,马云就提出了DT(Data technology)时代的概念,只不过当时和更早的20年前一样,人们不过觉得这个小个子在吹牛罢了。

但这位小个子首富的眼光不可谓不独到,让阿里的大数据成了BAT中起步最早的。

阿里大数据有两个起源,一是始于电商,二是始于阿里云。

不光是大数据始于电商,阿里整个公司都始于电商,电商是阿里大数据之魂。

起初阿里的数据产品名为“量子恒道”(现已更名生意参谋,专为淘宝卖家分析数据使用),可以说阿里对于大数据的认知起点就是始于这个电商数据分析软件的。从2008年起,阿里就把大数据作为一项基本战略,这样的意识完全是阿里在电商领域里尝到过甜头。所谓的数据魔方也好,淘宝指数也好,都是始于“量子恒道”的。

另一个起源是阿里云,阿里云是阿里大数据之灵。

阿里云创立于2009年,截至2016年第三季度,阿里云客户超过230万,付费用户达76.5万 。在天猫双11全球狂欢节、12306春运购票等极富挑战的应用场景中,阿里云保持着良好的运行纪录。

2016年1月20日,阿里云在2016云栖大会上海峰会上宣布开放阿里巴巴十年的大数据能力,发布全球首个一站式大数据平台“数加”,首批亮相20款产品,这一平台承载了阿里云“普惠大数据”的理想,即让全球任何一个企业、个人都能用上大数据。阿里的大数据团队——数加,就这样诞生了。

魂与灵的结合就是数加的产品商业化十分成熟,且极其符合中国商人的口味,在数据可视化上,其推出的大屏功能最受欢迎(灵感来自双11)。毕竟中国企业服务的两大要点到在这里了,视觉冲击足够大,足够满足管理欲。所以数加产品除了够商业,同时也够“中国”。

在这样的背景下,数加团队越发的朝着可实时性、可解释性、数据准确/稳定性发展,进而由电商为始逐步涉及到制造、金融、政务、交通、医疗、电信、能源等众多领域。

在输出自身大数据能力的同时,“数加”还向有数据开发能力的团队开放。这些团队可入驻“数加”,借助数加上的工具为各行业提供数据服务。“数加”平台首批集中发布了20款产品,覆盖数据采集、计算引擎、数据加工、数据分析、机器学习、数据应用等数据生产全链条。

就像在淘宝开店一样,只是他们售卖的是专业能力。

腾讯——大数据是腾讯游戏的秘密武器


马化腾这个人特别低调,低调到整个腾讯都学了他“闷声发大财”的路子,很少有相关消息或者报告面世。


腾讯大数据产品

但实际上在2009年1月,腾讯就搭建了第一个Hadoop集群,到2010年6月的时候,TDW v0.1版就发布了。

腾讯坐拥社交数据、游戏数据、交通数据、舆论数据等等,是场景化非常高的数据。

其中的社交数据,是腾讯自身最擅长的东西。如果腾讯愿意,它甚至可以通过分析得知,你的社会关系、性格禀赋、兴趣爱好、隐私绯闻甚至生理周期和心理缺陷。

腾讯的大多数消费数据都来源于游戏与增值服务。腾讯游戏的收入十分暴利,游戏迷们总是愿意付出高昂的费用来购买虚拟道具,以此满足自己的虚荣心。(据报道,王者荣耀第一季度流水达100亿人民币)

腾讯大数据的应用目前主要是为了完善自家产品,它了解用户的性格禀赋、兴趣爱好、隐私绯闻甚至生理周期,通过这些数据分析得出结果预测,做出来的产品能不受欢迎吗?事实上腾讯游戏的开发,以及一些产品的改进,也正是基于这些数据进行,其应用方法类似《纸牌屋》。

这使得腾讯游戏的发展产生了“马太效应”,坐拥海量游戏数据,做针对性的开发,然后继续完善数据,再开发新游戏。

当然,现在腾讯大数据也早就对外开放了,在2016年还拿了Sort Benchmark排序赛冠军,破了四项世界纪录,98秒内实现了对100TB数据的排序,技术实力也是不容忽视的。

三强的交叉点


大数据并不是报表平台、也不是计算平台,更不等同于精准营销。关键还是要看应用。

在大数据闭环系统中,万事万物都是数据产生者,同时也是数据的使用者。这就需要有大量能互相连接的的数据,在一个大数据计算平台,有相同的数据标准并能产生关联性,通过大数据相关处理技术最终形成自动化、智能化的闭环系统,自动学习,智能调整,从而提升整体的生产效率。

三强的数据量,目前是百度最大,腾讯次之,阿里最小,但阿里的数据变现做的最好。

三强目前的较量除了关起门来研究技术提升自身实力,也在其他领域里频频出手进行数据争夺,百度地图、高德地图、腾讯地图莫不是如此,前段时间的菜鸟物流与顺丰事件,也是阿里和腾讯对物流数据争夺的一个缩影。

三强面对的未来也许是三岔路


说出来你可能不信,国内最早研究大数据的,是在06年左右的暴风影音。但暴风影音只是搭建了一个大数据的架构,并没有对数据本身进行落地应用。

国内除BAT以外的,能说的上在搞大数据的,大概也就是三大电信运营商和银联这些央企了,这些公司和前一类公司的不同点在于他们已经有海量的数据,并且有足够的技术能力和财力。但此类公司目前的研究重点是国家战略的方向,在商用方便考虑较少,加上国企的一些常见病,对大数据的核心分析能力掌握不深,或者是没学习动力,基本是在等别人搞完了再拿过来。

所以说归根结底大数据还是得看怎么应用。

这才有了三强争霸的局面,日后的三强也是一样。

阿里的数据量虽然最小,但有高度商业应用价值,而且多数是结构化的数据。百度和腾讯的数据量都比阿里多很多(准确说,高出了数量级)。腾讯是以社交和游戏为主,而且基本给内部用。百度则是量最大的,主要是为提高用户的搜索体验和广告主的精准营销。

说到底,三家的差别主要是数据来源和商业用途上的差别,核心能力差不多,都基本可以靠Hadoop搞定半结构化数据。

三强面对的不光是彼此,还有国门外的世界,也许100年后的历史书上既不会提奥巴马医改,也不会写川普有性丑闻,但一定会浓墨重彩地写上从2014年起中国领导人决定走可持续发展的道路。

如今的三强正走在赶超GooGle、Amazon等硅谷企业的路上,他们彼此间的竞争其实也是面对新对手前的热身,在吃招喂招之间成长,而不是着眼于彼此。看看最近新闻上的三强在做什么就知道了。

阿里忙着去美国底特律开会,买加拿大龙虾帝王蟹,签支付宝国际合作协议;腾讯在忙着收购游戏公司,部署云计算基地;百度在家里憋大招苦修人工智能,无人驾驶。

可以说现阶段的三强间的摩擦都是一些小摩擦,各自其实都有着明确的路线蓝图,现阶段的摩擦不过是为了拿更多的数据喂食自家产品以及在新领域里做做探索罢了。

他们真正的的征程是走出国门迎战Google, Amazon,Microsoft,并且取而代之成为新时代的科技巨头。他们之间的格局最后也会变成Google, Amazon,Microsoft之间这样,既竞争,也彼此包容,既保持警惕,又不能自制的互相欣赏。

现阶段三强和海外巨头的大数据领域主要差距还是在对数据分析的基础研究上和大数据分析人才储备上(国内在大数据人才数量和质量上都和美国差的并不是太大,但毕竟起步晚了)。但大家的发展方向和架构没有本质上的差别。

十年前,拿三强和Google比,会有人讪笑,今天再拿三强和Google比,每一个国人都可以像新闻外交部发言人一样一本正经的说“那是历史的必然选择”。

百度、阿里和腾讯的大数据发展路线和区别相关推荐

  1. 谁是王者?百度、阿里和腾讯的大数据发展路线和区别

    本文转自36大数据,已获授权.作者:麒麟. 看中国科技企业发展,先看BAT. 三家公司各自占据自己的领域,成为了无数小公司叹为仰止的高山,在大数据的领域里,又尤以BAT最为耀眼. 在前不久的一次公开会 ...

  2. 阿里年薪50WJAVA工程师转大数据学习路线!

    大数据有两个方向,一个是偏计算机的,另一个是偏经济的.你学过Java,所以你可以偏将计算机的. Java程序员想转大数据可行吗?Java是全世界使用人数最多的编程语言.不少程序员选择Java做为了自己 ...

  3. 腾讯人口密度热力图_从腾讯位置大数据,看中国的超级城市

    世界那么大,谢谢你来看我!!关注我你就是个网络.电脑.手机小达人 地图作为现代人经常使用的工具.大数据的出现赋予了地图新的内涵,传统的地图不能满足日常的需求,热力图营运而生.谷歌腾讯阿里百度NASA滴 ...

  4. 腾讯人口密度热力图_从腾讯位置大数据看中国的超级城市,你所处位置是不是很亮?...

    欢迎点击关注,每天分享好看的文章! 地图作为现代人经常使用的工具.大数据的出现赋予了地图新的内涵,传统的地图不能满足日常的需求,热力图营运而生.谷歌腾讯阿里百度NASA滴滴高德都推出了相应的产品供大家 ...

  5. 腾讯QQ大数据:BI方法论-数据体系建设之路

    当一个企业要建立数据体系,它需要什么样的流程?当一个新的产品上线,它需要怎样建设业务的数据体系?这两个问题是否一些方法论去遵循?笔者原以为能在网上搜一篇关于数据体系建设的文章,居然未能如愿,甚为遗憾. ...

  6. 最新百度 阿里 华为 腾讯 谷歌面试笔试题及解析

    最新百度 阿里 华为 腾讯 谷歌面试笔试题及解析 8月15日,百度2道面试题: 1.来自<编程之美>的概率题:一个桶里面有白球.黑球各100个,现在按下述规则取球:的 i .每次从通里面拿 ...

  7. 腾讯与华为数据之争谈物联网大数据发展之困

    近期,互联网企业之间对大数据资源的争夺和摩擦日益增多,菜鸟网络和顺丰速递的"数据断交门"告一段落,华为和腾讯又因用户微信数据起了争端.在当今物联网信息时代大数据如何开放共享.用户隐 ...

  8. 【Python】基于Python获取腾讯位置大数据并进行数据清洗与可视化

    目录 1 引言 2 数据爬取 2.1 代码 2.2 结果 3 数据清洗 3.1 代码 3.2 结果 4 可视化展示 5 后记 1 引言 由于前面几篇关于百度迁徙获取数据的文章反响不错,有好多dalao ...

  9. 三马争霸消费积分 腾讯强化大数据布局

    前不久,由通用积分平台腾讯QQ彩贝做出的两组海报,引发了各界关注. 海报整体以"酷抠"为主题,一组突出四大名著,一组以"师说"为特点.漫画发布后瞬间风靡网络,像 ...

最新文章

  1. 聚类(Clustering)定义、聚类思想及形式、距离的度量
  2. 美国百亿亿次超算要比中国晚两三年,但真实性能更恐怖
  3. Linux下使用Nginx端口转发出现502错误的一种解决办法
  4. Office 2013和Office 365应用程序对电脑和移动操作系统支持情况分析
  5. Linux UIO 驱动模型
  6. Ubuntu20.04安装Redis
  7. MySQL数据库增删改查(基础操作命令详解)
  8. oracle显示工资计算税款,工资税收如何计算公式
  9. js【点击 div 2s 后颜色变成『粉色」】
  10. 多国拟发ChatGPT禁令 关“野兽”的笼子要来了?
  11. 怎么监控mysql数据变化_实时监控mysql数据库变化
  12. XLA IR:HLO、LHLO、MHLO和LMHLO
  13. 好东西(Android开发人员不得不收集的代码)
  14. Python读取dll库报错:[WinError 126]找不到指定的模块
  15. onscroll事件没有响应的问题
  16. 技术突破 | 融云超级群的无限用户分发实践
  17. 电影分区发行 移动端电影院创造中国电影市场新增量
  18. ch03:算数运算(长沙师范学院)
  19. A Physics-based Noise Formation Model for Extreme Low-light Raw Denoising论文学习理解
  20. 响应式布局 简单案例

热门文章

  1. 安装VS2008 SP1出现错误,文件正在使用 Microsoft Program Database
  2. 事件营销的话题选择之道
  3. 去除Neg窗口(警告窗口)
  4. java websocket广播_使用 Spring 对 Websocket 进行简单的消息广播和单播
  5. 如何将万能地图下载器下载的卫星地图加载到Autodesk InfraWorks 360内进行道路规划设计
  6. 非极大值抑制算法hard-NMS与soft-NMS
  7. MySQL基本管理(库管理与表管理)
  8. IDEA 关联本地SVN项目
  9. 7.python 移动目录下的文件至另一个目录下
  10. JVM 系列(一) --- 深入浅出对 JVM 的理解