大数据最核心的价值是什么?

有这样一段话:社交网络,让我们越来越多地从数据中观察到人类社会的复杂行为模式。社交网络,为大数据提供了信息汇集、分析的第一手资料。从庞杂的数据背后挖掘、分析用户的行为习惯和喜好,找出更符合用户“口味”的产品和服务,并结合用户需求有针对性地调整和优化自身,就是大数据的价值。诸位同僚觉得大数据的核心价值是什么?

1

先说结论:大数据的终极核心价值在于“资源优化配置”

无论是大数据在农业的应用也好,工业的应用也好,抑或是在金融行业的应用也好,最终都是通过大数据技术来获知事情发展的真相,最终利用这个“真相”来更加合理的配置资源。

具体来说,要实现大数据的核心价值,还需要前两个重要的步骤,第一步是通过“众包”的形式收集海量数据,第二步是通过大数据的技术途径进行“全量数据挖掘”,最后利用分析结果进行“资源优化配置”。

2

只说概念大家肯定没法直观的理解上面的观点,那就将几个咱们都接触过的例子讲一讲大数据是怎么通过这三步发挥核心价值的?

第一步、通过“众包”产生和收集数据。

高德地图、百度地图都有实时路况的功能,但大家有没有想过实时路况的数据是怎么收集的?

实际上经过了三个阶段,开始是跟交通口的一些公司合作,获取交通流量监测设备的数据,这个方法缺陷很明显,一个是受制于人,一个是想扩大监测范围就要部署大量设备,费时费力,而且还受法律制约。

于是一些专门做路况的公司开始用出租车当浮动车收集数据。但这种办法还是无法覆盖大量的大小路段,随着移动互联网的普及,高德地图的APP能够实时上传大量机动车的速度和位置信息,经过去噪和综合分析,就形成了覆盖率极高的实时路况信息。这就是一个典型的“众包”过程。

严谨一点来说,众包指的是一个公司或机构把过去由员工执行的工作任务,以自由自愿的形式外包给非特定的(而且通常是大型的)大众网络的做法。

大数据的“海量数据”就是由“众包”产生的。广义上,用户的行为数据,各种传感器的数据,也都是“众包”的形式,只要是由过去集中式的产生模式扩散到分布式的模式,都是众包的形式。

3

第二步、通过“全量数据挖掘”获知“真相”

讲第二个特点之前希望大家能看一下上面的视频,通过分析阿里巴巴全年的数据得到的阿里巴巴的世界贸易与全国贸易的趋势。

视频中体现的不仅是阿里巴巴集团的运营情况,其实也部分反映了整个中国的经济运行情况。而且这些数据不是通过采样得来的,就是真真切切的“全量数据”。

我们再也不用通过“管中窥豹”的形式来推测全局,而是直接通过“上帝视角”来窥视真相。这就是大数据的魅力,我们获得了前所未有的获取真相的能力,而且对于大型互联网公司来说,即使是PB级别的数据分析也是准实时的,我们下一个小时就能够得知上一个小时的全量数据分析结果,这样的能力是前所未有的。

4

第三步 大数据的核心价值——“资源优化配置”。

前段时间,滴滴打车曾通过投票和订单分析的方式得出了北上广深四地的加班大楼排行榜,敝司不幸排名第三,但事实真的是即使加班很晚也很难打到车啊啊!

所以滴滴打车更名为“滴滴出行”之后,也抛出了他们伟大的愿景,那就是利用大数据分析实时综合调度“快车”、“专车”、“出租车”、“顺风车”甚至是滴滴巴士的资源,实现全局的交通资源优化。

事实也是如此,滴滴的司机们越来越多的需要完成“指派任务”,而不是集中去抢高净值客户。也许对于个别单体来说他们的利益降低了,但全局的资源配置却避免了全局的资源浪费和过度竞争,无疑大大提高了交通资源的使用效率。所以我们说,基于大数据分析的结果,进行资源优化配置,才是大数据应用的落地点和真正价值。

而“资源优化配置”的价值,又远远超出我们能够想象的层面,在资本寒冬即将来临的大背景下,利用大数据实现资源的高效利用,显得更加重要。广告行业利用DMP、DSP进行广告的精准投放,房地产行业利用大数据分析价值洼地,宜信利用大数据建设征信系统降低坏账率,券商陆续推出大数据基金,全部都是广义的“资源优化配置”的体现。

大数据也远远不再停留在学术和“分析现象”的阶段,而是在各行各业实现了落地并发挥着非常非常重要的价值。我是在互联网广告行业从事程序化购买系统建设的,而这个行业也是大数据最先发挥价值的地方。举个最简单的例子来说明大数据在广告资源优化配置上的作用。

宝洁集团是我们的客户,而宝洁的产品有非常强的用户性别倾向性,护舒宝的广告就应该投给女性,投给男性就是赤裸裸的浪费。

而吉列的目标用户就只是男性。之前保洁集团是怎么做广告的?就是海投品牌广告,不分性别的海投,那这个做法在投放之前就已经确切无疑的知道有一半广告费用时浪费的。但没有办法,因为我们没有大数据技术来发掘用户的性别。

而随着DMP(Data Management Platform)技术的不断成熟,越来越多的广告主建立起自己的用户数据中心,可以不断积累客户的各种用户行为,进而判断出用户的性别,再通过DSP(Demand Side Platform)系统定向投放,最终可以为宝洁节省一半的广告预算。

上面的例子正是广告资源的优化配置,事实上DMP系统对用户画像的构建精确程度远超人们的想象,精准投放的各类筛选条件也越来越精细。现在微信支持精确到设备的精准投放,也就是未来完全可能实现精确到每个人终端的精准投放,这都依赖于大数据对于用户行为的挖掘,最终实现整个广告行业的效果提升。

很多同学可能会说大数据的核心是数据挖掘,是分布式存储,是NLP,是深度学习,但这一切其实只是大数据的技术途径,大数据的终极核心价值就在于“资源优化配置”。

易海聚|助力企业信息化建设日益完善

易海聚|面向科技情报的网络信息自动发现技术应用

易海聚网络大数据整合系统方案

易海聚新闻采编译系统

对链家数据的爬取分析:深圳到底哪种二手房最吃香?

大数据最核心的价值是什么?相关推荐

  1. (转)大数据最核心的价值是什么?

    下面是一些长篇的讨论,这里我把大数据的核心价值理解为核心商业价值. "很多人还没搞清楚什么是PC互联网,移动互联网来了,我们还没搞清楚移动互联的时候,大数据时代又来了."--马 云 ...

  2. 互联网时代大数据的核心价值

    都说现在是大数据时代,那么大数据是什么?大数据有什么用?大数据最核心的价值是什么呢?其实大数据的核心价值很简单,就是了解用户行为(更简单说就是了解用户行为习惯).今天我们就细说大数据的核心价值. 一. ...

  3. DT时代,大数据最核心的意义是什么?

    大数据最核心的价值就是在于对于海量数据进行存储和分析.相比起现有的其他技术而言,大数据的"廉价.迅速.优化"这三方面的综合成本是最优的. 当这项技术在自己用的时候,自己将会非常收益 ...

  4. 大数据的核心价值表现在哪里

    近些年来,大数据已成为了大家茶余饭后讨论的热门话题,像数据安全.数据挖掘.数据分析等围绕大数据的一系列技术也深受市场的喜爱.那么,在这样一个满城尽谈大数据的时代背景下,大数据的核心价值究竟是什么?今天 ...

  5. 什么是大数据的核心价值?

    以下是一些长篇的讨论.这里我把大数据的核心价值理解为核心商业价值. "非常多人还没搞清楚什么是PC互联网,移动互联网来了,我们还没搞清楚移动互联的时候,大数据时代又来了. "--马 ...

  6. 《大数据》2015年第2期“专题”——关于大数据交易核心法律问题 —— 数据所有权的探讨及建议...

    关于大数据交易核心法律问题--数据所有权的探讨及建议 王 融 中国信息通信研究院互联网法律中心 北京 100191 摘要:清晰的产权归属是交易的前提与基础.然而,当前关于数据的产权归属问题还远未达成共 ...

  7. 论大数据的泡沫、价值与应用陷阱

    1大数据源起:对未来不确定性的恐惧. 我们所生活的世界,就像一片混沌(chaos),大数据时代,我们周围更是充斥着各种不同的理论.知识.信息和噪音,数据爆炸式增长和科技高速发展所带来的冲击,加大了未来 ...

  8. 大数据在金融行业的价值

    要理解大数据在金融行业的价值,我们建议从4个V开始: 公司根据行业.公司自身的优先事项和目标实施大数据的某些方面. 容量(Volume)是指大数据技术处理多个Tbytes甚至Pbytes数据的能力.金 ...

  9. 大数据之父舍恩伯格:大数据的核心要义在于共享

    8月25日,2016IEBE(上海)国际电子商务博览会暨互联网+科创应用展"智享生态联接未来"高峰论坛在上海举行.大数据之父舍恩伯格出席了本次论坛,他与参会者探讨了大数据时代电子商 ...

  10. 我们怎样确保从大数据计算中获得价值

    我们怎样确保从大数据计算中获得价值 支持大数据方案并不是在硬件以及软件层次终止,企业要想真正地从大数据中受益,领导者必须改变思考与对待信息的方式.    我们怎样确保从大数据计算中获得价值? 当所有可 ...

最新文章

  1. Hibernate配置(2)
  2. python 微信爬虫_python3简单实现微信爬虫
  3. Stm32 Bootloader整理
  4. appium 3 跑起来
  5. 袁晖:C2B汽车电商模式创新
  6. 4.5 偏斜类-机器学习笔记-斯坦福吴恩达教授
  7. 香港连续25年被评为全球最自由经济体
  8. 计算机网络——TCP/IP参考模型和五层参考模型
  9. Spring集成Memcached三种方式(一)
  10. 你们网贷逾期最长多少时间,你们怎么处理的
  11. 70多套java必练项目,适合小白上手!
  12. 【Redis】client客户端 工具 redis-cli
  13. 阿帕奇apache服务器和webDav服务器快速配置。
  14. nRF Sniffer抓包环境搭建
  15. quora 查看自己关注了谁
  16. mysql查询IN索引无效的问题【已解决】
  17. 构造Gray码(格雷码)
  18. charindex 和patindex详解(转)
  19. 漏洞复现 a.WSO2 文件上传 (CVE-2022-29464)
  20. 会议服务与管理【2】

热门文章

  1. npoi Excel图表制作
  2. 数学建模中各种评价类模型的优点和缺点总结
  3. 百度搜索排名优化和SEO搜索引擎优化
  4. 【无标题】互联网广告投放优势和前景
  5. 实训十二:交换机隔离VLAN配置
  6. 贴心 | GXF Fix 修复 / 优化基因结构注释信息文件 - GTF/GFF3
  7. 使用 MATLAB Coder App 生成 C 代码
  8. 制作可被svchost调用的服务(上)
  9. 风险预测模型_慢乙肝患者的HCC风险预测模型——精准医学的希望|高分综述
  10. 科来数据包生成器使用,广播域内进行arp欺骗