转载地址:http://www.ppvke.com/Blog/archives/14307

在大多数人根本不知道大数据(Big Data)到底是什么的时候,不可否认的是,大数据已经在 21 世纪掀起一场惊涛骇浪。根据研究机构 IDC(国际数据资讯公司)的分析,这个世界上的资料正在以每两年就翻倍的惊人速度增加中。了解大数据、如何利用巨量资料,成了人人关心的重点议题。

尽管大数据的定义各家歧异,但基本上,大数据领域里的每个人都同意一点:大数据不仅仅是指更多资料而已。这篇文章整理出 7 个重要的大数据观点,希望大家不只是看着大数据的表皮,而能用不同的角度深入检视大数据。

    1) 最基本的大数据定义 The Original Big Data

大数据的 3Vs 定义是目前为止最受推崇且最广为人知的说法。3Vs 由 Gartner 的分析师 Doug Laney 最早在 2001 年时提出,分别代表资料量 Volume、资料传输速度 Velocity、资料类型 Variety。从那之后,便有人在 3Vs 之外陆续提出更多「V」, Veracity、Validity、 Value、Visibility 等,其中又以 Veracity (真实性)最被普遍认同。

3Vs 定义在上一篇文章中有仔细介绍,在这就不详述了,请参考《巨量资料的时代,用「大、快、杂、疑」四字箴言带你认识大数据》。

    2) 大数据即科技 Big Data as Technology

大数据并不是什么崭新的概念,好几十年前 CERN 的科学家就在处理每秒上看 PB (Peta Bytes)巨量资料。那为什么一直到近几年「大数据」这颗塬子弹才被投到科技圈,轰得人人叁句不离大数据?

现今要处理的资料量更庞大、资料产生跟处理速度更惊人、资料来源更多样,于是处理、储存大量资料的新技术跟工具快速发展,像是开源软体 Hadoop 跟 NoSQL 资料库。新科技诞生后,开发者跟使用者需要一个专业名词来与之前的科技作出区别,于是「大数据」一词因应而生。

因此大数据不只是指资料,也指这些用来分析、处理巨量资料的新兴科技。

“Big Data is the new tools helping us find relevant data and analyze its implications.”


    3) 大数据即不同的资料类型 Big Data as Data Distinctions

现今「大数据」所涉及的资料已经和过去的资料已经不同了。根据 Hortonworks 公司战略副总裁 Shaun Connolly 的说法1,过去的资料大部分是人工手记下来的交易纪录(Transactions),现在则是机器替我们记录下来的交易资料;除此之外,还有人们跟事物、企业间的互动资料(Interactions),例如人们在网路上点击网页跟连结的纪录;最后则是机器自动生成、累积下来的观察资料(Observations),例如智慧型家居产品记录下来的室温变化等。

因此 Shaun Connolly 定义大数据是由交易、互动、观察资料所组成的资料型态。

“Big Data = Transactions + Interactions + Observations”

    4) 大数据即讯号 Big Data as Signals

SAP 公司的高管 Steve Lucas 不以资料型态来看待大数据,而是以目的(intent)跟时机(timing)。在过去,企业收集到的资料只能在事情发生后引以为鉴,但现在企业收集到的是「新讯号」2,可以在事情发生前得到前兆跟提示,进而做出行动来影响事情结果。例如某品牌广告在社群网站上的「赞」数、点阅率如果跌落谷底,公司便可以预期接下来产品销售量一定也会惨不忍睹;同样的情形在过去时,公司所得到的数据就是产品发售后的销售量。

“Big Data is the new signals.”

    5) 大数据即机会 Big Data as Opportunity

根据 451 Research 的数据专家 Matt Aslett,他将大数据定义为「以前因为科技所限而忽略的资料」3,这个说法也受到许多人的赞同,因为多半提起大数据时,都是在讨论这些以前无法分析处理、囊括其中的资料。

“Big Data is data that was previously ignored because of technology limitations.”

其实他在文中并不是用 Big Data 一字,而是使用「Dark Data(暗数据)」。事实上许多公司都使用暗数据这个字,因为当资料变「暗」了,便表示一个漏掉的讯息、错失的机会,在企业策略中留下一个盲点4。一直以来,各企业雇用数据专家的目的就是希望能「点亮」这些暗数据(illuminate the Dark Data),观察到以前不曾注意过的趋势、做出更全面的考量。

也因此,SAP 曾经做过一个调查显示,将近 76% 的企业高管们视大数据为「机会」。个人也满喜欢这个观点,毕竟现在各公司在推动大数据的塬因,就是希望能掌握全面的讯息、把握住这些机会!

“A new survey by SAP suggests that nearly 76 percent of executives see “Big Data” as an opportunity” 5

    6) 大数据的哲学定义 Big Data as Metaphor

着名的摄影师和出版人,前《Time(时代)》、《Life(生活)》、《National Geographic(国家地理)》杂志摄影师,负责过有史以来最大摄影项目的 Rick Smolan ,在他的着作《大数据的人性面孔》(The Human Face of Big Data)一书中,则给了大数据一个最完美的哲学定义 ——「大数据是帮助地球建构神经系统的一个过程,在这系统中,我们(人类)不过是其中一种感测器。」6

“Big Data is the process of helping the planet grow a nervous system, one in which we are just another, human, type of sensor.”

深奥吧?如果你读过《大数据的人性面孔》一书,相信你应该会对这个比喻点头如捣蒜。求方便的话,这本书也提供了 iPad App 版本可以阅读,有兴趣可以到这里下载。

    7) 大数据是旧东西的新噱头 Big Data as New Term for Old Stuff

也有部份人认为,「大数据」一词被严重滥用,大数据只是商业智慧(Business intelligence)或商业分析(Business analytics)演化后的新字7。

从 Google Trend 里可以看出,从 2004 年到现在,「Big Data」一字的搜寻次数从 2011 年开始飙涨的同时,人们对「Business intelligence」的兴趣则是持续降低。「Business analytics」趋势虽然小幅上涨,但短时间应该不可能赶上另外两个字的风潮。

——转自中国大数据

7个你不可不知的大数据定义相关推荐

  1. 【数据仓库】大数据定义

    2012年Gartner公司将大数据定义为3V,即:大容量(Volume).高流速(Velocity).多样化(Variety),后来人们在3V基础上增加新的V-"Veracity" ...

  2. 大数据时代你需要知道的7个大数据定义

    文章讲的是大数据时代你需要知道的7个大数据定义,大数据究竟是什么?很多人可能仍然有些混淆,本文让我们来看看大数据的一些主要的定义.首先要注意的是,行业内的所有人都普遍认同,大数据不只是更多的数据. ( ...

  3. 大数据算法MOOC笔记1:大数据定义、特点、应用

    大数据的定义: "大数据"的概念起源于2008年9月<自然>(Nature)杂志刊登的名为"Big Data"的专题,由于成因复杂, 至今对大数据没 ...

  4. 今后五年你不能不知道的大数据

    2016年PM2.5浓度下降5%.大气污染治理安排资金165.4亿元."十三五"时期以治理PM2.5为重点,达到国家要求.2020年煤炭消费总量控制在900万吨以内. 2016年全 ...

  5. 不得不知的大数据四大常识,否则你都不敢说自己在做大数据?

    一.大数据分析的五个基本方面 1.可视化分析 大数据分析的使用者有大数据分析专家,同时还有普通用户,但是他们二者对于大数据分析最基本的要求就是可视化分析,因为可视化分析能够直观的呈现大数据特点,同时能 ...

  6. 你所不知道的大数据:一条微博得到王思聪手机号

    互联网已成为人们生活工作的重要组成部分,时时的网路连接不只带来便捷,也将我们所有数据保存到了网络空间中.然而这些越积越多的个人大数据,却为黑客入侵攻击大开方便之门.在今天举办的中国互联网安全大会(IS ...

  7. 你所不知道的大数据就业方向和岗位,成都大数据发展前景

    2018年,中低端IT工程师紧随浪潮加速向大数据转型,企业对大数据人才争夺直接进入白热化阶段.因此,对于零基础想学IT技术的人而言,直接选择学习大数据技术是符合潮流和就业需求的选择. 当下,大数据方面 ...

  8. 大数据定义、思维方式及架构模式

    一.大数据何以为大 数据现在是个热点词汇,关于有了大数据,如何发挥大数据的价值,议论纷纷,而笔者以为,似乎这有点搞错了原因与结果,就象关联关系,有A的时候,B与之关联,而有B的时候,A却未必关联,笔者 ...

  9. 透视大数据,未来市场谁主沉浮?这个4月,3W企服大数据OpenForm等你报名!

    当你认为风头无两的AI和区块链必将定义未来的时候,却不知脱离大数据的支撑,它们都没法独立发展.风口之上,大数据已然成为所有行业发展的必备基础,其背后巨大的空间值得我们展开无尽的想象. 为此,白热化的国 ...

最新文章

  1. Matlab实现图像边缘检测
  2. 神经网络优化算法综述
  3. Swift来了,是不是可以入手IOS开发了?
  4. python文件输出-python文件流
  5. [转]JavaScript中的几个tip
  6. linux_unix编程手册-信号概述signal函数
  7. 十七、去年jQuery的笔记
  8. SpringCloud:Feign接口转换调用服务(Feign 基本使用、Feign 相关配置)
  9. E1 PCM复用设备常见故障及处理方法
  10. JavaScript每日学习日记(2)
  11. 微服务升级_SpringCloud Alibaba工作笔记0008---spring gateway配置路由的两种方式
  12. 【转载】关于.NET下开源及商业图像处理(PSD)组件
  13. 【iCore4 双核心板_uC/OS-II】例程十:信号量集
  14. Android代码 listview选中,Android开发listview选中高亮简单实现代码分享
  15. Java周记(第五周)
  16. servlet是干什么的?
  17. 手机html5编辑器哪个好,3款容易上手的HTML5编辑工具推荐~
  18. ricequant量化交易文件如何保存和读取
  19. 转换YV12到RGB565图像转换,附YUV转RGB测试
  20. android网络请求忽略证书,android,_Okhttp3 忽略证书问题,android - phpStudy

热门文章

  1. php swool 携程,EasySwoole-延迟队列-取消订单
  2. DELL强化版《最终幻想11》认证电脑出炉
  3. uniapp中app分享小程序方法
  4. 计算机网络ping超时,ping请求超时怎么回事?ping请求超时的解决方法
  5. 使用father打包发布前端工具库
  6. 神技能:Python控制键盘鼠标
  7. Dev-cpp 配置新编译器
  8. 打印机只能扫描图片,不能扫描成PDF解决办法
  9. Python多线程-手慢无的真相
  10. Vivo手机获取文件管理器里的文件路径为空