什么是大数据?

高速发展的信息时代,新一轮科技革 命和变革正在加速推进 ,技术创新日益成为重塑经济发展模式和促进经济增长的重要驱动力量,而“大数据”无疑是核心推动力。

那么,大数据是什么意思呢?如果从字面意思来看,大数据指的是巨量数据。那么可能有人会问,多大量级的数据才叫大数据?不同的机构或学者有不同的理解,难以有一个非常定量的定义,只能说,大数据的计量单位已经越过TB级别发展到PB、EB、ZB、YB甚至BB级别。

最早提出“大数据”这一概念的 是全球知名咨询公司麦肯锡,它是这样定义大数据的:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型以及价值密度低四大特征。

研究机构Gartner是这样定义大数据的:“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流转优化能力来适应海量、高增长率和多样化的信息资产。

若从技术角度来看,大数据的战略意义不在于掌握庞大的数据,而在于对这些含有意义的数据进行专业化处理,换言之,如果把大数据比作一种产业,那么这种产业盈利的关键在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。

大数据的特征
一般认为,大数据主要具有以下4个方面的典型特征,即大量(Volume)、多样(Variety)、高速(Velocity)和价值(Value),即所谓的4V,接下来,通过一张图来具休描述。

1. Volume(大量)

大数据的特征首先就是数据规模大。随着互联网、物联网、移动互联技术的发展,人和事物的所有轨迹都可以被记录下来,数据呈现出爆发性增长。

单位换算格式

Byte1Byte=1024bit

KB1KB= 1024Byte

MB1MB= 1024KB

GB1GB= 1024MB

TB1TB= 1024GB

PB1PB= 1024TB

EB1EB= 1024PB

ZB1ZB= 1024EB

2. Variety(多样)

数据来源的广泛性,决定了数据形式的多样性。大数据可以分为三类,一是结构化数据,如财务系统数据、信息管理系统数据、医疗系统数据等,其特点是数据间因果关系强;一是非结构化的数据,如视频、图片、音频等,其特点是数据间没有因果关系;三是半结构化数据,如HTML文档、邮件、网页等,其特点是数据间的因果关系弱。有统计显示,目前结构化数据占据整个互联网数据量的75%以上,而产生价值的大数据,往往是这些非结构化数据。

3.Velocity(高速)

数据的增长速度和处理速度是大数据高速性的重要体现。与以往的报纸、书信等传统数据载体生产传播方式不同,在大数据时代,大数据的交换和传播主要是通过互联网和云计算等方式实现的,其生产和传播数据的速度是非常迅速的。另外,大数据还要求处理数据的响应速度要快,例如,上亿条数据的分析必须在几秒内完成。数据的输人、处理与丢弃必须立刻见效,几乎无延迟。

4.Value(价值)

大数据的核心特征是价值,其实价值密度的高低和数据总量的大小是成反比的,即数据价值密度越高数据总量越小,数据价值密度越低数据总量越大。任何有价值的信息的提取依托的就是海量的基础数据。当然目前大数据背景下有个未解决的问题,如何通过强大的机器算法更迅速地在海量数据中完成数据的价值提纯。

研究大数据有什么意义?

现在的社会是一个高速发展的社会,科技发达,信息流通,人们之间的交流也越来越密切,生活也越来越便捷,大数据就是这个高科技时代的产物。阿里巴巴创办人马云曾经说过,未来的时代将不是IT时代,而是DT的时代,DT就是Data Technology,数据科技,这显示出大数据对于阿里巴巴集团来说是举足轻重的。

有人把数据比喻为蕴藏能量的煤矿。煤炭按照性质有焦煤、无烟煤、肥煤、贫煤等分类,而露天煤矿、深山煤矿的挖掘成本又不一样。与此类似,大数据并不在于“大”,而在于“有用”。数据的价值含量、挖掘成本比数量更为重要。对于很多行业而言,如何利用这些大规模数据,发掘其潜在价值,才是赢得核心竞争力的关键。

研究大数据,最重要的意义是预测。因为数据从根本上讲,是对过去和现在的归纳和总结,其本身不具备趋势和方向性的特征,但是可以应用大数据去了解事物发展的客观规律、了解人类行为,并且能够帮助我们改变过去的思维方式,建立新的数据思维模型,从而对未来进行预测和推测。比如,商业公司对消费者日常的购买行为和使用商品习惯进行汇总和分析,了解到消费者的需求,从而改进已有商品并适时推出新的商品,消费者的购买欲就会提高。

知名互联网公司谷歌对其用户每天频繁搜索的词汇进行数据挖掘,从而进行相关的广告推广和商业研究。

大数据的处理技术迫在眉睫,近年来各国政府和全球学术界都掀起了一场大数据技术的革命,众人纷纷积极研究大数据的相关技术。很多国家都把大数据技术研究上升到了国家战略高度,提出了一系列的大数据技术研发计划,从而推动政府机构、学术界、相关行业和各类企业对大数据技术进行探索和研究。

可以说大数据是一种宝贵的战略资源,其潜在价值和增长速度正在改变着人类的工作、生活和思维方式。可以想象,在未来,各行各业都会积极拥抱大数据,积极探索数据挖掘和分析的新技术、新方法,从而更好地利用大数据。当然,大数据并不能主宰一切。大数据虽然能够发现“是什么”,却不能说明“为什么”;大数据提供的是些描述性的信息,而创新还是需要人类自己来实现。

全网最全大数据教程

怎样理解大数据概念?大数据有什么用处?相关推荐

  1. [大数据概念]-- 大数据的技术生态比喻

    作者:Xiaoyu Ma 链接:https://www.zhihu.com/question/27974418/answer/38965760 来源:知乎 著作权归作者所有.商业转载请联系作者获得授权 ...

  2. 大数据入门--大数据概念,大数据是什么?

    大数据是什么?   大数据(Big Data) :指无法在一定的时间范围内,用常规软件工具进行捕捉,管理和处理的数据集合.是需要新的处理模式,才能具有更强的决策力,洞察发现力和流程优化能力的海量,高增 ...

  3. 静态数据/动态数据/使用中数据概念及数据防泄漏 隐私保护

    数据防泄漏Data Loss Prevention 预防数据丢失(DLP),也称为数据泄漏预防,指的是一个全面的方法覆盖人,流程和系统,识别.监控.和保护数据在使用(例如,端点的行为),动态数据(例如 ...

  4. 大数据-概念-应用-弊端

    一:大数据概念 大数据(big data,mega data),或称巨量资料,指的是需要新处理模式才能具有更强的决策力.洞察力和流程优化能力的海量.高增长率和多样化的信息资产. 在维克托·迈尔-舍恩伯 ...

  5. 大数据入门(一)-大数据概念和特点(1)

    一.大数据概念 大数据是指无法在一定时间范围内用常规软件工具进行捕捉.管理和处理的数据集合,是需要新处理模式才能具有更强的决策力.洞察发现力和流程优化能力的海量.高增长率和多样化的信息资产. 大数据主 ...

  6. 大数据概论、大数据概念、大数据特点(4V)、Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、大数据应用场景、大数据发展前景、大数据部门间业务流程分析

    文章目录 1.大数据概念 2.大数据特点(4V) 2.1Volume(大量) 2.2Velocity(高速) 2.3Variety(多样) 2.4Value(低价值密度) 3.大数据应用场景 4.大数 ...

  7. 大数据是啥?大数据特点 大数据概念

    大数据 大数据概念 大数据(bigdata):指无法在一定时间范围内用常规软件工具进行捕捉,管理和处理的数据集合,是海量,高增长率和多样性的信息资产. 主要解决海量数据的存储和海量数据的分析计算问题. ...

  8. Hadoop系列——大数据概念day1-1

    Hadoop系列--大数据概念day1-1 Hadoop系列--大数据概念day1-1 数据 数据的单位 大数据 大数据的特点(5V) Volume数据体量大 Variety种类.来源多样化 Valu ...

  9. 大数据计算1-综述大数据概念,计算体系

    1.体系 大数据概念,计算体系 数据采集.建模和分析 大数据处理的分析算法 大数据处理技术 数据可视化 Hadoop计算体系 HDFS/HBase存储架构 MapReduce计算模型 计算模型和架构 ...

  10. 大数据之大数据概论(一)

    一.大数据概念 大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉.管理和处理的数据集合,是需要新处理模式才能具有更强的决策力.洞察发现力和流程优化能力的海量.高增长率和多样化的 ...

最新文章

  1. 实力坑队友! CTO 写出低级 Bug,致公司 70 GB 数据遭泄露!
  2. linux命令之添加系统搜索动态库目录-ldconfig
  3. ubuntu / 18.04 系统上配置 DHCP Server
  4. CentOS 6.4 卸载与安装桌面
  5. 98. Validate Binary Search Tree
  6. listitem android,android-为contextmenu标识listitem的ID
  7. 35岁的程序员如果不转行,从事哪些细分行业比较好?
  8. Android5.1权限问题解决
  9. ICP备案和经营性ICP有何不同
  10. html 中各种鼠标手势
  11. SCAU 正n多边形类的定义与使用
  12. 微软计算机电源怎么接,电源线,详细教您电脑电源线怎么接
  13. 用python画一个蜡笔小新
  14. 2022款Thinkphp家政上门预约系统-全开源系统源码
  15. APP隐私合规现状与防范措施
  16. canvas 画布画太极图和钟表
  17. fusioncharts的属性介绍
  18. latex作者不省略,加作者传记,latex图片取消自动编号,控制图片与上下文距离,段首取消空行。图的上下距离,去掉行间距
  19. 计算机解决问题时有什么特点,问题解决
  20. 胡适:非个人主义的新生活

热门文章

  1. Oracle-体系结构图
  2. bbs.php ww1.dzxa.me_bbs论坛小结
  3. CentOS安装图形界面
  4. android与ios系统优缺点,安卓系统与苹果iOS系统的差别,谁更好用?为什么系统会卡顿?...
  5. 论文阅读笔记:看完也许能进一步了解Batch Normalization
  6. 2022年数字科技前沿应用趋势
  7. Android学习笔记之AndroidManifest.xml文件解析(学习别人的..非原创)
  8. 线性代数:裁剪变换(投影变换)(一)
  9. 基于SONY ICX694的4通道成像组件设计与调试
  10. 安卓8.1 AEX5.4 Xposed框架T9拨号移植