大数据,又称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

大数据具有四个“V”特点,即多样性(Variety)、体量(Volume)、速度(Velocity)和价值(Value):第一,数据体量巨大。从TB级别,跃升到PB级别。数据的单位,已经从G和T发展到P、E、Z、Y等为计量单位。计算机中存储信息的基本单位是字节(Byte)。一个西文字符用一个字节存储,一个汉字需要两个字节存储。其他单位及其相互间的关系分别为:1K=1024Byte,1M=1024K,1G=1024M,1T=1024G,1P=1024T,1E=1024P,1Z=1024E,1Y=1024Z。有资料称,2011年全球的数据量达到1.8Z。第二,数据类型繁多。不仅包括人们在互联网上发布的信息,而且全世界的工业设备、汽车、电表上有着无数的数码传感器,随时测量和传递着有关位置、运动、震动、温度、湿度乃至空气中化学物质的变化,也产生了海量的数据信息。第三,价值密度低,商业价值高。也就是说单位数据的价值并不高,需要耗大量精力在大量的数据中发现有价值的数据或者将低价值的微小数据集聚成有价值的大数据。第四,处理速度快。1秒定律。最后这一点也是和传统的数据挖掘技术有着本质的不同。

从某种程度上说,大数据是数据分析的前沿技术。简言之,从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术。明白这一点至关重要,也正是这一点促使该技术具备走向众多行业的潜力。

大数据可分成大数据技术、大数据工程、大数据科学和大数据应用等领域。目前人们谈论最多的是大数据技术和大数据应用,工程和科学问题尚未被重视。大数据工程指大数据的规划建设运营管理的系统工程;大数据科学关注大数据网络发展和运营过程中发现和验证大数据的规律及其与自然和社会活动之间的关系。

大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。如中国物联网校企联盟认为,物联网的发展离不开大数据,依靠大数据可以提供足够有利的资源。

对于趋势的预测,也是大数据技术的价值所在。科学家的研究,已经越来越清晰地揭示出,人类行为多数是可以预测的,正如《爆发——大数据时代预见未来的新思维》书中所指出的:各种各样的记录人类行为的数据库,虽然给人类带来了前所未有的风险,但“同时也创造了一个历史性机遇——它第一次毫无偏见地为我们提供了成千上万人,而不是少数人的详细行为记录。在过去几年里,这些数据库为各大实验室提供了不少帮助,使很多计算机学家、物理学家、数学家、社会学家、心理学家以及经济学家得以在强大的计算机和新技术的支持下,对某些问题进行仔细研究。实验的结果令人振奋。他们有充分的证据证明,人类的大部分行为都受制于规律、模型以及原理法则,而且它们的可重现性和可预测性与自然科学不相上下”。

目前,“大数据”的概念及其价值更多的是被IT业和企业营销领域所关注,但事实上,传媒业也将是受到大数据时代冲击的主要行业之一。

20世纪50年代,美国就有媒体记者利用大型计算机对政府提供的数据库中的信息进行分析,以发现和调查新闻事实。之后,在西方,计算机辅助报道(ComputerAidedReporting,简称CAR)逐渐兴起。在这样一个新的领域内,人们不断探讨着以数据为基础挖掘新闻、解释新闻的方法。那些或公开或隐蔽的数据,成为记者发现新闻选题、拓展新闻深度的重要资源。

大数据技术正在对今天的新闻业形成冲击,它在一定程度上将对现有的新闻生产的模式与机制产生影响,这主要体现在:大数据技术渗透到新闻生产的核心环节,重树新闻质量标杆,进一步提升受众反馈的价值,拓展用户分析广度与深度。在大数据技术等因素的推动下,新闻业务将实现一些方向性调整,如趋势预测性新闻和数据驱动型深度报道分量的增加,数据呈现、分析与解读能力的提高,新闻生产中跨界合作的增强。
  人工智能、大数据、云计算和物联网的未来发展值得重视,均为前沿产业,多智时代专注于人工智能和大数据的入门和科谱,在此为你推荐几篇优质好文:
大数据工程师培训,需要学习的有哪些课程?
http://www.duozhishidai.com/article-15081-1.html
大数据工程师就业培训哪个好?
http://www.duozhishidai.com/article-15082-1.html
java大数据与python大数据如何选择?
http://www.duozhishidai.com/article-12540-1.html


多智时代-人工智能和大数据学习入门网站|人工智能、大数据、物联网、云计算的学习交流网站

大数据是什么,大数据的主要特点是什么?相关推荐

  1. 第二篇:智能电网(Smart Grid)中的数据工程与大数据案例分析

    前言 上篇文章中讲到,在智能电网的控制与管理侧中,数据的分析和挖掘.可视化等工作属于核心环节.除此之外,二次侧中需要对数据进行采集,数据共享平台的搭建显然也涉及到数据的管理.那么在智能电网领域中,数据 ...

  2. SparkSQL和Hadoop(面向数据科学家和大数据分析师)

    了解HDFS命令.Hadoop.Spark SQL.SQL查询.ETL和数据分析| Spark Hadoop集群虚拟机|完全解决的问题 你会学到什么 作为本课程的一部分,学生将获得在Spark Had ...

  3. 大数据的两面性_大数据,多大的数据才是大数据?

    大数据的本质是统计学,是通过统计分析得出最终结果.比如我们经常会使用到的图像识别,为什么手机能识别出来那些可能你也不知道的东西,因为那是建立在海量数据资料的基础之上的.就连如今人人都会用到的手机美颜也 ...

  4. 什么是大数据口子_大数据分析师年薪几十万,学什么专业才能从事大数据?

    近几年,大数据为各个领域带来了全新的变革,大数据的重要性越来越被企业和国家所看到,大数据工作者的需求再次被无限放大,他们的薪资和社会地位也在不断上涨.马云在演讲中就提到,未来的时代将不是IT时代,而是 ...

  5. 华为云大数据存储的冗余方式是三副本_大数据入门:HDFS数据副本存放策略

    大数据处理当中,数据储存始终是一个重要的环节,从现阶段的市场现状来说,以Hadoop为首的大数据技术框架,仍然占据主流地位,而Hadoop的HDFS,在数据存储方面,仍然得到重用.今天的大数据入门分享 ...

  6. MyBatis中使用流式查询避免数据量过大导致OOM

    欢迎关注方志朋的博客,回复"666"获面试宝典 今天mybatis查询数据库中大量的数据,程序抛出: java.lang.OutOfMemoryError: Java heap s ...

  7. 大数据实验室(大数据基础培训)——基础概念

    2019独角兽企业重金招聘Python工程师标准>>> 为某企业做的培训,完整文档见:http://gudaoxuri.github.io/bd-lab/ 3. 大数据总揽 见大数据 ...

  8. php读取大文件某行内容,php读取大文件最后几行数据的实现代码

    /* * 读取大文件最后几行数据 * by www.jbxue.com */ $file = $handledir.'/venocap.1'; $fp = fopen($file, "r&q ...

  9. 命名管道 win7未响应_大数据分析Python建立分析数据管道

    如果您曾经想通过流数据或快速变化的数据在线学习Python,那么您可能会熟悉数据管道的概念.数据管道允许您通过一系列步骤将数据从一种表示形式转换为另一种表示形式.数据管道是数据工程的关键部分,我们将在 ...

  10. R语言使用hexbin包的hexbin函数可视化散点图、应对数据量太大、且有数据重叠的情况、普通散点图可视化效果变差的情况、提供了对六边形单元格的二元绑定、通过图例颜色标定每一个区域数据点的数量

    R语言使用hexbin包的hexbin函数可视化散点图.应对数据量太大.且有数据重叠的情况.普通散点图可视化效果变差的情况.hexbin函数提供了对六边形单元格的二元绑定.通过图例颜色标定每一个区域数 ...

最新文章

  1. PCL滤波介绍(3)
  2. LeetCode-笔记-231-2的幂
  3. c++ class struct同名_第二课C到C++的关系
  4. C ++中的POD类型是什么?
  5. 机房合作--gitee的使用
  6. 一个能够编写、运行SQL查询并可视化结果的Web应用:SqlPad
  7. Weird Flecks, But OK
  8. ubuntu php7 memcache,linux上安装php7 memcache扩展
  9. 1.12 改善你的模型的表现
  10. Atitit Elasticsearch6之elasticsearch5.x 新特性 目录 1.1. 其实,elasticsearch5.x 和 elasticsearch2.x 并不区别很大。 1
  11. office word 页码从任意页开始
  12. 如何进行网站代备案?
  13. 全球与中国医疗AR VR市场深度研究分析报告
  14. JSP导入导出Excel功能
  15. 2020年小红书母婴行业报告
  16. 计算机技术在医学领域的运用,计算机在医疗系统中的应用
  17. mysql eav_mysql – 如何使此eav查询生成水平结果
  18. 如何自学单片机? 单片机怎么入门?
  19. CentOS 7 解决网络不可用问题
  20. MySQL的基本知识点,一千行命令概括

热门文章

  1. 免费的在线Web文件管理器:Net2FTP,Pydio,eXtplorer,KodExplorer–功能强大
  2. 仿鱼爪新媒交易账号过户转让平台源码担保第三方账号交易系统公众号服务号抖音快手小红书
  3. 计算机学生如何创新,试论如何在计算机教育中培养学生的创新能力
  4. Mapbox简易入门教程
  5. 【android】项目案例(一)之超级课程表
  6. 手机 长按删除 html5,移动端长按删除
  7. (四)万能的搜索 —— 2. 解救小哈
  8. Maven项目右边依赖好多红色波浪线处理办法
  9. 牛客网之黑暗的字符串
  10. 大数据24小时:九章云极宣布获近亿元B轮融资,我国成功研发智能辅助驾驶系统