目录

一、概念

二、特点

1.数据量大

2.数据时效性

3.数据多样性

4.数据价值低

三、国家发展促进

四、大数据岗位


一、概念

百度百科这样写道

大数据(big data),IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

其实大数据可以理解为大的数据。什么叫大的数据,首先数据量大,种类多,增长快,价值密度低,需要分析处理得出有价值的数据。我们技术人员一般讲大数据是指大数据技术,例如Hadoop等技术。

二、特点

1.数据量大

Volume:表示大数据的数据体量巨大。

数据集合的规模不断扩大,已经从 GB 级增加到 TB 级再增加到 PB 级,近年来,数据量甚至开始以 EB 和 ZB 来计数。例如微信,淘宝等网站的数据,全球几十亿人的数据都要处理。

2.数据时效性

Velocity:表示大数据的数据产生、处理和分析的速度在持续加快。

加速的原因是数据创建的实时性特点,以及将流数据结合到业务流程和决策过程中的需求。数据处理速度快,处理模式已经开始从批处理转向流处理。例如我们每天都要聊微信,每时每刻都要视频,这个数据都要实时进行传输,时效性在不断加快。

3.数据多样性

Variety:表示大数据的数据类型繁多。

传统 IT 产业产生和处理的数据类型较为单一,大部分是结构化数据。随着传感器、智能设备、社交网络、物联网、移动计算、在线广告等新的渠道和技术不断涌现,产生的数据类型无以计数。例如图片,视频等非结构化数据,都需要进行存储。

4.数据价值低

Value:表示大数据的数据价值密度低。

大数据由于体量不断加大,单位数据的价值密 度在不断降低,然而数据的整体价值在提高。以监控视频为例,在一小时的视频中,有用的数据可能仅仅只有一两秒,但是却会非常重要。现在许多专家已经将大数据等同于黄金和石油,这表示大数据当中蕴含了无限的商业价值。例如淘宝可以利用大数据来做推荐,百度可以利用大数据做竞价排名等。

三、国家发展促进

经李克强总理签批,2015年9月,国务院印发《促进大数据发展行动纲要》(以下简称《纲要》),系统部署大数据发展工作。

四、大数据岗位

大数据运维,大数据开发,数据仓库开发,数据分析等。

备注:以上资料来源于百度百科及网络,如有侵权请通知删除。

大数据入门-大数据是什么相关推荐

  1. 大数据入门-大数据技术概述(一)

    目录 大数据入门系列文章 1.大数据入门-大数据是什么 一.概念 二.技术详解 1.基础架构:Hadoop 2.分布式文件系统:HDFS 3.数据仓库:Hive 4.存储引擎:Kudu 5.分布式数据 ...

  2. 大数据入门--大数据特点

    大数据特点: ①volume(大量):数据量大. ②velocity(高速):框架在处理大数据是比传统的mysql要快很多. ③variety(多样化) ④value(低价值密度):大数据的处理特点有 ...

  3. 大数据入门--大数据概念,大数据是什么?

    大数据是什么?   大数据(Big Data) :指无法在一定的时间范围内,用常规软件工具进行捕捉,管理和处理的数据集合.是需要新的处理模式,才能具有更强的决策力,洞察发现力和流程优化能力的海量,高增 ...

  4. 大数据入门推荐 - 数据之巅 大数据革命,历史、现实与未来等五本PDF

    扫码时备注或说明中留下邮箱 付款后如未回复请至https://shop135452397.taobao.com/ 联系店主

  5. 大数据入门-什么是Kudu

    目录 一.概念 二.架构 1.Master Server 2.Tablet Server 3.Table 4.Tablet 三.特性 1.重要性 2.易用性 3.优势 4.与传统关系型数据库比较 5. ...

  6. 大数据入门-三分钟读懂Hadoop

    最近在收集整理大数据入门文章,各位盆友关注点赞不迷路,每天都要开心鸭! 大数据入门系列文章 1.大数据入门-大数据是什么 1.大数据入门-大数据是什么 2.大数据入门-大数据技术概述(一) 2.大数据 ...

  7. 大数据入门-五分钟读懂HDFS

    目录 大数据入门系列文章 一.概念 二.架构及组件概念 三.读写流程 四.大白话 五.其他 大数据入门系列文章 最近在收集整理大数据入门文章,各位盆友关注点赞不迷路,每天都要开心鸭! 大数据入门系列文 ...

  8. 女友问粉丝过万如何庆祝,我发万字长文《保姆级大数据入门篇》感恩粉丝们支持,学姐|学妹|学弟|小白看了就懂

    2021大数据领域优质创作博客,带你从入门到精通,该博客每天更新,逐渐完善大数据各个知识体系的文章,帮助大家更高效学习. 有对大数据感兴趣的可以关注微信公众号:三帮大数据 目录 粉丝破万了 新星计划申 ...

  9. 华为云大数据存储的冗余方式是三副本_大数据入门:HDFS数据副本存放策略

    大数据处理当中,数据储存始终是一个重要的环节,从现阶段的市场现状来说,以Hadoop为首的大数据技术框架,仍然占据主流地位,而Hadoop的HDFS,在数据存储方面,仍然得到重用.今天的大数据入门分享 ...

最新文章

  1. 小型数控雕刻机制作Arduino_开一家全屋定制装修公司,怎么选择开料机与雕刻机?...
  2. linux socket API / bind
  3. javascript 校验 非空_JavaScript_form表单非空验证;
  4. Android 第三方有用的库收集
  5. 《Photoshop混合模式深度剖析》目录—导读
  6. Iview的Tabs设置居中
  7. mysql 查找相似数据_局部敏感哈希LSH(Locality-Sensitive Hashing)——海量数据相似性查找技术...
  8. 三个优秀的PyTorch实现语义分割框架
  9. React-Native学习指南 1
  10. 使用Block在两个界面之间传值
  11. 程序员面试金典——5.5整数转化
  12. kali字典_Web渗透测试——暴力破解字典制作工具的使用2
  13. 抱米花-豆丁文档下载器 20100529
  14. Python快速实现一个域名、IP信息聚合网站
  15. 计算机网络图片大全,说说心情图片大全唯美
  16. pyecharts绘制K线
  17. Unity让图片动起来
  18. Java对数组对象进行排序
  19. android图片播放器,android案例之图片播放器
  20. linux中grep的用法

热门文章

  1. 代码报错看不懂!你还用有道词典吗?程序员已经用插件上高速了!
  2. 使用 DMV 进行监视_监视连接_针对 Azure SQL 数据库和 Azure SQL 托管实例进行手动性能优化
  3. golang使用execCommand调用的时候子进程如何杀掉处理方法
  4. MM科目决定 Account Determination
  5. 机器学习 实验二 决策树
  6. 部署kubeedge-temperature-demo 示例亲测成功
  7. oracle rac环境下修改1521集群端口
  8. mysql优化 个人笔记 非礼勿扰 -m03
  9. python爬虫:爬取图片素材案例
  10. [双语阅读]克林顿女儿切尔西订婚