大数据入门-大数据是什么
目录
一、概念
二、特点
1.数据量大
2.数据时效性
3.数据多样性
4.数据价值低
三、国家发展促进
四、大数据岗位
一、概念
百度百科这样写道
大数据(big data),IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
其实大数据可以理解为大的数据。什么叫大的数据,首先数据量大,种类多,增长快,价值密度低,需要分析处理得出有价值的数据。我们技术人员一般讲大数据是指大数据技术,例如Hadoop等技术。
二、特点
1.数据量大
Volume:表示大数据的数据体量巨大。
数据集合的规模不断扩大,已经从 GB 级增加到 TB 级再增加到 PB 级,近年来,数据量甚至开始以 EB 和 ZB 来计数。例如微信,淘宝等网站的数据,全球几十亿人的数据都要处理。
2.数据时效性
Velocity:表示大数据的数据产生、处理和分析的速度在持续加快。
加速的原因是数据创建的实时性特点,以及将流数据结合到业务流程和决策过程中的需求。数据处理速度快,处理模式已经开始从批处理转向流处理。例如我们每天都要聊微信,每时每刻都要视频,这个数据都要实时进行传输,时效性在不断加快。
3.数据多样性
Variety:表示大数据的数据类型繁多。
传统 IT 产业产生和处理的数据类型较为单一,大部分是结构化数据。随着传感器、智能设备、社交网络、物联网、移动计算、在线广告等新的渠道和技术不断涌现,产生的数据类型无以计数。例如图片,视频等非结构化数据,都需要进行存储。
4.数据价值低
Value:表示大数据的数据价值密度低。
大数据由于体量不断加大,单位数据的价值密 度在不断降低,然而数据的整体价值在提高。以监控视频为例,在一小时的视频中,有用的数据可能仅仅只有一两秒,但是却会非常重要。现在许多专家已经将大数据等同于黄金和石油,这表示大数据当中蕴含了无限的商业价值。例如淘宝可以利用大数据来做推荐,百度可以利用大数据做竞价排名等。
三、国家发展促进
经李克强总理签批,2015年9月,国务院印发《促进大数据发展行动纲要》(以下简称《纲要》),系统部署大数据发展工作。
四、大数据岗位
大数据运维,大数据开发,数据仓库开发,数据分析等。
备注:以上资料来源于百度百科及网络,如有侵权请通知删除。
大数据入门-大数据是什么相关推荐
- 大数据入门-大数据技术概述(一)
目录 大数据入门系列文章 1.大数据入门-大数据是什么 一.概念 二.技术详解 1.基础架构:Hadoop 2.分布式文件系统:HDFS 3.数据仓库:Hive 4.存储引擎:Kudu 5.分布式数据 ...
- 大数据入门--大数据特点
大数据特点: ①volume(大量):数据量大. ②velocity(高速):框架在处理大数据是比传统的mysql要快很多. ③variety(多样化) ④value(低价值密度):大数据的处理特点有 ...
- 大数据入门--大数据概念,大数据是什么?
大数据是什么? 大数据(Big Data) :指无法在一定的时间范围内,用常规软件工具进行捕捉,管理和处理的数据集合.是需要新的处理模式,才能具有更强的决策力,洞察发现力和流程优化能力的海量,高增 ...
- 大数据入门推荐 - 数据之巅 大数据革命,历史、现实与未来等五本PDF
扫码时备注或说明中留下邮箱 付款后如未回复请至https://shop135452397.taobao.com/ 联系店主
- 大数据入门-什么是Kudu
目录 一.概念 二.架构 1.Master Server 2.Tablet Server 3.Table 4.Tablet 三.特性 1.重要性 2.易用性 3.优势 4.与传统关系型数据库比较 5. ...
- 大数据入门-三分钟读懂Hadoop
最近在收集整理大数据入门文章,各位盆友关注点赞不迷路,每天都要开心鸭! 大数据入门系列文章 1.大数据入门-大数据是什么 1.大数据入门-大数据是什么 2.大数据入门-大数据技术概述(一) 2.大数据 ...
- 大数据入门-五分钟读懂HDFS
目录 大数据入门系列文章 一.概念 二.架构及组件概念 三.读写流程 四.大白话 五.其他 大数据入门系列文章 最近在收集整理大数据入门文章,各位盆友关注点赞不迷路,每天都要开心鸭! 大数据入门系列文 ...
- 女友问粉丝过万如何庆祝,我发万字长文《保姆级大数据入门篇》感恩粉丝们支持,学姐|学妹|学弟|小白看了就懂
2021大数据领域优质创作博客,带你从入门到精通,该博客每天更新,逐渐完善大数据各个知识体系的文章,帮助大家更高效学习. 有对大数据感兴趣的可以关注微信公众号:三帮大数据 目录 粉丝破万了 新星计划申 ...
- 华为云大数据存储的冗余方式是三副本_大数据入门:HDFS数据副本存放策略
大数据处理当中,数据储存始终是一个重要的环节,从现阶段的市场现状来说,以Hadoop为首的大数据技术框架,仍然占据主流地位,而Hadoop的HDFS,在数据存储方面,仍然得到重用.今天的大数据入门分享 ...
最新文章
- 小型数控雕刻机制作Arduino_开一家全屋定制装修公司,怎么选择开料机与雕刻机?...
- linux socket API / bind
- javascript 校验 非空_JavaScript_form表单非空验证;
- Android 第三方有用的库收集
- 《Photoshop混合模式深度剖析》目录—导读
- Iview的Tabs设置居中
- mysql 查找相似数据_局部敏感哈希LSH(Locality-Sensitive Hashing)——海量数据相似性查找技术...
- 三个优秀的PyTorch实现语义分割框架
- React-Native学习指南 1
- 使用Block在两个界面之间传值
- 程序员面试金典——5.5整数转化
- kali字典_Web渗透测试——暴力破解字典制作工具的使用2
- 抱米花-豆丁文档下载器 20100529
- Python快速实现一个域名、IP信息聚合网站
- 计算机网络图片大全,说说心情图片大全唯美
- pyecharts绘制K线
- Unity让图片动起来
- Java对数组对象进行排序
- android图片播放器,android案例之图片播放器
- linux中grep的用法
热门文章
- 代码报错看不懂!你还用有道词典吗?程序员已经用插件上高速了!
- 使用 DMV 进行监视_监视连接_针对 Azure SQL 数据库和 Azure SQL 托管实例进行手动性能优化
- golang使用execCommand调用的时候子进程如何杀掉处理方法
- MM科目决定 Account Determination
- 机器学习 实验二 决策树
- 部署kubeedge-temperature-demo 示例亲测成功
- oracle rac环境下修改1521集群端口
- mysql优化 个人笔记 非礼勿扰 -m03
- python爬虫:爬取图片素材案例
- [双语阅读]克林顿女儿切尔西订婚