大数据入门之什么是大数据?
文章目录
- 1.什么是大数据?
- 字面意思:
- 专业解释:
- 再专业点:
- 2.大数据的特点-- 4V(Volume,Velocity,Variety)?
- 2.1Volume(大量)
- 2.2 Velocity(高速)
- 2.3 Variety(多样)
- 2.4 Value(低价值密度)
- 3.大数据主要做什么?
- 4.大数据的应用场景
- 5.大数据未来的发展前景如何
- 6.总结一下
- 什么是大数据?
- 大数据有什么特点?
- 大数据能做什么?
- 大数据的前景:
1.什么是大数据?
字面意思:
- 大量的数据,海量的数据
- 一般我们的数据都是以处理M丶G丶T等单位(一首歌曲的大小约在4Mb,1024M=1G,1024G=1T)的数据,大数据一般都是在处理PB及PB以上的数据,进行储存,分析计算等
专业解释:
- 数据集的大小已经远远超过了现有普通数据库软件和工具的处理能力的数据
再专业点:
- 指无法在一定时间范围内用常规软件工具进行捕捉丶管理和处理的数据集合,是需要新处理模式才能具有更强的决策力丶洞察发现力和流程优化的海量丶高增长率和多样化的信息资产。
- 主要解决海量数据的存储和海量数据的分析计算问题
2.大数据的特点-- 4V(Volume,Velocity,Variety)?
2.1Volume(大量)
- 通俗点说:数据量大,多
- 截止目前,人类生产的所有印刷材料的数量是200PB,而历史上全人类总共说过的话的数据量大约是5EB,当前,典型个人计算机硬盘的容量为TB级,而一些大企业的数据量已经接近EB量级
2.2 Velocity(高速)
- 数据的增长速度快
- 这是大数据区分传统数据挖掘的最显著特征,根据IDC的"数字宇宙"的报告,预计到2020年,全球数据使用量将达到35.2ZB,在如此海量的数据面前,处理数据的效率就是企业的生命
- 天猫双十一:开场2分5秒,总交易额超100亿元;全天总交易额:2135亿元
2.3 Variety(多样)
- 结构化数据,半结构化数据,和非结构化数据
- 这种类型的多样化也让数据被分为结构化数据和非结构化数据.相当于以往便于存储的以数据库/文本为主的结构化数据,非结构化数据越来越多,包括网络日志,音频,视频,图片,地理位置信息等,这些多类型的数据对数据的处理能力提出了更高的要求
2.4 Value(低价值密度)
- 海量数据价值高
- 价值密度的高低与数据总量的大小成反比,如何快速对有价值数据"提纯"称为目前大数据背景下待解决的难题.
3.大数据主要做什么?
主要作用 |
---|
海量数据快速查询 |
海量数据的存储(数据量大,单个大文件) |
海量数据的快速计算(与传统的工具对比) |
海量数据实时计算(立刻马上) |
数据挖掘(挖掘以前没有发现的有价值的数据) |
4.大数据的应用场景
5.大数据未来的发展前景如何
大数据技术目前正处在落地应用的初期,从大数据自身发展和行业发展的趋势来看,大数据未来的前景还是不错的,具体原因有以下几点:
- 第一:大数据自身能够创造出更多的价值。大数据相关技术紧紧围绕数据价值化展开,数据价值化将开辟出广大的市场空间,重点在于数据本身将为整个信息化社会赋能。随着大数据的落地应用,大数据的价值将逐渐得到体现。目前在互联网领域,大数据技术已经得到了较为广泛的应用。
- 第二:大数据推动科技领域的发展。大数据的发展正在推动科技领域的发展进程,大数据的影响不仅仅体现在互联网领域,也体现在金融、教育、医疗等诸多领域。在人工智能研发领域,大数据也起到了重要的作用,尤其在机器学习、计算机视觉和自然语言处理等方面,大数据正在成为智能化社会的基础。
- 第三:大数据产业链逐渐形成。经过近些年的发展,大数据已经初步形成了一个较为完整的产业链,包括数据采集、整理、传输、存储、分析、呈现和应用,众多企业开始参与到大数据产业链中,并形成了一定的产业规模,相信随着大数据的不断发展,相关产业规模会进一步扩大。
- 第四:产业互联网将推动大数据落地。当前互联网正在经历从消费互联网向产业互联网过渡,产业互联网将利用大数据、物联网、人工智能等技术来赋能广大的传统产业,可以说产业互联网的发展空间非常大,而大数据则是产业互联网发展的一个重点,大数据能否落地到传统行业,关乎产业互联网的发展进程,所以在产业互联网阶段,大数据将逐渐落地,也必然落地。
通过以上分析可以得出,未来大数据领域的发展空间还是比较大的,而且目前大数据领域的人才缺口比较大,所以从就业的角度来说,当前学习大数据相关知识是个不错的选择。
6.总结一下
什么是大数据?
字面意思理解:大量的数据,海量的数据
数据集的大小已经远远超过了现有普通数据库软件和工具的处理能力的数据
大数据有什么特点?
海量化
数据量大(多)
多样化
结构化数据,半结构化数据,和非结构化数据
快速化
数据的增长速度快
高价值
海量数据价值高
大数据能做什么?
1、海量数据快速查询
2、海量数据的存储(数据量大,单个大文件)
3、海量数据的快速计算(与传统的工具对比)
4、海量数据实时计算(立刻马上)
5、数据挖掘(挖掘以前没有发现的有价值的数据)
大数据的前景:
好,不错,verygood!
本篇文章就到这里,下期再见! 喜欢给个关注点赞啊
大数据入门之什么是大数据?相关推荐
- 大模型入门(三)—— 大模型的训练方法
参考hugging face的文档介绍:https://huggingface.co/docs/transformers/perf_train_gpu_many#naive-model-paralle ...
- 大数据入门-大数据技术概述(一)
目录 大数据入门系列文章 1.大数据入门-大数据是什么 一.概念 二.技术详解 1.基础架构:Hadoop 2.分布式文件系统:HDFS 3.数据仓库:Hive 4.存储引擎:Kudu 5.分布式数据 ...
- 大数据入门-什么是Kudu
目录 一.概念 二.架构 1.Master Server 2.Tablet Server 3.Table 4.Tablet 三.特性 1.重要性 2.易用性 3.优势 4.与传统关系型数据库比较 5. ...
- 大数据入门-三分钟读懂Hadoop
最近在收集整理大数据入门文章,各位盆友关注点赞不迷路,每天都要开心鸭! 大数据入门系列文章 1.大数据入门-大数据是什么 1.大数据入门-大数据是什么 2.大数据入门-大数据技术概述(一) 2.大数据 ...
- 好程序员大数据培训分享怎样进行大数据入门学习
好程序员大数据培训分享怎样进行大数据入门学习,对于大数据的入门学习,基础不一样,起点就会不一样. 今天先来说说,对于零基础的同学想要学习大数据的方式方法吧!很多人可能感到不可思议,零基础怎么可能学习大 ...
- 零基础小白的大数据入门手册
零基础小白的大数据入门手册,学大数据前,大家可能听过不少说大数据难学.入行做好心理准备的.大家听完也很动摇很犹豫,怀疑自己能不能学好大数据.这其实完全没有必要,觉得一个东西难,百分之八十的原因是你不了 ...
- 大数据入门-五分钟读懂HDFS
目录 大数据入门系列文章 一.概念 二.架构及组件概念 三.读写流程 四.大白话 五.其他 大数据入门系列文章 最近在收集整理大数据入门文章,各位盆友关注点赞不迷路,每天都要开心鸭! 大数据入门系列文 ...
- 出行大数据,滴滴发布400城数据可视化分析
转 一:出行大数据,滴滴发布400城数据可视化分析 2018年01月04日 00:00:00 https://blog.csdn.net/zw0Pi8G5C1x/article/details/789 ...
- 女友问粉丝过万如何庆祝,我发万字长文《保姆级大数据入门篇》感恩粉丝们支持,学姐|学妹|学弟|小白看了就懂
2021大数据领域优质创作博客,带你从入门到精通,该博客每天更新,逐渐完善大数据各个知识体系的文章,帮助大家更高效学习. 有对大数据感兴趣的可以关注微信公众号:三帮大数据 目录 粉丝破万了 新星计划申 ...
最新文章
- c语言 狸抓兔子,捕捉猫狸的方法-
抓野猫的最好方法
- CentOS 6.0安装VNC Server
- 如何创建自己的docker image并上传到DockerHub上
- vb如何测试连接mysql_怎么在vb程序中查找数据库信息并显示
- VS2013安装MVC5
- VMware文件扩展名
- CecOS v1.4 中文企业云操作系统 管理员及用户指南发布
- uploadify插件的使用
- Kubernetes如何赋能可再生能源产业提升10倍效率
- 一天一小步_我学C#入门精典_第八天
- 同样是OpenJDK8,有的平台需要libpng12,有的不需要
- 4g 控矿驱动 迪兰rx574_用结果说话 篇四:迪兰RX580 2048SP 4G X-Serial战将i7-8700与R5 2400G双平台体验点评...
- “汇新杯”科技+社会公益专项赛介绍
- 量化交易——双均线策略(金叉死叉)
- 免费地图大战?阿里上将高德百度元帅百度地图
- 无人机航测技术在地形测绘中的应用
- guzzle 请求本地地址
- 安装MYSQL-8.0.30和MYSQL-5.7.28
- bat批处理脚本入门
- EpilepsyGAN:具有隐私保护的合成癫痫脑活动-2021(同26)