2021大数据领域优质创作博客,带你从入门到精通,该博客每天更新,逐渐完善大数据各个知识体系的文章,帮助大家更高效学习。

有对大数据感兴趣的可以关注微信公众号:三帮大数据

目录

大数据概念

数据

常见数据存储单位

大数据


大数据概念

最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,大数据是当前很热的一个词。这几年来,云计算、继而大数据,成了整个社会的热点,大数据究竟是什么东西?有哪些相关技术?对普通人的生活会有怎样的影响?我们来一步步弄清这些问题。

在讲什么是大数据之前,我们首先需要厘清数据的基本概念。

数据

数据是可以获取和存储的信息,直观而言,表达某种客观事实的数值是最容易被人们识别的数据(因为那是“数”)。但实际上,人类的一切语言文字、图形图画、音像记录,所有感官可以察觉的事物,只要能被记下来,能够查询到,就都是数据(data)。

随着互联网快速发展、智能手机以及“可佩带”计算设备的出现,我们的行为、位置,甚至身体生理数据等每一点变化都成为了可被记录和分析的数据。这些新技术推动着大数据时代的来临,各行各业每天都在产生数量巨大的数据碎片,数据计量单位已从Byte、KB、MB、GB、TB发展到PB、EB、ZB、YB甚至BB来衡量。

常见数据存储单位

1Byte = 8bit    1K(千)= 1024Byte  1MB(兆)=1024K  1G(吉) = 1024M

1T(太)=1024G   1P(拍)=1024T     1E(艾)=1024P     1Z(泽)=1024E

1Y (尧)=1024Z   1B(布)=1024Y     1N(诺)=1024B    1D(刀)=1024N

大数据

大数据(big data),是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

数据分析的前提是有数据,数据存储的目的是支撑数据分析。究竟怎么去存储庞大的数据量,是开展数据分析的企业在当下面临的一个问题。传统的数据存储模式存储容量是有大小限制或者空间局限限制的,怎么去设计出一个可以支撑大量数据的存储方案是开展数据分析的首要前提。

当解决了海量数据的存储问题,接下来面临的海量数据的计算问题也是比较让人头疼,因为企业不仅追求可以计算,还会追求计算的速度、效率。

以目前互联网行业产生的数据量级别,要处理这些数据,就需要一个更好、更便捷的分析计算方式了。传统的显然力不从心了,而且效率也会非常低下。这正是传统数据分析领域面临的另一个挑战,如何让去分析、计算。这个时候就需要有新的技术去解决这些问题,这个技术就是大数据。

大数据主要解决的问题: 海量数据的存储和海量数据的计算问题

2021年大数据基础(一):大数据概念相关推荐

  1. 【大数据】大数据基础知识科普--数据分层

    大数据基础知识科普–数据分层 (ETL.ODS.DW.DWD.DWM.DWS.DIM) 零.数据加载层:ETL(Extract-Transform-Load) 一.数据操作层:ODS(Operatio ...

  2. 大数据基础——Hadoop大数据平台搭建

    文章目录 前言 Hadoop大数据平台搭建 一.Hadoop原理和功能介绍 二.Hadoop安装部署 三.Hadoop常用操作 总结 前言 分布式机器学习为什么需求大数据呢?随着海量用户数据的积累,单 ...

  3. 大数据基础--学好大数据必看的文章

    大数据的项目流程 数据生产 数据采集 数据存储 需求分析 数据预处理 数据计算 数据存储 8.结果展现 大数据基础知识 目录 什么是服务器? 什么是RAID? 什么是集群? 什么是网络? 什么是交换机 ...

  4. 云计算与大数据基础之大数据

    什么是大数据 维基百科将大数据描述为: 大数据是现有数据库管理工具和传统数据处理应用很难处理的大型.复杂的数据集,大数据的挑战包括采集.存储.搜索.共享.传输.分析和可视化等. 大数据的"大 ...

  5. 大数据基础知识科普--数据分层(ETL、ODS、DW、DWD、DWM、DWS、DIM)

    零.数据加载层:ETL(Extract-Transform-Load) 一.数据运营层:ODS(Operational Data Store) 二.数据仓库层:DW(Data Warehouse) 1 ...

  6. 数据可视化系列-04数据大屏基础知识

    文章目录 5.销售数据看板 5.1 了解数据大屏基础知识 1.数据大屏简介: 2.数据大屏使用场景 3.数据大屏分类 5.2 数据大屏的设计: 1.大屏前端设计流程 2.数据大屏设计尺寸解析 3.可视 ...

  7. 大数据基础中台-数据仓库建设

    一.数据模型架构原则 数仓分层原则 优秀可靠的数仓体系,往往需要清晰的数据分层结构,即要保证数据层的稳定又要屏蔽对下游的影响,并且要避免链路过长.那么问题来了,一直在讲数仓要分层,那数仓分几层最好? ...

  8. 神策数据丨7 大分析云案例,揭开 232 亿美元市场的秘密

    数据分析已经成为企业必需的基本能力,业务的开展也越来越离不开分析工具的参与.随着技术的发展,分析工具也逐步演进为可覆盖多维度.多场景的平台化产品,比如分析云. 先进的分析云不仅能输出静态的数据洞察,还 ...

  9. 【大数据分析1】大数据基础理论

    大数据分析-考点 序号 大分类 分类 掌握程度 内容 完成进度 备注 1 大数据基础理论 大数据分析基础 领会 大数据技术诞生技术背景 大数据技术实际应用 分布式处理技术概念 数据分析和数据挖掘的概念 ...

  10. 什么是大数据 究竟多大才算是大数据,大数据怎么学习?

    大数据,什么是大数据呢?多大的数据叫大数据?红火一时的数据分析走向了我们,纷纷称不分析数据企业将长久不了,可是究竟什么样的数据才是大数据呢,什么样的数据才是最大的呢? 如果你没有接触过大数据,那么你就 ...

最新文章

  1. 2021-2027年中国一氧化氮行业市场研究及前瞻分析报告
  2. LSM 优化系列(四) -- Rocksdb和Lethe 对Delete问题的优化
  3. 我的编码习惯 —— API 接口定义
  4. 注解_自定义注解_元注解
  5. 0xFFFFFF的问题
  6. SpringMVC之控制器的单例和多例管理
  7. 深度松下MTS视频恢复软件 v8.1.0
  8. Spring Boot整合Swagger3的分组问题
  9. 创业项目筹备了两个多月,确实不容易
  10. np.memmap读取大文件
  11. “思考”绝非一时的想法——读大前研一《思考的技术》
  12. OpenCV学习(13) 细化算法(1)(转)
  13. MySQL主从复制: MHA
  14. 用于制作app store的截图的工具:Brief Wrapper —— 最便捷的应用商店屏幕快照
  15. Docx4j简单学习
  16. 三十而立程序员天马行空的心理路程(迷茫/焦虑)
  17. C++/openCV修改视频分辨率
  18. 最新Java面试题整理!java字符大写转小写
  19. 看脸、听话,飞猪未来酒店就是这么好住
  20. JVM内置函数intrinsics简介

热门文章

  1. rancher部署项目Validation failed in API: Deployment.apps“”must be no more than 63 characters问题原因及解决方法
  2. 2022-2028年中国水基胶行业市场深度评估及前瞻研究报告
  3. Go 学习笔记(64)— Go error.New 创建接口错误对象、fmt.Errorf 创建接口错误对象、errors.Is 和 errors.As
  4. vue实现文件上传功能
  5. 用心真诚对待,懂你的人
  6. xshell问题汇总
  7. 各种注意力机制PyTorch实现
  8. AndroidSDK结合SpringBoot实现支付宝支付功能
  9. 全文翻译(一):TVM: An Automated End-to-End Optimizing Compiler for Deep Learning
  10. 如何构建虚拟护士应用程序?