本节书摘来异步社区《大数据存储:MongoDB实战指南》一书中的第1章,第1.1节,作者: 郭远威 , 彭文波 责编: 陈冀康,更多章节内容可以访问云栖社区“异步社区”公众号查看。

1.1 什么是大数据

大数据存储:MongoDB实战指南
对于各种规模大小的组织机构而言,由于数据爆炸式的增长,传统的数据处理技术变得越来越难适应,需要有变革的技术来存储、分析这些大数据。谁能够掌握这些存储、分析技术,谁就有可能成为未来市场的主导者。财富500强公司在这个方面已走在前列,他们认识到大数据不仅仅是一门技术,而且是未来商业的发展趋势,并且已经开始从创新的大数据业务中受益。例如,企业能够分析用户的Web点击习惯,总结出用户喜好,进而有针对性地开展促销;政府部门能够利用大数据预测疾病的传播趋势,进而提前进行干预。

具体来说,大数据技术涉及到数据的创造、存储、获取和分析,数据的主要特点有以下几个。

数据量大。一个典型的PC机在2000年前后其存储空间可能有10GB,今天Facebook一天增加的数据量就将近有500TB;一架波音737的飞机围绕美国飞行一周将会产生240TB的数据;移动互联网的发展,智能手机的普及,人们每时每刻都在产生数以百万计的数据。

数据变化快。高速的股票交易市场,产生的数据以微秒计算;基础设施系统、实施系统每秒都产生大量的变化的日志,每秒都处理大量的并发。

数据多样性。大数据的类型不仅仅是简单的数字、日期和字符串,它可能包含地理数据、3D数据、音视频以及无结构的文档,而且这么多类型的数据可能需要保存在一起。

大数据技术的战略意义不仅在于掌握庞大的数据信息,而且也在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键在于提高对数据的“存储和加工能力”,通过“加工”实现数据的“增值”。大数据技术能够利用修改过的硬件取代原来高消耗和昂贵的老系统。由于许多大数据技术是开源的,它们实施起来更快且更便宜,例如,将它的数据存储技术迁移到MongoDB上来。

《大数据存储:MongoDB实战指南》一1.1 什么是大数据相关推荐

  1. 华为云大数据存储的冗余方式是三副本_阿里云大数据产品 | 大数据计算

    阿里云大数据计算产品包括MaxCompute.E-MapReduce和实时计算(Alibaba Cloud Realtime Compute). 一.MaxCompute 1.MaxCompute概述 ...

  2. 大数据分析的Python实战指南:数据处理、可视化与机器学习【上进小菜猪大数据】

    上进小菜猪,沈工大软件工程专业,爱好敲代码,持续输出干货. 引言: 大数据分析是当今互联网时代的核心技术之一.通过有效地处理和分析大量的数据,企业可以从中获得有价值的洞察,以做出更明智的决策.本文将介 ...

  3. emqtt数据存储mysql,数据存储 - MongoDB 消息存储 - 《EMQ X Enterprise v3.0 中文文档》 - 书栈网 · BookStack...

    MongoDB 消息存储 配置 MongoDB 消息存储 配置文件: emqx_backend_mongo.conf 配置 MongoDB 服务器 支持配置多台 MongoDB 服务器连接池:## M ...

  4. IoT 物联网海量时序数据存储最佳实战

    随着 5G/IoT 物联网技术的飞速发展,IoT 设备产生的时序数据也呈爆炸式增长,数据的总量(Volume).数据类型(Variety)越来越多.访问速度(Velocity)要求越来越快.对数据价值 ...

  5. B端数据表格设计实战指南(建议收藏)

    作者:nick (转载已取得作者授权) 1. 前言 在企业级中后产品中,通常大量使用表格来展示结构化的数据.合理地设计表格能给用户带来高效的信息获取率,但如何言而有物地设计表格,相信是绝大数刚入行B端 ...

  6. 单片机C语言数据存储原理,学习单片机C语言,必知的数据存储与程序编写知识!...

    一.五大内存分区 内存分成5个区,它们分别是堆.栈.自由存储区.全局/静态存储区和常量存储区. 1.栈区(stack):FIFO就是那些由编译器在需要的时候分配,在不需要的时候自动清除的变量的存储区. ...

  7. ElasticSearch高级 (Query DSL查询 bulk批量操作 导入数据 各种查询 实战技巧-优化比重 全量与增量数据同步)

    ElasticSearch高级 01-Query DSL(Domain Specific Language) 1 查询上下文 2 相关度评分:_score 3 元数据:_source 4 Query ...

  8. MongoDB实战指南(二):索引与查询优化

    数据库保存记录的机制是建立在文件系统上的,索引也是以文件的形式存储在磁盘上,在数据库中用到最多的索引结构就是B树.尽管索引在数据库领域是不可缺少的,但是对一个表建立过多的索引会带来一些问题,索引的建立 ...

  9. python大数据分析股票对比_Python大数据分析与挖掘实战 第7章 基于财务与交易数据的量化投资分析.pptx...

    ;随着我国证券市场的不断壮大,证券及证券投资在社会经济生活中的地位也越来越重要,上市公司的数量也不断增加,目前在上海证券交易所和深圳证券交易所上市交易的公司已经达到3700多家.投资者面对如此众多的不 ...

最新文章

  1. ​采访了14位技术公司的创始人,他们如何看待2020年的AI行业?
  2. docker pull时候太慢卡死
  3. Oracle中group by用法
  4. 【OpenCV】函数imread的使用之通道数变化
  5. Chrome Extension Dark Theme
  6. apache中怎么配置网站的默认首页
  7. php中写alter,MySQL之alter语句用法总结
  8. 设计模式之——单例模式(Singleton)的常见应用场景(转):
  9. mui ajax的值php怎样获取,关于mui.ajax的设置,以及php取不到data值的问题的方法
  10. 《深入浅出通信原理》学习(1-8)
  11. 关于诺顿误杀系统文件的解决方法
  12. C#坦克大战流程设计与源代码(1):基本对象类规划
  13. 51单片机c语言程序控制,51单片机C语言总结
  14. Android 项目总结(实现捕捉人脸)
  15. 如何在Mac上安全的下载BT
  16. Android开发——错误:远程主机强迫关闭一个现有连接——解决办法
  17. as 运行java_解决AndroidStudio无法运行java中的mian方法问题
  18. pip安装遇到警告which is not on PATH 不修改site.py也可解决
  19. 科技公司产品专利申请介绍
  20. API对接网关 code review

热门文章

  1. boost的chrono模块线程时钟的测试程序
  2. ITK:在灰度图像中标记连接的组件
  3. VTK:图表之ColorEdges
  4. VTK:几何对象之PlanesIntersection
  5. OpenCV imgproc直方图的实例(附完整代码)
  6. OpenCV离焦去模糊滤镜
  7. Qt Creator的配置
  8. C++ Heavy Light Decomposition重轻分解的实现算法(附完整源码)
  9. C++ kadane算法的实现之一(附完整源码)
  10. C语言实现了一个具有头结点的单链表(附完整源码)