大数据的产生:
为了解决数据量过大的问题
1)垂直扩展 :增加自己的硬件设施 但设备终归有极限;
2)横向扩展 :由多个服务器所一台一台连接起来的扩展方式,没有瓶颈,可以无限扩展,简单廉价的服务器或者PC端就可以

大数据的起源(鼻祖):google 的三大论文

GFS -------产生 HDFS分布式文件系统(分布式的存储)
MapReduce ---------分布式的处理
BigData --------- HBase (简单理解为仓库)

官网:https://hadoop.apache.org

Common ------- 里面类似于一些命令
YARN ------数据调度和集群资源管理的框架
HDFS --------综上
MapReduce -------综上 ------批处理

其他的一些项目:
Spark -----用于Hadoop数据的 快速通用计算引擎

1)spark core
2) sparkSQL —可以使用sql处理
3)sparkStreaming — 流式处理
4)mllib ----机器学习库
5) graphx -----spark停止维护

用于支撑HADOOP运行起来的技术
1)kafka
2) zookeeper—协调服务
3) flume 类似kafka ,但速度比kafka快,往往和KAFKA结合起来用
4) hive ------大型数据库 ----sql语句(专门用sql语句对大数据进行整合)
5)flink
6) storm
7) hbase

注:以上为市面上用的比较多的主流技术

补:HDFS的个人理解 (主从架构)
拿班级来举例子
班长----主节点(Namenode)
成员----从节点(Datanode)
学委---- client(可有可无)

存文件 -------hdfs的读写机制
读文件 -------hdfs的读写机制
备份-------为了解决安全问题

个人对大数据概念的理解(知识结构)相关推荐

  1. 什么是大数据,怎么理解和应对大数据时代

    什么是大数据,怎么理解和应对大数据时代 在大数据与深度学习中蝶化的人工智能.当代人工智能离不开大数据和深度学习算法.我们先来了解什么是大数据,大数据的本质是什么,在大数据时代我们应该如何应对? 当我们 ...

  2. 大数据-概念-应用-弊端

    一:大数据概念 大数据(big data,mega data),或称巨量资料,指的是需要新处理模式才能具有更强的决策力.洞察力和流程优化能力的海量.高增长率和多样化的信息资产. 在维克托·迈尔-舍恩伯 ...

  3. 大数据技术的理解误区

    大数据本身是基于数据价值化而构建出来的新概念,虽然概念比较新,但是数据却一直都在,所以大数据的核心并不在"大"上,而是基于大数据所构建出的一个新的价值空间.在理解大数据概念的时候, ...

  4. 大数据技术_ 基础理论 之 大数据概念与应用

    1.1 大数据的概念与意义 1.从"数据"到"大数据" 时至今日,"数据"变身"大数据","开启了一次重大的时 ...

  5. 分布式计算、云计算与大数据概论心得理解

    分布式计算.云计算与大数据概论心得理解 第一章 分布式计算概述 分布式计算的概念 分布式计算与其相关计算的发展趋势 集中计算(单机计算) 串行运算与并行运算简介 各种计算简介 网络计算 网格计算 分布 ...

  6. 2021年大数据基础(一):大数据概念

    2021大数据领域优质创作博客,带你从入门到精通,该博客每天更新,逐渐完善大数据各个知识体系的文章,帮助大家更高效学习. 有对大数据感兴趣的可以关注微信公众号:三帮大数据 目录 大数据概念 数据 常见 ...

  7. 大数据入门(一)-大数据概念和特点(1)

    一.大数据概念 大数据是指无法在一定时间范围内用常规软件工具进行捕捉.管理和处理的数据集合,是需要新处理模式才能具有更强的决策力.洞察发现力和流程优化能力的海量.高增长率和多样化的信息资产. 大数据主 ...

  8. 专栏:谈谈我对当下大数据整顿的理解与风控建议

    FAL金科应用研究院 专栏:谈谈我对当下大数据整顿的理解与风控建议 最近大数据行业爬虫业务监管调查风波刚稍有平息,又有P2P行业疑是被传"全军覆没",国家年前的整治力度可不谓不大. ...

  9. 大数据概论、大数据概念、大数据特点(4V)、Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、大数据应用场景、大数据发展前景、大数据部门间业务流程分析

    文章目录 1.大数据概念 2.大数据特点(4V) 2.1Volume(大量) 2.2Velocity(高速) 2.3Variety(多样) 2.4Value(低价值密度) 3.大数据应用场景 4.大数 ...

最新文章

  1. PHP7 学习笔记(七)如何使用zephir编译一个扩展记录
  2. Vim 自动文件头注释与模板定义
  3. python的shell无法输入_python中shell如何逐行输入?
  4. boost::hana::remove_if用法的测试程序
  5. Linux同步原语系列-spinlock及其演进优化
  6. 云小课|RDS实例连接又失败?看我祭出杀手锏!
  7. thinkPHP的Excel插件
  8. 宁波海曙区服务器维修,宁波市海曙区第二医院关于服务器(备份一体机) 1套的在线询价公告...
  9. java 字符串优化_Java字符串优化
  10. C++单元测试工具CppUnit使用简介 【转载】
  11. [转载] python3基础:异常处理及python常见异常类型总结
  12. java 按顺序读取文件夹_java读取某个文件夹下的所有文件实例代码
  13. python字典输出键值对_Python:遍历字典 键值对
  14. 动态爱心表白代码(绝对炫酷)
  15. 3d模型多怎么优化_高德地图又出逆天黑科技!全国各大城市模型直接获取
  16. city code table广东_【考试|定了!2021年广东高中学考安排来了】招生|高考|普通高中|英语_热点...
  17. Radysis ATCA-PP50板交换芯片配置
  18. 图数据库查询语言Cypher、Gremlin和SPARQL
  19. 通过OpenCV库实现基于FMM的图像修复概述
  20. 2020年数学建模国赛B题“穿越沙漠”思路

热门文章

  1. 安川服务器显示030,安川伺服驱动器常见故障报警代码解析
  2. mysql获取前一天日期_mysql中获取当前时间的前一天
  3. ERROR:TNS-12535: TNS: 操作超时
  4. [转]mitmproxy套件使用攻略及定制化开发
  5. python微信自动发消息_如何利用python3实现微信定时自动发消息和图片?
  6. NovAtel Inertial Explorer(历史版本)
  7. java remoteobject_RemoteObject使用 | 学步园
  8. 将首地址为MEM的100个字的数组中所有为0的项删除 ;并将后续项向前压缩,最后将数组剩余部分补上0。方法2!!!
  9. 如何写好新基建概念介绍总结PPT?
  10. 量子计算机 intel,Intel量子计算机技术 首次突破1开尔文