大数据入门之学习视频资料分享
分享大数据学习交流群:722680258零基础中高级视频资料,欢迎加入不定期分享资源数据准备:需要学习大数据的伙伴加我群领取学习视频资料
- 结构化存储,固定Schema
- 索引
- 标准化查询语言
- ACID
- 扩展性弱
- Schema不固定,可以动态改变
- 没有固定查询语言
- 可以扩展到很大规模
- 高容错性
- 一般ACID在一个节点内,最终达到一致
- 批处理:MapReduce,Spark
- 交互式处理:Shark,Hive
- 流式计算:S4,Storm
- 迭代计算:Twister,Spark
- 图计算:Pregel,Giraph
- 内存计算:Dremel,Redis
- 特点:
- 典型系统 --Dremel、spark
- 最适合于完成大数据批处理的计算模式是MapReduce ,
- MapReduce 是一个单输入、两阶段( Map 和Reduce) 的数据处理过程。
- 对具有简单数据关系、易于划分的大规模数据采用"分而治之"的并行处理思想
- MapReduce 提供了一个统一的并行计算框架,把并行计算所涉及到的诸多系统层细节都交给计算框架去完成,
- 简化了程序员进行并行化程序设计的负担。
- 对一定时间窗口内应用系统产生的新数据完成实时的计算,避免造成数据堆积和丢失。
- 在电信、电力、道路监控、互联网日志处理等得到广泛应用。
- 数据运动,计算不动,不同的运算节点常常绑定在不同的服务器上
- 图由于自身的结构特征,可以很好地表示事物之间的关系
- 随着图中节点和边数的增多(达到几千万甚至上亿数), 图数据处理的复杂性增加
- 图的存储和处理都十分困难
- 较为典型的系统包括Google 公司的Pregel 、Facebook Giraph 、Spark 下的GraphX
- 联网安装、升级,非常方便
- 自动下载依赖软件包
- Hadoop生态系统包自动匹配,不需要你寻找与当前Hadoop匹配的Hbase,Flume,Hive等软件,Yum/Apt会根据当前安装Hadoop版本自动寻找匹配版本的软件包,并保证兼容性。
- 自动创建相关目录并软链到合适的地方(如conf和logs等目录);自动创建hdfs, mapred用户,hdfs用户是HDFS的最高权限用户,mapred用户则负责mapreduce执行过程中相关目录的权限。
- Consistency(一致性), 数据一致更新,所有数据变动都是同步的
- Availability(可用性), 好的响应性能
- Partition tolerance(分区容错性) 可靠性
- Hadoop这个开源产品的出现打破了对数据力量的压制
- Hadoop源于Nutch这个小型的搜索引擎项目。而Nutch则出自于著名的开源搜索引擎解决方案Lucene, Lucene则来源于对Google的学习模仿。
- HDFS是GFS的山寨版
- Map-Reduce的思想来源于Goolge对Page rank的计算方法
- HBase模仿的是Big Table
- Zookeeper则学习了Chubby
- Hadoop mapreduce
- Hadoop distributed file system
- Hadoop common 工具程序和子项目
- 基于Map/Reduce技术,可以对大量数据进行分布式处理的软件框架
- Google的网络搜索引擎在得益于算法发挥作用的同时,MapReduce在后台发挥了极大的作用。MapReduce框架成为当今大数据处理背后的最具影响力的“发动机”。
大数据入门之学习视频资料分享相关推荐
- 大数据-spark-hbase-hive等学习视频资料
不错的大数据spark学习资料,连接过期在评论区评论,再给你分享 https://pan.baidu.com/s/1ts6RNuFpsnc39tL3jetTkg 转载于:https://www.cnb ...
- 自学大数据入门全套学习资料(视频+课程大纲+笔记)
目录: 大数据课程导论 分布式技术 Apache Hadoop概述 Hadoop集群搭建 Hadoop初体验 Hadoop HDFS基准测试 学习目标 理解大数据相关概念.特点.应用场景 掌握大数据业 ...
- 大数据-数仓学习总结与分享
学习大数据的契机 原因 在学习之前的是一直在干java开发的,但是手头上有个比较大的项目,本来是到9月底的样子就应该结束的,但后面需求变更,导致系统需要大改,之前的那批人也都走的差不多了(几个团队 ...
- 人工智能,大数据,深度学习,机器学习(百度云581G学习资料免费分享)
人工智能视频学习 链接:https://pan.baidu.com/s/14HwJZhcYj6L7l3ROUMmqsQ 提取码:264a 复制这段内容后打开百度网盘手机App,操作更方便哦 机器学习 ...
- 好程序员大数据培训分享怎样进行大数据入门学习
好程序员大数据培训分享怎样进行大数据入门学习,对于大数据的入门学习,基础不一样,起点就会不一样. 今天先来说说,对于零基础的同学想要学习大数据的方式方法吧!很多人可能感到不可思议,零基础怎么可能学习大 ...
- AI:一个20年程序猿的学习资料大全—区块链/大数据/数据集/云计算/前沿大会资料——只有你不想要的,没有你找不到的
AI:一个20年程序猿的学习资料大全-区块链/大数据/数据集/云计算/前沿大会资料--只有你不想要的,没有你找不到的 目录 区块链 大数据资料 数据集 云计算资料 前沿大会资料报告 相关文章 ...
- 《黑马程序员2023新版黑马程序员大数据入门到实战教程,大数据开发必会的Hadoop、Hive,云平台实战项目》学习笔记总目录
本文是对<黑马程序员新版大数据入门到实战教程>所有知识点的笔记进行总结分类. 学习视频:黑马程序员新版大数据 学习时总结的学习笔记以及思维导图会在后续更新,请敬请期待. 前言:配置三台虚拟 ...
- 大数据入门培训之大数据开发基础知识学习
在目前相信大多数IT开发人员对于人工智能+大数据并不陌生,使用的场景也越来越广,日常开发中前端同学也逐渐接触了更多与大数据相关的开发需求.因此对大数据知识也有必要进行一些学习理解,带大家来学习了解一下 ...
- 大数据入门学习之环境搭建
一:环境搭建:VM.CentOS7安装及网络配置 大数据入门首先需要搭建环境,接下来的三篇文章均是环境搭建部分的内容. 首先我们要安装虚拟机及linux系统 一.安装虚拟机VM 官网下载VM虚拟机:这 ...
最新文章
- 深度学习框架 通道顺序
- 安装zookeeper集群及出现的问题
- 把数据保存到数据库附加表 `XX_addonarticle` 时出错,Duplicate entry 'X' for key 'PRIMARY'...
- 除非另外还指定了 TOP 或 FOR XML,否则,ORDER BY 子句在视图、内联函数、派生表、子查询...
- wine运行exe程序只出现了一个黑色长方形
- 非法的表达式开始_轮回、开始还是结束?
- sqlserver binary varbinary image 的区别
- 五、Spring中的@Import注解
- Python 2.5.1 切片
- 2021-05-17 吾日三省吾身
- Qcom ramdump 解析
- 芜湖计算机专业学校录取分数线,芜湖市各类高中2018年中考录取分数线是多少...
- 阿里巴巴实习一年之后的感悟
- 使用frp进行内网穿透
- BMC-web的介绍(一)
- v-model的基本使用
- PDM信号与PCM信号
- 你的头发一根都不许掉!这款变态洗发皂,7天发量暴增!男同事亲测,20天浓密乌黑!!...
- 什么是爬虫,常见的java爬虫框架有哪些?-蛙课网
- windows系统下超级好用的欧路词典,足以秒杀有道!
热门文章
- 读取word、pdf某些位置的值
- 完全二叉树和满二叉树
- Object.assign与vue $set
- 天津计算机专业专科大学排名,天津的计算机专业大学排名
- SSO单点登录解决方案——Filter方式
- 安装Dev c++后,编译文件出现未编译的解决方法
- 实体-关系联合抽取:Incremental Joint Extraction of Entity Mentions and Relations
- 相对定位的元素会在原先的地方
- SAR+L波段+森林生物量估计+高度反演
- 光伏储能容量优化MATLAB论坛,微电网中电池储能的容量配置及优化