大数据系列整个课程课程大纲
大数据体系结构(开源组件介绍),让你对当前大数据技术栈一目了然;
Linux命令基础实战;
Hadoop基础,对Hadoop架构、核心组件HDFS/YARN做了深入浅出的介绍,让你快速把握Hadoop的核心技术和工作原理,逐渐形成分布式思维;
Sqoop,作为关系型数据库与Hadoop之间的桥梁,批量传输数据,让你自然的从关系型数据库过度到Hadoop平台,在关系型数据库与Hadoop之间游刃有余的进行数据导入导出;
Hive,基于Hadoop大数据平台的数据仓库,可以让你实现传统数据仓库中的绝大部分数据处理、统计分析,让你在Hadoop大数据平台上感受到Hive QL带来的便利的交互式查询体验;Mars将以日志分析或其他示例带大家熟练掌握Hive的应用;
HBase,列式存储数据库,提供了快速的查询方式,是Apache Kylin的默认数据存储结果;
Kylin,基于Hadoop的OLAP分析引擎,在Kylin中可以实现传统OLAP的各种操作,直接读取Hive的数据或流式数据作为数据源,把这些数据根据业务模型构建成Cube,Kylin提供了基于Hadoop(MapReduce)的Cube构建,Build完成的Cube数据直接存储于HBase中。Kylin提供了Web UI供查询,包括一些图表展现,是基于大数据的完美OLAP工具;
Spark,基于内存计算的大数据计算引擎,提供了Spark SQL、Spark MLlib(基于Spark的机器学习)、SparkR等框架适应不同的应用需求,Spark专题将和大家一起实践操作各种应用和算法;
转载于:https://www.cnblogs.com/rxbook/p/6024474.html
大数据系列整个课程课程大纲相关推荐
- 大数据系列修炼-Scala课程65
大数据系列修炼-Scala课程65 核心内容:Scala中的隐式转换操作规则与如何更好的使用隐式转换操作代码实战 1.Scala中的隐式转换操作规则与如何更好的使用隐式转换操作代码实战 1>Sc ...
- 大数据系列修炼-Scala课程96(2)
大数据系列修炼-Scala课程96(2) 核心内容: 1.Akka第一个案例动手实战代码总结 1.Akka第一个案例动手实战代码总结 Akka案例之WordCount完整代码: import akka ...
- 大数据系列修炼-Scala课程101
大数据系列修炼-Scala课程101 核心内容: 1.使用SBT开发Akka第一个案例源码解析MapActor.ReduceActor.AggregateActor 1.使用SBT开发Akka第一个案 ...
- 大数据系列修炼-Scala课程07
由于昨天下班后有点困,就没有来及写博客,今天会把它补上!把这个习惯坚持下去! 关于Scala高阶函数详解 1.Scala高阶函数代码实现:高阶函数就是在我们函数中套用函数 2.高阶函数代码详解:高阶函 ...
- 大数据系列修炼-Scala课程05
核心内容: 1.Map实战 2.Tuple实战 3.zip操作实战 1.Map实战 (1)Map映射在实际中用的非常广泛,通常用到的配置信息都是以映射的方式来呈现的,即以键值对的方式来呈现 (2)Ma ...
- python编写spark程序 视频_【Python版pyspark】Spark大数据基础入门视频课程
[注意:本课程只包含pyspark系列课程的基础入门部分] Python版本的pyspark是学习Python的人的福音,为广大的Python开发人员提供了一个使用Python调用Spark接口处理大 ...
- 推荐 :数据科学与大数据技术专业特色课程研究
在我国,数据科学与大数据技术专业的建设已成为新的热点话题.在系统调研世界一流大学数据科学专业建设现状的基础上,从特色课程视角重点分析加州大学伯克利分校.约翰·霍普金斯大学.华盛顿大学.纽约大学.斯坦福 ...
- 专题导读:新工科背景下的大数据人才培养及课程体系设计
专题:新工科背景下的大数据人才培养及课程体系设计 导读: 当今社会已进入大数据时代,为了顺应时代发展的潮流,国内外各类高校陆续开始聚焦大数据,布局新学科,加快人才培养的步伐.目前教育部已经正式批 准2 ...
- 哈工大《大数据计算基础》课程资料链接
哈工大<大数据计算基础>课程资料链接 这里列举一下笔者当时复习时候参考的学长的火炬的链接 复习链接 算法复习的链接 系统复习的链接 往年考试回忆链接 2021年的 2020年的
- map根据value值排序_凯哥带你从零学大数据系列之Java篇---第十九章:集合(Map+Collections)...
温馨提示:如果想学扎实,一定要从头开始看凯哥的一系列文章(凯哥带你从零学大数据系列),千万不要从中间的某个部分开始看,知识前后是有很大关联,否则学习效果会打折扣. 系列文章第一篇是拥抱大数据:凯哥带你 ...
最新文章
- mac 查看端口_黑客克星养成记 系列二:MAC-Flooding原理及解决方案
- Silverlight Telerik RadGridView动态增删行及行列操作(转载)
- 在keil中使用头文件实现多文件编程
- 大学python教材实验七字典与集合答案_2018-08-28 day7 python基础 字典和集合(含作业)...
- Go语言中查询SqlServer数据库
- java的3个初始化_通过实例解析Java类初始化和实例初始化
- ubuntu之find方法
- 计算机学院李世杰,有关办理2016级转专业学生相关手续通知
- Qt奇淫技巧-使用QSharedMemory方式实现数据跨界面传输
- Bootstrap4代码模板
- 区间DP--凸多边形三角剖分
- 支付宝小程序升级,一统阿里大生态!
- Web API-时间对象和戳
- 错误调试:Your CPU supports instructions that this TensorFlow binary was not compiled to use: SSE4.1 SSE4
- 【优化预测】基于matlab遗传算法优化极限学习机ELM预测【含Matlab源码 1673期】
- RFB-Net论文解读
- Pyqt walk 在Windows查找文件
- 鸢尾花lris数据集的SVM线性分类
- 微信电子健康卡开放平台接口对接
- Terry-Ye/im 系统使用zookeeper