大数据入门级学习攻略
学习大数据的话,可以给你一个大纲,入门可以参考。
很多初学者,对大数据的概念都是模糊不清的,大数据是什么,能做什么,学的时候,该按照什么线路去学习,学完往哪方面发展,想深入了解,想学习的同学欢迎加入大数据学习qq群:868847735,有大量干货(零基础以及进阶的经典实战)分享给大家,并且有清华大学毕业的资深大数据讲师给大家免费授课,给大家分享目前国内最完整的大数据高端实战实用学习流程体系
一般的学习方法如下:
1、Linux命令基础实战
大数据架构体系结构及开源组件介绍 (要掌握)
Linux基本操作 (常见的Linux命令需要会)
2:Hadoop基础
Hadoop基础,对Hadoop架构、核心组件HDFS/YARN做了深入浅出的介绍,让你快速把握Hadoop的核心技术和工作原理,逐渐形成分布式思维;
Hadoop介绍
Hadoop运行模式
3:Hadoop集群搭建
Hadoop集群搭建——安装Linux虚拟机
Hadoop集群搭建——远程连接
Hadoop集群搭建(on Linux)——Hadoop(上)
Hadoop集群搭建(on Linux)——Hadoop(下)
Hadoop集群搭建(on Mac)——Hadoop
4:HDFS原理
番外篇-课程体系
HDFS架构原理
FS Shell命令介绍及实践
5:YARN工作原理
YARN的产生背景
YARN的设计思想
YARN的基本架构
YARN的工作流程(小结)
6:Sqoop
Sqoop,作为关系型数据库与Hadoop之间的桥梁,批量传输数据,让你自然的从关系型数据库过度到Hadoop平台,在关系型数据库与Hadoop之间游刃有余的进行数据导入导出;
Sqoop & Hive课程内容介绍
Sqoop介绍与安装
Sqoop的基本使用
Sqoop 导入参数详解
Sqoop导入实战
Sqoop增量导入(上)
Sqoop增量导入(下)
Sqoop导出实战(上)
Sqoop导出实战(下)
Sqoop Job
7:Hive
Hive,基于Hadoop大数据平台的数据仓库,可以让你实现传统数据仓库中的绝大部分数据处理、统计分析,让你在Hadoop大数据平台上感受到Hive QL带来的便利的交互式查询体验;Mars将以日志分析或其他示例带大家熟练掌握Hive的应用;
Hive架构介绍(一)
Hive架构介绍(二)
Hive环境搭建(一)
Hive环境搭建(二)
Hive CLI初探
Beeline介绍
Hive数据类型
Hive表一——标准建表语句解析&内、外表
Hive表二——文件及数据格式
Hive分区&桶&倾斜概念
Hive表——Alter
Hive视图&索引简介
Hive表——show & Desc命令
Hive数据导入--load
Hive数据导入--insert
Hive分区表实战
Hive复杂数据类型的嵌套实例
Hive源码阅读环境
Hive执行原理
Hive查询优化
UDF函数实例
Hive终极实例——日志分析
(1)网站日志分析的术语、架构介绍
(2)建表及数据准备
(3)数据处理及统计分析
(4)数据采集到统计分析结果的crontab定时调度
8:HBase
HBase,列式存储数据库,提供了快速的查询方式,是Apache Kylin的默认数据存储结果;
HBase介绍及架构
HBase安装
HBase操作实战
Hive与HBase集成实战
9:Kylin
Kylin,基于Hadoop的OLAP分析引擎,在Kylin中可以实现传统OLAP的各种操作,直接读取Hive的数据或流式数据作为数据源,把这些数据根据业务模型构建成Cube,Kylin提供了基于Hadoop(MapReduce)的Cube构建,Build完成的Cube数据直接存储于HBase中。Kylin提供了Web UI供查询,包括一些图表展现,是基于大数据的完美OLAP工具;
维度建模
Kylin背景及原理架构
Kylin环境搭建
维度建模知识
Kylin Cube Build步骤解析
Kylin Cube实战
Kylin 增量Cube
Kylin 优化
10:Spark
Spark,基于内存计算的大数据计算引擎,提供了Spark SQL、Spark MLlib(基于Spark的机器学习)、SparkR等框架适应不同的应用需求,Spark专题将和大家一起实践操作各种应用和算法;
Spark集群搭建
Spark Core
Spark WordCount(Spark-shell/pyspark..)
IDEA IntelliJ搭建Spark开发环境
Spark编程实例
Spark SQL及DataFrame
Spark SQL实例
Spark Streaming
Spark Streaming实例
Spark MLlib
Spark MLlib应用实例
Spark R介绍
可以基于每个模版去查一些相应的资料 及教程,然后按照操作即可。。。
大数据入门级学习攻略相关推荐
- 大数据入门级学习路线
一.学习技能 1.1 必备技能(10项) 01. Java高级(虚拟机.并发) 02. Linux操作 03. Hadoop V2.0 (分布式存储系统HDFS[redundant reliable ...
- Graphviz:利用可视化工具Graphviz将dot数据进行图像可视化或者图像保存(两大方法)之详细攻略
Graphviz:利用可视化工具Graphviz将dot数据进行图像可视化或者图像保存(两大方法)之详细攻略 目录 graph_feature函数:为给定的特征生成特征谱系图
- 学python数据挖掘自学路线图_学习攻略 | 数据挖掘工程师学习路线图
原标题:学习攻略 | 数据挖掘工程师学习路线图 最近秋招也已经慢慢接近尾声了,从去年 8 月底开始,先后参加了 datacastle ,阿里天池,牛客网各自举办的数据挖掘比赛(都是 top10 ),今 ...
- java转大数据的学习路线
不要错过文末彩蛋] 申明: 本文旨在为普通程序员(Java程序员最佳)提供一个入门级别的大数据技术学习路径,不适用于大数据工程师的进阶学习,也不适用于零编程基础的同学. 前言: 一.背景介绍 二.大数 ...
- 大数据工程师学习路线
转载来源:https://blog.csdn.net/GitChat/article/details/78341484 申明: 本文旨在为普通程序员(Java程序员最佳)提供一个入门级别的大数据技术学 ...
- 数学菜鸟的AI学习攻略 | 数学符号轻松入门
你是否跟我一样,自幼恨透数学. 现在,我终于发现了我对数学绝缘的最主要原因:我的老师从来不去回答最重要的问题:我为什么要学数学?学数学有什么用? 他们只是在黑板上写下一大堆方程,并让我记下来. 现在, ...
- 数学菜鸟的AI学习攻略——数学符号轻松入门
[ 导读 ] 自学AI的过程中,我们非常需要理解这些数学符号.它可以让你用一种非常简洁的方式来表达一个复杂的想法. 你是否跟我一样,自幼恨透数学. 现在,我终于发现了我对数学绝缘的最主要原因:我的老师 ...
- 后端学习攻略,助你打怪升级
大家好,我是辣条,好久不见,甚是想念,今天给大家带来一份后端的学习攻略,希望能帮助到你. 目录 一. 数据结构与算法 为什么数据结构很重要? 数据结构与算法相关数据推荐 视频推荐 二.计算机网络 为什 ...
- python全栈是什么_Python全栈数据工程师养成攻略 PDF 下载
相关截图: 图书简介: 本书首先介绍了数据工程和Python语法,随后讲解如何获取和存储数据,并实现简单的静态可视化.文本作为一种极其重要的数据类型,也单独列出一章行讨论.之后读者将学习到关于Web建 ...
最新文章
- vsftp和nfs服务
- 错误解决记录------------mysql连接本地数据库显示can't get hostname for your address
- ACM中java的使用
- ueditor配置文件配置自动段落缩进_vimrc里各种配置的含义
- mysql删除表崩溃_MySQL在删除表时I/O错误原因分析
- Tricks(四十二)—— 数据集分块
- java barchart_Bar Chart
- 基于SSL/TLS双向安全连接设备CA证书认证
- 酒香也怕巷子深,教你一招,轻松让百度收录你的个人站点
- 计算机长时间休眠后无法唤醒,为什么我电脑长时间不动进入待机状态却无法唤醒出现死机情况?必须强制关机!...
- 【HTTP】HTTP Authorization 之 Basic Auth 和 X-Auth-Token
- 基于matlab计算aom衍射效率,傅里叶望远镜大气湍流模拟实验
- ota升级包编译过程中firmware如何添加进来
- idea2021版本添加上一步和下一步操作到工具栏
- 26款JAVA毕设项目合集【java课设】
- Zigbee之旅(二):第一个CC2430程序——LED灯闪烁实验
- 玩赚你的网站-网站运营必备手册
- 为什么计算机中数字符号位0表示正数,1表示负数
- ASP.NET MVC5 多语言国际化
- 递归实现:一个人赶着鸭子去每个村庄卖,每经过一个 村子卖去所赶鸭子的一半又一只。 这样他经过了 七个村子后还剩 两只鸭子,问问他出发时共赶多少只鸭子?经过每个村子卖出多少只鸭子?