学习大数据的话,可以给你一个大纲,入门可以参考。

很多初学者,对大数据的概念都是模糊不清的,大数据是什么,能做什么,学的时候,该按照什么线路去学习,学完往哪方面发展,想深入了解,想学习的同学欢迎加入大数据学习qq群:868847735,有大量干货(零基础以及进阶的经典实战)分享给大家,并且有清华大学毕业的资深大数据讲师给大家免费授课,给大家分享目前国内最完整的大数据高端实战实用学习流程体系

一般的学习方法如下:

1、Linux命令基础实战

大数据架构体系结构及开源组件介绍 (要掌握)

Linux基本操作 (常见的Linux命令需要会)

2:Hadoop基础

Hadoop基础,对Hadoop架构、核心组件HDFS/YARN做了深入浅出的介绍,让你快速把握Hadoop的核心技术和工作原理,逐渐形成分布式思维;

Hadoop介绍

Hadoop运行模式

3:Hadoop集群搭建

Hadoop集群搭建——安装Linux虚拟机

Hadoop集群搭建——远程连接

Hadoop集群搭建(on Linux)——Hadoop(上)

Hadoop集群搭建(on Linux)——Hadoop(下)

Hadoop集群搭建(on Mac)——Hadoop

4:HDFS原理

番外篇-课程体系

HDFS架构原理

FS Shell命令介绍及实践

5:YARN工作原理

YARN的产生背景

YARN的设计思想

YARN的基本架构

YARN的工作流程(小结)

6:Sqoop

Sqoop,作为关系型数据库与Hadoop之间的桥梁,批量传输数据,让你自然的从关系型数据库过度到Hadoop平台,在关系型数据库与Hadoop之间游刃有余的进行数据导入导出;

Sqoop & Hive课程内容介绍

Sqoop介绍与安装

Sqoop的基本使用

Sqoop 导入参数详解

Sqoop导入实战

Sqoop增量导入(上)

Sqoop增量导入(下)

Sqoop导出实战(上)

Sqoop导出实战(下)

Sqoop Job

7:Hive

Hive,基于Hadoop大数据平台的数据仓库,可以让你实现传统数据仓库中的绝大部分数据处理、统计分析,让你在Hadoop大数据平台上感受到Hive QL带来的便利的交互式查询体验;Mars将以日志分析或其他示例带大家熟练掌握Hive的应用;

Hive架构介绍(一)

Hive架构介绍(二)

Hive环境搭建(一)

Hive环境搭建(二)

Hive CLI初探

Beeline介绍

Hive数据类型

Hive表一——标准建表语句解析&内、外表

Hive表二——文件及数据格式

Hive分区&桶&倾斜概念

Hive表——Alter

Hive视图&索引简介

Hive表——show & Desc命令

Hive数据导入--load

Hive数据导入--insert

Hive分区表实战

Hive复杂数据类型的嵌套实例

Hive源码阅读环境

Hive执行原理

Hive查询优化

UDF函数实例

Hive终极实例——日志分析

(1)网站日志分析的术语、架构介绍

(2)建表及数据准备

(3)数据处理及统计分析

(4)数据采集到统计分析结果的crontab定时调度

8:HBase

HBase,列式存储数据库,提供了快速的查询方式,是Apache Kylin的默认数据存储结果;

HBase介绍及架构

HBase安装

HBase操作实战

Hive与HBase集成实战

9:Kylin

Kylin,基于Hadoop的OLAP分析引擎,在Kylin中可以实现传统OLAP的各种操作,直接读取Hive的数据或流式数据作为数据源,把这些数据根据业务模型构建成Cube,Kylin提供了基于Hadoop(MapReduce)的Cube构建,Build完成的Cube数据直接存储于HBase中。Kylin提供了Web UI供查询,包括一些图表展现,是基于大数据的完美OLAP工具;

维度建模

Kylin背景及原理架构

Kylin环境搭建

维度建模知识

Kylin Cube Build步骤解析

Kylin Cube实战

Kylin 增量Cube

Kylin 优化

10:Spark

Spark,基于内存计算的大数据计算引擎,提供了Spark SQL、Spark MLlib(基于Spark的机器学习)、SparkR等框架适应不同的应用需求,Spark专题将和大家一起实践操作各种应用和算法;

Spark集群搭建

Spark Core

Spark WordCount(Spark-shell/pyspark..)

IDEA IntelliJ搭建Spark开发环境

Spark编程实例

Spark SQL及DataFrame

Spark SQL实例

Spark Streaming

Spark Streaming实例

Spark MLlib

Spark MLlib应用实例

Spark R介绍

可以基于每个模版去查一些相应的资料 及教程,然后按照操作即可。。。

大数据入门级学习攻略相关推荐

  1. 大数据入门级学习路线

    一.学习技能 1.1 必备技能(10项) 01. Java高级(虚拟机.并发) 02. Linux操作 03. Hadoop V2.0 (分布式存储系统HDFS[redundant reliable ...

  2. Graphviz:利用可视化工具Graphviz将dot数据进行图像可视化或者图像保存(两大方法)之详细攻略

    Graphviz:利用可视化工具Graphviz将dot数据进行图像可视化或者图像保存(两大方法)之详细攻略 目录 graph_feature函数:为给定的特征生成特征谱系图

  3. 学python数据挖掘自学路线图_学习攻略 | 数据挖掘工程师学习路线图

    原标题:学习攻略 | 数据挖掘工程师学习路线图 最近秋招也已经慢慢接近尾声了,从去年 8 月底开始,先后参加了 datacastle ,阿里天池,牛客网各自举办的数据挖掘比赛(都是 top10 ),今 ...

  4. java转大数据的学习路线

    不要错过文末彩蛋] 申明: 本文旨在为普通程序员(Java程序员最佳)提供一个入门级别的大数据技术学习路径,不适用于大数据工程师的进阶学习,也不适用于零编程基础的同学. 前言: 一.背景介绍 二.大数 ...

  5. 大数据工程师学习路线

    转载来源:https://blog.csdn.net/GitChat/article/details/78341484 申明: 本文旨在为普通程序员(Java程序员最佳)提供一个入门级别的大数据技术学 ...

  6. 数学菜鸟的AI学习攻略 | 数学符号轻松入门

    你是否跟我一样,自幼恨透数学. 现在,我终于发现了我对数学绝缘的最主要原因:我的老师从来不去回答最重要的问题:我为什么要学数学?学数学有什么用? 他们只是在黑板上写下一大堆方程,并让我记下来. 现在, ...

  7. 数学菜鸟的AI学习攻略——数学符号轻松入门

    [ 导读 ] 自学AI的过程中,我们非常需要理解这些数学符号.它可以让你用一种非常简洁的方式来表达一个复杂的想法. 你是否跟我一样,自幼恨透数学. 现在,我终于发现了我对数学绝缘的最主要原因:我的老师 ...

  8. 后端学习攻略,助你打怪升级

    大家好,我是辣条,好久不见,甚是想念,今天给大家带来一份后端的学习攻略,希望能帮助到你. 目录 一. 数据结构与算法 为什么数据结构很重要? 数据结构与算法相关数据推荐 视频推荐 二.计算机网络 为什 ...

  9. python全栈是什么_Python全栈数据工程师养成攻略 PDF 下载

    相关截图: 图书简介: 本书首先介绍了数据工程和Python语法,随后讲解如何获取和存储数据,并实现简单的静态可视化.文本作为一种极其重要的数据类型,也单独列出一章行讨论.之后读者将学习到关于Web建 ...

最新文章

  1. vsftp和nfs服务
  2. 错误解决记录------------mysql连接本地数据库显示can't get hostname for your address
  3. ACM中java的使用
  4. ueditor配置文件配置自动段落缩进_vimrc里各种配置的含义
  5. mysql删除表崩溃_MySQL在删除表时I/O错误原因分析
  6. Tricks(四十二)—— 数据集分块
  7. java barchart_Bar Chart
  8. 基于SSL/TLS双向安全连接设备CA证书认证
  9. 酒香也怕巷子深,教你一招,轻松让百度收录你的个人站点
  10. 计算机长时间休眠后无法唤醒,为什么我电脑长时间不动进入待机状态却无法唤醒出现死机情况?必须强制关机!...
  11. 【HTTP】HTTP Authorization 之 Basic Auth 和 X-Auth-Token
  12. 基于matlab计算aom衍射效率,傅里叶望远镜大气湍流模拟实验
  13. ota升级包编译过程中firmware如何添加进来
  14. idea2021版本添加上一步和下一步操作到工具栏
  15. 26款JAVA毕设项目合集【java课设】
  16. Zigbee之旅(二):第一个CC2430程序——LED灯闪烁实验
  17. 玩赚你的网站-网站运营必备手册
  18. 为什么计算机中数字符号位0表示正数,1表示负数
  19. ASP.NET MVC5 多语言国际化
  20. 递归实现:一个人赶着鸭子去每个村庄卖,每经过一个 村子卖去所赶鸭子的一半又一只。 这样他经过了 七个村子后还剩 两只鸭子,问问他出发时共赶多少只鸭子?经过每个村子卖出多少只鸭子?

热门文章

  1. 微信号名称乱码什么情况_微信号改成什么好?
  2. 科沃斯扫地机器人电路原理图_科沃斯扫地机器人的工作原理及维修方法
  3. Websocket(二)-客户端与服务器通信
  4. Carsim-simulink联合仿真注意事项
  5. Win11重启后无法进入系统解决办法
  6. 电脑开机蓝屏代码C000021a
  7. 项目名前有个红色感叹号的解决办法
  8. 如何使用python获取Windows 10精美的桌面壁纸
  9. java后端面试总结
  10. 一次使用 Go 语言编写脚本的经历