倾情大奉送--Spark入门实战系列
这一两年Spark技术很火,自己也凑热闹,反复的试验、研究,有痛苦万分也有欣喜若狂,抽空把这些整理成文章共享给大家。这个系列基本上围绕了Spark生态圈进行介绍,从Spark的简介、编译、部署,再到编程模型、运行架构,最后介绍其组件SparkSQL、Spark Streaming、Spark MLib和Spark GraphX等。文章内容的整理一般是先介绍原理,随后是实战例子,由于面向的是入门读者,在实战中多截图,还请谅解。为了大家实验方便,在这里把实验相关的测试数据和安装包放在百度盘提供 链接: https://pan.baidu.com/s/1mm9X95PstczvseZw0xj8Jw 密码: t5kw
本系列博客在博客园和CSDN首发,地址为:
博客园 http://www.cnblogs.com/shishanyuan
CSDN http://blog.csdn.net/yirenboy
以下为该系列文章列表:
1.Spark及其生态圈简介 下载
2.Spark编译与部署(上)--基础环境搭建 下载
2.Spark编译与部署(中)--Hadoop编译安装 下载
2.Spark编译与部署(下)--Spark编译安装 下载
3.Spark编程模型(上)--编程模型及SparkShell实战 下载
3.Spark编程模型(下)--IDEA搭建及实战 下载
4.Spark运行架构 下载
5.Hive(上)--Hive介绍及部署 下载
5.Hive(下)--Hive实战 下载
6.SparkSQL(上)--SparkSQL简介 下载
6.SparkSQL(中)--深入了解运行计划及调优 下载
6.SparkSQL(下)--Spark实战应用 下载
7.Spark Streaming(上)--实时流计算Spark Streaming原理介绍 下载
7.Spark Streaming(下)--实时流计算Spark Streaming实战 下载
8.Spark MLlib(上)--机器学习及SparkMLlib简介 下载
8.Spark MLlib(下)--机器学习库SparkMLlib实战 下载
9.Spark图计算GraphX 下载
10.分布式内存文件系统Tachyon介绍及安装部署 下载
倾情大奉送--Spark入门实战系列相关推荐
- Spark入门实战系列--6.SparkSQL(中)--深入了解SparkSQL运行计划及调优
[注]该系列文章以及使用到安装包/测试数据 可以在<倾情大奉送--Spark入门实战系列>获取 1.1 运行环境说明 1.1.1 硬软件环境 l 主机操作系统:Windows 64位, ...
- Spark入门实战系列--5.Hive(下)--Hive实战
[注]该系列文章以及使用到安装包/测试数据 可以在<倾情大奉送--Spark入门实战系列>获取 1.Hive操作演示 1.1 内部表 1.1.1 创建表并加载数据 第一步 启动HDFS ...
- Spark入门实战系列--2.Spark编译与部署(下)--Spark编译安装
[注]该系列文章以及使用到安装包/测试数据 可以在<倾情大奉送--Spark入门实战系列>获取 1.编译Spark Spark可以通过SBT和Maven两种方式进行编译,再通过make-d ...
- Spark入门实战系列--8.Spark MLlib(上)--机器学习及SparkMLlib简介
[注]该系列文章以及使用到安装包/测试数据 可以在<倾情大奉送--Spark入门实战系列>获取 1.机器学习概念 1.1 机器学习的定义 在维基百科上对机器学习提出以下几种定义: l&qu ...
- Spark入门实战系列--4.Spark运行架构
注]该系列文章以及使用到安装包/测试数据 可以在<倾情大奉送--Spark入门实战系列>获取 1. Spark运行架构 1.1 术语定义 lApplication:Spark Applic ...
- Spark入门实战系列--6.SparkSQL(上)--SparkSQL简介
[注]该系列文章以及使用到安装包/测试数据 可以在<倾情大奉送--Spark入门实战系列>获取 1.SparkSQL的发展历程 1.1 Hive and Shark SparkSQL的前身 ...
- Spark入门实战系列--7.Spark Streaming(上)--实时流计算Spark Streaming原理介绍
[注]该系列文章以及使用到安装包/测试数据 可以在<倾情大奉送--Spark入门实战系列>获取 1.Spark Streaming简介 1.1 概述 Spark Streaming 是Sp ...
- Spark入门实战系列--3.Spark编程模型(上)--编程模型及SparkShell实战
[注]该系列文章以及使用到安装包/测试数据 可以在<倾情大奉送--Spark入门实战系列>获取 1.Spark编程模型 1.1 术语定义 l应用程序(Application): 基于Spa ...
- Spark入门实战系列--6.SparkSQL(下)--Spark实战应用
[注]该系列文章以及使用到安装包/测试数据 可以在<倾情大奉送--Spark入门实战系列>获取 1.运行环境说明 1.1 硬软件环境 l 主机操作系统:Windows 64位,双核4线程 ...
最新文章
- c# 读取mysql时间
- dirwatcher java_commonIO
- Lambda使用——JDK8新特性
- PHP中的addslashes()
- LeetCode Algorithm 217. 存在重复元素
- android oreo 源码,android – Oreo:如何在源代码中找到所有受限制的系统调用?
- sqlyog怎么连接mysql错误2003_网站突然连不上,MySQL连接错误经常内存不够宕机
- (54)FPGA基础编码D触发器(三)
- 基于selenium的爬虫
- Top 10 盘点:2019 Java 开发者必学的测试框架、工具和库!
- 如何在npm上发布项目
- Android中更详细的log获取方法
- vs 2012/2013 等工具中,使用正则表达式,查找、替换
- java中mergesort函数怎么用_MergeSort与TimSort,ComparableTimSort
- 详谈软件工程之系统设计模式
- 专访SOSO街景地图:寻找工具性产品突破的机遇
- 今夏流行的十大避暑胜地
- 实训任务4:Hadoop综合操作
- 给自己定一系列小目标
- 解决:Word在试图打开文件时遇到错误。请尝试下列方法……
热门文章
- 产品经理岗位职责说明_公司销售经理岗位职责说明书
- 电子时钟单片机c语言程序,51单片机电子时钟C语言程序
- 棉花糖主机送mysql_mysql操作
- FZ25/FZ35 恒流电子负载
- 负数对2取余_不同语言的负数取余问题
- 五子棋博弈树剪枝c语言,五子棋AI博弈树之带Alpha-Beta剪枝的极大极小过程函数...
- linux 信号软中断的方式
- 整个html和内部html,什么是HTML?
- java中字符串分割器_java简易文本分割器实现代码
- ibm oracle 应用程序 编排_IBM使用Kubernetes将云扩展到本地