Spark企业级开发最佳实践
课程介绍
本课程是世界上第一Spark企业级最佳实践课程,课程包含:
Spark的架构设计;
Spark编程模型;
Spark内核框架源码剖析;
Spark的广播变量与累加器;
Shark的原理和使用;
Spark的机器学习;
Spark的图计算GraphX;
Spark SQL;
Spark实时流处理;
Spark程序的测试;
Spark的优化;
Spark on Yarn;
JobServer;
最后以一个商业级别的Spark案例为基础,实战展示商业级别Spark项目的架构设计、实现和优化;
培训对象
1, 云计算大数据从业者;
2, Hadoop使用者;
3, 系统架构师、系统分析师、高级程序员、资深开发人员;
4, 牵涉到大数据处理的数据中心运行、规划、设计负责人;
5, 政府机关,金融保险、移动和互联网等大数据来源单位的负责人;
6, 高校、科研院所涉及到大数据与分布式数据处理的项目负责人;
7, 数据仓库管理人员、建模人员,分析和开发人员、系统管理人员、数据库管理人员以及对数据仓库感兴趣的其他人员;
学员基础
了解面向对象编程;
了解Linux的基本使用;
了解Scala语法
王家林老师
中国目前唯一的移动互联网和云计算大数据集大成者;
云计算大数据Spark亚太研究院院长和首席专家;
联系邮箱:18610086859@126.com
联系电话:18610086859
Spark亚太研究院院长和首席专家,Spark源码级专家,对Spark潜心研究(2012年1月起)2年多后,在完成了对Spark的13不同版本的源码的彻底研究的同时不断在实际环境中使用Spark的各种特性的基础之上,编写了世界上第一本系统性的Spark书籍并开设了世界上第一个系统性的Spark课程并开设了世界上第一个Spark高端课程(涵盖Spark内核剖析、源码解读、性能优化和商业案例剖析)。Spark源码研究狂热爱好者,醉心于Spark的新型大数据处理模式改造和应用。
Hadoop源码级专家,曾负责某知名公司的类Hadoop框架开发工作,专注于Hadoop一站式解决方案的提供,同时也是云计算分布式大数据处理的最早实践者之一,Hadoop的狂热爱好者,不断的在实践中用Hadoop解决不同领域的大数据的高效处理和存储,现在正负责Hadoop在搜索引擎中的研发等,著有《云计算分布式大数据Hadoop实战高手之路---从零开始》《云计算分布式大数据Hadoop实战高手之路---高手崛起》《云计算分布式大数据Hadoop。实战高手之路---高手之巅》等;
Android架构师、高级工程师、咨询顾问、培训专家;
通晓Android、HTML5、Hadoop,迷恋英语播音和健美;
致力于Android、HTML5、Hadoop的软、硬、云整合的一站式解决方案;
国内最早(2007年)从事于Android系统移植、软硬整合、框架修改、应用程序软件开发以及Android系统测试和应用软件测试的技术专家和技术创业人员之一。
HTML5技术领域的最早实践者(2009年)之一,成功为多个机构实现多款自定义HTML5浏览器,参与某知名的HTML5浏览器研发;
超过10本的IT畅销书作者;
培训内容
第一天 |
第1堂课:Spark的架构设计 1.1 Spark生态系统剖析 1.2 Spark的架构设计剖析 1.3 RDD计算流程解析 1.4 Spark的出色容错机制 第2堂课:Spark编程模型 2.1 RDD 2.2 transformation 2.3 action 2.4lineage 2.5宽依赖与窄依赖 第3堂课:深入Spark内核 3.1 Spark集群 3.2 任务调度 3.3 DAGScheduler 3.4 TaskScheduler 3.5 Task内部揭秘 第4堂课:Spark的广播变量与累加器 4.1 广播变量的机制 4.2 广播变量使用最佳实践 4.3 累加器的机制 4.4 累加器使用的最佳实践 第5堂课:编写Spark程序 5.1 程序数据的来源:File、HDFS、HBase、S3等 5.2 IDE环境构建 5.3 Maven 5.4 sbt. 5.5 编写并部署Spark程序的实例 第6堂课:SparkContext解析和数据加载以及存储 6.1 源码剖析SparkContext 6.2 Scala、Java、Python使用SparkContext 6.4 加载数据成为RDD 6.5 把数据物化 |
|
时间 |
內 容 |
备注 |
第二天 |
第7堂课:深入实战RDD 7.1 DAG 7.2 深入实战各种Scala RDD Function 7.3 Spark Java RDD Function 7.4 RDD的优化问题 第8堂课:Shark的原理和使用 8.1 Shark与Hive 8.2 安装和配置Shark 8.3 使用Shark处理数据 8.4 在Spark程序中使用Shark Queries 8.5 SharkServer 8.6 思考Shark架构 第9堂课:Spark的机器学习 9.1 LinearRegression 9.2 K-Means 9.3 Collaborative Filtering 第10堂课:Spark的图计算GraphX 10.1 Table Operators 10.2 Graph Operators 10.3GraphX 第11堂课:Spark SQL 11.1 Parquet支持 11.2 DSL 11.3 SQL on RDD |
时间 |
內 容 |
备注 |
第三天 |
第12堂课:Spark实时流处理 12.1DStream 12.2transformation 12.3 checkpoint 12.4 性能优化 第13堂课:Spark程序的测试 13.1 编写可测试的Spark程序 13.2 Spark测试框架解析 13.3 Spark测试代码实战 第14堂课:Spark的优化 14.1 Logs 14.2 并发 14.3 内存 14.4 垃圾回收 14.5 序列化 14.6 安全 第15堂课:Spark on Yarn 15.1 Spark on Yarn的架构原理 15.2 Spark on Yarn的最佳实践 第16堂课:JobServer 16.1 JobServer的架构设计 16.2 JobServer提供的接口 16.3 JobServer最佳实践 第17堂课:Spark项目案例实战 17.1 Spark项目的最佳架构模式 17.2 案例的介绍和架构 17.3 案例的源码实现 17.4 调优 |
转载于:https://www.cnblogs.com/spark-hadoop/p/4183474.html
Spark企业级开发最佳实践相关推荐
- java EE设计模式--spring企业级开发最佳实践文摘
第一章 企业级java应用程序架构和设计 应用程序的分层:表现层 业务层 数据访问层 单层架构:一台主机 两层架构:胖客户端 + 主机服务器 三层架构:瘦客户端(浏览器)+ 应用程序服务器 ...
- Spark 大数据处理最佳实践
开源大数据社区 & 阿里云 EMR 系列直播 第十一期 主题:Spark 大数据处理最佳实践 讲师:简锋,阿里云 EMR 数据开发平台 负责人 内容框架: 大数据概览 如何摆脱技术小白 Spa ...
- QCon北京2015:移动开发最佳实践专题前瞻
从社交到游戏,从电商到O2O,移动互联网已经深入渗透到各行各业,而外卖和打车市场,更是正在经历着一些深刻的变化.巨额的融资和庞大的用户群当然是吸引眼球的,但是小团队背后的故事或许也能让你眼前一亮.不同 ...
- web前端开发最佳实践_学习前端Web开发的最佳方法
web前端开发最佳实践 为什么要进行网站开发? (Why web development?) Web development is a field that is not going anywhere ...
- Web前端开发最佳实践(8):还没有给CSS样式排序?其实你可以更专业一些
前言 CSS样式排序是指按照一定的规则排列CSS样式属性的定义,排序并不会影响CSS样式的功能和性能,只是让代码看起来更加整洁.CSS代码的逻辑性并不强,一般的开发者写CSS样式也很随意,所以如果不借 ...
- 《微信公众平台开发最佳实践》——第3章 基 础 接 口 3.1 接收用户消息
本节书摘来自华章出版社<微信公众平台开发最佳实践>一 书中的第3章,第3.1节,作者:方倍工作室,更多章节内容可以访问云栖社区"华章计算机"公众号查看. 第3章 基 础 ...
- 《微信公众平台开发最佳实践》——2.4 本章小结
本节书摘来自华章出版社<微信公众平台开发最佳实践>一 书中的第2章,第2.4节,作者:方倍工作室,更多章节内容可以访问云栖社区"华章计算机"公众号查看. 2.4 本章小 ...
- 《Web前端开发最佳实践》——1.2 Web前端开发现状
本节书摘来自华章计算机<Web前端开发最佳实践>一书中的第1章,第1.2节,作者:党 建 更多章节内容可以访问云栖社区"华章计算机"公众号查看. 1.2 Web前端开发 ...
- Android开发最佳实践《IT蓝豹》
Android开发最佳实践 移动开发Android经验分享应用GoogleMaterial Design 摘要:前 段时间,Google公布了Android开发最佳实践的一系列课程,涉及到一些平时 ...
最新文章
- android 读取内部存储文件格式,Android中的数据储存之文件存储
- ios开发国外视频教程(有翻译)
- JAVA GUI关闭按钮不起作用(用SwingWorker解决)
- 启动计算机引导win10,教您win10引导项丢失怎么办
- postgresql数据库备份与还原
- HDU 1257 最少拦截系统【最长上升子序列】
- lstrip和rstrip_Python装饰字符串– rstrip(),lstrip(),strip()
- CAN学习笔记之15765-2协议摘要
- linux操作实例,linux下的一些文档操作实例 | Soo Smart!
- Android意图Intent总结代码
- 起风了用计算机打,《起风了》计算机简谱
- Bootstrap栅格系统(屏幕大小)
- android点击图片进入幻灯片,Android实现幻灯片式图片浏览器
- 部署论坛代码(linux)
- Android开发 调用系统相机相册图片功能,解决小米手机拍照或者图片横竖相反问题,及小米手机相册图片路径问题
- 基于VuePress搭建网站
- nl-mean程序下载_将MEAN应用程序部署到Amazon EC2(第1部分)
- hpc与超级计算机的区别,超级计算和高性能计算(HPC)的综合分析
- C语言基础09——数据在内存中的存储。整型的存储、大小端讲解、浮点数的存储、杨辉三角、找凶手、猜名次
- gm convert: Improper image header