12月上海Cloudera Hadoop大数据培训:CCAH、CCDH
北京、上海、广州、成都长期开班;南京、杭州、芜湖定期开班
12月上海开班时间:管理员周末班(12月12-13日;12月19-20日)
开发者脱产班(12月28-31日)
【其他课程安排请咨询】15000519329(陈老师)
课程内容:
【Cloudera ApacheHadoop管理员课程】
课时:4天
学习系统管理的概念和Apache Hadoop的最佳实践,
从安装和配置到负载均衡和调优。
这个4天的的课程通过动手时间来赋予你部署的经验,
以及更多的安全方面的经验和故障排除。
课程结束后,学员被鼓励去参加Cloudera和Apache Hadoop管理员(CCAH)考试。
【课程内容】
1、Hadoop分布式文件系统(HDFS)
2、YARN/MapReduce的工作原理
3、如何优化Hadoop机群所需要的硬件配置
4、搭建Hadoop机群所需要考虑的网络因素
5、Hadoop机群维护和控制
6、如何利用Hadoop配置选项进行系统性能调优
7、如何利用FairScheduler为多用户提供服务级别保障
8、Hadoop机群维护和监控
9、如何使用Flume从动态生成的文件加载到Hadoop
10、如何使用Sqoop从关系型数据加载数据
11、Hadoop生态系统工具(如Hive、Impala、Pig和Base)
【学员基础】
具备基本Linux系统管理经验。不需要事先掌握Hadoop相关知识。
【授课形式】
案例教学+上机实践
【Cloudera Apache Hadoop程序员课程】
课时:4天
学习Hadoop分布式文件系统(HDFS)基础和MapReduce框架以及如何利用其API来编写程序,
讨论为更大型的工作流程而设计技术。
这门4天的课程涵盖了为MapReduce程序修复漏洞和优化性能所需的高级技巧。
程序员课程也引入了Apache生态项目比如Hive、Pig、HBase、Flume和Oozie。
在完成课程后,学员被鼓励参加Cloudera认证Apache Hadoop程序员(CCDH)考试。
【课程内容】
1、MapReduce与HDFS内核知识以及如何编写MapReduce程序
2、Hadoop开发的最佳实践,调试、实现工作流及通用算法
3、如何利用Hive、Pig、Sqoop、Flume、Oozie及其他Hadoop的组件
4、按需定制WritableComparables与InputFormats处理复杂的数据类型
5、利用MapReduce编写、执行连接操作以整合不同数据集合
6、用于现实世界数据分析所需的高级HadoopAPI主题
7、用Java写MapReduce程序,用Streaming写MapReduce程序
8、调试MapReduce代码的策略,利用localjobrunner在本地测试MapReduce代码
9、Partitioners和Reducers如何一起工作,定制化Partitioners
10、定制Writable和WritableComparable
11、用SequenceFile和Avro数据文件存储二进制数据
【学员基础】
该课程适合具有一定编程经验的程序开发人员。由于课程中需要完成Hadoop相关编程练习,熟悉Java者优先
【授课形式】
案例教学+上机实践
【Cloudera 数据分析课程】
课时:4天
针对任何需要在Hadoop上实时地通过SQL和熟悉的脚本来管理、操纵和查询大型复杂数据的人。
学习Apache Pig、Apache Hive和Cloudera Impala如何通过过滤联接和其他用户自定义的功能
来支持数据的转型和分析。
【课程内容】
1、Hadoop生态圈、实验场景介绍、用Hadoop工具导入数据
2、pig的特性、使用案例、和pig交互、pig Latin语法、Field定义、用pig执行ETL流程
3、pig处理复杂数据,复杂/nested嵌套的数据类型、用pig分析广告战役的数据
4、pig的多数据组操作,pig链接多数据组、用pig分析离散的数据组
5、用流处理和UDFs扩展pig,Macros和Imports、contributed functions,用其他语言和pig一起处理数据
6、pig故障排查和优化,用web界面排查一个故障的任务、Data采样和故障排查、理解执行计划、提高pig任务性能
7、hive表结构和数据储存、对比hive和传统数据库、hive vs.pig、hive使用案例
8、hive的关系数据分析、数据管理、文本处理、优化及扩展,在shell、脚本和hue上运行hive查询
9、impala和hive、pig、关系数据库的不同、使用impala shell
10、采样impala分析数据,过滤、排序and limiting results,提升impala性能,impala的交互式分析
11、对比map reduce、pig、hive、impala和关系数据库
【学员基础】
该课程适合有SQL经验和基本UNIX和Linux命令的数据分析师、业务分析师和管理员
事先无需Java和Apache Hadoop的经验
【授课形式】
案例教学+上机实践
12月上海Cloudera Hadoop大数据培训:CCAH、CCDH相关推荐
- 上海Cloudera Hadoop大数据培训:CCAH、CCP:DE
上海Cloudera Hadoop大数据培训:CCAH.CCP:DE 北京.上海.广州长期开班 3月上海开班时间:管理员(3月1-4日):开发者(3月23-26日) [其他课程安排请咨询]150005 ...
- 【免费咨询】 Cloudera Hadoop大数据培训:管理员、开发者、数据分析
北京.上海.广州.成都长期开班 [上海十一月底十二月初开班时间] 管理员:11月27日-11月30日 开发者:12月1日-12月4日 [免费咨询]15000519329(陈老师) PS:也可免费索要一 ...
- 《Cloudera hadoop大数据平台实战指南》此书2019年1月已上市
这本书由宋立桓老师和陈建平老师共同合作,本书的切入点明确而清晰,从Hadoop 生态明星 Cloudera 入手,单刀直入逐步引出各类大数据基础和核心应用框架. 全书系统介绍了大数据的相关知识,全书共 ...
- Hadoop大数据平台开发与案例分析
关于举办"Hadoop大数据平台开发与案例分析 "高级工程师 一.课程介绍 1. 需求理解 Hadoop 设计之初的目标就定位于高可靠性.高可拓展性.高容错性和高效性,正是这些设计 ...
- “数聚上海 共赢未来” 上海大数据产业高端峰会 Cloudera让大数据实现更多价值...
ZDNet至顶网服务器频道 07月13日 新闻消息:今天,大数据已经是一个绕不开的话题了.然而怎样才能拥有大数据能力,却是众多企业头疼的问题.毕竟大数据能力并不是简单的拥有大数据,而是如何利用大数据来 ...
- Hadoop大数据零基础高端实战培训系列配文本挖掘项目
<Hadoop大数据零基础高端实战培训系列配文本挖掘项目(七大亮点.十大目标)> 课程讲师:迪伦 课程分类:大数据 适合人群:初级 课时数量:230课时 用到技术:部署Hadoop集群 涉 ...
- 大数据培训:Hadoop HDFS 实现原理
一.HDFS体系结构 1.1 HDFS 简介 Hadoop分布式文件系统 (HDFS) 是运行在通用硬件(commodity hardware)上的分布式文件系统(Distributed File S ...
- 深圳大数据培训技术分享:Hadoop集群同步
深圳大数据培训技术分享:Hadoop集群同步 分享--是技术突飞猛进的很好体验!在千锋学习大数据技术,开始学会了分享,班里五十个人,每个人就能得到49份不同技术探讨.每次到分享的时刻,总会收获不同的想 ...
- 大数据培训Hadoop数据压缩之压缩方式选择
压缩方式选择 1 Gzip压缩 优点∶压缩率比较高,而且压缩/解压速度也比较快;Hadoop本身支持,在 应用中处理zip格式的文件就和直接处理文本一样;大部分Linux系统都自带 zip命令,使用方 ...
最新文章
- JQ加AJAX 加PHP实现网页登录功能
- 开发者转型AI看过来,这是一场汇聚中美顶尖专家的AI盛会
- Debina解决浏览器中乱码(将系统字体改为中文)
- 你初吻啥时候没有的​?​
- oa提醒模块要素_OA系统进军贸易行业,高效完成CRM管理
- 从3000元月薪码农到首席架构师的经历
- C++ gbk与utf8互转
- DAY1——sql 建表/插入数据
- Oracle数据库数据同步方法
- win10时间不准_简单几招教会你win10系统时间不准怎么解决
- Pandas:分组级的运算和转换--transform和apply
- 在VMware上用深度技术安装windows xp
- HTML一个简单大一的网页作业
- 动手深度学习13——计算机视觉:数据增广、图片分类
- Linux下安装ORACLE(一周成果、全是干货!)
- 使用picgo配置图床使用
- Win server 2012及sql server 2014,2016及vs安装及资料及故障排除
- edge如何玩4399小游戏
- EasyClick脚本开发教程(6)获取抖音视频评论内容
- 电竞计算机专业,专科自考计算机专业好考吗?可以从事电竞工作吗
热门文章
- win11系统下word文档中鼠标指针消失解决方案
- 自制wpf年会抽奖小软件
- CC00022.CloudOpenStack——|OpenStack组件.V01|——|OpenStack-Dashboard|Dashboard基础条件配置|
- python障碍式期权定价公式
- HotSpot 是啥?
- 2019年12月PAT甲级 第一题 Good in C(1164)题解
- iqeq.com测智网原题之-找规律类!
- 计算机组成原理算术逻辑实验,《计算机组成原理》算术逻辑运算实验报告.doc...
- 网站服务器被黑后多久降权,网站降权了还可以恢复吗,多久能恢复
- php get str length,Oracle自定义函数f_henry_GetStringLength