基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析

【上集】百度网盘下载:链接:http://pan.baidu.com/s/1eQJFXZ0 密码:kdx9

【下集】百度网盘下载:链接:http://pan.baidu.com/s/1hq4cO2w 密码:cnsq

课程内容简介:

本课程分两大部分:

第一部分全面深入地介绍了Greenplum数据库,包括架构特性、部署、管理、开发和调优等,由浅入深

,理论结合实战,让同学全面彻底掌握这把大数据利剑。

第二部分深入阐述了Hadoop的架构原理,Hadoop整体技术架构,包括HBase、Hive、Pig、ZooKeeper、

Chukwa等实战运用。另外还介绍了云计算的基础知识和Hadoop在云计算领域的运用,以及剖析了Hadoop在

各个互联网巨头商业环境的运用。

【上集】 Greenplum 分布式数据库基础(41课时)

1 Greenplum架构

什么是Greenplum

Greenplum体系结构

Greenplum高可用性架构

2 安装Greenplum

配置环境

安装并初始化GPDB系统

启停数据库

配置GP系统

3 分布式数据库存储

数据是如何存储的

分布策略

4 GBDB查询处理

查询命令的执行

SQL查询处理机制

并行查询计划

5 角色权限及客户端认证管理

客户端认证

管理用户和组

6 客户端接口和程序

pgAdmin III

PSQL

7 定义数据库对象

创建并管理数据库

创建并管理表空间

创建并管理模式

创建并管理表

分区表

数据分布与分区

压缩存储与行列存储

序列、索引与视图

8 管理数据

插入、更新、删除记录

事务管理

空间回收和统计

9 查询数据

定义查询

使用函数和运算符

查询分析

10 工作负载及资源管理

GP工作负载管理概述

配置工作负载管理

创建资源队列

分配资源队列

检查资源队列状态

11 装载和卸载数据

GP装载命令概述

装载数据到GP

从GP卸载数据

格式化数据文件

12 备份恢复

串行备份和恢复

并行恢复和恢复

13 性能调优

如何进行调优

常见的性能问题

14 GP系统配置参数

关于GP的Master参数与本地化参数

设置配置参数

配置参数种类

15 开启高可用性

GP高可用概述

开启GP的Mirror

获知Segment何时失败

恢复失败的Segment

恢复失败的Master

16 GP MapReduce

MapReduce基础

GP MapReduce编程

MapReduce作业执行和故障诊断

【下集】 Hadoop分布式平台(55课时)

1 Hadoop的起源和体系

Hadoop思想起源:Google

Hadoop子项目家族

Hadoop的架构

2 Hadoop的安装与配置

准备和配置环境

三种运行模式

完全分布式模式安装

3 HDFS-大数据存储

HDFS概念与体系结构

HDFS的可靠性

HDFS文件操作

HDFS API

4 关于MapReduce

MapReduce编程模型

MapReduce的集群行为

MapReduce任务的优化

MapReduce工作机制

错误处理及作业调度机制

5 MapReduce应用开发

Hadoop Eclipse插件开发

数据筛选程序开发

倒排索引程序开发

6 Hadoop监控与管理

页面监控

hadoop备份

7 HBase数据库

Hbase体系结构

HBase shell

HBase API应用实例

HBase场景应用

HBase模式设计

8 Hive数据仓库

Hive组件与体系架构

Hive安装配置

Hive的服务接口

HiveQL常用操作

Hive的优化

Hive UDF编程

Hive综合实战

9 Pig数据分析平台

Pig框架

Pig安装配置

Pig的使用

Pig的数据模型

常用Pig Latin操作

Pig UDF编程

Pig数据分析实战

10 ZooKeeper分布式服务框架

ZooKeeper工作原理

ZooKeeper设计目标

ZooKeeper的数据结构和组成

ZooKeeper的安装配置

ZooKeeper命令行工具

ZooKeeper API

ZooKeeper实战:Hadoop任务调度

11 Chukwa集群监控系统

Chukwa的组成

Chukwa架构和设计

Chukwa安装与配置

常用Chukwa命令

实现自定义数据处理

12 Hadoop商业应用案例

云计算概念和特征

云计算服务模式和形态

Hadoop在云计算的运用

京东商城

百度

阿里巴巴

腾讯

13 Greenplum Hadoop集群

集成架构的特征

集成架构的优势

配置gphdfs协议使用环境

使用HDFS外部表

转载于:https://blog.51cto.com/10676583/1690050

Greenplum Hadoop分布式平台大数据解决方案实战教程相关推荐

  1. Hadoop集群大数据解决方案之MapReduce 程序实战进阶(自定义partitionsortgroup)(六)

    准 备   在上一篇博客举了个简单的word count,重在说明mapreduce的流程,但是针对mapreduce的编程,程序员能控制的,远远不止map和reduce,还有诸如partition, ...

  2. 大数据开发实战教程目录

    大数据开发实战教程目录 一. 课程性质.目的和任务 本课程目的是让学生了解并掌握四个领域 (1)大数据系统的起源及系统特征 (2)大数据系统的架构设计及功能目标设计 (3)大数据系统程序开发.企业大数 ...

  3. 大数据项目实战教程:使用SparkSQL+Hbase+Oozie构建企业级用户画像

    大数据项目实战教程,本课程需要有大数据基础(掌握基本大数据组件应用)的人才可以学习哦!市面上全面的大数据教程较少,今天分享给大家的就是一套全面的大数据学习教程,企业级大数据项目:360度用户画像实战 ...

  4. 《离线和实时大数据开发实战》(二)大数据平台架构 技术概览

    前言 接着上一章 构建大数据开发知识体系图谱,本次继续分享邦中老师的<离线和实时大数据开发实战>读书笔记 .到底什么样的平台才能算是大数据平台呢?带着这个问题,我们开始今天的内容 ( •̀ ...

  5. 《企业大数据系统构建实战:技术、架构、实施与应用》——第3章 企业大数据解决方案 3.1 企业大数据解决方案实现方式...

    本节书摘来自华章计算机<企业大数据系统构建实战:技术.架构.实施与应用>一书中的第3章,第3.1节,作者 吕兆星 郑传峰 宋天龙 杨晓鹏,更多章节内容可以访问云栖社区"华章计算机 ...

  6. 《Python Spark 2.0 Hadoop机器学习与大数据实战_林大贵(著)》pdf

    <Python+Spark 2.0+Hadoop机器学习与大数据实战> 五星好评+强烈推荐的一本书,虽然内容可能没有很深入,但作者非常用心的把每一步操作详细的列出来并给出说明,让我们跟着做 ...

  7. SQL on Hadoop在快手大数据平台的实践与优化 | 分享实录

    快手大数据架构工程师钟靓 本文是根据快手大数据架构工程师钟靓于 5月18-19日在A2M人工智能与机器学习创新峰会<SQL on Hadoop在快手大数据平台的实践与优化>演讲中的分享内容 ...

  8. Hadoop-Apache Hadoop大数据解决方案的整体介绍

    一 大数据价值和当前主要应用 大数据的价值 当前全球数据的生产速度急剧加快,海量数据的存储以及计算问题通过传统的解决方案已经无法应对处理,为此急需有一套针对性的解决方案,Hadoop应运而生. 当前大 ...

  9. 涵盖从java入门到深入架构,Linux、云计算、分布式、大数据Hadoop、ios、Android、互联网技术应有尽有

    [涵盖从java入门到深入架构,Linux.云计算.分布式.大数据Hadoop.ios.Android.互联网技术应有尽有] 1.javascript视频教程 链接: http://pan.baidu ...

最新文章

  1. Python改变生活 | 轻松识别数百个快递单号
  2. Guava RateLimiter限流源码解析和实例应用
  3. php开发微信支付获取用户地址
  4. .NET Conf 2017后初尝Xamarin Forms 3.0@Linux
  5. 【升级版】如何使用阿里云云解析API实现动态域名解析,搭建私有服务器【含可执行文件和源码】...
  6. android实现电话功能实验报告,安卓开发实验报告-20210407005833.docx-原创力文档
  7. android中的xml布局文件如何引用另一个xml布局文件,引用另一个layout.xml文件而不复制它...
  8. android序列化好处,浅谈Android序列化
  9. matex2推送鸿蒙系统,拜拜了,Powered by Android!
  10. jsp java代码报错,求助!JSP代码中调java服务出参返回正常 weblogic报错BEA-101017
  11. mysql union all 等效_Mysql联合查询UNION和UNION ALL的使用介绍
  12. C语言房地产销售管理系统,房地产销售管理系统的设计与实现
  13. Zip函数教程(简单示例)
  14. 使用微信公众号openid获取用户信息判断是否关注公众号
  15. HASH 、MD、SHA、MAC、HMAC、SM3
  16. uniapp微信小程序使用自定义字体和外部字体
  17. 场论:关于矢量场梯度=0的证明
  18. macbook 终端命令怎么使用_苹果MAC系统怎么使用ping命令打开终端?
  19. 中级微观经济学:Chap 12 不确定性
  20. 【天光学术】财务会计论文:家电连锁零售企业财务分析方法与注意问题(节选)

热门文章

  1. 中国决定以“六大政策”推动新一代人工智能发展
  2. 权威发布 |《科学美国人》:2018全球十大新兴技术
  3. 半导体终极武器光刻机:为何中国难望ASML项背?!有了全套图纸也做不出来
  4. 快手宣布 7 月将取消大小周,​互联网大厂不卷了?
  5. 漫画 | 辞职前与老板的最后一次谈话有哪些禁忌?
  6. 三星教父逝世!李健熙缔造的商业传奇和争议人生
  7. CSDN下载资源+全领域电子书+程序员提升课,领取这些不香吗?
  8. 如何在java中去除中文文本的停用词
  9. Linux反空闲设置的两种方法
  10. java成员变量和局部变量的初始化和内存中的运行机制