开始之前

  • 最新版Docker
  • 给Docker分配4GB内存
  • Docker可用的磁盘空间10GB

使用Docker可以快速体验CDH,并且依据localhost提供的案例,可以体验CDH在Sqoop,HDFS,Hive,Impala,Spark,Search方面的应用。安装预计耗时15分钟左右,体验上诉各种场景在2小时左右。

第一部分:安装CDH

1. 从Cloudera下载docker镜像

2. 解压缩之后导入

docker import cloudera-quickstart-vm-5.13.0-0-beta-docker.tar

3. 启动容器

docker run --hostname=quickstart.cloudera --privileged=true -t -i -d -p 8888:8888 -p 80:80 -p 7180:7180 -p 21050:21050 -p 50070:50070 -p 50075:50075 -p 50010:50010 -p 50020:50020 -p 8020:8020 [containerid] /usr/bin/docker-quickstart

第二部分:使用Sqoop从Mysql导入表,并使用impala进行SQL查询

1. 进入服务器

docker exec -t -i [container name] /bin/bash

2. 切换到cloudera用户

su - cloudera

3. 导入测试数据

[cloudera@quickstart ~]$ sqoop import-all-tables \-m 1 \--connect jdbc:mysql://quickstart:3306/retail_db \--username=retail_dba \--password=cloudera \--compression-codec=snappy \--as-parquetfile \--warehouse-dir=/user/hive/warehouse \--hive-import

4. 访问http://localhost:8888,打开hue,账号密码都是cloudera

5. 刷新impala缓存

invalidate metadata;

6. hue界面中执行SQL查询

其他应用场景可以参考http://localhost进行体验,后续还包含search应用,spark体验等。

说明:docker版本默认不启动clouder-manager,如果需要启动,将docker的内存分配到8GB,然后进入cdh的容器中,执行/home/cloudera/cloudera-manager –express,之后可以通过浏览器访问localhost:7180查看到Cloudera-manager

在Docker启动Cloudera并开始体验相关推荐

  1. Docker深入浅出系列 | 容器初体验

    Docker深入浅出系列 | 容器初体验 教程目标 Docker已经上市很多年,不是什么新鲜事物了,很多企业或者开发同学以前也不多不少有所接触,但是有实操经验的人不多,本系列教程主要偏重实战,尽量讲干 ...

  2. 通过Docker 安装 cloudera manager 平台

    下载镜像 docker pull cloudera/quickstart // 或者在 cloudera 官网下载文件后使用 `docker import` 命令导入 // https://downl ...

  3. Cloudera Manager初体验

    Cloudera Manager初体验 概述 启动 查看 HDFS Hive Oozie Sqoop YARN Hue 关闭 概述 之前配置各种分布式应用(Hadoop.Hive等)都是利用命令行配置 ...

  4. 数据湖之Hudi(7):使用docker进行Hudi的快速体验和使用

    目录 0. 相关文章链接 1. 构建CentOS7环境 2. 设置Docker 2.1. 编译Hudi源码 2.2. 安装docker和docker-compose 2.3. 运行 docker co ...

  5. 虚拟机内 docker启动 局域网无发访问 问题解决

    虚拟机内 docker启动 局域网无发访问 问题解决 参考文章: (1)虚拟机内 docker启动 局域网无发访问 问题解决 (2)https://www.cnblogs.com/Pualfly/p/ ...

  6. docker启动elasticsearch失败--jvm内存不足解决方案

    docker启动elasticsearch失败--jvm内存不足解决方案 参考文章: (1)docker启动elasticsearch失败--jvm内存不足解决方案 (2)https://www.cn ...

  7. centos7 docker 启动报错 Job for docker.service failed 解决办法

    启动  docker 报错 查看docker 版本,只有client,没有server. 解决方法:执行 vi /etc/sysconfig/selinux , 把 selinux 属性值改为disa ...

  8. linux redhat、ubuntu系统 docker启动、停止命令

    redhat操作系统: docker启动命令 sudo systemctl start docker 守护进程重启 sudo systemctl daemon-reload 重启docker服务 su ...

  9. 关闭或启动linux防火墙后,docker启动容器报错

    # docker启动报错 # 解决办法:重建docker0网络恢复 #按照进程名杀死docker进程 [root@localhost mysqlconf]# pkill docker #清空防火墙规则 ...

最新文章

  1. Singleton(单例模式)
  2. ​KDD 2020 开源论文 | 图神经网络多变量时序预测
  3. ERROR: SonarQube scanner exited with non-zero code: 137
  4. SAP Spartacus 的 CSS 架构
  5. 中国电信建成全球首个覆盖最广的商用下一代物联网
  6. 解决IIS数据库连接出错方法
  7. PL/SQL中导出整个表、表结构、部分数据、以及导入整个表
  8. Android 文件下载三种基本方式
  9. 批量html源代码 翻译,一键实现网页中英文对照的黑科技翻译工具
  10. 双眼融合训练一个月_视觉融合功能的四种训练方法
  11. hdu 5145 NPY and girls 莫队
  12. van-field 校验手机号码格式
  13. 短文本分类:电力95598工单分类实现
  14. 台式电脑共享笔记本电脑的无线网络
  15. 智慧非智能,智慧园区智慧在哪里?
  16. Android五大数据存储
  17. Attention机制介绍(原理+代码)
  18. 心脏滴血漏洞(CVE-2014-0160)分析与防护
  19. 使用Excel制作一个动态计划表
  20. LVGL lv_cont 容器(8)

热门文章

  1. 计算机 连接ip,连接在Internet上的计算机都拥有IP地址。
  2. C++输入输出类的层次
  3. html5测试 2345,HTML5实例测试
  4. Leetcode 203. 移除链表元素 (每日一题 20210914)
  5. 李宏毅线性代数笔记2: 线性方程组和数域
  6. python 笔记:函数
  7. 机器学习笔记 RNN初探 LSTM
  8. Tableau实战系列浏览 Tableau 环境(七) -重组工作区
  9. 算法效果AB测试中的PV-UV不对称性
  10. dapper mysql 批量_MySQL数据库之c#mysql批量更新的两种方法