在Docker启动Cloudera并开始体验
开始之前
- 最新版Docker
- 给Docker分配4GB内存
- Docker可用的磁盘空间10GB
使用Docker可以快速体验CDH,并且依据localhost提供的案例,可以体验CDH在Sqoop,HDFS,Hive,Impala,Spark,Search方面的应用。安装预计耗时15分钟左右,体验上诉各种场景在2小时左右。
第一部分:安装CDH
1. 从Cloudera下载docker镜像
2. 解压缩之后导入
docker import cloudera-quickstart-vm-5.13.0-0-beta-docker.tar
3. 启动容器
docker run --hostname=quickstart.cloudera --privileged=true -t -i -d -p 8888:8888 -p 80:80 -p 7180:7180 -p 21050:21050 -p 50070:50070 -p 50075:50075 -p 50010:50010 -p 50020:50020 -p 8020:8020 [containerid] /usr/bin/docker-quickstart
第二部分:使用Sqoop从Mysql导入表,并使用impala进行SQL查询
1. 进入服务器
docker exec -t -i [container name] /bin/bash
2. 切换到cloudera用户
su - cloudera
3. 导入测试数据
[cloudera@quickstart ~]$ sqoop import-all-tables \-m 1 \--connect jdbc:mysql://quickstart:3306/retail_db \--username=retail_dba \--password=cloudera \--compression-codec=snappy \--as-parquetfile \--warehouse-dir=/user/hive/warehouse \--hive-import
4. 访问http://localhost:8888,打开hue,账号密码都是cloudera
5. 刷新impala缓存
invalidate metadata;
6. hue界面中执行SQL查询
其他应用场景可以参考http://localhost进行体验,后续还包含search应用,spark体验等。
说明:docker版本默认不启动clouder-manager,如果需要启动,将docker的内存分配到8GB,然后进入cdh的容器中,执行/home/cloudera/cloudera-manager –express,之后可以通过浏览器访问localhost:7180查看到Cloudera-manager
在Docker启动Cloudera并开始体验相关推荐
- Docker深入浅出系列 | 容器初体验
Docker深入浅出系列 | 容器初体验 教程目标 Docker已经上市很多年,不是什么新鲜事物了,很多企业或者开发同学以前也不多不少有所接触,但是有实操经验的人不多,本系列教程主要偏重实战,尽量讲干 ...
- 通过Docker 安装 cloudera manager 平台
下载镜像 docker pull cloudera/quickstart // 或者在 cloudera 官网下载文件后使用 `docker import` 命令导入 // https://downl ...
- Cloudera Manager初体验
Cloudera Manager初体验 概述 启动 查看 HDFS Hive Oozie Sqoop YARN Hue 关闭 概述 之前配置各种分布式应用(Hadoop.Hive等)都是利用命令行配置 ...
- 数据湖之Hudi(7):使用docker进行Hudi的快速体验和使用
目录 0. 相关文章链接 1. 构建CentOS7环境 2. 设置Docker 2.1. 编译Hudi源码 2.2. 安装docker和docker-compose 2.3. 运行 docker co ...
- 虚拟机内 docker启动 局域网无发访问 问题解决
虚拟机内 docker启动 局域网无发访问 问题解决 参考文章: (1)虚拟机内 docker启动 局域网无发访问 问题解决 (2)https://www.cnblogs.com/Pualfly/p/ ...
- docker启动elasticsearch失败--jvm内存不足解决方案
docker启动elasticsearch失败--jvm内存不足解决方案 参考文章: (1)docker启动elasticsearch失败--jvm内存不足解决方案 (2)https://www.cn ...
- centos7 docker 启动报错 Job for docker.service failed 解决办法
启动 docker 报错 查看docker 版本,只有client,没有server. 解决方法:执行 vi /etc/sysconfig/selinux , 把 selinux 属性值改为disa ...
- linux redhat、ubuntu系统 docker启动、停止命令
redhat操作系统: docker启动命令 sudo systemctl start docker 守护进程重启 sudo systemctl daemon-reload 重启docker服务 su ...
- 关闭或启动linux防火墙后,docker启动容器报错
# docker启动报错 # 解决办法:重建docker0网络恢复 #按照进程名杀死docker进程 [root@localhost mysqlconf]# pkill docker #清空防火墙规则 ...
最新文章
- Singleton(单例模式)
- ​KDD 2020 开源论文 | 图神经网络多变量时序预测
- ERROR: SonarQube scanner exited with non-zero code: 137
- SAP Spartacus 的 CSS 架构
- 中国电信建成全球首个覆盖最广的商用下一代物联网
- 解决IIS数据库连接出错方法
- PL/SQL中导出整个表、表结构、部分数据、以及导入整个表
- Android 文件下载三种基本方式
- 批量html源代码 翻译,一键实现网页中英文对照的黑科技翻译工具
- 双眼融合训练一个月_视觉融合功能的四种训练方法
- hdu 5145 NPY and girls 莫队
- van-field 校验手机号码格式
- 短文本分类:电力95598工单分类实现
- 台式电脑共享笔记本电脑的无线网络
- 智慧非智能,智慧园区智慧在哪里?
- Android五大数据存储
- Attention机制介绍(原理+代码)
- 心脏滴血漏洞(CVE-2014-0160)分析与防护
- 使用Excel制作一个动态计划表
- LVGL lv_cont 容器(8)
热门文章
- 计算机 连接ip,连接在Internet上的计算机都拥有IP地址。
- C++输入输出类的层次
- html5测试 2345,HTML5实例测试
- Leetcode 203. 移除链表元素 (每日一题 20210914)
- 李宏毅线性代数笔记2: 线性方程组和数域
- python 笔记:函数
- 机器学习笔记 RNN初探 LSTM
- Tableau实战系列浏览 Tableau 环境(七) -重组工作区
- 算法效果AB测试中的PV-UV不对称性
- dapper mysql 批量_MySQL数据库之c#mysql批量更新的两种方法