数据治理从理论到实战系列

提示:数据治理实战需要用到统一版本大数据开源组件,为了避免版本混乱导致的安装使用异常,我们先在这章节插入到了cdh安装


数据治理(三)cdh安装

  • 数据治理从理论到实战系列
  • 前言
  • 一、cdh是什么?
  • 二、部署本地Linux服务器
  • 三、部署cdh
    • 1.部署规划
    • 2.优化文件系统
    • 3.关闭 SWAP
    • 4.禁用透明大页面
    • 5.MySQL驱动移动到目录下
    • 6.cdh服务配置
    • 7.cdh安装
    • 8.修改 CM 配置
    • 8.修改 CM 配置
    • 9.前移文件
    • 10.启动服务

前言

提示:即便已有大数据开源组件,后续的版本不一问题可能会比较难处理,所以还是需要统一版本!!!


一、cdh是什么?

CDH是一个强大的商业版数据中心管理工具(6.3以下能免费使用)。
相比原生安装:
1.版本管理做的好
2. 版本更新速度快
3.集群搭建效率高
4.安全性高
5.支持多种安装方式(Cloudera Manager方式)

二、部署本地Linux服务器

在搭建cdh之前,我们插入一个章节部署本地Linux服务器,详情跳转到上一章

三、部署cdh

1.部署规划

node01 192.168.43.181 CentOS 7.x master 12G 内存 50G磁盘
node02 192.168.43.182 CentOS 7.x slave 4G 内存 40G硬盘
node03 192.168.43.183 CentOS 7.x slave 4G 内存 40G硬盘

2.优化文件系统

vim /etc/fstab
将defaults 改成 noatime

3.关闭 SWAP

[root@]# echo 1 >/proc/sys/vm/swappiness #执行命令
[root@]# swapoff -a && swapon -a # 执行
[root@]# sysctl -p # 执行
[root@~]# vim /etc/sysctl.conf #修改文件 将vm.swappiness改为 1 没有则新增
vm.swappiness = 1

4.禁用透明大页面

[root@]# echo ‘echo never > /sys/kernel/mm/transparent_hugepage/defrag’ >> /etc/rc.d/rc.local
[root@]# echo ‘echo never > /sys/kernel/mm/transparent_hugepage/enabled’ >> /etc/rc.d/rc.local

5.MySQL驱动移动到目录下

[root@~]# mkdir -p /usr/share/java/ #创建一个存放 Driver包的目录
[root@ ~]# cd mysql-connector-java-5.1.46 #进入目录
[root@ ~]# cp mysql-connector-java-5.1.46-bin.jar /usr/share/java/mysql-connector-java.jar #驱动改名 放到这个目录下 供CDH使用

6.cdh服务配置

CM共有三个服务 daemons 、agent、server
主节点(弄de01)需安装 daemons 、agent、server
node02/03 需要安装 daemons 、agent

7.cdh安装

node01安装
yum -y install cloudera-manager-daemons-6.3.1-1466458.el7.x86_64.rpm
yum -y install cloudera-manager-server-6.3.1-1466458.el7.x86_64.rpm
yum -y install cloudera-manager-agent-6.3.1-1466458.el7.x86_64.rpm
node02 node03安装
yum -y install cloudera-manager-daemons-6.3.1-1466458.el7.x86_64.rpm
yum -y install cloudera-manager-agent-6.3.1-1466458.el7.x86_64.rpm

该处使用的url网络请求的数据。

8.修改 CM 配置

[root@zzq-01 ~]# vim /etc/cloudera-scm-server/db.properties #修改连接mysql数据库的配置 改为如下内容即可
com.cloudera.cmf.db.host=node01
com.cloudera.cmf.db.name=root
com.cloudera.cmf.db.user=root
com.cloudera.cmf.db.password=123456
com.cloudera.cmf.db.setupType=EXTERNAL

8.修改 CM 配置

vim /etc/cloudera-scm-agent/config.ini #修改为server所在服务器 即 node01
server_host=node01

9.前移文件

迁移文件
将下面的三个文件拷贝到 制定目录下 /opt/cloudera/parcel-repo
[root@zzq-01 ~]# cp ./CDH-6.3.1-1.cdh6.3.1.p0.1470567-el7.parcel /opt/cloudera/parcel-repo/
[root@zzq-01 ~]# cp ./CDH-6.3.1-1.cdh6.3.1.p0.1470567-el7.parcel.sha1 /opt/cloudera/parcel-repo/
[root@zzq-01 ~]# cp ./manifest /opt/cloudera/parcel-repo/
#注意需要将
CDH-6.3.1-1.cdh6.3.1.p0.1470567-el7.parcel.sha1 文件名修改 去掉1
CDH-6.3.1-1.cdh6.3.1.p0.1470567-el7.parcel.sha

10.启动服务

到此安装过程告一段落 ,开始启动服务
#主节点执行
systemctl start cloudera-scm-server #主节点启动 server服务
tail -f /var/log/cloudera-scm-server/cloudera-scm-server.log #查看server启动日志 确保没有错误
如果无报错 继续进行
#所有节点执行
systemctl start cloudera-scm-agent
tail -f /var/log/cloudera-scm-server/cloudera-scm-agent.log #查看agent启动日志 确保没有错误
启动无报错的话 就可以访问地址 192.168.1.201:7180 了(主节点的ip地址,7180端口) 账号密码是admin/admin


数据治理从理论到实战系列(三)——cdh安装相关推荐

  1. 数据治理从理论到实战系列(一)——简要概述

    数据治理从理论到实战系列 数据治理(一):简要概述 数据治理从理论到实战系列 一.为什么要进行数据治理? 二.什么是数据治理? 三.如何解决上述问题? 三.数据治理的体系 四.数据治理平台建设 跳转连 ...

  2. 【Youtobe trydjango】Django2.2教程和React实战系列三【Django超级管理员和内置内容】

    [Youtobe trydjango]Django2.2教程和React实战系列三[Django超级管理员和内置内容] 1. Django数据初始化及超级管理员 2. 用户模块使用 1. Django ...

  3. 数据治理的理论实践与发展趋势

    为什么80%的码农都做不了架构师?>>> 数据治理的理论实践与发展趋势 大数据时代的到来为各行业带来基于数据资产进行业务创新,管理创新的契机以及大数据技术建设需求,面向大数据环境和传 ...

  4. 【热点专刊】大数据治理的理论与技术(附链接)

    来源:软件学报微站 本文约2500字,建议阅读5分钟 本专题旨在探究大数据治理所面临的核心技术挑战. 大数据治理的理论与技术专题 数字经济时代, 数据已成为新型生产要素, 大数据技术更是数据要素市场发 ...

  5. Skype For Business 2015实战系列2:安装活动目录

    Skype For Business 2015实战系列2:安装活动目录 今天开始我们就正式进入了Skype For Business 2015的部署阶段,在部署开始之前,我们先来看一下我们本次的环境列 ...

  6. Docker系列三~docker安装nginx

    Docker系列三 docker安装nginx 搜索nginx版本 docker search nginx 拉取nginx最新版本镜像 docker pull nginx:latest 查看本地镜像 ...

  7. Docker最全教程——从理论到实战(三)

    容器是应用走向云端之后必然的发展趋势,因此笔者非常乐于和大家分享我们这段时间对容器的理解.心得和实践. 本篇教程持续编写了2个星期左右,只是为了大家更好地了解.理解和消化这个技术,能够搭上这波车. 你 ...

  8. java search 不能使用方法_ElasticSearch实战系列三: ElasticSearch的JAVA API使用教程

    前言 在上一篇中介绍了ElasticSearch实战系列二: ElasticSearch的DSL语句使用教程---图文详解,本篇文章就来讲解下 ElasticSearch 6.x官方Java API的 ...

  9. 数据治理-从理论到实践(一)

    大数据治理范围 一.背景概述 1.数据治理 由于切入点和侧重点,业内给予了不同的见解. 广泛认可标准:DMBOK.COBIT 5.DGI.和IBM数据治理委员会的定义. 明确数据治理的目标 理解数据治 ...

最新文章

  1. python贪吃蛇控制台_如何用Python写一个贪吃蛇AI
  2. 后端系统架构 听课笔记
  3. 注入代码oracle
  4. [html] html元素哪些标签是不可替换元素?哪些是可替换元素?
  5. 一款纯css3实现的超炫动画背画特效
  6. thinkpython2e电子书下载_《Think Python 2e》中译版电子书分享
  7. struts中采用注解配置Action
  8. [UVA 11374] Airport Express
  9. SLIC 超像素分割(C++)
  10. 软件设计 抽象_调试抽象给软件工程师带来正念的好处
  11. 计算机基础及ms office应用,计算机基础及MS Office应用知识
  12. 【工具分享】任意坐标系CAD范围线多点配准及准确导入导入LSV
  13. python sphinx_Python Sphinx使用踩坑记录
  14. TLS远程信息泄露 心脏滴血 CVE-2014-0160 漏洞复现
  15. ARP病毒专杀工具免费下载
  16. MPLS Virtual Private Network
  17. Unity 自动创建材质球工具
  18. 小苏java学习之路
  19. opera关闭价格或房型
  20. 人工智能不可挡 但别让恐惧成为自我实现的预言!

热门文章

  1. EXE4J 使用教程
  2. 剑指泛娱乐,互联网企业产业布局再度升级
  3. Usaco Training 刷怪旅 第三层 第六题:Ski Course Design
  4. 中科曙光2018年会的一点感悟
  5. ITERATE MYSQL 例子_介绍 MySQL 的 Iterate 迭代语句实例代码
  6. Recyclerview 实现双联表联动
  7. html+纯CSS实现小彩虹效果
  8. 网站丨看似简单却大有内容
  9. [IOS APP]简爱跑步12周
  10. boosting系列算法