一、集群配置

域名 ip 硬盘 内存
bigdata-01 xx.xx.xx.7 898G系统盘+14.4T数据盘 504G
bigdata-02 xx.xx.xx.8 898G系统盘+14.4T数据盘 504G
bigdata-03 xx.xx.xx.9 898G系统盘+14.4T数据盘 504G
bigdata-04 xx.xx.xx.13 898G系统盘+14.4T数据盘 504G
bigdata-05 xx.xx.xx.14 898G系统盘+14.4T数据盘 504G
bigdata-06 xx.xx.xx.15 898G系统盘+14.4T数据盘 504G
bigdata-07 xx.xx.xx.18 898G系统盘+14.4T数据盘 504G
bigdata-08 xx.xx.xx.19 898G系统盘+14.4T数据盘 504G
bigdata-09 xx.xx.xx.20 898G系统盘+14.4T数据盘 504G
bigdata-10 xx.xx.xx.21 898G系统盘+14.4T数据盘 504G

所有机器的系统都是CentOS6.6版本。

二、集群规划

参见blog:https://blog.csdn.net/worldchinalee/article/details/82114243

三、Linux系统环境准备

  • 网络配置

因为网络配置运维人员已经设置好,略过。

  • 配置普通用户sudo权限或者root用户
  • 关闭防火墙
service iptables stop (暂时关闭)
chkconfig iptables off(永久性关闭)
  • 禁用selinux
vi /etc/sysconfig/selinux
SELINUX=disabled
  • 设置文件打开数量和用户最大进程数
查看文件打开数量        ulimit -a
查看用户最大进程数      ulimit -u
vi /etc/security/limits.conf
增加以下内容:
* soft nofile 65535
* hard nofile 65535
* soft nproc 32000
* hard nproc 32000
在当前会话马上生效:
ulimit -n 65535
  • 配置yum源

https://blog.csdn.net/worldchinalee/article/details/82107279

  • 卸载CentOS自带的JDK
sudo rpm -qa|grep jdk 或 sudo rpm -qa|grep java
sudo rpm -e –nodeps xxx yyy zzz
  • 安装JDK
10.1 安装jdk输入命令:sudo yum install oracle-j2sdk1.8
10.2 配置环境变量: vi /etc/profile在文件的末尾添加一下内容export JAVA_HOME=/usr/java/jdk1.8.0_111-clouderaexport PATH=$PATH:$JAVA_HOME/bin
10.3 执行以下命令:(root用户)echo "JAVA_HOME=/usr/java/jdk1.8.0_111-cloudera" >> /etc/environment
10.4 新建一个软链:ln -s /usr/java/jdk1.8.0_172/bin/java /usr/bin/java
10.5 source /etc/profile生效
10.6 java -version测试
  • 设置 /proc/sys/vm/swappiness
(root用户)输入:echo "vm.swappiness=0"  >> /etc/sysctl.conf 
  • 集群时间同步

https://blog.csdn.net/worldchinalee/article/details/82109932

  • 配置免密登录
cd ~/.ssh/ssh-keygen -t rsacat id_rsa.pub >> authorized_keyschmod 600 authorized_keysscp authorized_keys root@tdxy-bigdata-01:~/.ssh/

如果只要namenode的机器可以对其他机器免密登录,把authorized_keys的内容添加到其他机器的authorized_keys文件中即可。

四、Cloudera安装

注意: CentOS可能自带了MariaDB,注意观察安装日志是否被取代

1.安装mysql

1 查看CentOS自带mysql是否已安装。输入:

 sudo yum list installed | grep mysql

2 若有自带安装的mysql,如何卸载CentOS系统自带mysql数据库?输入:

sudo yum -y remove mysql-libs.x86_64

若有多个依赖文件则依次卸载, 当结果显示为Complete!即卸载完毕。

3.查看yum库上的mysql版本信息(CentOS系统需要正常连接网络)。 输入:

 sudo yum list | grep mysql 或 sudo yum -y list mysql*

4.使用yum安装mysql数据库。 输入:

sudo yum -y install mysql-server mysql mysql-devel

命令将:mysql-server、mysql、mysql-devel都安装好,当结果显示为“Complete!”即安装完毕。
    注:安装mysql只是安装了数据库,只有安装mysql-server才相当于安装了客户端。

5.设置开机启动:

sudo chkconfig mysqld on

6.删除/var/lib/mysql/ib_logfile0 和 /var/lib/mysql/ib_logfile1文件

rm -f /var/lib/mysql/ib_logfile0
rm -f /var/lib/mysql/ib_logfile1

7.安装MySQL的JDBC Driver

在地址https://dev.mysql.com/downloads/connector/j/5.1.html下载最近的驱动
解压下载的压缩包:tar zxvf mysql-connector-java-5.1.31.tar.gz
复制jar包到指定目录:$ sudo cp mysql-connector-java-5.1.31/mysql-connector-java-5.1.31-bin.jar /usr/share/java/mysql-connector-java.jar
如果目录不存在:$ sudo mkdir -p /usr/share/java/
$ sudo cp mysql-connector-java-5.1.31/mysql-connector-java-5.1.31-bin.jar /usr/share/java/mysql-connector-java.jar

8.修改mysql配置文件

cp /etc/my.cnf /etc/my.cnf.bak
vim /etc/my.cnf

cloudera推荐的配置如下:

[mysqld]
transaction-isolation = READ-COMMITTED
# Disabling symbolic-links is recommended to prevent assorted security risks;
# to do so, uncomment this line:
# symbolic-links = 0key_buffer_size = 32M
max_allowed_packet = 32M
thread_stack = 256K
thread_cache_size = 64
query_cache_limit = 8M
query_cache_size = 64M
query_cache_type = 1max_connections = 550
#expire_logs_days = 10
#max_binlog_size = 100M#log_bin should be on a disk with enough free space. Replace '/var/lib/mysql/mysql_binary_log' with an appropriate path for your system
#and chown the specified folder to the mysql user.
log_bin=/var/lib/mysql/mysql_binary_log# For MySQL version 5.1.8 or later. For older versions, reference MySQL documentation for configuration help.
binlog_format = mixedread_buffer_size = 2M
read_rnd_buffer_size = 16M
sort_buffer_size = 8M
join_buffer_size = 8M# InnoDB settings
innodb_file_per_table = 1
innodb_flush_log_at_trx_commit  = 2
innodb_log_buffer_size = 64M
innodb_buffer_pool_size = 4G
innodb_thread_concurrency = 8
innodb_flush_method = O_DIRECT
innodb_log_file_size = 512M[mysqld_safe]
log-error=/var/log/mysqld.log
pid-file=/var/run/mysqld/mysqld.pidsql_mode=STRICT_ALL_TABLES

9.执行MySQL脚本初始化root帐号

/usr/bin/mysql_secure_installation

Set root password? [Y/n] y
Remove anonymous users? [Y/n] y
Disallow root login remotely? [Y/n] n
Remove test database and access to it? [Y/n] y
Reload privilege tables now? [Y/n] y

9.启动mysql,输入:

 sudo service mysqld start

10.修改mysql的访问权限
    输入:mysql -uroot -proot

mysql> grant all privileges on *.* to 'root'@'%' identified by 'root';
mysql> flush privileges;

2.创建cloudera manager需要的数据库

注意: 原文中的数据库清单不全, 缺少hue和scm, 准确清单如下:

Role Database User Password
Activity Monitor amon amon amon_password
Reports Manager rman rman rman_password
Hive Metastore Server hive hive hive_password
Sentry Server sentry sentry sentry_password
Cloudera Navigator Audit Server nav nav nav_password
Cloudera Navigator Metadata Server navms navms navms_password
Cloudera Manager scm scm scm_password
Oozie oozie oozie oozie_password
Hue hue hue hue_password

以管理员身份登陆MySQL并执行以下SQL:

CREATE DATABASE scm DEFAULT CHARACTER SET utf8;grant all on scm.* TO 'scm'@'%' IDENTIFIED BY 'scm_password';CREATE DATABASE amon DEFAULT CHARACTER SET utf8;grant all on amon.* TO 'amon'@'%' IDENTIFIED BY 'amon_password';CREATE DATABASE rman DEFAULT CHARACTER SET utf8;grant all on rman.* TO 'rman'@'%' IDENTIFIED BY 'rman_password';CREATE DATABASE hive DEFAULT CHARACTER SET utf8;grant all on hive.* TO 'hive'@'%' IDENTIFIED BY 'hive_password';CREATE DATABASE sentry DEFAULT CHARACTER SET utf8;grant all on sentry.* TO 'sentry'@'%' IDENTIFIED BY 'sentry_password';CREATE DATABASE nav DEFAULT CHARACTER SET utf8;grant all on nav.* TO 'nav'@'%' IDENTIFIED BY 'nav_password';CREATE DATABASE navms DEFAULT CHARACTER SET utf8;grant all on navms.* TO 'navms'@'%' IDENTIFIED BY 'navms_password';CREATE DATABASE oozie DEFAULT CHARACTER SET utf8;grant all on oozie.* TO 'oozie'@'%' IDENTIFIED BY 'oozie_password';CREATE DATABASE hue DEFAULT CHARACTER SET utf8;grant all on hue.* TO 'hue'@'%' IDENTIFIED BY 'hue_password';FLUSH PRIVILEGES;

3.在master节点安装cloudera manager server和cloudera manager agent

1.在master节点安装cloudera manager server和cloudera manager agent

yum install cloudera-manager-daemons cloudera-manager-server cloudera-manager-agent

2.在master节点执行scm_prepare_database.sh

/usr/share/cmf/schema/scm_prepare_database.sh mysql scm scm scm_password

3.启动cloudera manager server

service cloudera-scm-server start

4.查看日志文件是否报错:

tail -f /var/log/cloudera-scm-server/cloudera-scm-server.log

5.启动cloudera manager agent

service cloudera-scm-agent start

6.查看日志文件是否报错:

tail -f /var/log/cloudera-scm-agent/cloudera-scm-agent.log

4.在其他节点安装cloudera manager agent

1.安装cloudera manager agent

yum install cloudera-manager-daemons cloudera-manager-agent

2.修改 /etc/cloudera-scm-agent/config.ini 中的server_host为master的IP, (注意填Private IP或者机器名)

vim /etc/cloudera-scm-agent/config.ini
[General]# Hostname of the CM server.server_host=masterHostIp #这里改成master的ip# Port that the CM server is listening on.server_port=7182

3.启动cloudera manager agent

service cloudera-scm-agent start

4.查看日志文件是否报错:

tail -f /var/log/cloudera-scm-agent/cloudera-scm-agent.log

5.安装CDH 5.14.2

1.使用parcel方式安装,先下载好资源文件,下载版本为5.14.2

资源地址:http://archive.cloudera.com/cdh5/parcels/5.14.2/

下载CentOS6.6对应的文件:

CDH-5.14.2-1.cdh5.14.2.p0.3-el6.parcel   2018-04-06 13:05    1.7 GB
CDH-5.14.2-1.cdh5.14.2.p0.3-el6.parcel.sha1 2018-04-06 13:05    41.0 B
manifest.json   2018-04-06 13:05    72.3 KB

2.将下载好的资源文件放到指定目录:

[root@tdxy-bigdata-03 parcel-repo]# pwd
/opt/cloudera/parcel-repo

3.修改目录文件权限 并把CDH-5.14.2-1.cdh5.14.2.p0.3-el6.parcel.sha1修改为CDH-5.14.2-1.cdh5.14.2.p0.3-el6.parcel.sha

完成之后,目录中的文件为:

修改权限
chown cloudera-scm:cloudera-scm ./*
[root@tdxy-bigdata-03 parcel-repo]# ll
total 1806480
-rw-r--r-- 1 cloudera-scm cloudera-scm 1849673608 Jul  5 02:46 CDH-5.14.2-1.cdh5.14.2.p0.3-el6.parcel
-rw-r--r-- 1 cloudera-scm cloudera-scm         41 Jul  4 19:09 CDH-5.14.2-1.cdh5.14.2.p0.3-el6.parcel.sha
-rw-r--r-- 1 cloudera-scm cloudera-scm      74062 Aug 24 15:09 manifest.json

4.打开 http://masterHost:7180 (cloudera-manager-server所在服务器的公网IP), 进入管理页面进行安装

登录,默认用户名为admin,密码为admin。

在条款页面 点击同意

在“欢迎使用 Cloudera Manager”页面, 选择Cloudera Express版本

然后进入下个页面时应在“当前管理的主机”内看到刚才的服务器清单, 点击全选, 进入下一步

5.选择CDH的时候,选择parcel安装,版本选择5.14.2,其他的选无。

6.然后会进入安装界面:

7.安装后会进入检查主机正确性界面

 8.Select Services

按照自己集群的需要选择服务,可以选择核心Hadoop等,也可以选择自定义。

9.自定义角色分配

按照前面的角色分配,把相应的服务分配到指定主机。

10.设置hive, hue和oozie的数据库连接

11.其他配置

12.完成配置

Cloudera Manager5.14.3集群搭建相关推荐

  1. Kubernetes(k8s)1.14 离线版 集群搭建系列

    声明:          如果您有更好的技术与作者分享,或者商业合作:          请访问作者个人网站 http://www.esqabc.com/view/message.html  留言给作 ...

  2. Hbase基础(特点、架构、应用场景、集群搭建、HA设计)这一篇就够了

    Hbase基础(特点.架构.应用场景.集群搭建.HA设计)这一篇就够了 1. Hbase特点 2. Hbase VS RDBMS 3. Hbase架构及版本选择 4. Hbase应用场景 5. Ntp ...

  3. cdh集群搭建(6.3)

    如果你的虚拟机给的内存少于14G,不用往下看了,机器压力非常大,建议先装内存条. 我们做大数据的,机器就是要大硬盘,大内存,高核cpu,其他无所谓,如果要做机器学习,那你显卡还得很好. cdh的好处, ...

  4. 环境搭建-Hadoop集群搭建

    环境搭建-Hadoop集群搭建 写在前面,前面我们快速搭建好了centos的集群环境,接下来,我们就来开始hadoop的集群的搭建工作 实验环境 Hadoop版本:CDH 5.7.0 这里,我想说一下 ...

  5. Hadoop集群搭建(超详细)

    Hadoop三大公司 apache hortonWorks Cloudera 星环科技(国内) Hadoop的模块组成 HDFS:一个高可靠.高吞吐量的分布式文件系统. MapReduce:一个分布式 ...

  6. java kafka 集群消费_kafka集群搭建和使用Java写kafka生产者消费者

    转自:http://chengjianxiaoxue.iteye.com/blog/2190488 1 kafka集群搭建 1.zookeeper集群 搭建在110, 111,112 2.kafka使 ...

  7. Spark集群搭建【Spark+Hadoop+Scala+Zookeeper】

    1.安装Linux 需要:3台CentOS7虚拟机 IP:192.168.245.130,192.168.245.131,192.168.245.132(类似,尽量保持连续,方便记忆) 注意: 3台虚 ...

  8. Hadoop2.6.5集群搭建

    一. Hadoop的分布式模型 Hadoop通常有三种运行模式:本地(独立)模式.伪分布式(Pseudo-distributed)模式和完全分布式(Fully distributed)模式. 安装完成 ...

  9. hadoop + spark+ hive 集群搭建(apache版本)

    0. 引言 hadoop 集群,初学者顺利将它搭起来,肯定要经过很多的坑.经过一个星期的折腾,我总算将集群正常跑起来了,所以,想将集群搭建的过程整理记录,分享出来,让大家作一个参考. 由于搭建过程比较 ...

  10. RabbitMQ的安装及集群搭建方法

    转自:http://blog.csdn.net/u013256816/article/details/53524766 RabbitMQ安装 1 安装erlang 下载地址:http://www.er ...

最新文章

  1. 简述RHEL7新特性(一)
  2. Hook技术之4 在自己的进程中注入一个Dll到别人的进程
  3. 自适应页面 移动端获取焦点自动放大_专业 | 惠检LIMS系统:手机移动应用(MA)...
  4. Unix 网络编程(四)- 典型TCP客服服务器程序开发实例及基本套接字API介绍
  5. java字符串替换空格符_特殊的空格(Java无法替换字符串中的空格)转
  6. 基于javaweb+jsp的员工绩效考核管理系统(带报告文档)
  7. C# 专业的软件安装包
  8. FFmpeg —— 屏幕录像机
  9. zemax中如何和matlab中通信,如何在Zemax与Matlab间通信
  10. python之迭代器和生成器全解--包含实现原理及应用场景
  11. 阿里云OSS线程增长问题分析
  12. 斯坦福全球AI报告:中国AI论文发表数首超欧洲,全球AI投资700亿
  13. 积水成渊:用github gist收藏你的代码片段
  14. 英特尔AI医疗实战曝光:10倍加速辅助诊断、准确度高达90%
  15. 领军服务外包 大连软件业加速对接资本市场
  16. 双因素认证,让用户的帐号安全无忧
  17. 用Python分析了7000多个交易日的涨跌数据,看看A股有没有“黑色星期五”
  18. k8s.io/client-go@v0.20.2/tools/cache/reflector.go:167: Failed to watch *v1beta1.Ingress: failed to l
  19. DM backup database 报错[-7169](bakres与dmap消息通信失败)
  20. 腾讯文档服务器异常怎么回事,腾讯文档怎么编辑不了 编辑不了解决方法

热门文章

  1. Gullo’s Hosting保加利亚NAT VPS评测
  2. html计时加速,HTML-加速、再加速
  3. 电动自行车16 CFR 1512标准要求及流程
  4. 描写计算机老师上课的神态,描写老师上课的神态的作文300字
  5. 【cocos2dx】记录解决csb创建font字体造成的内存泄漏问题
  6. win7 计算机 其他 删除,win7双系统怎么删除一个?windows7双系统删除一个方法汇总...
  7. Java项目经验之交易密码安全机制
  8. MySQL学习笔记(6)
  9. 建立主DNS区域和辅助DNS区域的最佳实践
  10. MSSQL2005的新功能创建数据库快照