我在使用rancher过程中遇到的问题:

一开始是用的单机的环境,没有设置启动内存,而且mysql使用的是内嵌的数据库。Rancher Server在运行了几个月后变的极慢,甚至不能再添加和启动、删除容器,一个操作会卡在那一直不动。

当时的启动命令是

sudo docker run --name rancher-server -d --restart=unless-stopped -p 18180:8080 rancher/server

可以参看我之前写的文章https://www.jianshu.com/p/1a80328ea0a5

问题调研

翻看了rancher社区和官方文档发现:

很可能有一些任务由于某些原因而处于僵死状态,如果你能够用界面查看系统管理 -> 系统进程,你将可以看到Running中的内容,如果这些任务长时间运行(并且失败),则Rancher会最终使用太多的内存来跟踪任务。这使得Rancher Server处于了内存不足的状态。

为了使服务器变为可响应状态,你需要添加更多内存。通常4GB的内存就够了。

你需要再次运行Rancher Server命令并且添加一个额外的选项-e JAVA_OPTS="-Xmx4096m",但是由于之前用的是内嵌的mysql,一旦重新运行一个容器,所有数据就会丢失,所以强烈建议使用外部mysql

$ docker run -d -p 8080:8080 --restart=unless-stopped -e JAVA_OPTS="-Xmx4096m" rancher/server

根据MySQL数据库的设置方式的不同,你可能需要进行升级才能添加该选项。

如果是由于缺少内存而无法看到系统管理 -> 系统进程的话,那么在重启Rancher Server之后,已经有了更多的内存。你现在应该可以看到这个页面了,并可以开始对运行时间最长的进程进行故障分析。

解决方案

1. 使用外部的msyql数据库

在你的外部数据库中,只需要提前创建数据库名和数据库用户。Rancher会自动创建Rancher所需要的数据库表。

以下是创建数据库和数据库用户的SQL命令例子

CREATE DATABASE IF NOT EXISTS cattle COLLATE = 'utf8_general_ci' CHARACTER SET = 'utf8';

GRANT ALL ON cattle.* TO 'cattle'@'%' IDENTIFIED BY 'cattle';

GRANT ALL ON cattle.* TO 'cattle'@'localhost' IDENTIFIED BY 'cattle';

启动一个Rancher连接一个外部数据库,你需要在启动容器的命令中添加额外参数。

sudo docker run -d --restart=unless-stopped -p 8080:8080 rancher/server \

--db-host myhost.example.com --db-port 3306 --db-user username --db-pass password --db-name cattle

大部分的输入参数都有默认值并且是可选的,只有MySQL server的地址是必须输入的。

--db-host IP or hostname of MySQL server

--db-port port of MySQL server (default: 3306)

--db-user username for MySQL login (default: cattle)

--db-pass password for MySQL login (default: cattle)

--db-name MySQL database name to use (default: cattle)

多节点的HA部署

HA部署需求

HA 节点:

所有安装有支持的Docker版本的现代Linux发行版 RancherOS, Ubuntu, RHEL/CentOS 7 都是经过严格的测试。

对于 RHEL/CentOS, 默认的 storage driver, 例如 devicemapper using loopback, 并不被Docker推荐。 请参考Docker的文档去修改使用其他的storage driver。

对于 RHEL/CentOS, 如果你想使用 SELinux, 你需要 安装额外的 SELinux 组件.

9345, 8080 端口需要在各个节点之间能够互相访问

1GB内存

MySQL数据库

至少 1 GB内存

每个Rancher Server节点需要50个连接 (例如:3个节点的Rancher则需要至少150个连接)

MYSQL配置要求

选项1: 用默认COMPACT选项运行Antelope

选项2: 运行MySQL 5.7,使用Barracuda。默认选项ROW_FORMAT需设置成Dynamic

外部负载均衡服务器

负载均衡服务器需要能访问Rancher Server节点的 8080 端口

大规模部署建议

每一个Rancher Server节点需要有4 GB 或者8 GB的堆空间,意味着需要8 GB或者16 GB内存

MySQL数据库需要有高性能磁盘

对于一个完整的HA,建议使用一个有副本的Mysql数据库。另一种选择则是使用Galera集群并强制写入一个MySQL节点。

在每个需要加入Rancher Server HA集群的节点上,运行以下命令:

docker run -d --restart=unless-stopped -p 8080:8080 -p 9345:9345 -e JAVA_OPTS="-Xmx4096m" rancher/server \

--db-host myhost.example.com --db-port 3306 --db-user username --db-pass password --db-name cattle \

--advertise-address

在每个节点上, 需要在每个节点上唯一,因为这个IP会被添加到HA的设置中。

如果你修改了 -p 8080:8080 并在host上暴露了一个不一样的端口,你需要添加 --advertise-http-port 参数到命令中。

注意:

你可以使用 docker run rancher/server --help 获得命令的帮助信息

配置一个外部的负载均衡器,这个负责均衡负责将例如80或443端口的流量,转发到运行Rancher Server的节点的8080端口中。负载均衡器必须支持websockets 以及 forwarded-for 的Http请求头以支持Rancher的功能。参考 使用SSL 这个配置的例子。

rancher2.0安装mysql_高可用rancher集群搭建相关推荐

  1. (七)centos7案例实战——nginx+keepalived高可用服务器集群搭建

    前言 本节内容延续之前的内容,往期博客已经介绍了如何安装nginx服务器以及将nginx安装成为一个系统服务,本节内容是在前期内容的基础上,搭建一个高可用的nginx服务器集群,主要使用Keepali ...

  2. 【有料】4 种高可用 RocketMQ 集群搭建方案!

    背景 笔者所在的业务线,最初化分为三个服务,由于业务初期业务复杂度相对简单,三个业务服务都能很好的独立完成业务功能. 随着产品迭代,业务功能越来越多后慢慢也要面对高并发.业务解耦.分布式事务等问题,所 ...

  3. Hadoop2.2.0 HA高可用分布式集群搭建(hbase,hive,sqoop,spark)

    1 需要软件 Hadoop-2.2.0 Hbase-0.96.2(这里就用这个版本,跟Hadoop-2.2.0是配套的,不用覆盖jar包什么的) Hive-0.13.1 Zookeepr-3.4.6( ...

  4. 基于虚拟机高可用redis集群搭建

    redis集群搭建 介绍 刚开始学习 redis集群搭建可能会被繁琐的配置劝退,但重复配置是我们敲代码路上最平坦的一条路了,希望晨雨和大家以后都有足够的耐心,学好技术,装好B格.本文基于redis-5 ...

  5. springcloud高可用服务器集群搭建

    服务器健壮是非常重要的, 但是有很多种原因可能会导致服务注册中心宕机,如果宕机就会有一些灾难性的问题出现,所以保证服务注册中心处于活着运行状态显得尤为重要!!! 我们必须保证,哪怕某些服务器宕机了我们 ...

  6. activeMq-2 高可用以及集群搭建

    Activemq 的集群方法可以有多种实现方式,我们这里使用zookeeper来实现 要搭建集群,请确保已经搭建好zookeeper环境.这里不再演示. 基本原理: 使用ZooKeeper(集群)注册 ...

  7. MySQL服务MySQL+MHA高可用服务集群搭建

    MySQL MHA MySQL MHA 一.MHA概念 1.MHA 的组成 2.MHA 的特点 二.搭建MySQL+MHA 1.所有服务器,关闭系统防火墙和安全机制 2.修改 master(192.1 ...

  8. flink HA高可用Standalone集群搭建

    flink 1.9.2版本搭建的HA JM存在bug: 明明在node01, node02两个节点上都有JM,但是孰是activing,孰是standby状态无法区分.Spark是有明确的状态显示的. ...

  9. NameNode自动HA(高可用) 集群搭建和启动

    1.规划 2. ssh时不提示信息配置 后续需要编写HDFS HA集群的启动和关闭的Shell脚本,在Shell脚本中会涉及到 ssh nodeX 命令,将会出现提示fingerprint信息,比较烦 ...

最新文章

  1. R计算数组的累计加和(Cumulative Sums)
  2. ecmall数据库表详解 二次开发必备
  3. 华尔街英语软件_华尔街英语吧啦吧啦聊点啥:美式“人情世故”
  4. xcode 可以打开xmind_原来xmind还有一款如此漂亮的思维导图工具
  5. 如何实现tm同时监控多个状态的改变_广电机房监控系统【斯必得智慧机房】
  6. vs strcore.cpp(156) 内存泄漏
  7. 实现userdetails_Spring Security使用Hibernate实现自定义UserDetails
  8. 10分钟实现RPC框架
  9. SSP控制寄存器SSPCON
  10. xp系统运行asp.net时候出现“服务器应用程序不可用”,vs2005无法启动调试
  11. 电信华为 HG526 破解 - 简易启用USB恢复
  12. 惠普服务器故障代码_hp常见错误代码
  13. 图书排行:计算机书籍每周销量排行榜
  14. RDIFramework.NET ━ 9.10 岗位(职位)管理 ━ Web部分
  15. java汽车租赁系统(java租赁系统java共享汽车java汽车租借系统)java汽车租赁管理系统java自行车租赁系统共
  16. 半小时一篇文过完C语言基础知识点
  17. Python爬虫:爬取华为应用市场app数据
  18. [pyecharts1.7] 坐标轴设置:X轴、Y轴通用
  19. 【毕业设计】基于STM32的智能路灯设计与实现 - 物联网 嵌入式 单片机
  20. 计算机主板系统安装系统安装系统,重装系统_系统重装_电脑重装系统【步骤|图文教程】-太平洋IT百科手机版...

热门文章

  1. SPOJ 2713 线段树(sqrt)
  2. POJ2186 强联通
  3. C语言经典例66-输入3个数a,b,c,按大小顺序输出
  4. 【错误记录】编译 Linux 内核报错 ( fatal error: openssl/opensslv.h: No such file or directory )
  5. 【数字信号处理】相关函数 ( 卷积与交换性 | 相关函数不具有交换性 | 推导过程 )
  6. 【商务智能】数据仓库 ( 多维数据模型 | 多维数据分析 )
  7. 【RecyclerView】 七、RecyclerView.ItemDecoration 条目装饰 ( getItemOffsets 边距设置 )
  8. Educational Codeforces Round 66 (Rated for Div. 2)
  9. Hadoop-2.8.5的HA集群搭建
  10. C++11 (多线程)并发编程总结