2019独角兽企业重金招聘Python工程师标准>>>

一、服务/容器

1、为什么我只能编辑容器的名称?

Docker容器在创建之后就不可更改了。唯一可更改的内容是我们要存储的不属于Docker容器本身的那一部分数据。无论是停止、启动或是重新启动,它始终在使用相同的容器。如需改变任何内容都需要删除或重新创建一个容器。

你可以克隆,即选择已存在的容器,并基于已有容器的配置提前在添加服务界面中填入所有要设置的内容,如果你忘记填入某项内容,可以通过克隆来改变它之后删除旧的容器。

2、service-link的容器/服务在Rancher中是如何工作的?

在Docker中,关联容器(在docker run中使用--link)的ID和IP地址会出现在容器的/etc/hosts中。在Rancher中,我们不需要更改容器的/etc/hosts文件,而是通过运行一个内部DNS服务器来关联容器,DNS服务器会返回给我们正确的IP。

3、不能通过Rancher的界面打开命令行或查看日志,如何去访问容器的命令行和日志?

Agent主机有可能会暴露在公网上,Agent上接受到的访问容器命令行或者日志的请求是不可信的。Rancher Server中发出的请求包括一个JWT(JSON Web Token),JWT是由服务器签名并且可由Agent校验的,Agent可以判断出请求是否来自服务器,JWT中包括了有效期限,有效期为5分钟。这个有效期可以防止它被长时间使用。如果JWT被拦截而且没有用SSL时,这一点尤为重要。

如果你运行docker logs -f (rancher-agent名称或ID)。日志会显示令牌过期的信息,随后检查Rancher Server主机和Rancher Agent主机的时钟是否同步。

4、在哪里可以看到我的服务日志?

在服务的详细页中,我们提供了一个服务日志的页签日志。在日志页签中,列出了和服务相关的所有事件,包括时间戳和事件相关描述,这些日志将会保留24小时。

5、RANCHER SERVER 点击WEB shell屏幕白屏

如果RANCHER SERVER 运行在V1.6.2版本,点击WEB shell出现白屏,这是UI上的一个BUG,请选择升级server服务。

二、跨主机通信

如果容器运行在不同主机上,不能够ping通彼此,可能是由一些常见的问题引起的。

1、如何检查跨主机通信是否正常?

在应用->基础设施中,检查 healthcheck 应用的状态。如果是active跨主机通信就是正常的。

手动测试,你可以进入任何一个容器中,去ping另一个容器的内部IP。在主机页面中可能会隐藏掉基础设施的容器,如需查看点击“显示系统容器”的复选框。

2、UI中显示的主机IP是否正确?

有时,Docker网桥的IP地址会被错误的作为了主机IP,而并没有正确的选择真实的主机IP。这个错误的IP通常是172.17.42.1或以172.17.x.x开头的IP。如果是这种情况,在使用docker run命令添加主机时,请用真实主机的IP地址来配置CATTLE_AGENT_IP环境变量。

sudo docker run -d -e CATTLE_AGENT_IP=<HOST_IP> --privileged \
-v /var/run/docker.sock:/var/run/docker.sock \
rancher/agent:v0.8.2 http://SERVER_IP:8080/v1/scripts/xxxx

3、Rancher的默认子网(10.42.0.0/16)在我的网络环境中已经被使用或禁止使用,我应该怎么去更改这个子网?

Rancher Overlay网络默认使用的子网是10.42.0.0/16。如果这个子网已经被使用,你将需要更改Rancher网络中使用的默认子网。你要确保基础设施服务里的Network组件中使用着合适的子网。这个子网定义在该服务的rancher-compose.yml文件中的default_network里。

要更改Rancher的IPsec或VXLAN网络驱动,你将需要在环境模版中修改网络基础设施服务的配置。创建新环境模板或编辑现有环境模板时,可以通过单击编辑来配置网络基础结构服务的配置。在编辑页面中,选择配置选项>子网输入不同子网,点击配置。在任何新环境中将使用环境模板更新后的子网,编辑已经有的环境模板不会更改现在已有环境的子网。

这个实例是通过升级网络驱动的rancher-compose.yml文件去改变子网为10.32.0.0/16。

ipsec:network_driver:name: Rancher IPsecdefault_network:name: ipsechost_ports: truesubnets:# After the configuration option is updated, the default subnet address is updated- network_address: 10.32.0.0/16dns:- 169.254.169.250dns_search:- rancher.internalcni_config:'10-rancher.conf':name: rancher-cni-networktype: rancher-bridgebridge: docker0# After the configuration option is updated, the default subnet address is updatedbridgeSubnet: 10.32.0.0/16logToFile: /var/log/rancher-cni.logisDebugLevel: falseisDefaultGateway: truehostNat: truehairpinMode: truemtu: 1500linkMTUOverhead: 98ipam:type: rancher-cni-ipamlogToFile: /var/log/rancher-cni.logisDebugLevel: falseroutes:- dst: 169.254.169.250/32

注意:随着Rancher通过升级基础服务来更新子网,以前通过API更新子网的方法将不再适用。

4、VXLAN 网络模式下,跨主机容器无法通信

Vxlan 通过4789端口实现通信,检查防火墙有没有开放此端口;

执行iptables -t filter -L -n参看IPtable表,查看chain FORWARD 是不是被丢弃,如果是,执行sudo iptables -P FORWARD ACCEPT

三、DNS

1、如何查看我的DNS是否配置正确?

如果你想查看Rancher DNS配置,点击应用 > 基础服务。点击network-services应用,选择metadata,在metadata中,找到名为network-services-metadata-dns-X的容器,通过UI点击执行命令行后,可以进入该容器的命令行,然后执行如下命令。

cat /etc/rancher-dns/answers.json

2、在Ubuntu上运行容器时彼此间不能正常通信。

如果你的系统开启了UFW,请关闭UFW或更改/etc/default/ufw中的策略为:

DEFAULT_FORWARD_POLICY="ACCEPT"

四、负载均衡

1、为什么我的负载均衡一直是Initializing状态?

负载均衡器自动对其启用健康检查。如果负载均衡器处于初始化状态,则很可能主机之间无法进行跨主机通信。

2、我如何查看负载均衡的配置?

如果要查看负载均衡器的配置,你需要用进入负载均衡器容器内部查找配置文件,你可以在页面选择负载均衡容器的执行命令行

cat /etc/haproxy/haproxy.cfg

该文件将提供负载均衡器的所有配置详细信息。

3、我在哪能找到HAproxy的日志?

HAProxy的日志可以在负载均衡器容器内找到。负载均衡器容器的docker logs只提供与负载均衡器相关的服务的详细信息,但不提供实际的HAProxy日志记录。

cat /var/log/haproxy

4、如何自定义负载均衡的配置

如图,在自定义配置中,按照global、defaults、frontend、backend的格式配置。

五、健康检查

1、为什么健康检查服务一直显示黄色初始化状态?

healthcheck不仅为其他服务提供健康检查,对系统组件(比如调度服务)也提供健康检查服务,healthcheck也对自己进行健康检查。多个healthcheck组件时,它们会相互交叉检查,只有健康检查通过后,容器状态才会变成绿色。而healthcheck一直显示黄色初始化状态,说明一直没有通过健康检查。健康检查都是通过网络访问的,所以一定是网络通信异常导致。

六、调度

为什么节点关机后,应用没有自动调度到其他节点上?Rancher上应用的调度,需要配合健康检查功能。当健康检查检查到应用不健康才会重新调度,如果没有配置健康检查,即使关机,cattle也不会对应用做调度处理。

七、CentOS

1、为什么容器无法连接到网络?

如果你在主机上运行一个容器(如:docker run -it ubuntu)该容器不能与互联网或其他主机通信,那可能是遇到了网络问题。Centos默认设置/proc/sys/net/ipv4/ip_forward为0,这从底层阻断了Docker所有网络。

解决办法:

vi /usr/lib/sysctl.d/00-system.conf

添加如下代码:

net.ipv4.ip_forward=1
net.bridge.bridge-nf-call-ip6tables = 1
net.bridge.bridge-nf-call-iptables = 1
net.bridge.bridge-nf-call-arptables = 1

重启network服务

systemctl restart network

查看是否修改成功

sysctl net.ipv4.ip_forward

如果返回为net.ipv4.ip_forward = 1则表示成功了

八、京东云

1、京东云运行rancher server出现以下问题

解决办法:sudo sysctl -w net.ipv4.tcp_mtu_probing=1

推荐阅读:《FAQ宝典之Rancher Server》,《FAQ宝典之Rancher Server、K8s、Docker》

转载于:https://my.oschina.net/u/3330830/blog/1596601

FAQ宝典之常见问题排查与修复方法相关推荐

  1. 运维人员打字耍不要快_Linux运维人员应该知道的系统故障排查及修复方法

    今天小编要跟大家分享的文章是关于Linux运维人员应该知道的系统故障排查及修复方法.熟悉Linux的小伙伴都知道,Linux系统在启动过程中会出现一些故障,导致系统无法正常启动,小编在文章中分享了几个 ...

  2. 手机屏幕常见故障_触屏不灵敏、断触怎么回事?手机触摸屏的基本原理与常见问题排查方法介绍...

    手机触摸屏断触是怎么回事?大家在日常使用中可能会碰到各种各样的触摸屏问题,类似:断触,滑动屏幕不跟手,输入法打字不灵敏,游戏中多点触摸不灵敏,等问题,下面咱们从利用排除法来进行排查定位.想要弄清手机触 ...

  3. DNF登陆的时候说连接服务器失败,请检查您的网络。是否启用修复程序进行修复?,地下城和勇士常见问题修复方法.doc...

    地下城和勇士常见问题修复方法 日常问答 [未使用第三方软件被系统提示使用第三方软件] 解决方案:请到 HYPERLINK "/dnf/index_dnf.htm?t=dnf" \t ...

  4. js vm报错_uni-app v3版本更新常见问题排查

    uni-app v3版本更新常见问题排查 组件不显示或者功能异常 原因:组件内使用了 onReady,onReady 是页面的生命周期,不应在组件中直接使用,组件中应该使用 mounted 生命周期 ...

  5. 安装程序将在重启您的计算机后黑屏,安装windows10一直黑屏怎么解决_win10安装到一半黑屏修复方法...

    现阶段,许多用户都慢慢开始给自己配置一台电脑在使用了,但是由于新入手的电脑中安装的系统不是用户所要win10版本,因此就会有用户对其进行重新安装,可是在安装的过程中却突然出现安装到一半就黑屏的现象,那 ...

  6. Linux系统故障排查和修复技巧

    (一)单用户模式 Linux系统提供了单用户模式(类似Windows安全模式),可以在最小环境中进行系统维护.在单用户模式(运行级别1)中,Linux引导进入根shell,网络被禁用,只有少数进程运行 ...

  7. 小米 samba linux,解决Win10.4无法访问samba协议小米路由盘修复方法

    原标题:解决Win10.4无法访问samba协议小米路由盘修复方法 近日,应该有不是朋友使用Win10升级到最新系统Windows 10 Fall Creators Update(秋季创意者更新),这 ...

  8. 这些常见的漏洞和修复方法你知道吗?

    1.SQL注入 描述:Web程序中对于用户提交的参数未做过滤直接拼接到SQL语句中执行,导致参数中的特殊字符破坏了原有SQL语句逻辑,攻击者可以利用这个漏洞执行任意SQL语句. 修复方法: 代码层最佳 ...

  9. vcruntime140_1.dll无法继续执行代码,vcruntime140_1.dll丢失修复方法

    电脑更新卸载一些垃圾软件后,再打开游戏或者软件程序的时候,电脑突然提示VCRUNTIME140_1.dll找不到?这个问题不少小伙伴都遇到过,但是不知道怎么修复?折腾了半天也没有修复,其实这个修复起来 ...

最新文章

  1. Java并发学习三:银行转账的死锁问题解决及示例
  2. 跟我学雨林木风系统制作——2.涉及的技术及用到的工具介绍
  3. 学完了python能做什么-学完Python能做什么
  4. Oracle10g的flashback drop
  5. 【LOJ#6682】梦中的数论(min_25筛)
  6. LeetCode 668. 乘法表中第k小的数(二分查找)
  7. 一句话超短摘要,速览752篇EMNLP论文
  8. 安卓逆向_15( 一 ) --- JNI 和 NDK
  9. 最让人纠结的等式:0.999...=1
  10. 一文掌握 Linux 性能分析之网络篇(续)
  11. Rainmeter个人使用的插件
  12. 动态规划-自底向上的 0-1 背包问题
  13. Java版 设计一个程序, 输入三位数a, 分别输出个,十,百位
  14. LeaRun .Net Core/Java工作流引擎,分离式前端,升级Vue
  15. 2017年Gartner的数据防泄漏(DLP)魔力象限(Magic Quadrant)
  16. VS2010开发体验系列之二 - 语言C#4.0
  17. 06oracle视图与物化视图
  18. 为什么鸿蒙系统那么火七星彩,七星彩要想独中500万 我们告诉你会出哪些号码!...
  19. 文本大数据挖掘项目(Go语言)
  20. 千万不要和男生说:世界上没有奥特曼,否则你会见识到真正的奥特曼。

热门文章

  1. ununtu20.04系统中如何划词翻译_如何高效阅读PDF外文文献,这一篇文章全搞定
  2. Android面试题集合
  3. 12C OCP 1ZO-071 题库(8月以前)
  4. 如何使用数据库SCHEDULER来执行清归档脚本
  5. 物理机Windoes上运行VWware 虚拟机连接外部物理机、外部网络的方法
  6. c 语言贪心钓鱼思路,2020届九年级中考语文复习教案:第4讲现代文阅读之概括(27页)-原创力文档...
  7. jwt token长度限制_ASP.NET Core Web Api之JWT(一)
  8. mac idea用自带的maven还是_苹果电脑自带截图工具怎么用?mac自带截屏工具使用技巧分享
  9. vue xlsx 导入导出_只需三步vue实现excel文件数据提取并存为json数据
  10. 数据库系统概论:第六章 关系数据库理论