Pod挂载Volume失败问题分析
Kubernetes环境偶尔出现StatefulSet中的Pod被删除,新启动的Pod(还是调度到原有节点)挂载volume失败的问题,如下图,经过一番定位分析,也让我们对于Kubernetes系统复杂程度有了新的认知。
在分析此问题之前,作为相关背景知识,先简单介绍对于Kubernetes存储系统的理解。
| 存储系统简析
存储也是Kubernetes中比较重要而复杂的系统,功能比较庞大,涉及到不同组件中,不同控制器的协作,如下图。
从三个维度分析:
1、从卷的生命周期来讲,卷被Pod使用或者卷被回收,会依赖顺序严格的几个阶段
卷被Pod使用:
provision,卷分配成功
attach,卷挂载在对应worker node
mount,卷挂载为文件系统并且映射给对应Pod
卷要成功被Pod使用,需要遵循以上顺序。
卷被回收:
umount,卷已经和对应worker node解除映射,且已经从文件系统umount
detach,卷已经从worker node卸载
recycle,卷被回收
卷要成功回收,需要遵循以上顺序。
2、从Kubernetes存储系统来讲,卷生命周期管理的职责,又分散于不同的控制器中
pv controller,负责创建和回收卷
attach detach controller,负责挂载和卸载卷
volume manager,负责mount和umount卷
3、controller模式,每个controller负责特定功能,并且不断进行reconcile(对比期望状态与实际状态),然后进行调整
比如attach detach controller和volume manager中,各自都会有desiredStateOfWorld(缓存期望状态)和actualStateOfWorld(缓存实际状态)缓存,并且由各自的syncLoopFunc不断对比两个缓存的差异,并进行调整,下文中会介绍。
for {desired := getDesiredState();current := getCurrentState();makeChanges(desired, current);
}
结合以上三个维度,Kubernetes需要保证卷的管理功能分布在不同控制器的前提下保证卷生命周期顺序的正确性。以Pod使用卷为例,看Kubernetes是如何做到这一点?
| Pod启动流程
假设scheduler已经完成worker node选择,确定调度的节点,此时启动Pod前,需要先完成卷映射到Pod路径中,结合前面的分析,整个过程如下:
1、卷分配,pvc绑定pv,由pv controller负责完成,结合相关代码1[1]。
此时pvc绑定pv。
2、attach detach controlle,如果pod分配到worker node,并且对应卷已经创建,则将卷挂载到对应worker node,并且给worker node资源增加volume已经挂载对应卷的状态信息,结合相关代码2[2]和代码3[3]。
此时对应node资源状态中增加volume信息。
[root@10-10-88-152 ~]# kubectl get nodes 10-10-88-113 -o yaml
apiVersion: v1
kind: Node
....
volumesAttached:
- devicePath: csi-add9fc778d9593d01818d65ccde7013e87327d9f675b47df42a34b860c581711
name: kubernetes.io/csi/csi-qcfsplugin^csi-qcfs-volume-4faa18f5bbbd11e8-1365
- devicePath: csi-5dd249387138238e8e2209eb471450a072dd6543adde7a6769c8461943c789ca
name: kubernetes.io/csi/csi-qcfsplugin^csi-qcfs-volume-4fa9b764bbbd11e8-1366
- devicePath: csi-bc9b81e32d84e8890d17568964c1e01af97b0c175e0b73d4bf30bba54e3f1a1e
name: kubernetes.io/csi/csi-qcfsplugin^csi-qcfs-volume-4fa94533bbbd11e8-1364
volumesInUse:
- kubernetes.io/csi/csi-qcfsplugin^csi-qcfs-volume-4fa94533bbbd11e8-1364
- kubernetes.io/csi/csi-qcfsplugin^csi-qcfs-volume-4fa9b764bbbd11e8-1366
- kubernetes.io/csi/csi-qcfsplugin^csi-qcfs-volume-4faa18f5bbbd11e8-1365
3、volume manager在worker node中负责将卷挂载到对应路径。
Pod分配到本worker node后,获取Pod需要的volume,通过对比node状态中的volumesAttached,确认volume是否已经attach到node节点,如果attach到node节点则将自身actualStateOfWorld中的volume状态设置成attached,对应代码4[4]、代码5[5]。
如果已经attached成功,则进入到文件系统挂载流程,相关代码6[6]。
先挂载到node中全局路径,比如/var/lib/kubelet/plugins/kubernetes.io/csi/pv/pvc-3ecd68c7b7d211e8/globalmount。
映射到Pod对应路径,比如/var/lib/kubelet/pods/49a5fede-b811-11e8-844f-fa7378845e00/volumes/kubernetes.io~csi/pvc-3ecd68c7b7d211e8/mount。
actualStateOfWorld中设置volume为挂载成功状态。
4、pod controller确认卷已经映射成功,启动Pod,此处不详细展开。
| Pod被删除的过程
pod controller watch到pod处于被删除状态,执行killPod操作,删除Pod,此处不详细展开。
volume manager获取到Pod被删除的信息,会执行如下几步,相关代码5[5]。
将Pod从desiredStateOfWorld的缓存信息中清除。
actualStateOfWorld中已经挂载的卷和desiredStateOfWorld发现Pod不应该挂载,执行UmountVolume操作,将Pod和卷映射关系解除,并将Pod从actualStateOfWorld的卷信息中剔除。
此时如果实际状态中卷没有关联任何Pod,则说明卷需要可以完全与节点分离,则先执行UnmountDevice将卷的globalpath umount掉,等到下次reconcile时执行MarkVolumeAsDetached将卷完全从实际状态中删除掉。
attach detach controller发现挂载到node节点的volume没有被Pod使用,执行detach操作,将卷从node节点detach,此时卷完全处于集群中未被使用的状态,此处不详细展开。
总结为Kubernetes存储系统的特点:
不同组件通过资源状态协作,attach detach controller需要PVC绑定PV的状态,volume manager需要node status中volume attached状态。
组件通过reconcile方式达到期望状态,并且状态可能需要多次reconcile中完成,如Pod清除掉后,volume最终和node分离。
| 问题
理解了存储系统的整体过程之后,回到问题,StatefulSet中Pod被删除会发生什么?
首先,对于StatefulSet的了解,Pod被删除,StatefulSet controller应该会很快创建Pod,在我们的场景中,Pod还是调度到先前节点中启动。结合对存储的理解,可能的场景:
场景一:delete Pod,感知顺序为volume manager(umount)->statefulset->scheduler->volume manager(mount)。
volume manager发现Pod被删除,执行umount
StatefulSet发现Pod被删除,马上创建Pod
scheduler发现Pod进行调度
volume manager发现原有volume需要绑定Pod,执行mount
场景二:delete Pod,感知顺序为volume manager(umount)->volume manager(unmountDevice)->volume manager(MarkVolumeAsDelete)->attach detach controller(Detach)->statefulset->scheduler->attach detach controller(Attach)->volume manager。
volume manager发现Pod被删除,执行umount/unmountDevice/MarkVolumeAsDelete(通过几次reconcile)
attach detach controller发现volume在node节点未被使用,执行detach
scheduler发现Pod进行调度
attach detach controller发现volume需要attach,执行attach
volume manager挂载
场景三:delete Pod,感知顺序为statefulset->volume manager(umount/deviceUmount)->scheduler->volume manager(mount)。
StatefulSet发现Pod被删除,马上创建Pod
volume manager发现Pod被删除,执行umount/deviceUmount(通过几次reconcile),注意此时devicePath和deviceMountPath都为空
scheduler发现Pod进行调度
volume manager发现原有volume需要绑定Pod,执行mount而此时devicePath和deviceMountPath都为空,问题出现
再结合问题出现日志分析:
Sep
14
19
:
28
:
33
10
-10
-40
-16
kubelet: I0914
19
:
28
:
33.174310
1953
operation_generator.
go
:
1168
] Controller attach succeeded
for
volume
"pvc-3ecd68c7b7d211e8"
(UniqueName:
"kubernetes.io/csi/csi-qcfsplugin^csi-qcfs-volume-3ecd68c7b7d211e8-338"
) pod
"yoooo-416ea0-0"
(UID:
"49a5fede-b811-11e8-844f-fa7378845e00"
) device path:
"csi-eb93736e654600786d95eaffa7cd5d616f11a90bdc109e0df575e8646c250eb2"
Sep
14
19
:
28
:
33
10
-10
-40
-16
kubelet: I0914
19
:
28
:
33.273344
1953
operation_generator.
go
:
486
] MountVolume.WaitForAttach entering
for
volume
"pvc-3ecd68c7b7d211e8"
(UniqueName:
"kubernetes.io/csi/csi-qcfsplugin^csi-qcfs-volume-3ecd68c7b7d211e8-338"
) pod
"yoooo-416ea0-0"
(UID:
"49a5fede-b811-11e8-844f-fa7378845e00"
) DevicePath
"csi-eb93736e654600786d95eaffa7cd5d616f11a90bdc109e0df575e8646c250eb2"
Sep
14
19
:
28
:
33
10
-10
-40
-16
kubelet: I0914
19
:
28
:
33.318275
1953
operation_generator.
go
:
495
] MountVolume.WaitForAttach succeeded
for
volume
"pvc-3ecd68c7b7d211e8"
(UniqueName:
"kubernetes.io/csi/csi-qcfsplugin^csi-qcfs-volume-3ecd68c7b7d211e8-338"
) pod
"yoooo-416ea0-0"
(UID:
"49a5fede-b811-11e8-844f-fa7378845e00"
) DevicePath
"csi-eb93736e654600786d95eaffa7cd5d616f11a90bdc109e0df575e8646c250eb2"
Sep
14
19
:
28
:
33
10
-10
-40
-16
kubelet: I0914
19
:
28
:
33.319345
1953
operation_generator.
go
:
514
] MountVolume.MountDevice succeeded
for
volume
"pvc-3ecd68c7b7d211e8"
(UniqueName:
"kubernetes.io/csi/csi-qcfsplugin^csi-qcfs-volume-3ecd68c7b7d211e8-338"
) pod
"yoooo-416ea0-0"
(UID:
"49a5fede-b811-11e8-844f-fa7378845e00"
) device mount path
"/var/lib/kubelet/plugins/kubernetes.io/csi/pv/pvc-3ecd68c7b7d211e8/globalmount"
Sep
14
19
:
29
:
12
10
-10
-40
-16
kubelet: I0914
19
:
29
:
12.826916
1953
operation_generator.
go
:
486
] MountVolume.WaitForAttach entering
for
volume
"pvc-3ecd68c7b7d211e8"
(UniqueName:
"kubernetes.io/csi/csi-qcfsplugin^csi-qcfs-volume-3ecd68c7b7d211e8-338"
) pod
"yoooo-416ea0-0"
(UID:
"67f223dc-b811-11e8-844f-fa7378845e00"
) DevicePath
"csi-eb93736e654600786d95eaffa7cd5d616f11a90bdc109e0df575e8646c250eb2"
Sep
14
19
:
29
:
14
10
-10
-40
-16
kubelet: I0914
19
:
29
:
14.465225
1953
operation_generator.
go
:
495
] MountVolume.WaitForAttach succeeded
for
volume
"pvc-3ecd68c7b7d211e8"
(UniqueName:
"kubernetes.io/csi/csi-qcfsplugin^csi-qcfs-volume-3ecd68c7b7d211e8-338"
) pod
"yoooo-416ea0-0"
(UID:
"67f223dc-b811-11e8-844f-fa7378845e00"
) DevicePath
"csi-eb93736e654600786d95eaffa7cd5d616f11a90bdc109e0df575e8646c250eb2"
Sep
14
19
:
29
:
14
10
-10
-40
-16
kubelet: I0914
19
:
29
:
14.466483
1953
operation_generator.
go
:
514
] MountVolume.MountDevice succeeded
for
volume
"pvc-3ecd68c7b7d211e8"
(UniqueName:
"kubernetes.io/csi/csi-qcfsplugin^csi-qcfs-volume-3ecd68c7b7d211e8-338"
) pod
"yoooo-416ea0-0"
(UID:
"67f223dc-b811-11e8-844f-fa7378845e00"
) device mount path
"/var/lib/kubelet/plugins/kubernetes.io/csi/pv/pvc-3ecd68c7b7d211e8/globalmount"
Sep
14
19
:
29
:
15
10
-10
-40
-16
kubelet: W0914
19
:
29
:
15.491424
1953
csi_mounter.
go
:
354
] kubernetes.io/csi: skipping mount dir removal, path does not exist [/
var
/lib/kubelet/pods/
49
a5fede-b811
-11e8
-844f
-fa7378845e00/volumes/kubernetes.io~csi/pvc
-3
ecd68c7b7d211e8/mount]
Sep
14
19
:
29
:
15
10
-10
-40
-16
kubelet: I0914
19
:
29
:
15.491450
1953
operation_generator.
go
:
686
] UnmountVolume.TearDown succeeded
for
volume
"kubernetes.io/csi/csi-qcfsplugin^csi-qcfs-volume-3ecd68c7b7d211e8-338"
(OuterVolumeSpecName:
"data"
) pod
"49a5fede-b811-11e8-844f-fa7378845e00"
(UID:
"49a5fede-b811-11e8-844f-fa7378845e00"
). InnerVolumeSpecName
"pvc-3ecd68c7b7d211e8"
. PluginName
"kubernetes.io/csi"
, VolumeGidValue
""
Sep
14
19
:
29
:
44
10
-10
-40
-16
kubelet: W0914
19
:
29
:
44.896387
1953
csi_mounter.
go
:
354
] kubernetes.io/csi: skipping mount dir removal, path does not exist [/
var
/lib/kubelet/pods/
67f
223dc-b811
-11e8
-844f
-fa7378845e00/volumes/kubernetes.io~csi/pvc
-3
ecd68c7b7d211e8/mount]
Sep
14
19
:
29
:
44
10
-10
-40
-16
kubelet: I0914
19
:
29
:
44.896403
1953
operation_generator.
go
:
686
] UnmountVolume.TearDown succeeded
for
volume
"kubernetes.io/csi/csi-qcfsplugin^csi-qcfs-volume-3ecd68c7b7d211e8-338"
(OuterVolumeSpecName:
"data"
) pod
"67f223dc-b811-11e8-844f-fa7378845e00"
(UID:
"67f223dc-b811-11e8-844f-fa7378845e00"
). InnerVolumeSpecName
"pvc-3ecd68c7b7d211e8"
. PluginName
"kubernetes.io/csi"
, VolumeGidValue
""
Sep
14
19
:
29
:
44
10
-10
-40
-16
kubelet: I0914
19
:
29
:
44.917540
1953
reconciler.
go
:
278
] operationExecutor.UnmountDevice started
for
volume
"pvc-3ecd68c7b7d211e8"
(UniqueName:
"kubernetes.io/csi/csi-qcfsplugin^csi-qcfs-volume-3ecd68c7b7d211e8-338"
) on node
"10-10-40-16"
Sep
14
19
:
29
:
44
10
-10
-40
-16
kubelet: W0914
19
:
29
:
44.919231
1953
mount_linux.
go
:
179
] could not determine device
for
path:
"/var/lib/kubelet/plugins/kubernetes.io/csi/pv/pvc-3ecd68c7b7d211e8/globalmount"
Sep
14
19
:
29
:
45
10
-10
-40
-16
kubelet: I0914
19
:
29
:
45.609605
1953
operation_generator.
go
:
760
] UnmountDevice succeeded
for
volume
"pvc-3ecd68c7b7d211e8"
%!(EXTRA
string
=UnmountDevice succeeded
for
volume
"pvc-3ecd68c7b7d211e8"
(UniqueName:
"kubernetes.io/csi/csi-qcfsplugin^csi-qcfs-volume-3ecd68c7b7d211e8-338"
) on node
"10-10-40-16"
)
Sep
14
19
:
29
:
45
10
-10
-40
-16
kubelet: I0914
19
:
29
:
45.624963
1953
operation_generator.
go
:
486
] MountVolume.WaitForAttach entering
for
volume
"pvc-3ecd68c7b7d211e8"
(UniqueName:
"kubernetes.io/csi/csi-qcfsplugin^csi-qcfs-volume-3ecd68c7b7d211e8-338"
) pod
"yoooo-416ea0-0"
(UID:
"77b8caf7-b811-11e8-844f-fa7378845e00"
) DevicePath
""
Sep
14
19
:
29
:
46
10
-10
-40
-16
kubelet: E0914
19
:
29
:
46.006612
1953
nestedpendingoperations.
go
:
267
] Operation
for
"\"kubernetes.io/csi/csi-qcfsplugin^csi-qcfs-volume-3ecd68c7b7d211e8-338\""
failed. No retries permitted until
2018
-09
-14
19
:
29
:
46.506583596
+
0800
CST m=+
105572.978439381
(durationBeforeRetry
500
ms). Error:
"MountVolume.WaitForAttach failed for volume \"pvc-3ecd68c7b7d211e8\" (UniqueName: \"kubernetes.io/csi/csi-qcfsplugin^csi-qcfs-volume-3ecd68c7b7d211e8-338\") pod \"yoooo-416ea0-0\" (UID: \"77b8caf7-b811-11e8-844f-fa7378845e00\") : resource name may not be empty"
Sep
14
19
:
29
:
46
10
-10
-40
-16
kubelet: I0914
19
:
29
:
46.533962
1953
operation_generator.
go
:
486
] MountVolume.WaitForAttach entering
for
volume
"pvc-3ecd68c7b7d211e8"
(UniqueName:
"kubernetes.io/csi/csi-qcfsplugin^csi-qcfs-volume-3ecd68c7b7d211e8-338"
) pod
"yoooo-416ea0-0"
(UID:
"77b8caf7-b811-11e8-844f-fa7378845e00"
) DevicePath
""
WaitForAttach有两个阶段:
Sep 14 19:29:14以及之前DevicePath非空
Sep 14 19:29:45以及之后DevicePath为空
那么在这两个时间点之间发生了什么,怀疑这个时间点发生的问题造成卷无法挂载。
通过日志发现Sep 14 19:29:14到Sep 14 19:29:45有一段日志信息比较关键,分析如下:
Sep
14 19
:29
:14
……
MountVolume
.MountDevice
……
Sep
14 19
:29
:15
…..
UnmountVolume
.TearDown
……
Sep
14 19
:29
:44
……
UnmountVolume
.TearDown
……
Sep
14 19
:29
:44
……
operationExecutor
.UnmountDevice
……
Sep
14 19
:29
:44
……
could
not
determine
device
for
path
….
在步骤4中,有设置相关函数的:
UnmountDevice->GenerateUnmountDeviceFunc->actualStateOfWorld.MarkDeviceAsUnmounted->asw.SetVolumeGloballyMounted
其中比较关键的函数SetVolumeGloballyMounted:
asw.SetVolumeGloballyMounted(volumeName,
false
/* globallyMounted */
,
/* devicePath */
""
,
/* deviceMountPath */
""
)
| 总结
Kubernetes之所以在当前成为容器编排领域的事实标准,原因很多,但是对我们来讲基于声明式API的编程范式是我们依赖Kubernetes的重要原因,当然在其解决的问题规模下复杂程度也不言而喻,总之,一句话,没有银弹。
相关链接:
https://github.com/kubernetes/kubernetes/blob/release-1.10/pkg/controller/volume/persistentvolume/pv_controller.go#L301
https://github.com/kubernetes/kubernetes/blob/release-1.10/pkg/controller/volume/attachdetach/populator/desired_state_of_world_populator.go#L88
https://github.com/kubernetes/kubernetes/blob/release-1.10/pkg/controller/volume/attachdetach/reconciler/reconciler.go#L251
https://github.com/kubernetes/kubernetes/blob/release-1.10/pkg/kubelet/volumemanager/populator/desired_state_of_world_populator.go#L152
https://github.com/kubernetes/kubernetes/blob/release-1.10/pkg/kubelet/volumemanager/reconciler/reconciler.go#L160
https://github.com/kubernetes/kubernetes/blob/release-1.10/pkg/kubelet/volumemanager/reconciler/reconciler.go#L238
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/28218939/viewspace-2217186/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/28218939/viewspace-2217186/
Pod挂载Volume失败问题分析相关推荐
- pod挂载nas启动失败报错:unable to mount volume xxxx Timeout waiting for mount paths to be created
深夜你熟睡时,用户打来电话.大哥我在上线我的应用怎么突然起不来了.快帮我看看,再过一个小时店铺就开门了. 核实pod状态 打开电脑登入环境,使用kubectl get pod 查询到用户的pod处于创 ...
- k8s1.5.4挂载volume之nfs
k8s1.5.4挂载volume之nfs volume的例子集合 https://github.com/kubernetes/kubernetes/tree/master/examples/volum ...
- K8S集群中Pod挂载Storageclass存储卷异常排查思路
K8S集群中Pod挂载Storageclass存储卷异常排查思路 故障描述: Jenkins是在K8S集群中部署的,Jenkins使用的各种资源以及全部创建了,但是Jenkins的Pod依旧无法启动, ...
- RV1108 EMMC 程序下载失败原因分析
RV1108 EMMC 程序下载失败原因分析 目录 RV1108 EMMC 程序下载失败原因分析 1. 出现的现象 硬件环境 表现出的问题 2. 原因查找 检查硬件 3. rv1108 bootloa ...
- 【Android 逆向】启动 DEX 字节码中的 Activity 组件 ( 使用 DexClassLoader 获取组件类失败 | 失败原因分析 | 自定义类加载器没有加载组件类的权限 )
文章目录 一.使用 DexClassLoader 获取组件类失败报错 二.失败原因分析 一.使用 DexClassLoader 获取组件类失败报错 在上一篇博客 [Android 逆向]启动 DEX ...
- SCRUM 敏捷开发 基础及失败成功案例分析
什么是敏捷开发方法?什么是SCRUM? 有人在这个字面上下功夫,说敏捷就是反应要灵敏,动作要快捷:有人还在字面上进行延伸,说敏捷就是又好又快,或者就是多快好省:有人说敏捷就是光写代码不写文档:有人觉得 ...
- Scrum失败/成功案例分析
什么是敏捷开发方法?什么是SCRUM? 有人在这个字面上下功夫,说敏捷就是反应要灵敏,动作要快捷:有人还在字面上进行延伸,说敏捷就是又好又快,或者就是多快好省:有人说敏捷就是光写代码不写文档:有人觉得 ...
- 【问题解决方案】git clone失败的分析和解决
[问题解决方案]git clone失败的分析和解决 参考文章: (1)[问题解决方案]git clone失败的分析和解决 (2)https://www.cnblogs.com/anliux/p/116 ...
- Solidworks异型孔打孔失败原因分析
Solidworks异型孔打孔失败原因分析 在使用异型孔给钣金件打孔时,弹出下面的对话框没有找到有效的用于生成装饰螺纹的边线 原因分析 底孔设置问题,按照正常的钻孔攻螺纹经验,一般材料攻M8的螺纹孔, ...
最新文章
- Ansible5:Ad-hoc常用模块
- strrchr php,php strstr() strrchr() strpos() strrpos()函数_PHP教程
- 操作系统页面置换算法
- c语言程序设计对称字符串,C语言程序设计(字符串)
- LeetCode 2095. 删除链表的中间节点(快慢指针)
- for循环和while循环
- 安装sql时挂起的解决方法
- 米线店结账程序 装饰着模式_真实数据:外卖销售9999+ 长沙米线万单店 它究竟是怎么做到的?...
- for 循环中实现多个点击事件
- linux返回根目录的命令
- 匿名发送邮件python_邮箱伪造之搭建匿名SMTP服务器
- Android 10 状态栏通知图标和下拉状态栏图标为白色问题
- SMB Signing not required漏洞修复方法
- Tocmat的中文问题解决方法总结:mxz
- 低秩矩阵RPCA MATLAB,低秩矩阵分解
- java 不要科学计数法_java – 设置Jackson ObjectMapper类不要使用科学记数法来表示double...
- Java编程验证哥德巴赫猜想:任何一个大于6的偶数,都能分解成两个质数的和
- 线上报了内存溢出异常,又不完全是内存溢出
- 使用matlab部分分式展开
- 基于oval注解支持JavaScript表达式约束条件