在这篇文章中,我会尽最大的努力来解释Volume是如何工作的,并展示一些最佳实践。这篇文章主要是针对那些对Volume不了解的Docker用户,当然有经验的用户也可以通过本文了解一些Volume的细节。

想要了解Docker Volume,首先我们需要知道Docker的文件系统是如何工作的。Docker镜像是由多个文件系统(只读层)叠加而成。当我们启动一个容器的时候,Docker会加载只读镜像层并在其上(译者注:镜像栈顶部)添加一个读写层。如果运行中的容器修改了现有的一个已经存在的文件,那该文件将会从读写层下面的只读层复制到读写层,该文件的只读版本仍然存在,只是已经被读写层中该文件的副本所隐藏。当删除Docker容器,并通过该镜像重新启动时,之前的更改将会丢失。在Docker中,只读层及在顶部的读写层的组合被称为Union File System(联合文件系统)。

为了能够保存(持久化)数据以及共享容器间的数据,Docker提出了Volume的概念。简单来说,Volume就是目录或者文件,它可以绕过默认的联合文件系统,而以正常的文件或者目录的形式存在于宿主机上。

我们可以通过两种方式来初始化Volume,这两种方式有些细小而又重要的差别。我们可以在运行时使用-v来声明Volume:

$ docker run -it --name container-test -h CONTAINER -v /data debian /bin/bash
root@CONTAINER:/# ls /data
root@CONTAINER:/#

上面的命令会将/data挂载到容器中,并绕过联合文件系统,我们可以在主机上直接操作该目录。任何在该镜像/data路径的文件将会被复制到Volume。我们可以使用docker inspect命令找到Volume在主机上的存储位置:

$ docker inspect -f {{.Volumes}} container-test

你会看到类似的输出:

map[/data:/var/lib/docker/vfs/dir/cde167197ccc3e138a14f1a4f...b32cec92e79059437a9]

这说明Docker把在/var/lib/docker下的某个目录挂载到了容器内的/data目录下。让我们从主机上添加文件到此文件夹下:

$ sudo touch /var/lib/docker/vfs/dir/cde167197ccc3e13814f...b32ce9059437a9/test-file

进入我们的容器内可以看到:

$ root@CONTAINER:/# ls /data
test-file

只要将主机的目录挂载到容器的目录上,那改变就会立即生效。我们可以在Dockerfile中通过使用VOLUME指令来达到相同的目的:

FROM debian:wheezy
VOLUME /data

但还有另一件只有-v参数能够做到而Dockerfile是做不到的事情就是在容器上挂载指定的主机目录。例如:

$ docker run -v /home/adrian/data:/data debian ls /data

该命令将挂载主机的/home/adrian/data目录到容器内的/data目录上。任何在/home/adrian/data目录的文件都将会出现在容器内。这对于在主机和容器之间共享文件是非常有帮助的,例如挂载需要编译的源代码。为了保证可移植性(并不是所有的系统的主机目录都是可以用的),挂载主机目录不需要从Dockerfile指定。当使用-v参数时,镜像目录下的任何文件都不会被复制到Volume中。(译者注:Volume会复制到镜像目录,镜像不会复制到卷)

数据共享

如果要授权一个容器访问另一个容器的Volume,我们可以使用-volumes-from参数来执行docker run

$ docker run -it -h NEWCONTAINER --volumes-from container-test debian /bin/bash
root@NEWCONTAINER:/# ls /data
test-file
root@NEWCONTAINER:/#

值得注意的是不管container-test是否运行,它都会起作用。只要有容器连接Volume,它就不会被删除。

数据容器

常见的使用场景是使用纯数据容器来持久化数据库、配置文件或者数据文件等。官方的文档上有详细的解释。例如:

$ docker run --name dbdata postgres echo "Data-only container for postgres"

该命令将会创建一个已经包含在Dockerfile里定义过Volume的postgres镜像,运行echo命令然后退出。当我们运行docker ps命令时,echo可以帮助我们识别某镜像的用途。我们可以用-volumes-from命令来识别其它容器的Volume:

$ docker run -d --volumes-from dbdata --name db1 postgres

使用数据容器的两个注意点:

  • 不要运行数据容器,这纯粹是在浪费资源。

  • 不要为了数据容器而使用“最小的镜像”,如busyboxscratch,只使用数据库镜像本身就可以了。你已经拥有该镜像,所以并不需要占用额外的空间。

备份

如果你在用数据容器,那做备份是相当容易的:

$ docker run --rm --volumes-from dbdata -v $(pwd):/backup debian tar cvf /backup/backup.tar /var/lib/postgresql/data

该示例应该会将Volume里所有的东西压缩为一个tar包(官方的postgres Dockerfile在/var/lib/postgresql/data目录下定义了一个Volume)

权限与许可

通常你需要设置Volume的权限或者为Volume初始化一些默认数据或者配置文件。要注意的关键点是,在Dockerfile的VOLUME指令后的任何东西都不能改变该Volume,比如:

FROM debian:wheezy
RUN useradd foo
VOLUME /data
RUN touch /data/x
RUN chown -R foo:foo /data

该Docker file不能按预期那样运行,我们本来希望touch命令在镜像的文件系统上运行,但是实际上它是在一个临时容器的Volume上运行。如下所示:

FROM debian:wheezy
RUN useradd foo
RUN mkdir /data && touch /data/x
RUN chown -R foo:foo /data
VOLUME /data

Docker可以将镜像中Volume下的文件挂载到Volume下,并设置正确的权限。如果你指定Volume的主机目录将不会出现这种情况。

如果你没有通过RUN指令设置权限,那么你就需要在容器启动时使用CMDENTRYPOINT指令来执行(译者注:CMD指令用于指定一个容器启动时要运行的命令,与RUN类似,只是RUN是镜像在构建时要运行的命令)。

删除Volumes

这个功能可能会更加重要,如果你已经使用docker rm来删除你的容器,那可能有很多的孤立的Volume仍在占用着空间。

Volume只有在下列情况下才能被删除:

  • 该容器是用docker rm -v命令来删除的(-v是必不可少的)。

  • docker run中使用了--rm参数

即使用以上两种命令,也只能删除没有容器连接的Volume。连接到用户指定主机目录的Volume永远不会被docker删除。

除非你已经很小心的,总是像这样来运行容器,否则你将会在/var/lib/docker/vfs/dir目录下得到一些僵尸文件和目录,并且还不容易说出它们到底代表什么。

延伸阅读

以下资源更深入的探究了Volumes机制(译注:以下译文稍后奉上):

  • 疯狂Docker之纯数据容器

  • 深入Docker:Volumes(已译)

  • 容器数据管理

另外,我们可以期待不久的将来会更多的有关处理volumes的工具:

  • Docker提议 #8484

原文链接:Understanding Volumes in Docker(翻译:田浩浩 审校:李颖杰)

===========================
译者介绍
田浩浩,悉尼大学USYD硕士研究生,目前在珠海从事Android应用开发工作。业余时间专注Docker的学习与研究,希望通过DockerOne把最新最优秀的译文贡献给大家,与读者一起畅游Docker的海洋。

转载于:https://blog.51cto.com/13791715/2300157

Volume是如何工作的相关推荐

  1. NFS Volume Provider(Part I) - 每天5分钟玩转 OpenStack(62

    2019独角兽企业重金招聘Python工程师标准>>> cinder-volume 支持多种 volume provider,前面我们一直使用的是默认的 LVM,本节我们将增加 NF ...

  2. 深入理解Docker Volume(一)

    本文讲的是深入理解Docker Volume(一),[编者的话]本文主要介绍了Docker Volume的原理以及使用方式,是Docker入门教程的延伸.作者通过从数据的共享.数据容器.备份.权限以及 ...

  3. K8S:Volume

    Volume(数据卷) 容器里进程新建的文件,怎么才能让宿主机获取到?宿主机上的文件和目录,怎么才能让容器里的进程访问到? Volume 机制,允许将宿主机上指定的目录或者文件,挂载到容器里面进行读取 ...

  4. 在 Surfer 中对具有不同网格几何形状的网格使用 Grid Math 和 Grid Volume

    您是否需要使用一个或多个网格文件进行数学计算?或者确定上下网格表面之间的体积?这些计算在 Surfer 中总是可行的,但只能在具有相同几何形状的网格文件之间进行--这在现实世界中很少见.Surfer ...

  5. 容器复习-----6、volume(数据卷)

    数据卷 1.考虑问题 2.volume机制 2.1 声明方式 2.2 挂载机制 3.额外知识(copyData) 1.考虑问题 1 宿主机文件怎么让容器访问到 2 容器内文件怎么让宿主机访问到 2.v ...

  6. cinder存储服务

    一.cinder 介绍: 理解 Block Storage 操作系统获得存储空间的方式一般有两种: 1.通过某种协议(SAS,SCSI,SAN,iSCSI 等)挂接裸硬盘,然后分区.格式化.创建文件系 ...

  7. 理解 Cinder 架构 - 每天5分钟玩转 OpenStack(45)

    从本节开始我们学习 OpenStack 的 Block Storage Service,Cinder 理解 Block Storage 操作系统获得存储空间的方式一般有两种: 通过某种协议(SAS,S ...

  8. 2021-7-19-OpenStack基础知识学习

    OpenStack基础知识学习 参考文献:Wolf_Coder,百度百科 1,云计算 1.1,出现原因 由亚马逊公司提出.1.随着业务增加公司内部的服务器不够使用,进行虚拟化技术->2.随着公司 ...

  9. openstack核心组件-块存储 (Block Storage) : Cinder

    cinder 介绍: 理解 Block Storage 操作系统获得存储空间的方式一般有两种: 通过某种协议(SAS,SCSI,SAN,iSCSI 等)挂接裸硬盘,然后分区.格式化.创建文件系统:或者 ...

最新文章

  1. 第八周项目5-定期存款利息计算器
  2. bobo老师机器学习笔记1.1 - 什么是机器学习
  3. 计算机408试题2014,2014年考研计算机统考408真题
  4. Pandas库(2):数据的统计分析
  5. 消息发送到topic多个MessageQueue
  6. html按钮按下效果_CSS+HTMLlt;水滴按钮效果gt;
  7. HDU 2187 悼念512汶川大地震遇难同胞——老人是真饿了
  8. 整合Flask中的目录结构
  9. spark-env.sh配置
  10. java下载网络文件_java 从网络Url中下载文件
  11. k8s nginx-ingress 上传大小限制问题配置
  12. python编写交互界面设计_第16 p,PYthon中的用户交互,Python GUI编程
  13. 微信小程序 button按钮 image图片
  14. 拉卡拉支付最新支付方式预览——刷脸支付上线
  15. word 插入公式附加右侧编号方法
  16. [C#]Excel画斜线以及Excel宏的利用
  17. RAD Studio 10.3.1 cannot initialize object parameter of type..........“
  18. NFDATA定义的一个细节
  19. 实时数据库数据采集接口API八爪鱼采集接口
  20. python print空格占位_python的占位格式符 %

热门文章

  1. 解决安卓系统写入SD卡权限问题
  2. ptam tracking
  3. 事务隔离机制原理深入分析以及MySQL不同隔离级别分场景下实验对比
  4. CentOS 5.5 编译安装apache+php+mysql,利用CMS快速建立论坛
  5. C#实现对象的Xml格式序列化及反序列化
  6. xml操作类(转载)
  7. PyTorch中nn.Module类中__call__方法介绍
  8. C++/C++11中左值、左值引用、右值、右值引用的使用
  9. 设计模式之建造者模式(生成器模式、Builder)摘录
  10. js如何将数据放在一个内置窗口里面_Java 爬虫遇上数据异步加载,试试这两种办法!...