Docker数据管理

  • 生产环境中,对数据进行持久化,或者需要在多个容器直接进行数据共享,这必然涉及到容器的一些数据管理的操作。
  • 容器中数据管理主要有两种方式:
    • 数据卷(Data Volumes):容器内数据直接映射到本地的主机环境
    • 数据卷容器(Data Volume Containers):使用特定的容器维护数据卷

数据卷

  • 数据集是一个可停过容器使用的特殊的文件目录,他将主机操作系统目录直接映射进容器,类似Linux中的mount操作。
  • 数据卷提供很多有用的特性如下:
    • 数据集可以在容器之间共享和重用,容器间传递数据将变得高效方便
    • 对数据卷内数据的修改会立刻生效,无论是容器内部的操作还是本地文件之间修改
    • 对书籍的更新不会影响镜像,解耦了应用和数据
    • 数据卷会一直存在,直到没有容器使用,可以安全的卸载它
  • 如下使用案例
  1. 在容器中创建一个数据卷
  • 在Docker run命令中使用 -v参数标记可以在容器内创建一个数据卷。多次重复使用-v 标记可以创建多个数据卷。
  • 现在使用training/webapp 镜像创建一个web容器,并创建一个数据卷挂载到容器的/webapp目录:
docker run -p 80:80 --name web -d -v /webapp training/webapp python app.py

  • 如上命令,在本地镜像仓库中没有对应镜像时候,会先自动下载
  • -p 指定将容器服务暴露的端口,是自动映射到本地主叫的临时端口80
  • -d 指定在后台运行
  • –name 指定容器启动后的别名
  1. 挂载一个主机目录作为数据卷
  • 使用-v标记也可以指定挂载一个本地以已经有的目录到容器中去作为数据卷,如下命令(推荐此种方式)
docker run -d -p 81:81 --name web -v /src/webapp:/opt/webapp training/webapp python app.py
  • 以上命令中加载主机的/src/webapp目录到容器的/opt/webapp目录
  • 这个功能在进行测试的时候比较方便,比如我们可以将一些程序或者数据预先放到本地的目录中,然后在容器中运行和使用。另外,本地目录的路径必须是绝对路径,如果目录不存在,Docker会自动创建。
  • Docker挂载数据卷的默认权限是读写(RW),我们可以通过ro指定位只读:
docker run -d -p 80:80 -name web -v /src/webapp:/opt/webapp:ro training/webapp python app.py
  • 如上命令,添加:ro后,容器内部对所挂载的数据卷内的数据就无法修改了。
  1. 挂载一个本地直接文件作为数据卷
  • -v 标记也可以从主机挂载单个文件到容器中作为数据卷(不推荐方式)。
docker run --rm -it -v ~/.bash_history:/.bash_history ubuntu /bin/bash
  • 如上就可以距离在容器输入过的命令历史
  • 问题:如果直接挂载一个文件到容器,使用文件编辑工具,例如vi或者sed–in-place的时候,可能造成文件inode的改变,从Docker1.1.0开始,这回导致报错。所以推荐的方式是直接挂载文件所在目录。

数据卷容器

  • 现在我们需要在多个容器之间共享同一个持续更新的数据,最简单的方式是使用数据卷容器。数据卷容器也是一个容器,他的功能是用来提供数据卷供其他容器挂载。
  • 首先创建一个数据卷容器dbdata,并在其中创建一个数据卷挂载到/dbdata:
docker run -it -v /dbdata --name dbdata ubuntu
  • 查看/dbdata目录:
  • 如上已经有dbdata目录,我们可以在其他容器中使用–volumes-form来挂载dbdata容器中的数据卷,例如创建db1,db2两个容器,并从dbdata容器挂载数据卷:
docker run -it --volumes-from dbdata --name db1 ubuntu
docker run -it --volumes-from dbdata --name db2 ubuntu
  • 此时,容器db1和db2 都挂载同一个数据卷到相同的/dbdata目录。三个容器任何一方在该目录下的写入,其他容器都可以看到。
  • 示例:在dbdata容器中创建test文件
  • 在db1 容器中查看其目录下的dbdata文件中内容:
  • 我们也可以多次使用–volumes-from参数来从多个容器挂载多个数据卷。还可以从其他已经挂载了容器卷的容器来挂载数据卷。
  • 问题:
    • 使用–volumes-from参数所挂载数据卷的容器自身并不需要保持在运行状态
    • 如果删除了挂载的容器,包括上面的dbdata, db1, db2,数据卷并不会被自动删除。如果要删除一个数据卷,必须在删除最后一个还挂载着他的容器时显示的使用docker rm -v 命令指定同时删除关联的容器
    • 使用数据卷容器可以让用户在容器之间自由的升级和移动数据卷。

利用数据卷来迁移数据

  • 可以利用数据卷容器对启动的数据卷进行备份,恢复,这样实现数据的迁移
备份
  • 使用以下买那个了备份dbdata数据卷容器内的数据卷
docker run --volumes-from dbdata -v $(pwd):/backup ubuntu tar cvf /backup/backup.tar dbdata
  • 如上命令:

    • 利用ubuntu镜像创建一个容器worker。使用–volumes-from dbdata参数来容worker容器挂载dbdata容器的数据卷(即dbdata数据卷);
    • 使用 -v ${pwd}:/backup参数来挂载本地的当前目录到worker容器的/backup目录。
    • worker容器启动后,使用tar cvf /backuo.backuo.tar/dbdata命令来将/dbdata下内容备份为容器内的/backup/backup.tar,即宿主机当前目录下的backup.tar
    • 执行后可以看到宿主机/backup目录下出现backup.tar
恢复
  • 如果需要将数据恢复到一个容器,可以按一下步骤:
  • 创建一个带有数据卷的容器dbdata2
docker run -v /dbdata --name dbdata2 ubuntu /bin/bash
  • 然后创建另外一个新的容器,挂载dbdata2 的容器,并使用untar解压备份文件到所挂载的容器卷中:
docker run --volumes-from dbdata2 -v $(pwd):/backup busybox tar xvf /backup/backup.tar

总结

  • Docker在设计上就考虑过数据问题,为数据管理提供了充分操作支持
  • 以上通过备份,恢复,共享机制,即使容器在运行中出现故障,用户也不必担心数据发生丢失,只要快速重新创建容器即可。
  • 生产环境中,推荐使用数据卷汇总数据卷容器以外,我们还需要定期将主机的本地数据进行备份,或者使用支持容错的存储系统,包括RAID或者分布式文件系统HDFS等。

上一篇:SpringCloud + Docker
下一篇:使用Dockerfile创建镜像

Docker中数据管理相关推荐

  1. Docker的使用(五:Docker中的网络与数据管理)

    实验环境 三台运行有Ubuntu 16.04 操作系统的虚拟机,并每台主机中已安装docker环境: 学习目标 docker的网络管理 docker Swarm集群的使用 Volume数据卷的使用 实 ...

  2. docker镜像了解(建立私有仓库,基于已有镜像创建,Docker的数据管理) 基于Dockerfile创建,基于本地模板创建,端口映射,容器互联)

    文章目录 docker镜像 制作镜像的过程 基于已有镜像创建 基于本地模板创建 基于Dockerfile创建 Dockerfile操作指令 Docker的数据管理 数据卷 docker的网络通信 容器 ...

  3. Docker 中的网络管理与集群构建

    Docker中的网络与数据管理 一.Docker网络管理 1.Docker默认网络管理 docker的网络模式 注:docker有三种网络模式,默认的为bridge,配置后可以和宿主机通信,host和 ...

  4. Docker的数据管理

    Docker的数据管理 一.管理docker容器中数据 管理Docker 容器中数据主要有两种方式:数据卷(Data Volumes)和数据卷容器( DataVolumes Containers) . ...

  5. Docker 的数据管理(Dockerfile的概述和构建)

    文章目录 1 Docker 的数据管理 1.1 数据卷 1.2 数据卷容器 2 端口映射(2:31) 3 容器互联(使用 centos 镜像) 4 Docker 镜像的创建 4.1 基于现有镜像创建 ...

  6. 你在 Docker 中跑 MySQL?恭喜你,可以下岗了!

    欢迎关注方志朋的博客,回复"666"获面试宝典 容器的定义:容器是为了解决"在切换运行环境时,如何保证软件能够正常运行"这一问题. 目前,容器和 Docker ...

  7. docker保护python源码_Tensorflow在Docker中运行和源码编译

    本文分享在在Docker中运行Tensorflow和进行源码编译的方法和步骤,包括:编译.构建docker镜像.创建和运行Docker容器.部署完的容器可以通过Jupyter Notebook进行访问 ...

  8. Docker中的Java内存消耗优化以及我们如何使用Spring Boot

    ---- / BEGIN/ ---- 如果您的Docker容器占用太多内存而无法达到最佳性能,请阅读下文以了解一个团队如何找到解决方案. 最近,我所在的团队在部署我们的微服务(AWS上Docker中的 ...

  9. Docker中的“公开”和“发布”有什么区别?

    本文翻译自:What is the difference between "expose" and "publish" in Docker? I'm exper ...

最新文章

  1. Django 中ORM 的使用
  2. javascript焦点图(根据图片下方的小框自动播放)
  3. CSDN专家分和博客系统积分获得规则!
  4. docker安装(linux)
  5. Windows Phone开发(4):框架和页
  6. 在加利福尼亚州投资于新餐馆:一种数据驱动的方法
  7. Python破解滑块验证码算法,完美避开人机识别
  8. 关于session.auto_start报警的问题
  9. ubuntu18.04中tomcat8.5启动时报找不到JAVA_HOME和JRE_HOME
  10. python控制键盘事件、粘贴_python调用键盘控制游戏事件
  11. maven的pom文件解析及配置
  12. 提升精度或者训练损失不继续下降办法汇总,(进一步提升效果)
  13. WPF TextBox 设置多行
  14. axure 鼠标样式_Axure菜单导航怎么添加鼠标选中变色的特效?
  15. 二维码名片的生成与读取
  16. JAVA计算机毕业设计的问卷调查系统设计与实现源码+数据库+系统+lw文档
  17. 直流充电桩和交流充电桩有什么区别?
  18. echarts的词云图
  19. 如何让全链路压测落地?
  20. 产品经理的核心竞争力是什么?为什么?

热门文章

  1. C和指针之动态内存分配(读取范围在1和标准输入读取的size之前每个数据出现的次数)
  2. linux之openssl简单介绍
  3. 看得懂的外观设计模式 python3 实现
  4. 【C语言简单说】三:浮点数变量和字符变量(4)
  5. python typeerror* wants int_python-TypeError:’int’对象是不可迭代的?
  6. php邮件发送tp,Thinkphp5 邮件发送Thinkphp发送邮件
  7. 触发器及其应用实验报告总结_调机技巧总结: 先快后慢射胶法及其应用
  8. 2021年将迎接你的是什么?
  9. “对不起,我们只招父母毕业于名牌院校的孩子”:最可怕的,是你还以为学历不重要...
  10. 2018年最后一个月最值得关注的13个优质公号