这是本系列的第四篇文章, 将介绍Docker的数据卷。
由于容器默认使用的AUFS文件系统的设计使得Docker可以提高镜像构建、存储和分发的效率,节省了时间和存储空间,然而也存在以下问题:
- 容器中的文件在宿主机上存在形式复杂,不能在宿主机上很方便地对容器中的文件进行访问;
- 多个容器之间的数据无法方便的共享;
- 当删除容器时,容器产生的数据将丢失;
于是,Docker引入了数据卷(volume)机制(vfs文件系统,不支持写时复制)。
一、数据卷的作用
数据卷是存在于一个或多个容器中的特定的目录,这一目录绕过UFS,可以提供以下特性:
- 数据卷可以在容器之间共享和重用;
- 对数据卷的修改会立马生效;
- 对数据卷的更新,不会影响镜像;
- 数据卷是被设计用来持久化数据的,它的生命周期独立于容器,默认会一直存在,即使容器被删除。
*注意:数据卷的使用,类似于 Linux 下对目录或文件进行 mount,镜像中的被指定为挂载点的目录中的文件会隐藏掉,能显示看的是挂载的数据卷。
二、数据卷的原理
Docker的数据的本质是容器中一个特殊的文件或目录(挂载点)。在容器的创建过程中,这个挂载点会被 挂载一个宿主机上的指定的目录 (一个以volumeID为名称的目录 或者指定的宿主机目录)。
例1: docker run -v /data busybox /bin/sh
//将宿主机上的volume_id目录绑定挂载到rootfs中指定的挂载点/data上 mount("/var/lib/docker/vfs/dir/volume_id","rootfs/data","none",MS_BIND,NULL);
例2: docker run -v /var/log:/data busybox /bin/bash
//将宿主机上的/var/log目录绑定挂载到rootfs中指定的挂载点/data上 mount("/var/log","rootfs/data","none",MS_BIND,NULL);
以上两种挂载方法的区别除了挂载的源目录不一样外,root/data目录下原来的文件在例1下是不存在的,但在例2下是仍旧存在的。
- 创建Volume
volume的来源只有3种:即从容器挂载、从宿主机挂载和其他容器共享。内部通过Mount对象来维护逻辑。
- 删除Volume
如果删除容器时带有-v标签或是这个容器运行时带有一个–rm标签,删除容器时会尝试删除这个容器所使用的volum。在将自己从volume的Container列表中删除后,判断volume的Container的列表是否为空,如果这个volume不被任务容器使用,则将这个volume删除 ,然后做以下两件事:
- 删除这个volume对应的配置文件;
如果这个volume是从容器挂载的,所以只需要删除宿主机上对应的volume_id文件夹。
volume的相关配置文件
Docker的每个容器在docker/containers文件夹下有一个以容器ID命名的子文件夹,这个子文件夹中的config.json文件是这个容器的配置文件,可以从中看到这个容器所使用的volume ID以及它们的可写情况。 如果你要查看volume的具体信息,你可以在docker/volumes文件夹下找与volume id命名的子文件夹,这个子文件夹中的config.json文件包含了volume的具体信息。
三、数据卷的使用
- 挂载一个主机目录作为数据据卷
$ sudo docker run -d -P –name web -v /src/webapp:/opt/webapp:ro training/webapp python app.py
Docker 挂载数据卷的默认权限是读写,用户也可以通过 :ro 指定为只读。
当然, 一次可以挂载多个数据卷。
查看数据卷的具体信息,docker inspect web 查看volume字段信息。
- 挂载一个本地主机文件作为数据卷
$ sudo docker run –rm -it -v ~/.bash_history:/.bash_history ubuntu /bin/bash
- 数据卷容器
首先, 创建一个名为dbdata的数据卷容器
sudo docker run -d -v /dbdata –name dbdata training/postgres echo Data-only container for postgres
然后,在其他容器中使用 –volumes-from 来挂载 dbdata 容器中的数据卷。
$ sudo docker run -d –volumes-from dbdata –name db1 training/postgres
$ sudo docker run -d –volumes-from dbdata –name db2 training/postgres
可以使用超过一个的 –volumes-from 参数来指定从多个容器挂载不同的数据卷。 也可以从其他已经挂载了数据卷的容器来级联挂载数据卷。
$ sudo docker run -d –name db3 –volumes-from db1 training/postgres
注意:使用 –volumes-from 参数所挂载数据卷的容器自己并不需要保持在运行状态。如果删除了挂载的容器(包括 dbdata、db1 和 db2),数据卷并不会被自动删除。如果要删除一个数据卷,必须在删除最后一个还挂载着它的容器时使用 docker rm -v 命令来指定同时删除关联的容器。
- 数据卷备份
首先使用 –volumes-from 标记来创建一个加载 dbdata 容器卷的容器,并从主机挂载当前目录到容器的 /backup 目录。命令如下:
$ sudo docker run –volumes-from dbdata -v $(pwd):/backup ubuntu tar cvf /backup/backup.tar /dbdata
容器启动后,使用了 tar 命令来将 dbdata 卷备份为容器中 /backup/backup.tar 文件,也就是主机当前目录下的名为 backup.tar 的文件。
- 数据卷恢复
如果要恢复数据到一个容器,首先创建一个带有空数据卷的容器 dbdata2。
$ sudo docker run -v /dbdata –name dbdata2 ubuntu /bin/bash
然后创建另一个容器,挂载 dbdata2 容器卷中的数据卷,并使用 untar 解压备份文件到挂载的容器卷中。
$ sudo docker run –volumes-from dbdata2 -v $(pwd):/backup busybox tar xvf /backup/backup.tar
为了查看/验证恢复的数据,可以再启动一个容器挂载同样的容器卷来查看+
$ sudo docker run –volumes-from dbdata2 busybox /bin/ls /dbdata