### 一、镜像概述 Docker 镜像包含运行应用程序所需的所有内容:代码、运行时、库、环境变量和配置文件。镜像是构建 Docker 容器的蓝图。它们是分层的,每一层都代表一个镜像构建的指令。当你创建一个新的镜像时,你会在一个基础镜像之上添加一个新的层,这个基础镜像可能是一个操作系统(如 Ubuntu 或 CentOS),也可能是另一个已经包含了额外组件的镜像。每当你在镜像上执行一个操作(如安装软件包或修改文件),Docker 都会在镜像的顶部添加一个新的层 ### 二、镜像核心技术——联合文件系统 Union File System 联合文件系统允许多个不同的文件系统被叠加在一起,形成单个文件系统。每一层都可以添加变更,而不影响其他层。广泛应用于 Linux 发行版中的 Live CD、Docker 镜像等场景。常见的联合文件系统有 AUFS、OverlayFS、Btrfs 等 联合文件系统的原理是将多个目录(称为分支)叠加在一起,这样就可以合并它们的内容。用户在访问文件或目录时,实际上是在访问一个由这些分支叠加而成的统一视图。下面是一些关键特点和工作原理: - **分层结构:**在 UnionFS 中,每个分支都可以看作是一个层,层与层之间可以是只读或者可写的。这些层从下往上叠加,形成一个统一的文件系统。最下面的层通常是只读的,而最上面的层是可写的 - **只读和可写层:**只读层包含不变的数据,而可写层通常用于存储变更。这种结构使得基础数据(只读层)在多个应用中被重复利用,而不需要复制,从而节省空间 - **Copy-On-Write(COW):**这是 UnionFS 的一种核心策略。当需要对文件进行修改时,如果该文件处于只读层,则首先会将该文件复制到最上面的可写层,然后再进行修改。这个过程称为“写时复制”,意味着只有在需要修改时,文件的副本才会被创建 - **文件和目录的合并视图:**从用户的角度来看,叠加在一起的所有层就像是一个普通的文件系统。如果多个层中包含了相同的文件或目录,UnionFS 按照一定的优先级规则(通常是最上面的层优先)来决定哪个版本对用户可见 - **删除和修改:**当删除或修改一个文件时,UnionFS 会在可写层创建一个特殊的标记(白板或删除标记),表示该文件在这个层被删除或修改了。即使底层的只读分支中仍然存在这个文件的原始版本,用户也看不到 - **透明性:**对于最终用户和应用程序来说,UnionFS 提供了一个透明的文件系统接口,使得它们无需关心底层的分层和叠加细节 ### 三、镜像核心技术——写时复制 Copy On Write 一种优化策略,用于在容器中管理文件系统的写入操作 #### 基本原理 1. **初始状态:** 当容器启动时,文件系统的各个层次被堆叠在一起,形成一个联合文件系统。这些层次中的每一个层都是只读的 2. **写操作触发:** 当容器需要对文件系统进行写操作时,例如创建、修改或删除文件,"Copy-On-Write"被触发 3. **创建副本:** 联合文件系统不直接在底层文件系统上执行写操作。相反,它在顶层的可写层创建一个被写入的文件或目录的副本 4. **仅在需要时复制:** 副本的创建是按需进行的,只有在写入操作发生时才会复制相关的文件或目录。直到写入操作发生,原始文件系统层仍然是只读的 #### 优势与好处 1. **避免污染底层层次:** "Copy-On-Write"策略确保了底层文件系统层不会被写入,因此原始镜像或者其他容器共享的底层层次不会被修改。这有助于维护原始镜像的不变性 2. **节省存储空间:** 由于只有在写入操作发生时才会创建副本,"Copy-On-Write"减少了对存储空间的需求。多个容器可以共享相同的底层层次,只需保存它们各自的修改,而不必复制整个文件系统 3. **快速创建副本:** 由于只有在需要时才复制文件,"Copy-On-Write"使得容器可以快速创建修改,而不需要复制整个文件系统,提高了性能和效率 4. **隔离写入操作:** "Copy-On-Write"确保了容器之间的文件写入操作是相互隔离的。每个容器都有自己的写入层,使得它们可以独立地对文件系统进行修改,而不会相互影响 ### 四、镜像制作 #### 技术 1. **Dockerfile:** Docker 使用 Dockerfile 来定义和描述镜像的构建步骤。Dockerfile 是一个文本文件,包含了从基础镜像开始,逐步添加、配置和操作的指令,最终构建出一个新的镜像。 2. **基础镜像:** 基础镜像是构建其他镜像的起点,它通常包含了操作系统和基本的运行时环境。选择适当的基础镜像对于镜像的性能和大小都有影响。 3. **Docker CLI:** Docker 命令行工具是与 Docker 引擎进行交互的主要方式。通过 Docker CLI,可以执行构建、运行、推送等操作,对 Docker 镜像进行管理。 4. **Docker Hub:** Docker Hub 是一个中央仓库,用于存储和分享 Docker 镜像。用户可以将自己构建的镜像推送到 Docker Hub,也可以从 Docker Hub 拉取公共镜像 #### 流程 1. **创建 Dockerfile:** 首先,通过创建一个 Dockerfile 来定义镜像的构建步骤。Dockerfile 包含了一系列指令,例如基础镜像的选择、软件的安装、配置文件的添加等 ```dockerfile FROM base_image:tag RUN apt-get update && apt-get install -y software COPY local-files /app ``` 2. **构建镜像:** 使用 `docker build` 命令执行 Dockerfile 中定义的构建步骤。这将会逐步执行每个指令,生成一个新的 Docker 镜像 ```bash docker build -t my_custom_image:tag . ``` 3. **运行容器:** 可以使用 `docker run` 命令基于刚刚构建的镜像启动容器。在容器中,你可以测试和验证构建的应用程序或服务 ```bash docker run -it my_custom_image:tag ``` 4. **推送到仓库:** 如果你想分享或备份你的镜像,可以使用 `docker push` 命令将镜像推送到 Docker Hub 或其他容器仓库 ```bash docker push my_custom_image:tag ``` 5. 持续集成(可选):** 对于大型项目或团队,可以考虑将 Docker 镜像的构建过程整合到持续集成(CI)流程中,确保代码变更触发自动的构建和测试 #### Dockerfile编写关键指令 1. **FROM:** 指定基础镜像,所有其他指令都基于该镜像。 ```dockerfile FROM ubuntu:20.04 ``` 2. **LABEL:** 为镜像添加元数据,通常用于提供版本、描述等信息。 ```dockerfile LABEL maintainer="your-name" ``` 3. **RUN:** 在镜像中执行命令,用于安装软件包、配置环境等。 ```dockerfile RUN apt-get update && apt-get install -y software ``` 4. **COPY:** 将文件从主机复制到镜像中。 ```dockerfile COPY local-files /app ``` 5. **ADD:** 类似于 COPY,但可以处理 URL 和解压缩 tar 文件。 ```dockerfile ADD https://example.com/file.tar.gz /app ``` 6. **WORKDIR:** 设置工作目录,后续的相对路径都相对于该目录。 ```dockerfile WORKDIR /app ``` 7. **ENV:** 设置环境变量。 ```dockerfile ENV MY_VARIABLE=my-value ``` 8. **EXPOSE:** 声明容器运行时监听的网络端口。 ```dockerfile EXPOSE 80 ``` 9. **CMD:** 指定容器启动时要运行的命令。可以有多个 CMD,但只有最后一个生效。 ```dockerfile CMD ["executable", "param1", "param2"] ``` 10. **ENTRYPOINT:** 指定容器启动时要运行的命令,与 CMD 结合使用。CMD 提供默认参数。 ```dockerfile ENTRYPOINT ["executable", "param1", "param2"] ``` 11. **VOLUME:** 创建挂载点,用于持久化存储或与其他容器共享数据。 ```dockerfile VOLUME /data ``` 12. **USER:** 设置运行时的用户名或 UID。 ```dockerfile USER username ``` 13. **ARG:** 定义构建时的参数,可通过 `docker build` 命令传递。 ```dockerfile ARG version=latest ``` ### 五、镜像存储与分发 #### 存储方式: 1. **本地文件系统:** - Docker 镜像可以直接存储在本地文件系统上。这适用于开发和测试阶段,以及在单机环境中使用。 2. **Docker Hub 和其他 Registry:** - Docker Hub 是 Docker 官方提供的中央镜像仓库,允许用户将镜像上传至其中,并从中下载。私有仓库(如 Harbor、Amazon ECR、Azure Container Registry 等)也提供了类似的功能,适用于企业内部或有特殊需求的场景。 3. **Docker Volume:** - Docker Volume 用于持久化存储容器数据,但也可以用来存储镜像。这种方式适用于需要在容器之间共享数据的场景,但并不是首选的镜像存储方式。 4. **分布式存储系统:** - 在某些场景中,可以使用分布式存储系统(如 Ceph、GlusterFS、NFS 等)来存储 Docker 镜像。这种方式允许多个 Docker 主机共享相同的存储,提供高可用性和扩展性。 #### 分发方式: 1. **Docker Push 和 Pull:** 使用 `docker push` 命令将本地构建的镜像上传到 Docker Hub 或其他 Registry,并使用 `docker pull` 命令在其他机器上下载镜像。这是最常见的分发方式。 ```bash # 将镜像推送至 Docker Hub docker push username/repository:tag # 在其他机器上拉取镜像 docker pull username/repository:tag ``` **Docker Save 和 Load:** 使用 `docker save` 命令将镜像保存为 tar 文件,然后通过 `docker load` 命令在其他机器上加载。这种方式适用于离线环境或需要手动迁移镜像的情况。 ```bash # 将镜像保存为 tar 文件 docker save -o image.tar username/repository:tag # 在其他机器上加载镜像 docker load -i image.tar ``` **导出和导入容器快照:** 使用 `docker export` 命令导出容器快照,然后使用 `docker import` 命令导入为镜像。这种方式适用于将容器快照分享给其他人。 ```bash # 导出容器快照 docker export container_id > container.tar # 导入为镜像 cat container.tar | docker import - username/repository:tag ```