Docker 构建 Layer

层优化

docker在构建每条Dockerfile的每一条命令(RUN,COPY,ADD),会生成一个镜像中间层。每条指令对应一个层。
当构建同一个镜像的时候,Docker会检查是否有同样的指令+相同的上下文(输入文件内容,命令内容,源文件)。如果某一层的指令没变并且输入没变,则可以复用之前的缓存层。
如果某一层呗修改,那么这层会失效,其后所有依赖这层的层,都必须重新执行/重建.

为什么“层多”不一定更容易命中缓存？

修改频率高的层在中后部会使后续很多层都失效
如果一个频率高（经常改动:源码之类的）的指令在 Dockerfile 的上面／中间，那么修改时这一层会失效，
连带它下方所有层都要重新 build。就算层很多，如果这些层都在“被修改的层之后”也会全部失效。
层的输入是否相同更关键
比如 COPY . . 指令会把整个上下文拷贝过去，如果某个源文件变了，这条 COPY 的层就不能命中缓存。
即使之前很多层都没变，但因为这个 COPY 在中间，之后的所有层都要从这里开始重建。
层太多可能带来过多中间状态／元数据开销
每个 layer 都有一些元数据、IO 操作、存储空间开销。太多层也可能使得查找、合并 overlay 之类成本变高。
缓存粒度 vs 构建效率权衡
有些步骤也许不希望太早失效（比如安装系统包、配置环境等），
如果这些都拆成很多层，也容易因小变动失效；有些步骤希望频繁变，比如拷贝代码，那么把它们稍微放后面比较好。

怎么设计 Dockerfile 才更容易命中缓存（实践建议-GPT5）

1. 把不太变动的指令放前面
  比如系统包安装、基础工具安装、依赖库安装这些。它们一旦设定好，改动少，方便缓存命中。
1. COPY 用到的文件要精细
  把频繁变动的那些文件单独 COPY 放后面；不变的文件（比如依赖清单、配置模板、脚本）先拷贝。这样“依赖安装”的层可以被复用
1. 合并多个相关操作入同一个 RUN
  安装 + 清理 + 更新等步骤合并在一起，可以减少中间无用层，也减少临时文件残留。
1. 用 .dockerignore 排除无关文件
  如果上下文（context）里有很多无关文件每次都被拷贝，会导致 COPY 指令层频繁失效。用 .dockerignore 排除掉比如日志、编译中间产物、未使用文件等。

为什么“多个操作合并在一个 RUN”有优势

临时文件残留的问题
假设你有两条 RUN：一条下载某个 tar 包，一条解压并删除这个 tar 包。
如果你把下载和解压／删除分在两个 RUN，那么第一条下载的 layer 会保存那个 tar 包，
即使第二条删除了，第一层也还保留那文件，这样镜像里就有无用文件占空间。

合并后
如果你下载 + 解压 + 删除放在同一个 RUN，用 && rm … 在同一个层里删除临时文件，
那么这个层最终看起来就像那文件从来没被保留过（因为虽然下载了，但被删除了，最终 diff 不包含临时文件）。这样能减少镜像体积。

层数／元数据开销
每一个 RUN 都会生成一层。层太多会导致镜像的元数据多、查找／合并 overlay 的代价稍微大。还可能影响拉镜像／推镜像时处理层的次数

合并后
合并 RUN 能减少层数 → 镜像结构更简单，启动／推送／拉取的时候效率更高