【Docker 新手入门指南】第十章:Dockerfile
bigegpt 2025-06-03 20:23 8 浏览
Dockerfile 是 Docker 镜像构建的核心配置文件,通过预定义的指令集实现镜像的自动化构建。以下从核心概念、指令详解、最佳实践三方面展开说明,帮助你系统掌握 Dockerfile 的使用逻辑:
一、Dockerfile 核心概念
- 本质与作用
- 定义:纯文本文件,包含从基础镜像构建自定义镜像的所有指令,是镜像构建的“源代码”。
- 核心价值:
标准化构建流程:通过版本控制 Dockerfile,确保镜像构建过程可复现。
分层构建机制:每条指令生成镜像的一层,利用缓存机制加速后续构建(未修改的层直接复用)。
- 构建流程
- 准备上下文:指定包含 Dockerfile 和相关文件的目录(通过 docker build . 的 . 传递)。
- 解析指令:Docker 按顺序执行 Dockerfile 指令,逐层生成镜像。
- 生成镜像:最终输出可运行的镜像,支持通过标签(Tag)唯一标识。
二、Dockerfile 常用指令详解
- 基础镜像与元数据
- FROM
- 作用:指定基础镜像(必须为第一条指令),支持 scratch 空镜像构建极简镜像。
- 示例:
FROM node:20-alpine # 基于 Node.js 20 轻量级镜像
- LABEL(替代已弃用的 MAINTAINER)
- 作用:添加镜像元数据(作者、版本、描述等)。
- 示例:
LABEL org.opencontainers.image.authors="your-name@example.com" \
version="1.0.0" \
description="Web application service"
- 构建时执行指令
- RUN
- 作用:在构建阶段执行命令,支持 shell(默认)和 exec 格式。
- 最佳实践:
多条命令用 && 合并,减少镜像层数(如 RUN apt-get update && apt-get install -y package)。
使用 exec 格式避免 shell 注入风险:
RUN ["apt-get", "update"]
- COPY vs ADD
指令 | 优势 | 劣势 | 典型场景 |
COPY | 简单高效,仅复制文件/目录 | 不支持远程 URL、不解压 tar | 复制本地代码到镜像 |
ADD | 支持远程 URL、自动解压 tar | 构建缓存易失效,性能较低 | 下载远程文件或解压资源 |
- 示例:
COPY src/ /app/ # 复制本地 src 目录到镜像 /app/
ADD app.tar.gz /app # 解压 app.tar.gz 到 /app(自动解压)
- 容器运行时配置
- CMD
- 作用:指定容器启动时的默认命令,仅最后一条有效,支持三种格式:
CMD ["node", "app.js"] # exec 格式(推荐)
CMD node app.js # shell 格式
CMD ["--port", "8080"] # 为 ENTRYPOINT 提供默认参数
- ENTRYPOINT
- 作用:设置容器启动时的主程序(不可被 docker run 命令覆盖),常与 CMD 配合使用。
- 示例:
ENTRYPOINT ["nginx", "-g", "daemon off;"] # 固定主程序
CMD ["-c", "/etc/nginx/nginx.conf"] # 可替换的参数
- ENV vs ARG
指令 | 作用范围 | 能否在运行时访问 | 默认值支持 | 典型场景 |
ENV | 构建阶段 + 运行时 | 是 | 是 | 配置环境变量(如端口、路径) |
ARG | 仅限构建阶段 | 否 | 是 | 传递构建参数(如版本号) |
- 示例:
ARG BUILD_VERSION=1.0.0 # 构建参数,默认值 1.0.0
ENV APP_ENV=production # 运行时环境变量
- 容器资源配置
- EXPOSE
- 作用:声明容器运行时监听的端口(需配合 docker run -p 映射宿主机端口)。
- 示例:
EXPOSE 80 443 # 声明 HTTP/HTTPS 端口
- VOLUME
- 作用:定义数据卷,实现容器数据持久化或与宿主机共享数据。
- 示例:
VOLUME /data/db # 声明 /data/db 为数据卷
- WORKDIR
- 作用:设置后续指令的工作目录(避免路径硬编码)。
- 示例:
WORKDIR /app COPY package*.json ./
三、Dockerfile 最佳实践
- 分层构建优化
- 原则:
- 高频变动的文件(如代码)放在靠后的层,低频变动的依赖(如基础镜像、依赖包)放在靠前的层,充分利用缓存。
- 避免冗余层,用 && 合并同类 RUN 指令。
- 示例(Node.js 应用):
FROM node:20-alpine AS build # 构建阶段
WORKDIR /app COPY package*.json ./ # 先复制依赖清单,缓存依赖安装层
RUN npm install --production
COPY . . # 最后复制代码,减少缓存失效概率
FROM node:20-alpine AS runtime # 运行阶段(使用轻量级镜像)
WORKDIR /app
COPY --from=build /app/node_modules ./
COPY --from=build /app/dist ./ # 仅复制构建产物
CMD ["node", "server.js"]
- 安全与轻量化
- 使用非 root 用户:
RUN addgroup -S app && adduser -S app -G app
USER app
WORKDIR /home/app
- 选择合适的基础镜像:
- 优先使用 alpine 结尾的轻量级镜像(如 nginx:alpine、python:3.12-alpine),减少镜像体积。
- 生产环境避免使用 latest 标签,指定具体版本(如 node:20.6.1)确保稳定性。
- 上下文管理
- .dockerignore 文件:
在上下文目录中创建 .dockerignore,排除无需打包的文件(如 node_modules、日志、临时文件):
node_modules/
*.log
.git/
- 避免远程资源直接写入镜像:
尽量通过 COPY 传递本地文件,避免在 RUN 中使用 wget 下载大文件(可通过构建参数传递 URL,或使用构建时缓存)。
四、实战案例:构建 Spring Boot 镜像
# 构建阶段(使用 Java 17 构建环境)
FROM maven:3.9.2-eclipse-temurin-17 AS build
WORKDIR /app
COPY pom.xml .
RUN mvn dependency:resolve
COPY src ./src
RUN mvn package -DskipTests
# 运行阶段(使用轻量级 OpenJDK 镜像)
FROM eclipse-temurin:17-jre-alpine
WORKDIR /app
COPY --from=build /app/target/*.jar app.jar # 复制构建好的 Jar 包
ENV JAVA_OPTS="-Xms512m -Xmx1024m" # 配置 JVM 内存
EXPOSE 8080
CMD ["java", "$JAVA_OPTS", "-jar", "app.jar"]
构建命令:
docker build -t my-spring-boot-app:1.0 .
五、总结
Dockerfile 通过标准化的指令集,将镜像构建过程代码化,实现了环境配置的版本控制和容器化应用的可移植性。掌握核心指令(如 FROM、COPY、RUN、CMD)的适用场景,结合分层构建、轻量化等最佳实践,可高效构建健壮、可维护的 Docker 镜像。如需进一步优化特定场景(如多阶段构建、缓存管理),可深入研究指令细节与 Docker 构建机制。
- 上一篇:Windows下最简单的ESP8266_ROTS_ESP-IDF环境搭建与腾讯云SDK编译
- 已经是最后一篇了
相关推荐
- 【Docker 新手入门指南】第十章:Dockerfile
-
Dockerfile是Docker镜像构建的核心配置文件,通过预定义的指令集实现镜像的自动化构建。以下从核心概念、指令详解、最佳实践三方面展开说明,帮助你系统掌握Dockerfile的使用逻...
- Windows下最简单的ESP8266_ROTS_ESP-IDF环境搭建与腾讯云SDK编译
-
前言其实也没啥可说的,只是我感觉ESP-IDF对新手来说很不友好,很容易踩坑,尤其是对业余DIY爱好者搭建环境非常困难,即使有官方文档,或者网上的其他文档,但是还是很容易踩坑,多研究,记住两点就行了,...
- python虚拟环境迁移(python虚拟环境conda)
-
主机A的虚拟环境向主机B迁移。前提条件:主机A和主机B已经安装了virtualenv1.主机A操作如下虚拟环境目录:venv进入虚拟环境:sourcevenv/bin/active(1)记录虚拟环...
- Python爬虫进阶教程(二):线程、协程
-
简介线程线程也叫轻量级进程,它是一个基本的CPU执行单元,也是程序执行过程中的最小单元,由线程ID、程序计数器、寄存器集合和堆栈共同组成。线程的引入减小了程序并发执行时的开销,提高了操作系统的并发性能...
- 基于网络安全的Docker逃逸(docker)
-
如何判断当前机器是否为Docker容器环境Metasploit中的checkcontainer模块、(判断是否为虚拟机,checkvm模块)搭配学习教程1.检查根目录下是否存在.dockerenv文...
- Python编程语言被纳入浙江高考,小学生都开始学了
-
今年9月份开始的新学期,浙江省三到九年级信息技术课将同步替换新教材。其中,新初二将新增Python编程课程内容。新高一信息技术编程语言由VB替换为Python,大数据、人工智能、程序设计与算法按照教材...
- CentOS 7下安装Python 3.10的完整过程
-
1.安装相应的编译工具yum-ygroupinstall"Developmenttools"yum-yinstallzlib-develbzip2-develope...
- 如何在Ubuntu 20.04上部署Odoo 14
-
Odoo是世界上最受欢迎的多合一商务软件。它提供了一系列业务应用程序,包括CRM,网站,电子商务,计费,会计,制造,仓库,项目管理,库存等等,所有这些都无缝集成在一起。Odoo可以通过几种不同的方式进...
- Ubuntu 系统安装 PyTorch 全流程指南
-
当前环境:Ubuntu22.04,显卡为GeForceRTX3080Ti1、下载显卡驱动驱动网站:https://www.nvidia.com/en-us/drivers/根据自己的显卡型号和...
- spark+python环境搭建(python 环境搭建)
-
最近项目需要用到spark大数据相关技术,周末有空spark环境搭起来...目标spark,python运行环境部署在linux服务器个人通过vscode开发通过远程python解释器执行代码准备...
- centos7.9安装最新python-3.11.1(centos安装python环境)
-
centos7.9安装最新python-3.11.1centos7.9默认安装的是python-2.7.5版本,安全扫描时会有很多漏洞,比如:Python命令注入漏洞(CVE-2015-2010...
- Linux系统下,五大步骤安装Python
-
一、下载Python包网上教程大多是通过官方地址进行下载Python的,但由于国内网络环境问题,会导致下载很慢,所以这里建议通过国内镜像进行下载例如:淘宝镜像http://npm.taobao.or...
- centos7上安装python3(centos7安装python3.7.2一键脚本)
-
centos7上默认安装的是python2,要使用python3则需要自行下载源码编译安装。1.安装依赖yum-ygroupinstall"Developmenttools"...
- 利用本地数据通过微调方式训练 本地DeepSeek-R1 蒸馏模型
-
网络上相应的教程基本都基于LLaMA-Factory进行,本文章主要顺着相应的教程一步步实现大模型的微调和训练。训练环境:可自行定义,mac、linux或者window之类的均可以,本文以ma...
- 【法器篇】天啦噜,库崩了没备份(天啦噜是什么意思?)
-
背景数据库没有做备份,一天突然由于断电或其他原因导致无法启动了,且设置了innodb_force_recovery=6都无法启动,里面的数据怎么才能恢复出来?本例采用解析建表语句+表空间传输的方式进行...
- 一周热门
- 最近发表
- 标签列表
-
- mybatiscollection (79)
- mqtt服务器 (88)
- keyerror (78)
- c#map (65)
- resize函数 (64)
- xftp6 (83)
- bt搜索 (75)
- c#var (76)
- mybatis大于等于 (64)
- xcode-select (66)
- mysql授权 (74)
- 下载测试 (70)
- skip-name-resolve (63)
- linuxlink (65)
- pythonwget (67)
- logstashinput (65)
- hadoop端口 (65)
- vue阻止冒泡 (67)
- oracle时间戳转换日期 (64)
- jquery跨域 (68)
- php写入文件 (73)
- kafkatools (66)
- mysql导出数据库 (66)
- jquery鼠标移入移出 (71)
- 取小数点后两位的函数 (73)