百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

【Docker 新手入门指南】第十章:Dockerfile

bigegpt 2025-06-03 20:23 8 浏览

Dockerfile 是 Docker 镜像构建的核心配置文件,通过预定义的指令集实现镜像的自动化构建。以下从核心概念、指令详解、最佳实践三方面展开说明,帮助你系统掌握 Dockerfile 的使用逻辑:

一、Dockerfile 核心概念

  1. 本质与作用
  • 定义:纯文本文件,包含从基础镜像构建自定义镜像的所有指令,是镜像构建的“源代码”。
  • 核心价值

标准化构建流程:通过版本控制 Dockerfile,确保镜像构建过程可复现。

分层构建机制:每条指令生成镜像的一层,利用缓存机制加速后续构建(未修改的层直接复用)。

  1. 构建流程
  • 准备上下文:指定包含 Dockerfile 和相关文件的目录(通过 docker build .. 传递)。
  • 解析指令:Docker 按顺序执行 Dockerfile 指令,逐层生成镜像。
  • 生成镜像:最终输出可运行的镜像,支持通过标签(Tag)唯一标识。

二、Dockerfile 常用指令详解

  1. 基础镜像与元数据
  • FROM
    • 作用:指定基础镜像(必须为第一条指令),支持 scratch 空镜像构建极简镜像。
    • 示例
FROM node:20-alpine # 基于 Node.js 20 轻量级镜像
  • LABEL(替代已弃用的 MAINTAINER
    • 作用:添加镜像元数据(作者、版本、描述等)。
    • 示例
LABEL org.opencontainers.image.authors="your-name@example.com" \ 
version="1.0.0" \ 
description="Web application service"
  1. 构建时执行指令
  • RUN
    • 作用:在构建阶段执行命令,支持 shell(默认)和 exec 格式。
    • 最佳实践

多条命令用 && 合并,减少镜像层数(如 RUN apt-get update && apt-get install -y package)。

使用 exec 格式避免 shell 注入风险:

RUN ["apt-get", "update"]
  • COPY vs ADD

指令

优势

劣势

典型场景

COPY

简单高效,仅复制文件/目录

不支持远程 URL、不解压 tar

复制本地代码到镜像

ADD

支持远程 URL、自动解压 tar

构建缓存易失效,性能较低

下载远程文件或解压资源

    • 示例
COPY src/ /app/ # 复制本地 src 目录到镜像 /app/ 
ADD app.tar.gz /app # 解压 app.tar.gz 到 /app(自动解压)
  1. 容器运行时配置
  • CMD
    • 作用:指定容器启动时的默认命令,仅最后一条有效,支持三种格式:
CMD ["node", "app.js"] 					 # exec 格式(推荐) 
CMD node app.js 											# shell 格式 
CMD ["--port", "8080"] 					  # 为 ENTRYPOINT 提供默认参数
  • ENTRYPOINT
    • 作用:设置容器启动时的主程序(不可被 docker run 命令覆盖),常与 CMD 配合使用。
    • 示例
ENTRYPOINT ["nginx", "-g", "daemon off;"]				 # 固定主程序 
CMD ["-c", "/etc/nginx/nginx.conf"]												 # 可替换的参数
  • ENV vs ARG

指令

作用范围

能否在运行时访问

默认值支持

典型场景

ENV

构建阶段 + 运行时

配置环境变量(如端口、路径)

ARG

仅限构建阶段

传递构建参数(如版本号)

  • 示例
ARG BUILD_VERSION=1.0.0 						# 构建参数,默认值 1.0.0 
ENV APP_ENV=production 							# 运行时环境变量
  1. 容器资源配置
  • EXPOSE
    • 作用:声明容器运行时监听的端口(需配合 docker run -p 映射宿主机端口)。
    • 示例
EXPOSE 80 443 # 声明 HTTP/HTTPS 端口
  • VOLUME
    • 作用:定义数据卷,实现容器数据持久化或与宿主机共享数据。
    • 示例
VOLUME /data/db # 声明 /data/db 为数据卷
  • WORKDIR
    • 作用:设置后续指令的工作目录(避免路径硬编码)。
    • 示例
WORKDIR /app COPY package*.json ./

三、Dockerfile 最佳实践

  1. 分层构建优化
  • 原则
  • 高频变动的文件(如代码)放在靠后的层,低频变动的依赖(如基础镜像、依赖包)放在靠前的层,充分利用缓存。
  • 避免冗余层,用 && 合并同类 RUN 指令。
  • 示例(Node.js 应用)
FROM node:20-alpine AS build 									 # 构建阶段 
WORKDIR /app COPY package*.json ./ 		 # 先复制依赖清单,缓存依赖安装层 
RUN npm install --production
 COPY . . 																																 # 最后复制代码,减少缓存失效概率 

FROM node:20-alpine AS runtime 							# 运行阶段(使用轻量级镜像) 
WORKDIR /app 
COPY --from=build /app/node_modules ./ 
COPY --from=build /app/dist ./ 										# 仅复制构建产物 
CMD ["node", "server.js"]
  1. 安全与轻量化
  • 使用非 root 用户
RUN addgroup -S app && adduser -S app -G app 
USER app 
WORKDIR /home/app
  • 选择合适的基础镜像
    • 优先使用 alpine 结尾的轻量级镜像(如 nginx:alpinepython:3.12-alpine),减少镜像体积。
    • 生产环境避免使用 latest 标签,指定具体版本(如 node:20.6.1)确保稳定性。
  1. 上下文管理
  • .dockerignore 文件
    在上下文目录中创建 .dockerignore,排除无需打包的文件(如 node_modules、日志、临时文件):
node_modules/ 
  *.log
   .git/
  • 避免远程资源直接写入镜像
    尽量通过 COPY 传递本地文件,避免在 RUN 中使用 wget 下载大文件(可通过构建参数传递 URL,或使用构建时缓存)。

四、实战案例:构建 Spring Boot 镜像

# 构建阶段(使用 Java 17 构建环境)
FROM maven:3.9.2-eclipse-temurin-17 AS build
WORKDIR /app
COPY pom.xml .
RUN mvn dependency:resolve
COPY src ./src
RUN mvn package -DskipTests

# 运行阶段(使用轻量级 OpenJDK 镜像)
FROM eclipse-temurin:17-jre-alpine
WORKDIR /app
COPY --from=build /app/target/*.jar app.jar  # 复制构建好的 Jar 包
ENV JAVA_OPTS="-Xms512m -Xmx1024m"            # 配置 JVM 内存
EXPOSE 8080
CMD ["java", "$JAVA_OPTS", "-jar", "app.jar"]

构建命令:

docker build -t my-spring-boot-app:1.0 .

五、总结

Dockerfile 通过标准化的指令集,将镜像构建过程代码化,实现了环境配置的版本控制和容器化应用的可移植性。掌握核心指令(如 FROMCOPYRUNCMD)的适用场景,结合分层构建、轻量化等最佳实践,可高效构建健壮、可维护的 Docker 镜像。如需进一步优化特定场景(如多阶段构建、缓存管理),可深入研究指令细节与 Docker 构建机制。

相关推荐

【Docker 新手入门指南】第十章:Dockerfile

Dockerfile是Docker镜像构建的核心配置文件,通过预定义的指令集实现镜像的自动化构建。以下从核心概念、指令详解、最佳实践三方面展开说明,帮助你系统掌握Dockerfile的使用逻...

Windows下最简单的ESP8266_ROTS_ESP-IDF环境搭建与腾讯云SDK编译

前言其实也没啥可说的,只是我感觉ESP-IDF对新手来说很不友好,很容易踩坑,尤其是对业余DIY爱好者搭建环境非常困难,即使有官方文档,或者网上的其他文档,但是还是很容易踩坑,多研究,记住两点就行了,...

python虚拟环境迁移(python虚拟环境conda)

主机A的虚拟环境向主机B迁移。前提条件:主机A和主机B已经安装了virtualenv1.主机A操作如下虚拟环境目录:venv进入虚拟环境:sourcevenv/bin/active(1)记录虚拟环...

Python爬虫进阶教程(二):线程、协程

简介线程线程也叫轻量级进程,它是一个基本的CPU执行单元,也是程序执行过程中的最小单元,由线程ID、程序计数器、寄存器集合和堆栈共同组成。线程的引入减小了程序并发执行时的开销,提高了操作系统的并发性能...

基于网络安全的Docker逃逸(docker)

如何判断当前机器是否为Docker容器环境Metasploit中的checkcontainer模块、(判断是否为虚拟机,checkvm模块)搭配学习教程1.检查根目录下是否存在.dockerenv文...

Python编程语言被纳入浙江高考,小学生都开始学了

今年9月份开始的新学期,浙江省三到九年级信息技术课将同步替换新教材。其中,新初二将新增Python编程课程内容。新高一信息技术编程语言由VB替换为Python,大数据、人工智能、程序设计与算法按照教材...

CentOS 7下安装Python 3.10的完整过程

1.安装相应的编译工具yum-ygroupinstall"Developmenttools"yum-yinstallzlib-develbzip2-develope...

如何在Ubuntu 20.04上部署Odoo 14

Odoo是世界上最受欢迎的多合一商务软件。它提供了一系列业务应用程序,包括CRM,网站,电子商务,计费,会计,制造,仓库,项目管理,库存等等,所有这些都无缝集成在一起。Odoo可以通过几种不同的方式进...

Ubuntu 系统安装 PyTorch 全流程指南

当前环境:Ubuntu22.04,显卡为GeForceRTX3080Ti1、下载显卡驱动驱动网站:https://www.nvidia.com/en-us/drivers/根据自己的显卡型号和...

spark+python环境搭建(python 环境搭建)

最近项目需要用到spark大数据相关技术,周末有空spark环境搭起来...目标spark,python运行环境部署在linux服务器个人通过vscode开发通过远程python解释器执行代码准备...

centos7.9安装最新python-3.11.1(centos安装python环境)

centos7.9安装最新python-3.11.1centos7.9默认安装的是python-2.7.5版本,安全扫描时会有很多漏洞,比如:Python命令注入漏洞(CVE-2015-2010...

Linux系统下,五大步骤安装Python

一、下载Python包网上教程大多是通过官方地址进行下载Python的,但由于国内网络环境问题,会导致下载很慢,所以这里建议通过国内镜像进行下载例如:淘宝镜像http://npm.taobao.or...

centos7上安装python3(centos7安装python3.7.2一键脚本)

centos7上默认安装的是python2,要使用python3则需要自行下载源码编译安装。1.安装依赖yum-ygroupinstall"Developmenttools"...

利用本地数据通过微调方式训练 本地DeepSeek-R1 蒸馏模型

网络上相应的教程基本都基于LLaMA-Factory进行,本文章主要顺着相应的教程一步步实现大模型的微调和训练。训练环境:可自行定义,mac、linux或者window之类的均可以,本文以ma...

【法器篇】天啦噜,库崩了没备份(天啦噜是什么意思?)

背景数据库没有做备份,一天突然由于断电或其他原因导致无法启动了,且设置了innodb_force_recovery=6都无法启动,里面的数据怎么才能恢复出来?本例采用解析建表语句+表空间传输的方式进行...