利用Docker分层构建优化镜像大小
合适docker镜像文件大小不仅影响容器启动效率,也影响资源占用效率。本文介绍如何利用分层方式构建docker镜像,采用多种方式避免镜像文件太大而影响性能。
Docker 镜像大小优化的重要性
-
资源利用效率
较小的镜像文件在存储和传输过程中占用更少的空间和带宽。例如,在将镜像从本地仓库推送到远程仓库或者在集群环境中分发镜像时,小镜像可以加快传输速度,减少网络资源的占用。
当在主机上存储大量镜像时,较小的镜像可以节省磁盘空间,使得可以在有限的磁盘容量下存储更多的镜像,这对于容器编排系统(如 Kubernetes)管理大量不同的容器镜像非常重要。
-
容器启动速度
小镜像启动速度通常更快。因为在容器启动时,需要将镜像中的文件系统加载到容器的存储层,如果镜像文件较小,那么加载的时间和资源消耗会相应减少,从而提高容器的启动效率。
分层构建镜像的原理和优势
-
原理
Docker 镜像是由多层文件系统叠加而成的。每一层都代表了一次对文件系统的修改,例如安装软件包、添加配置文件等操作。当构建镜像时,Docker 会将这些操作按顺序记录下来,形成一个分层的结构。
例如,基础镜像(如
ubuntu:latest)是最底层,然后在其上添加新的层,如安装nginx软件包会形成一个新的层,修改nginx的配置文件又会形成另外一层。

-
优势对镜像大小的影响
复用已有层:分层构建最大的优势之一是可以复用层。如果多个镜像都基于相同的基础镜像,并且在基础镜像之上的某些层是相同的(例如都安装了相同的系统库),那么这些相同的层在存储时只会保存一份。
例如,有镜像 A 和镜像 B 都基于
ubuntu:latest构建,并且都安装了python3 - pip包,那么这个python3 - pip安装层只会在存储中保存一次,多个镜像可以共享该层。这样可以大大减少镜像存储所需的空间总量。增量构建和更新:当需要更新镜像中的某一部分时,只需要更新对应的层。例如,如果只是更新了应用程序的代码而没有改变基础操作系统或其他依赖库,那么只有包含代码的层会被更新,其他层可以保持不变。这使得更新镜像时的数据传输量最小化,有助于保持镜像大小的合理性。
分层构建镜像的最佳实践
-
合理选择基础镜像
基础镜像的大小对最终镜像大小有很大影响。尽量选择轻量级的基础镜像。例如,对于基于 Linux 的应用程序,如果不需要完整的 Ubuntu 或 CentOS 系统的所有功能,可以选择
alpine作为基础镜像。alpine是一个轻量级的 Linux 发行版,其镜像大小通常只有几兆字节,相比完整的 Ubuntu 或 CentOS 镜像(可能几百兆字节)要小很多。例如,构建一个简单的 Python Web 应用容器,使用
python:alpine作为基础镜像会比使用python:ubuntu产生更小的镜像。 -
合并多层操作(减少层数)
虽然分层有很多优势,但过多的层也可能导致一些问题,如镜像存储和传输效率下降。在构建镜像过程中,可以将一些相关的操作合并到同一层中。
例如,在安装多个软件包时,可以在一个
RUN指令中完成,而不是为每个软件包安装使用一个单独的RUN指令。比如在Dockerfile中,不要这样写:
RUN apt - get updateRUN apt - get install - y package1RUN apt - get install - y package2
应该这样写:
RUN apt - get update && apt - get install - y package1 package2
这样可以减少镜像的层数,因为每一个RUN指令都会产生一个新的层。
- 清理无用文件和缓存
在构建镜像过程中,安装软件包或编译程序等操作可能会产生一些临时文件和缓存。这些文件会增加镜像的大小,但在容器运行时可能并不需要。
例如,在apt - get安装软件包后,可以使用apt - get clean命令清理软件包缓存。在构建基于 Java 的应用程序镜像时,编译后的字节码文件可能不需要包含源代码文件,那么可以在构建过程中删除源代码文件。在Dockerfile中可以这样写:
RUN apt - get update && apt - get install - y package && apt - get clean
或者在构建 Java 应用程序镜像时:
# 假设编译后的代码在/target目录,源代码在/src目录COPY. /appWORKDIR /appRUN mvn clean install - DskipTestsRUN rm - rf /app/src
通过分层构建镜像并结合上述最佳实践,可以有效地控制 Docker 镜像的大小,提高镜像的存储和使用效率。
- 多阶段构建
原理:多阶段构建允许将构建过程分为多个阶段,每个阶段可以使用不同的基础镜像和构建工具。在前面的阶段可以进行代码编译、测试等操作,在后面的阶段只复制运行时需要的文件,从而减少最终镜像的大小。
示例:以一个 Go 语言应用为例,第一阶段可以使用包含 Go 编译器的基础镜像来编译应用程序,第二阶段可以使用一个轻量级的alpine基础镜像来运行编译后的程序。
# 第一阶段:构建应用FROM golang:1.18 - alpine AS builderCOPY. /appWORKDIR /appRUN go build - o myapp# 第二阶段:运行应用FROM alpine:latestCOPY -- from = builder /app/myapp /usr/local/bin/myappCMD ["myapp"]
在这个例子中,第一阶段构建出了 Go 应用,第二阶段只复制了运行时需要的可执行文件myapp到一个轻量级的alpine镜像中,最终的镜像不包含 Go 编译器和其他构建过程中产生的不必要的文件,大大减小了镜像大小。
相关文章:
利用Docker分层构建优化镜像大小
合适docker镜像文件大小不仅影响容器启动效率,也影响资源占用效率。本文介绍如何利用分层方式构建docker镜像,采用多种方式避免镜像文件太大而影响性能。 Docker 镜像大小优化的重要性 资源利用效率 较小的镜像文件在存储和传输过程中占用更少的空间和带…...
Spring 魔法探秘:从 Bean 线程安全到事务魔法全解析
1.Spring 框架中的单例 Bean 是线程安全的么? Spring 框架中的单例 Bean 本身并不保证线程安全性。单例模式意味着在整个应用程序的生命周期中,只会创建该 Bean 的一个实例,并且所有对该 Bean 的请求都将共享这个实例。 线程安全与否取决于…...
[Maven]IDEA父工程创建子工程后父工程不可运行
IDEA在使用maven构建项目时,如果你在当前工程下创建一个子工程,那么原有的工程(变为父工程的工程)原有的代码通常会变得不可运行。 这是因为,使用maven创建父子工程关系后,IDEA会自动变更项目的模块相关配置。 比如这是我maven工程…...
【系统移植】在开发板上加载内核和根文件系统的三种方法
实现环境:ubuntu24.04和FS4412实验平台。 要在开发板上运行linux操作系统,首先要将linux内核镜像(uImage)、设备树(dexynos4412-fs4412.dtb)和根文件系统镜像(ramdisk.img)加载到开发板内存。有以下几种方式加载: 一、通过tftp加载内核和根文件系统 二、通过EMMC加…...
#渗透测试#漏洞挖掘#红蓝攻防#护网#sql注入介绍02-基于错误消息的SQL注入(Error-Based SQL Injection)
免责声明 本教程仅为合法的教学目的而准备,严禁用于任何形式的违法犯罪活动及其他商业行为,在使用本教程前,您应确保该行为符合当地的法律法规,继续阅读即表示您需自行承担所有操作的后果,如有异议,请立即停…...
数据结构-排序(来自于王道)
排序的基本概念 插入排序 在这个算法中,除了输入的数组本身,没有使用额外的数据结构来存储数据,所有的操作都是在原数组上进行的。因此,无论输入数组的大小 n 是多少,算法执行过程中所占用的额外空间是固定的ÿ…...
【蓝桥杯选拔赛真题93】Scratch青蛙过河 第十五届蓝桥杯scratch图形化编程 少儿编程创意编程选拔赛真题解析
目录 Scratch青蛙过河 一、题目要求 编程实现 二、案例分析 1、角色分析 2、背景分析 3、前期准备 三、解题思路 1、思路分析 2、详细过程 四、程序编写 五、考点分析 六、推荐资料 1、入门基础 2、蓝桥杯比赛 3、考级资料 4、视频课程 5、python资料 Scr…...
ReactPress最佳实践—搭建导航网站实战
Github项目地址:https://github.com/fecommunity/easy-blog 欢迎Star。 近期,阮一峰在科技爱好者周刊第 325 期中推荐了一款开源工具——ReactPress,ReactPress一个基于 Next.js 的博客和 CMS 系统,可查看 demo站点。(…...
Hive-4.0.1数据库搭建(可选配置用户名密码远程连接)
1.官网下载tar包上传到服务器并解压(我这里解压到了hive目录): 2.进入到conf目录,并复制模板配置文件进行修改: cd /apache-hive-4.0.1-bin/conf cp hive-default.xml.template hive-site.xml3.编写内容如下: <property>&…...
P8772 求和 P8716 回文日期
文章目录 [蓝桥杯 2022 省 A] 求和[蓝桥杯 2020 省 AB2] 回文日期 [蓝桥杯 2022 省 A] 求和 题目描述 给定 n n n 个整数 a 1 , a 2 , ⋯ , a n a_{1}, a_{2}, \cdots, a_{n} a1,a2,⋯,an, 求它们两两相乘再相加的和,即 S a 1 ⋅ a 2 a 1 ⋅ a 3 ⋯ a…...
MySQL迁移SQLite
将 MySQL 的表结构和数据迁移到 SQLite,可以通过以下步骤实现。这个过程主要包括导出 MySQL 数据库到 SQL 文件,然后将其导入到 SQLite 数据库中。 步骤 1: 导出 MySQL 数据库 首先,需要将 MySQL 数据库导出为一个 SQL 文件。可以使用 mysq…...
RocketMQ中的顺序消息和乱序消息详解
内容编辑中… 1.背景 顺序消息是消息队列 RocketMQ 提供的一种高级消息类型。 对于一个指定的Topic,消息严格按照先进先出(FIFO)的原则进行消息发布和消费。 即先发送的消息先消费,后发送的消息后消费。 顺序消息在发送、存储和投递的处理过程中,强调多条消息间的先后…...
Unity UGUI图片循环列表插件
效果展示: 下载链接:https://gf.bilibili.com/item/detail/1111843026 概述: LoopListView2 是一个与 UGUI ScrollRect 相同的游戏对象的组件。它可以帮助 UGUI ScrollRect 以高效率和节省内存的方式支持任意数量的项目。 对于具有10,000个…...
Kafka系列教程 - Kafka 生产者 -2
1. 生产者简介 不管是把 Kafka 作为消息队列系统、还是数据存储平台,总是需要一个可以向 Kafka 写入数据的生产者和一个可以从 Kafka 读取数据的消费者,或者是一个兼具两种角色的应用程序。 使用 Kafka 的场景很多,诉求也各有不同ÿ…...
AI Chat API 对接说明
AI Chat API 对接说明 我们知道,市面上一些问答 API 的对接还是相对没那么容易的,比如说 OpenAI 的 Chat Completions API,它有一个 messages 字段,如果要完成连续对话,需要我们把所有的上下文历史全部传递࿰…...
Thread线程基础使用
多线程目的:其实就是希望“并行”执行多任务,提升效率。 单核多线程基于时间片轮询 并发而非并行 线程最大数等于cpu核心数为佳 namespace thinger.ThreadDemo {class Program{//主线程static void Main(string[] args){Console.WriteLine("这个…...
【Linux】结构化命令
结构化命令structured command:允许脚本根据条件跳过部分命令,改变执行流程。 1、if-then语句 格式1: if command then commands fi 格式2: if command; then commands fi 运行if之后的command命令,如果它的退出状态码…...
ElasticSearch01-概述
零、文章目录 ElasticSearch01-概述 1、Elastic Stack (1)简介 官网地址:https://www.elastic.co/cn/ELK是一个免费开源的日志分析架构技术栈总称,包含三大基础组件,分别是Elasticsearch、Logstash、Kibana。但实际…...
docker xxxx is using its referenced image ea06665f255d
Error response from daemon: conflict: unable to remove repository reference “registrxxxxxx” (must force) - container 9642fd1fd4a0 is using its referenced image ea06665f255d 这个错误表明你尝试删除的镜像正在被一个容器使用,因此无法删除。要解决这…...
Vue 2 中 v-text 和 v-html 指令的使用详解
目录 Vue 2 中 v-text 和 v-html 指令的使用详解 v-text 指令 简介 基本语法 示例 1:基础用法 特点 v-html 指令 简介 基本语法 示例 2:基础用法 注意事项 区别与选择指南 何时使用 最佳实践 Vue 2 中 v-text 和 v-html 指令的使用详解 V…...
深度学习在微纳光子学中的应用
深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向: 逆向设计 通过神经网络快速预测微纳结构的光学响应,替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…...
linux之kylin系统nginx的安装
一、nginx的作用 1.可做高性能的web服务器 直接处理静态资源(HTML/CSS/图片等),响应速度远超传统服务器类似apache支持高并发连接 2.反向代理服务器 隐藏后端服务器IP地址,提高安全性 3.负载均衡服务器 支持多种策略分发流量…...
【WiFi帧结构】
文章目录 帧结构MAC头部管理帧 帧结构 Wi-Fi的帧分为三部分组成:MAC头部frame bodyFCS,其中MAC是固定格式的,frame body是可变长度。 MAC头部有frame control,duration,address1,address2,addre…...
Spring Boot 实现流式响应(兼容 2.7.x)
在实际开发中,我们可能会遇到一些流式数据处理的场景,比如接收来自上游接口的 Server-Sent Events(SSE) 或 流式 JSON 内容,并将其原样中转给前端页面或客户端。这种情况下,传统的 RestTemplate 缓存机制会…...
【HTML-16】深入理解HTML中的块元素与行内元素
HTML元素根据其显示特性可以分为两大类:块元素(Block-level Elements)和行内元素(Inline Elements)。理解这两者的区别对于构建良好的网页布局至关重要。本文将全面解析这两种元素的特性、区别以及实际应用场景。 1. 块元素(Block-level Elements) 1.1 基本特性 …...
【python异步多线程】异步多线程爬虫代码示例
claude生成的python多线程、异步代码示例,模拟20个网页的爬取,每个网页假设要0.5-2秒完成。 代码 Python多线程爬虫教程 核心概念 多线程:允许程序同时执行多个任务,提高IO密集型任务(如网络请求)的效率…...
LangChain知识库管理后端接口:数据库操作详解—— 构建本地知识库系统的基础《二》
这段 Python 代码是一个完整的 知识库数据库操作模块,用于对本地知识库系统中的知识库进行增删改查(CRUD)操作。它基于 SQLAlchemy ORM 框架 和一个自定义的装饰器 with_session 实现数据库会话管理。 📘 一、整体功能概述 该模块…...
MySQL 8.0 事务全面讲解
以下是一个结合两次回答的 MySQL 8.0 事务全面讲解,涵盖了事务的核心概念、操作示例、失败回滚、隔离级别、事务性 DDL 和 XA 事务等内容,并修正了查看隔离级别的命令。 MySQL 8.0 事务全面讲解 一、事务的核心概念(ACID) 事务是…...
Python+ZeroMQ实战:智能车辆状态监控与模拟模式自动切换
目录 关键点 技术实现1 技术实现2 摘要: 本文将介绍如何利用Python和ZeroMQ消息队列构建一个智能车辆状态监控系统。系统能够根据时间策略自动切换驾驶模式(自动驾驶、人工驾驶、远程驾驶、主动安全),并通过实时消息推送更新车…...
MySQL:分区的基本使用
目录 一、什么是分区二、有什么作用三、分类四、创建分区五、删除分区 一、什么是分区 MySQL 分区(Partitioning)是一种将单张表的数据逻辑上拆分成多个物理部分的技术。这些物理部分(分区)可以独立存储、管理和优化,…...
