当前位置: 首页 > article >正文

10、Docker容器故障排查

Docker 容器故障排查详细步骤一、基础检查流程1. 服务状态检查# 检查Docker服务运行状态 systemctl status docker service docker status # 适用于旧版本系统 # 检查Docker守护进程健康状态 docker info # 若正常会返回系统信息异常则显示错误 # 查看容器状态摘要 docker ps -a # 所有容器包括停止的 docker stats --no-stream # 容器资源使用情况 # 检查Docker日志 journalctl -u docker --no-pager -n 50 # 系统日志 tail -n 100 /var/log/docker.log # Docker日志文件2. 容器基础信息检查# 查看容器详细配置 docker inspect 容器ID/名称 # 查看容器日志 docker logs 容器ID/名称 # 基础日志 docker logs -f --tail 100 容器ID/名称 # 实时跟踪最新100行 docker logs --since 30m 容器ID/名称 # 查看最近30分钟日志 # 检查容器进程 docker top 容器ID/名称3. 网络连通性测试# 检查容器端口映射 docker port 容器ID/名称 # 测试容器内部网络 docker exec 容器ID/名称 ping -c 3 8.8.8.8 docker exec 容器ID/名称 curl -I www.baidu.com # 测试主机到容器的连接 telnet 容器IP 端口 nc -zv 容器IP 端口 # 检查网络模式 docker network inspect bridge # 检查默认桥接网络二、配置验证1. 配置文件检查# 检查Docker守护进程配置 cat /etc/docker/daemon.json docker info | grep -i config # 验证配置是否生效 # 检查容器启动命令 docker inspect --format {{.Config.Cmd}} 容器ID/名称 # 验证Dockerfile语法需在Dockerfile目录 docker build --no-cache --progressplain -t test:tmp . # 验证docker-compose配置 docker-compose config # 检查语法并显示配置2. 常见配置问题点检查容器资源限制内存限制是否合理--memory/--memory-swapCPU限制是否过度--cpus/--cpu-shares检查卷挂载宿主路径是否存在且有正确权限挂载模式读写/只读是否正确检查网络配置端口映射是否冲突网络模式与应用需求是否匹配环境变量配置敏感信息是否正确注入必要变量是否遗漏三、详细诊断方法1. 调试模式操作# 以交互模式启动容器用于调试启动问题 docker run -it --rm --entrypoint /bin/sh 镜像名 # 为运行中容器添加调试工具 docker exec -it 容器ID/名称 apt update apt install -y net-tools # Debian/Ubuntu docker exec -it 容器ID/名称 yum install -y net-tools # CentOS # 启用Docker守护进程调试模式需重启服务 echo {debug: true} /etc/docker/daemon.json systemctl restart docker2. 容器健康检查矩阵测试类型命令示例预期结果基础连接测试docker exec 容器 curl localhost:端口返回200状态码卷读写测试docker exec 容器 touch /挂载点/test rm -f /挂载点/test无错误输出环境变量验证docker exec 容器 envgrep 关键变量健康检查状态docker inspect --format {{.State.Health.Status}} 容器返回healthy重启策略验证docker inspect --format {{.HostConfig.RestartPolicy.Name}} 容器符合预期策略always/on-failure等镜像完整性检查docker image inspect --format {{.Id}} 镜像名与仓库镜像ID一致3. 常见错误代码分析错误代码/信息含义说明解决方案port is already allocated端口已被占用更换映射端口或停止占用端口的进程no space left on device磁盘空间不足清理无用镜像和容器docker system prune -apermission denied权限不足检查挂载目录权限或使用--user指定正确用户unauthorized: authentication required镜像仓库认证失败执行docker login重新认证container ID is not running容器未运行检查启动日志docker logs IDcontext deadline exceeded操作超时检查网络连接或增加超时时间export DOCKER_CLIENT_TIMEOUT120四、高级诊断工具1. 容器监控工具# 实时监控容器资源 ctop # 需单独安装的可视化工具 # 查看容器详细资源使用历史 docker stats --no-stream --format table {{.Name}}\t{{.CPUPerc}}\t{{.MemUsage}}\t{{.NetIO}}\t{{.BlockIO}} # 检查容器文件系统使用 docker system df # 整体存储使用 du -sh /var/lib/docker/volumes/ # 卷存储占用2. 网络诊断工具# 容器网络抓包 docker run --rm -v /var/run/docker.sock:/var/run/docker.sock nicolaka/netshoot tcpdump -i any port 80 # 查看容器网络命名空间 nsenter -t $(docker inspect -f {{.State.Pid}} 容器ID) -n netstat -tulnp # DNS解析测试 docker run --rm --net container:容器ID nicolaka/netshoot nslookup www.baidu.com3. 深入容器内部诊断# 查看容器文件系统变化 docker diff 容器ID/名称 # 导出容器文件系统用于分析 docker export 容器ID | tar -xf - -C /tmp/container-fs # 检查容器系统调用需容器PID pid$(docker inspect -f {{.State.Pid}} 容器ID) strace -p $pid -e tracenetwork # 跟踪网络系统调用五、常见问题解决方案1. 容器无法启动检查docker inspect --format {{.State.Status}} {{.State.Error}} 容器ID docker logs 容器ID可能原因启动命令错误依赖服务未就绪资源限制不足卷挂载失败解决# 尝试手动执行启动命令调试 docker run --rm -it --entrypoint /bin/sh 镜像名 -c 原启动命令 # 检查卷权限 chown -R 1000:1000 /宿主卷路径 # 根据容器内用户ID调整 # 临时去除资源限制测试 docker update --memory-remove 容器ID2. 容器网络不通检查# 检查DNS配置 docker exec 容器ID cat /etc/resolv.conf # 检查防火墙规则 iptables -L DOCKER-USER # 检查网络连通性链条 ping 宿主机IP → docker exec 容器 ping 网关IP → docker exec 容器 ping 8.8.8.8解决重启Docker网络systemctl restart docker重建网络docker network rm 网络名 docker network create 网络名检查并关闭SELinux/AppArmor限制3. 卷挂载问题检查# 验证卷存在性 docker volume inspect 卷名 # 检查挂载点权限 ls -ld /宿主挂载路径 docker exec 容器ID ls -ld /容器挂载点 # 检查挂载模式 docker inspect --format {{range .Mounts}}{{.Source}}:{{.Destination}} ({{.Mode}}){{end}} 容器ID解决修复权限chmod 777 /宿主挂载路径临时测试用使用命名卷替代绑定挂载docker volume create myvol检查挂载路径是否包含特殊字符或软链接4. 容器资源耗尽检查# 查看OOM事件 dmesg | grep -i out of memory # 检查容器资源限制 docker inspect --format {{.HostConfig.Memory}} {{.HostConfig.CpuShares}} 容器ID # 查看容器内存使用详情 docker stats --no-stream 容器ID解决调整资源限制docker update --memory 2g --cpus 1 容器ID优化应用内存使用配置自动扩缩容结合K8s等编排工具六、维护检查清单日常检查# 检查异常容器 docker ps -f statusexited -f exited1 # 检查镜像更新 docker images --filter danglingtrue # 检查系统资源对Docker的影响 free -h # 内存 df -h /var/lib/docker # 磁盘每周维护清理无用资源docker system prune -af --volumes # 谨慎使用会删除未使用的卷检查安全漏洞docker scan 镜像名 # 需要安装docker-scan插件备份重要数据卷docker run --rm -v 卷名:/source -v $(pwd):/backup alpine tar czvf /backup/卷名_backup.tar.gz -C /source .应急工具包# 导出容器配置 docker inspect 容器ID 容器名_config_backup.json # 保存容器状态创建新镜像 docker commit 容器ID 镜像名:emergency-backup # 快速恢复容器基于备份配置 docker run --name 新容器名 $(jq -r .HostConfig | --memory \(.Memory) --cpus \(.Cpus) -v \(.Mounts[] | .Source):\(.Destination):\(.Mode) 容器名_config_backup.json) 镜像名通过以上系统化的排查步骤可有效定位和解决Docker容器的常见问题。建议结合监控工具如PrometheusGrafana建立长期监控对容器健康状态、资源使用和响应时间进行持续跟踪。

相关文章:

10、Docker容器故障排查

Docker 容器故障排查详细步骤 一、基础检查流程 1. 服务状态检查 # 检查Docker服务运行状态 systemctl status docker service docker status # 适用于旧版本系统# 检查Docker守护进程健康状态 docker info # 若正常会返回系统信息,异常则显示错误# 查看容器状态摘…...

EF Core 10向量扩展生产就绪 checklist(含A/B测试分流、向量维度漂移监控、fallback降级开关)

第一章:EF Core 10向量扩展生产就绪全景概览EF Core 10 向量扩展(Vector Extensions)并非官方内置功能,而是由社区驱动、经微软认可的高性能向量计算增强方案,专为 AI 原生应用与嵌入式相似性搜索场景设计。它深度集成…...

智慧校园平台中免费技术实现与应用分析

✅作者简介:合肥自友科技 📌核心产品:智慧校园平台(包括教工管理、学工管理、教务管理、考务管理、后勤管理、德育管理、资产管理、公寓管理、实习管理、就业管理、离校管理、科研平台、档案管理、学生平台等26个子平台) 。公司所有人员均有多…...

8、Docker镜像瘦身

Docker镜像瘦身 一、 常见docker镜像瘦身方法 在 Docker 镜像瘦身方面,有多种工具和技术可以帮助你显著减小镜像体积,提升构建和部署效率。以下是常用的工具和方法: 1. 基础优化方法 ① 多阶段构建(Multi-stage Builds&#xf…...

从导航软件到推荐系统:闵可夫斯基距离(Minkowski Distance)中的参数p,到底该怎么选?

从导航软件到推荐系统:闵可夫斯基距离中的参数p选择实战指南 想象一下,当你使用导航软件规划路线时,系统会提供多种路径选择——有时是蜿蜒曲折的小路,有时是笔直的高速公路。这背后隐藏着一个数学秘密:不同的路径计算…...

CSS如何利用Sass定义全局阴影方案_通过变量实现统一CSS风格

用语义化Sass变量(如$shadow-sm)统一管理box-shadow值是最轻量可持续的方案,按视觉层级而非像素分档,配合map实现多态扩展,并可生成CSS变量兼顾动态主题与编译期逻辑。如何用Sass变量统一管理box-shadow值直接结论&…...

用Python实现切比雪夫距离:从国际象棋到KNN算法的实战指南

用Python实现切比雪夫距离:从国际象棋到KNN算法的实战指南 想象一下国际象棋棋盘上的国王,它每一步可以朝任意方向移动一格——横着走、竖着走,甚至斜着走。这种看似简单的移动规则,背后隐藏着一个强大的数学概念:切比…...

用STM32CubeMX和HAL库驱动RC522 NFC模块,从零实现一个简易门禁(附完整代码)

基于STM32CubeMX与HAL库的RC522门禁系统开发实战 在智能硬件开发领域,NFC技术因其非接触式交互特性,已成为门禁系统的首选方案。本文将完整呈现如何利用STM32CubeMX图形化工具和HAL库,从零构建一个稳定可靠的RC522门禁系统。不同于传统寄存器…...

Vitis 2020.1编译MicroBlaze程序报错?别急着找CPU,先看看你的BRAM够不够用

Vitis 2020.1编译MicroBlaze程序报错?别急着找CPU,先看看你的BRAM够不够用 最近在Xilinx Vitis 2020.1环境下为MicroBlaze软核开发C程序时,遇到了一个看似简单却让人抓狂的问题——点击运行按钮后,系统弹窗提示"找不到microb…...

Java 25虚拟线程性能断崖式下跌事件复盘(附JFR火焰图+Arthas实时诊断脚本+可审计的线程生命周期规范)

第一章:Java 25虚拟线程性能断崖式下跌事件复盘(附JFR火焰图Arthas实时诊断脚本可审计的线程生命周期规范)某金融核心交易系统在升级至 JDK 25 EA build 2024-07-15 后,突发 P99 响应延迟从 8ms 暴增至 1.2s,TPS 下跌 …...

Linux RT 调度器的入队与出队:rt_enqueue_task/rt_dequeue_task

前言在工业自动化、自动驾驶、机器人控制、5G 基站等强实时性业务场景中,Linux 的SCHED_FIFO/SCHED_RR实时调度策略是保障任务确定性执行的核心。RT 调度器区别于 CFS 完全公平调度器,严格按照任务优先级抢占执行,高优先级任务一旦就绪&#…...

Linux RT 调度器的优先级数组:struct rt_prio_array 的实现

前言在工业控制、自动驾驶、航空航天、5G 基站等强实时性场景中,Linux 的 PREEMPT_RT 补丁与原生实时调度类(SCHED_FIFO/SCHED_RR)是保障系统确定性的核心基石。与 CFS 完全公平调度器基于红黑树的时间片分配不同,实时调度器的核心…...

告别玄学调试:用Wireshark抓包实战解析PCIe链路训练与有序集(TS1/TS2/EIOS全解)

从信号到问题:Wireshark抓包实战解码PCIe链路训练全流程 当一块全新的PCIe显卡无法被系统识别,或是企业级NVMe存储阵列频繁出现链路降速时,硬件工程师的调试台上总少不了一台运行Wireshark的笔记本和几个神秘的TS序列。这些看似简单的有序集&…...

告别迷茫!手把手教你用CANoe 15.0从零搭建第一个仿真工程(附DBC文件创建)

告别迷茫!手把手教你用CANoe 15.0从零搭建第一个仿真工程(附DBC文件创建) 第一次打开CANoe软件时,面对密密麻麻的菜单栏和复杂的配置选项,很多初学者都会感到无从下手。本文将带你一步步完成从工程创建到DBC文件配置的…...

告别sc.exe!用NSSM把任意exe变成Windows服务(附Frpc实战配置)

告别sc.exe!用NSSM把任意exe变成Windows服务(附Frpc实战配置) 在Windows服务器管理中,将应用程序转化为系统服务一直是运维人员的刚需。传统sc.exe命令虽然功能完整,但其晦涩的语法和有限的配置选项常让人望而生畏。当…...

DIY智能家居控制面板:用ESP8266和TM1629A打造低成本数码管时钟/温湿度显示器

DIY智能家居控制面板:用ESP8266和TM1629A打造低成本数码管时钟/温湿度显示器 周末在家捣鼓电子元件时,突然想到能不能用闲置的数码管做个既实用又酷炫的桌面小工具。于是就有了这个项目——一个不到百元成本的智能显示面板,既能精准报时又能监…...

LVGL Spinner控件调参避坑指南:从卡顿到丝滑,我只改了这两个参数

LVGL Spinner控件性能调优实战:从参数解析到流畅动画的终极方案 在嵌入式GUI开发中,加载动画的流畅度往往直接关系到用户体验的第一印象。最近在开发智能家居控制面板时,我发现一个有趣的现象:同样的LVGL Spinner控件,…...

异步电路后端实现:从CDC约束到SignOff的实战解析

1. 异步电路后端实现的核心挑战 在复杂SoC设计中,异步时钟域交叉(CDC)问题就像城市间的交通管制——不同节奏的时钟域如同不同时区的城市,数据在这些区域间传输时,稍有不慎就会引发"交通事故"。作为后端工程…...

如何快速解决苹果设备Windows连接问题:一键驱动安装终极指南

如何快速解决苹果设备Windows连接问题:一键驱动安装终极指南 【免费下载链接】Apple-Mobile-Drivers-Installer Powershell script to easily install Apple USB and Mobile Device Ethernet (USB Tethering) drivers on Windows! 项目地址: https://gitcode.com/…...

ESP32 + micro-ROS实战:手把手教你用Action Server做个智能小车遥控器

ESP32 micro-ROS实战:手把手教你用Action Server做个智能小车遥控器 在机器人开发领域,实时控制与反馈一直是个技术难点。想象一下,当你需要远程控制一台智能小车完成复杂动作时,简单的指令发送往往不够——你需要知道小车是否成…...

STM32+FreeModbus实战:用AHT20传感器搭建低成本温湿度监测从机(附完整代码)

STM32FreeModbus实战:用AHT20传感器搭建低成本温湿度监测从机(附完整代码) 在工业物联网和智能家居领域,温湿度监测是最基础也最普遍的需求之一。如何用最低的成本构建一个稳定可靠的监测节点?本文将带你从零开始&…...

强化学习基础(RL)笔记

pagehelper整合 引入依赖com.github.pagehelperpagehelper-spring-boot-starter2.1.0compile编写代码 GetMapping("/list/{pageNo}") public PageInfo findAll(PathVariable int pageNo) {// 设置当前页码和每页显示的条数PageHelper.startPage(pageNo, 10);// 查询数…...

Linux DTS配置避坑指南:以GC8034/OV系列Camera的I2C地址和引脚复用为例

Linux设备树配置实战:从GC8034/OV系列Camera的I2C地址陷阱到引脚复用优化 当你在凌晨三点的实验室里盯着示波器上那条毫无波动的I2C信号线时,是否曾怀疑过人生?作为嵌入式Linux开发者,我们或多或少都经历过这种绝望——特别是当面…...

从“国王-男人+女人=女王”到推荐系统:Word2Vec的Skip-gram与CBOW模型,到底该怎么选?

从词向量到业务落地:Skip-gram与CBOW模型工程选型指南 当我们在电商平台搜索"机械键盘"时,推荐系统会自动提示"游戏鼠标";当我们在音乐APP收听周杰伦的歌曲时,系统会推荐类似风格的歌手——这些智能推荐背后&…...

NRF52840 USB CDC例程里那个1Hz定时器,到底该怎么用才不踩坑?

NRF52840 USB CDC例程中1Hz定时器的深度优化指南 从32768到精准定时:理解低频时钟的奥秘 第一次接触NRF52840的开发者往往会对例程中那个神秘的32768数值感到困惑。这个数字并非随意选取,而是与芯片内部的低频时钟源(LFCLK)直接相关。NRF52840默认使用32…...

从GCC切换到Clang:在Qt 5.12.9项目中体验更快的代码分析与静态检查

从GCC切换到Clang:在Qt 5.12.9项目中体验更快的代码分析与静态检查 当你的Qt项目逐渐膨胀到数万行代码时,是否经历过这样的场景:修改一个头文件后,IDE的代码补全需要等待5秒才能响应;或者明明存在潜在的类型转换风险&a…...

Qwen2.5-0.5B-Instruct环保监测:野外设备数据解析AI部署

Qwen2.5-0.5B-Instruct环保监测:野外设备数据解析AI部署 想象一下这个场景:你是一名环保工程师,负责监测一片偏远湿地的水质。你的设备每隔一小时就会通过卫星链路传回一串数据,里面包含了水温、pH值、溶解氧、浊度等十几个参数。…...

从‘小白人转圈’到丝滑移动:详解UE角色蓝图里4种方向向量的正确用法

从‘小白人转圈’到丝滑移动:详解UE角色蓝图里4种方向向量的正确用法 在虚幻引擎的角色开发中,方向向量的选择往往决定了角色行为的精准度与自然度。许多开发者都遇到过这样的场景:明明按照教程连接了移动输入节点,角色却开始原地…...

Xamarin跨平台开发实战:为仓储盘点APP集成东大PDA扫码模块

Xamarin跨平台开发实战:为仓储盘点APP集成东大PDA扫码模块 在仓储管理和物流盘点场景中,快速准确的条码扫描是提升工作效率的关键。传统手机摄像头扫码方案在工业级场景下往往力不从心——扫描速度慢、对焦困难、弱光环境表现差等问题频出。而专为工业环…...

支付宝沙箱验签踩坑记:Hutool JSONObject格式化参数设置不当引发的invalid-signature

支付宝沙箱验签失败深度解析:Hutool JSON格式化参数引发的隐形陷阱 当你在Java项目中集成支付宝支付功能时,是否遇到过这样的场景:本地测试一切正常,但一旦接入沙箱环境就频繁报错"invalid-signature"?这个问…...