当前位置: 首页 > article >正文

Docker Registry Push 超时排查全记录:从网络栈到残留 veth 的真相

摘要在私有化部署 Docker Registry 时遇到宿主机 curl 容器映射端口超时的诡异问题。经历 iptables、rp_filter、bindv6only、抓包等深入排查后最终发现是 Docker 卸载残留的 veth 接口扰乱了内核包转发路径。本文完整记录排错过程与根因供同行参考。一、问题现象在宿主机192.168.0.146上使用docker run -d -p 5555:5000 registry:3启动官方 Registry 容器后发现容器内wget 127.0.0.1:5000/v2/正常返回200和{}。宿主机执行curl 127.0.0.1:5555/v2/超时Connection timed out。宿主机执行curl 172.17.0.2:5000/v2/同样超时。但宿主机ping 172.17.0.2却能通且延迟极低。二、环境信息OS: CentOS Stream 8 / 9Docker: 24.xRegistry 镜像registry:3启动命令docker run -d --name ags-registry -p 5555:5000 -v /data/...:/var/lib/registry registry:3三、第一阶段排查 iptables 与 Docker 代理检查端口监听ss -tlnp | grep 5555显示docker-proxy正在监听所有网络接口的 5555 端口状态正常。检查 NAT 规则iptables -t nat -L -v中发现DNAT规则将访问宿主机 5555 端口的数据包转发到172.17.0.2:5000看起来没有问题。验证 docker-proxy 是否工作用curl 127.0.0.1:5555和192.168.0.146:5555都超时说明流量进入了代理但未从容器返回。排查 filter 表FORWARD链默认ACCEPTDOCKER链中有明确允许到容器 5000 端口的规则未被拦截。初步结论流量成功送达容器但应用层未响应。四、第二阶段怀疑内核网络参数rp_filter 反向路径过滤rp_filter为 1可能导致容器回包被丢弃。临时关闭rp_filter后问题依旧排除此项。bridge-nf-call-iptables该参数为 1但关闭后依然超时且 ping 通 TCP 不通排除。conntrack 表连接跟踪表占用极低无table full日志排除。五、第三阶段深入应用层与 IPv6 陷阱确认容器内服务正常docker exec进容器用wget 127.0.0.1:5000/v2/成功证明 Registry 进程正常。跨容器测试docker run --rm --network bridge busybox wget http://172.17.0.2:5000/v2/同样超时这说明问题不是宿主机独有而是任何非容器本身的访问都失败。检查 Registry 监听地址日志中出现listening on [::]:5000表明 Registry 默认绑定到了 IPv6 通配符地址。虽然容器内net.ipv6.bindv6only0但实际测试发现来自桥接网络的 IPv4 流量虽然能完成 TCP 握手抓包可见但 HTTP 响应包永远不会发出。使用 Host 网络模式验证改用--network host并设置REGISTRY_HTTP_ADDR0.0.0.0:5555后curl 127.0.0.1:5555/v2/立刻成功。由此基本确认Bridge 网络下 IPv4 到 IPv6 监听套接字的映射存在缺陷导致应用层无声丢弃连接。六、转折点发现残留 veth 接口尽管 Host 模式解决了问题但我们注意到ip neigh show中仍有旧容器的 IP172.17.0.2和 MAC 地址02:42:ac:11:00:02。进一步检查/sys/class/net/docker0/brif/发现残留的 veth 接口vethfa82f9f且没有对应的容器进程。该残留 veth 曾在之前的 Docker 卸载/重装中未被清理其 MAC 地址恰好与新创建的 Registry 容器的 IP 相同。当新容器连接到 docker0 时内核 ARP 缓存可能将流量错误地导向这个僵尸 veth导致正常数据包被丢弃而 ICMP 响应由内核直接处理不受影响从而解释了“ping 通 TCP 不通”的现象。七、最终修复清理残留 veth 接口baship link del vethfa82f9f ip neigh flush dev docker0彻底重启 Docker推荐或重新创建容器bashsystemctl restart docker强制 Registry 监听 IPv4 地址重新创建容器时添加环境变量bashdocker run -d --name ags-registry \ -p 5555:5000 \ -e REGISTRY_HTTP_ADDR0.0.0.0:5000 \ registry:3验证bashcurl -v http://127.0.0.1:5555/v2/ # 200 OK docker push hub.ags.local:5555/myimage # 成功八、总结现象真正原因ping 通但 TCP 超时残留 veth 导致非 ICMP 流量被导向无效端点容器内访问正常容器内走 lo 接口不受 veth 干扰Host 网络下正常绕过了 docker0 桥接避免残留接口影响Registry 日志显式 IPv6双栈绑定在纯净网络下无问题但与残留 veth 共存时触发内核 bug经验教训卸载 Docker 时应使用yum remove并手动清理/var/lib/docker和/run/docker必要时重启。遇到类似“网络半通”故障时检查桥接接口下的 veth 残留往往比反复调整 iptables 更高效。容器化服务应显式绑定0.0.0.0而非依赖通配符避免 IPv6 兼容性踩坑

相关文章:

Docker Registry Push 超时排查全记录:从网络栈到残留 veth 的真相

摘要: 在私有化部署 Docker Registry 时,遇到宿主机 curl 容器映射端口超时的诡异问题。经历 iptables、rp_filter、bindv6only、抓包等深入排查后,最终发现是 Docker 卸载残留的 veth 接口扰乱了内核包转发路径。本文完整记录排错过程与根因…...

从停机问题到AI责任:技术不可判定性与法律归责的跨界思考

1. 项目概述:一个横跨技术与法律的硬核议题最近和几位做算法开发的朋友聊天,大家不约而同地提到了一个共同的困惑:我们写的代码、训练的模型,一旦“闯了祸”,责任到底算谁的?是写代码的工程师,是…...

CANN/ops-transformer FFA算子设计

1 计算过程 【免费下载链接】ops-transformer 本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-transformer 按照FusedFloydAttention正向计算流程实现,整体计算流程如下&#x…...

CANNBot技能:模型推理预取优化

【免费下载链接】cannbot-skills CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体,本仓库为其提供可复用的 Skills 模块。 项目地址: https://gitcode.com/cann/cannbot-skills name: model-infer-prefetch description: 基于 PyTorch 框架的昇腾 N…...

组态屏工程备份 / 恢复 / 加密 / 密码忘记

在工业自动化现场,组态屏作为人机交互的核心设备,承载着设备监控、参数设置、报警记录等关键功能。而组态工程文件,则是这块屏幕的“灵魂”——一旦工程丢失或损坏,重新编写不仅耗时数日,甚至可能因工艺参数遗忘而导致…...

可解释AI如何破解人机协同决策的信任难题?

1. 项目概述:当AI开始解释自己最近几年,我参与和观察了不少将人工智能(AI)引入关键决策流程的项目,从医疗诊断辅助到金融风控,再到工业运维。一个越来越强烈的感受是:当AI的预测或建议摆在我们面…...

CANN π₀.₅模型训练优化说明

π₀.₅ 模型训练昇腾迁移与性能优化说明 【免费下载链接】cann-recipes-embodied-intelligence 本项目针对具身智能业务中的典型模型、加速算法,提供基于CANN平台的优化样例 项目地址: https://gitcode.com/cann/cann-recipes-embodied-intelligence 背景介…...

LobeHub 这玩意儿,到底香在哪?

先说结论:LobeHub 是目前我在前端圈里看到的,最接近“智能体操作系统”的一个东西。不是吹,是真的好用到让我有点慌。事情是这样的前阵子我在搞一个自动化工单系统,本来打算自己撸一套 Agent 调度逻辑,结果写到第三天我…...

AI+SPU-Net:机器人辅助脊柱手术的自动切面规划技术详解

1. 项目概述与核心价值在骨科脊柱外科领域,椎板切除术是一项常规且至关重要的减压手术,用于治疗椎管狭窄、椎间盘突出等疾病。手术的核心在于精准、安全地切除椎板骨质,为受压的神经结构“松绑”。然而,传统手术高度依赖主刀医生的…...

CANN/ops-fft:FFT算子库

ops-fft 【免费下载链接】ops-fft ops-fft 是 CANN (Compute Architecture for Neural Networks)算子库中提供 FFT 类计算的基础算子库,采用模块化设计,支持灵活的算子开发和管理。 项目地址: https://gitcode.com/cann/ops-fft…...

CANN一维最近邻上采样算子

aclnnUpsampleNearest1dV2 【免费下载链接】ops-cv 本项目是CANN提供的图像处理、目标检测相关的算子库,实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-cv 📄 查看源码 产品支持情况 产品是否支持Ascend 950PR/Ascend 950…...

Figma中文界面终极指南:3分钟让英文设计工具秒变中文

Figma中文界面终极指南:3分钟让英文设计工具秒变中文 【免费下载链接】figmaCN 中文 Figma 插件,设计师人工翻译校验 项目地址: https://gitcode.com/gh_mirrors/fi/figmaCN 还在为Figma的英文界面而苦恼吗?FigmaCN是一款专为中文用户…...

CANN/asc-devkit贡献指南

贡献指南 【免费下载链接】asc-devkit 本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。 项目地址: https://gitcode.com/c…...

库存预测准确率大PK!实在Agent如何终结企业“库存积压”噩梦?

摘要:在2026年全球供应链进入“盈利竞赛”的理性成熟期,库存预测的精准度已成为制造与流通企业的生命线。面对IDC预测的300亿美元规模市场,企业不仅面临库存积压与资金占用的双重压力,更深陷系统围墙、信创适配难及传统自动化工具…...

对比自行维护与使用 Taotoken 聚合 API 的运维复杂度

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 对比自行维护与使用 Taotoken 聚合 API 的运维复杂度 在构建基于大模型的应用时,开发者通常面临一个选择:是…...

2026年隔热条十大品牌:谁是真正的研发王者?

随着建筑节能标准的不断提高,隔热条在门窗幕墙系统中的重要性日益凸显。作为门窗节能系统的核心部件,隔热条不仅直接影响建筑的节能效果,还关系到居住安全和企业的可持续发展。在这个竞争激烈的市场中,哪些品牌能够脱颖而出&#…...

大语言模型能力结构实证研究:参数量与智能的非线性关系

1. 项目概述:我们到底在研究什么?最近几年,大语言模型(LLM)的浪潮席卷了整个行业,从ChatGPT的横空出世到各类开源模型的百花齐放,我们似乎每天都在见证“奇迹”。但作为一名在一线摸爬滚打多年的…...

AI如何突破人文学科认知局限:从海量数据处理到量化分析实践

1. 项目概述:当AI遇见人文,一场认知边界的重塑“人工智能如何突破人文学科的认知局限并引领数字人文复兴”——这个标题听起来宏大,但内核其实非常具体。作为一名在数字人文领域摸爬滚打了十来年的从业者,我亲眼见证了从早期简单的…...

CANN/ops-cv 3D最近邻上采样算子

aclnnUpsampleNearest3d 【免费下载链接】ops-cv 本项目是CANN提供的图像处理、目标检测相关的算子库,实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-cv 📄 查看源码 产品支持情况 产品是否支持Ascend 950PR/Ascend 950DT…...

CANN元数据定义FrameworkType

FrameworkType 【免费下载链接】metadef Ascend Metadata Definition 项目地址: https://gitcode.com/cann/metadef 函数功能 设置原始模型的框架类型。 函数原型 [OpRegistrationData](https://link.gitcode.com/i/e39588e20f92bc787b393b3e218d186f) &Framewor…...

CANN版本发布管理8.5.0-beta.1

CANN 8.5.0-beta 1 【免费下载链接】release-management CANN版本发布管理仓库 项目地址: https://gitcode.com/cann/release-management 版本地址 CANN 8.5.0-beta 1 版本目录说明如下: ├── aarch64 # CPU为ARM类型 │ ├── ops …...

AI赋能学术研究:基于NLP的SDGs自动映射技术解析与实践

1. 项目概述:当学术研究遇见全球议程最近几年,无论是申请科研基金、撰写项目报告,还是发表学术论文,我身边越来越多的同行开始被问到一个问题:“你的这项研究,与联合国的可持续发展目标(SDGs&am…...

LangChain Tool + Agent 最小可运行示例解析

下面给出一个代码示例: 展示如何使用 LangChain 通义千问(Qwen),通过 ReAct Agent 安全地调用自定义工具完成数学计算任务。 示例代码取自《AI Agent智能体开发实践》第8章。 # -*- coding: utf-8 -*- """ Creat…...

【SITS2026独家前瞻】:AI技术大会同期活动5大不可错过的隐藏议程与入场暗号

更多请点击: https://intelliparadigm.com 第一章:SITS2026大会同期活动全景导览 SITS2026(Smart Infrastructure & Technology Summit 2026)同期活动覆盖技术实践、产业对接与开发者赋能三大维度,形成“主论坛12…...

【信号去噪】基于马氏距离和EDF统计(IEE-TSP)的基于小波的多元信号去噪方法研究附Matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长毕业设计辅导、数学建模、数据处理、程序设计科研仿真。🍎完整代码获取 定制创新 论文复现点击:Matlab科研工作室👇 关注我领取海量matlab电子书和数学建模资料 &#x1f3…...

第9章:从直播到录播——知识产品的矩阵化运营 /《程序员AI时代实现 直播知识付费实现月入100万的落地详细实战方案》

第9章:从直播到录播——知识产品的矩阵化运营 如果说到前面那些章节,我更像是把直播当成卖时间的主动收入事业来做的话,从这一章开始,我想给你看一个更加根本的跃迁逻辑。一场直播卖得好,你赚数字的绝对值是靠每一分钟…...

多智能体粒子群优化的ELM模型预测控制附Matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长毕业设计辅导、数学建模、数据处理、程序设计科研仿真。🍎完整代码获取 定制创新 论文复现点击:Matlab科研工作室👇 关注我领取海量matlab电子书和数学建模资料 &#x1f3…...

CANN PyPTO索引添加UB函数

pypto.index_add__ub 【免费下载链接】pypto PyPTO(发音: pai p-t-o):Parallel Tensor/Tile Operation编程范式。 项目地址: https://gitcode.com/cann/pypto 产品支持情况 产品是否支持Ascend 950PR/Ascend 950DT√Atlas A3 训练系列…...

联邦学习在物联网场景下的性能评估与基准测试实践

1. 项目概述:当联邦学习遇上物联网,我们如何量化其真实性能?如果你正在关注边缘智能或者分布式机器学习,那么“联邦学习”这个词对你来说一定不陌生。它被誉为解决数据孤岛和隐私保护问题的关键技术,尤其是在物联网这个…...

CANN/ops-math循环填充2D反向传播

aclnnCircularPad2dBackward 【免费下载链接】ops-math 本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-math 📄 查看源码 产品支持情况 产品是否支持Ascend 950PR/Ascend 950DT√…...