当前位置：首页 > article >正文

【CVPR26-Min Tan-杭电】基于多线索学习的伪标签进化融合与优化：用于无监督伪装检测

article 2026/3/17 2:28:40

文章EReCu: Pseudo-label Evolution Fusion and Refinement with Multi-Cue Learning for Unsupervised Camouflage Detection代码https://github.com/JSLiam94/EReCu单位杭州电子科技大学、浙江大学一、问题背景伪装目标检测的核心难点在于目标物体与周边环境高度相似纹理对比度低、边界交融紧密常规的显著性检测方法难以有效识别。而无监督伪装目标检测更是需要在无人工像素级标注的前提下完成检测现有方法主要分为两大范式且均存在明显瓶颈伪标签引导类方法早期依赖静态伪标签生成易引入背景噪声后续的师生网络改进方案又忽略了图像原生感知线索导致边界溢出、语义漂移检测结果不准确特征学习类方法通过注意力机制、环境先验等分离前景和背景特征但缺乏伪标签的显式监督容易造成目标边界模糊、精细纹理细节丢失。此外现有方法普遍将语义可靠性和纹理保真度分开优化形成了语义与感知之间的鸿沟进一步加剧了伪标签漂移和细节退化的问题难以在复杂伪装场景下实现精准检测。二、方法创新研究团队提出的EReCu框架基于DINO的师生网络架构核心创新是将多线索原生感知与伪标签进化融合、局部精修相结合让语义可靠性和纹理保真度通过相互反馈共同进化从根本上解决了现有方法的痛点。框架包含三大核心模块各模块协同作用、层层递进1. 多线索原生感知模块MNP作为整个框架的基础该模块提取图像的原生视觉先验信息融合LBP、DoG等低层纹理特征和冻结ResNet-18提取的中层语义特征构建多线索特征表示同时设计多线索质量度量指标量化前景-背景的可分离性为后续伪标签的进化和精修提供可靠的图像原生监督信号确保所有优化都贴合图像本身的固有特征。2. 伪标签进化融合模块PEF包含进化伪标签学习EPL和谱张量注意力融合STAF两个子模块EPL通过深度可分离卷积实现学生浅层特征与教师深层特征的交互结合Dice损失和MNP损失迭代优化伪标签实现语义去噪和伪标签的动态进化STAF则利用Tucker分解和截断SVD谱滤波融合学生网络多层注意力图在抑制噪声的同时保留语义和结构一致性生成稳定的全局伪标签。3. 局部伪标签精修模块LPR针对全局伪标签易丢失边界和纹理细节的问题利用DINO多头自注意力的空间多样性通过目标感知注意力选择TAS结合注意力熵和MNP感知线索筛选出聚焦目标的注意力头再通过局部伪标签生成LPG从高置信度区域生成精细的局部伪标签结合Dice损失和交叉熵损失优化全局预测结果恢复目标的精细纹理和边界保真度。三大模块形成闭环MNP为PEF和LPR提供原生线索指导PEF生成高质量全局伪标签LPR对全局伪标签进行局部细节精修最终实现结构保留的伪装目标检测。三、实验结果为验证EReCu框架的有效性研究团队开展了全面的实验验证实验设置和结果均表现出优异的性能1. 实验设置数据集训练集融合CAMO-Train1000张和COD10K-Train3040张无标注图像在CHAMELEON、CAMO、COD10K、NC4K四个主流COD基准数据集上进行测试评价指标采用结构度量、加权F值、E度量、平均绝对误差M四大经典指标实现细节以DINO-ViT-S/8为编码器采用AdamW优化器、余弦退火学习率在NVIDIA Tesla V100-SXM2 GPU上完成训练保证实验的可复现性。2. 核心结果定量性能EReCu在四个测试数据集的所有评价指标上均达到SOTA水平全面超越UCOD-DPL、SdalsNet等主流无监督伪装目标检测方法以及TokenCut、FOUND等经典无监督目标分割方法例如在CHAMELEON数据集上达0.7321、M低至0.0716边界和细节检测精度显著提升定性效果在复杂伪装场景下EReCu生成的分割掩码边界更锐利、结构细节更丰富能有效识别深度伪影下的伪装目标相比现有方法更贴合真实标注消融实验移除任一核心模块均会导致性能明显下降MNP与EPL的组合带来最显著的性能提升证明各模块的互补性和整体框架的合理性所有模块的协同集成是实现高性能的关键。四、优势与局限1. 核心优势创新的协同优化思路首次将多线索原生感知与伪标签的进化、精修深度结合实现语义和感知的共同进化填补了两者之间的鸿沟同时解决了伪标签漂移和细节退化两大核心问题高精度的检测效果相比现有方法EReCu在边界对齐、细节感知上表现更优能在复杂伪装场景下生成更准确、更精细的分割掩码泛化能力更强高效的计算与设计采用深度可分离卷积、低秩分解等轻量化操作在保证性能的同时降低计算成本各模块设计贴合伪装目标检测的任务特性针对性强良好的可复现性公开代码和详细的实验设置为后续无监督伪装目标检测的研究提供了可靠的基准。2. 现存局限对纹理特征的依赖性MNP模块依赖低层纹理特征提取在纹理极度模糊、目标与背景几乎无纹理差异的极端伪装场景下检测性能可能出现下降超参数的敏感性框架中部分阈值、可学习参数如注意力选择的阈值、局部伪标签生成的α需通过经验设定在不同类型的数据集上可能需要重新调优检测速度相比部分轻量级无监督检测方法EReCu因包含多层特征融合、迭代优化等步骤在检测推理速度上仍有提升空间暂难以满足实时检测的需求。五、一句话总结杭州电子科技大学与浙江大学团队提出的EReCu框架通过多线索原生感知、伪标签进化融合和局部精修三大模块的协同作用实现了无监督伪装目标检测中语义可靠性与纹理保真度的共同进化在多个基准数据集上达到SOTA性能有效提升了复杂场景下伪装目标的边界检测精度和细节感知能力为无监督伪装目标检测的研究提供了新的思路和基准。

【CVPR26-Min Tan-杭电】基于多线索学习的伪标签进化融合与优化：用于无监督伪装检测

相关文章：

【CVPR26-Min Tan-杭电】基于多线索学习的伪标签进化融合与优化：用于无监督伪装检测

Python战棋游戏开发：六边形地图A*寻路算法实战（附完整代码）

开源大模型实践：软萌拆拆屋LoRA融合多专家模型探索

DJI Windows SDK开发避坑指南：从注册到成功运行（VS2019实测）

Windows 上 openclaw onboard --install-daemon 命令的安装位置和启动配置

PyTorch钩子方法实战：如何用register_forward_hook提取中间层特征图（附代码避坑指南）

ChatGLM3-6B在医疗领域的创新应用：智能问诊与病历分析

AirLLM技术教程：低资源环境下的大模型部署解决方案

RTOS技术路线之争的办公室江湖

AI超清画质增强镜像：图片细节修复与降噪功能体验

Wan2.1问题解决指南：视频生成失败、质量不高怎么办？

美国FDA官网的这些宝藏文件，撰写综述类文章的优质参考资料

Alpamayo-R1-10B基础操作：Front/Left/Right三摄像头图像上传与格式规范

NEURAL MASK 版本管理与协作：使用Git进行代码和模型资产的版本控制

避开这3个坑！用nRF Connect调试BLE信标时90%人会犯的错误

2024年中国多属性建筑矢量数据（CMAB）｜3100万栋单体建筑｜含高度/功能/年份/质量｜Sci Data权威发布

实时口罩检测-通用GPU优化部署：FP16精度下吞吐量提升2.1倍实测

如何用Lima在macOS上构建高效Linux开发环境：从入门到精通

Lingyuxiu MXJ LoRA Python入门：从零开始的艺术生成

StructBERT中文情感模型部署教程：Kubernetes Helm Chart封装方案

AI在制造业落地全解析：3大核心场景+实操代码+企业案例

LaTeX新手必看：IEEEtran参考文献格式全解析（含期刊会议缩写查询）

基于Kubernetes弹性部署LumiPixel Canvas Quest：应对流量高峰的实战策略

广角拍照人像变形？3种主流校正算法对比与实战选择指南

Android面试指南：从基础到高级的知识体系构建

PDF书签目录一键生成神器PdgCntEditor保姆级教程（附下载链接）

Qwen2.5-32B-Instruct保姆级教程：Ubuntu20.04环境部署全流程

Qwen-Audio智能语音助手效果对比：与传统ASR系统差异

量化投资实战指南：3步打造风险平价模型实现稳健投资组合

SecGPT-14B镜像免配置教程：Supervisor守护+WebUI+API三端同步启动