当前位置: 首页 > article >正文

基于SAM的交叉提示与自适应采样一致性用于半监督医学图像分割/文献速递-大模型与图像分割在医疗影像中应用

2026.3.16本研究提出了CPAC-SAM一个基于SAM的交叉提示框架通过原型引导的网格采样和提示一致性正则化有效利用未标注数据进行SAM微调显著提升了半监督医学图像分割的性能尤其在标注数据极度稀缺时表现优异。Title题目01SAM-driven cross prompting with adaptive sampling consistency for semi-supervised medical image segmentation基于SAM的交叉提示与自适应采样一致性用于半监督医学图像分割文献速递介绍02分割是医学图像诊断和治疗规划的关键步骤。深度学习方法在分割任务中表现出色但需要大量标注数据这在医学领域成本高昂。半监督学习SSL通过利用少量标注数据和大量未标注数据来解决这一挑战。SSL成功的关键在于两点从有限标注数据中快速学习通用判别信息以及有效利用未标注数据进行优化。现有SSL方法主要关注后者而忽略了前者。本文作者关注预训练在海量自然图像上的Segment Anything Model (SAM)它具有在少量标注数据下快速适应新任务的潜力。之前的SAM医学图像分割方法多为全监督或将SAM作为独立模块未能充分利用未标注数据。本文旨在将SAM无缝集成到SSL框架中利用其提示机制开发从未标注数据中学习的有效策略提出了CPAC-SAM框架包含SAM驱动的交叉提示、原型引导网格采样和提示一致性正则化以实现SAM在半监督训练中的持续优化和更高精度。Aastract摘要02半监督学习SSL在医学图像分割领域取得了显著进展。为实现有效的SSL模型需要能够高效地从有限标注数据中学习并有效利用丰富的未标注数据中的知识。视觉基础模型如Segment Anything Model, SAM的最新发展已显示出卓越的适应性和更高的样本效率。为将基础模型无缝整合到SSL中我们提出了CPAC-SAM一个基于SAM的交叉提示框架结合自适应采样和提示一致性用于半监督医学图像分割。我们的方法利用SAM独特的提示设计在一个双分支框架内创新性地采用交叉提示策略自动在两个解码器分支间生成提示和监督从而有效利用少量标注数据和大量未标注数据进行学习。为确保未标注数据提示的质量并提供有意义的监督我们提出了一种创新的原型引导网格采样策略具有自适应间隔以同时提高提示选择区域的可靠性并确保足够的提示密度和完整的 T目标覆盖。我们进一步设计了一种新颖的提示一致性正则化来降低SAM对提示的敏感性并增强不同提示下的输出不变性。我们在五个医学图像分割任务包括2D和3D场景上验证了该方法。在不同标注数据比例和模态下的广泛实验表明我们提出的方法优于最先进的SSL方法例如在乳腺癌和左心房分割任务上Dice系数分别提高了4.1%和3.8%。我们的代码已开源。Method方法03本文提出了CPAC-SAM一个基于SAM驱动的交叉提示框架结合自适应采样和提示一致性用于半监督医学图像分割。该方法在SSL管道中直接微调SAM以促进从有限标注数据中快速学习。基于SAM的可提示特性开发了一个交叉提示双分支框架来充分利用未标注数据。具体来说首先利用一个分支的无提示输出通过原型引导网格采样策略为另一个分支生成提示。然后第二个分支生成的更可靠的提示输出用于指导第一个分支的学习将SAM的提示机制作为一种自提升的细化步骤。此外为解决SAM对不同提示敏感性可能带来的负面影响进一步提出了提示一致性正则化PCR以增强在各种提示下的输出不变性。网络设计采用了共享图像编码器和提示编码器以及两个结构相同但权重初始不同的掩膜解码器以鼓励输出多样性。Discussion讨论04本研究强调了SSL方法成功的两个关键从有限标注数据中快速学习判别信息和有效利用未标注数据进行优化。现有SAM基SSL方法多将SAM作为独立组件未充分利用未标注数据潜力。本文通过将SAM无缝整合到SSL框架中提出了一个新颖的交叉提示模块利用SAM的可提示特性有效利用大量未标注数据。实验证明带有适当提示的输出比无显式提示的输出更准确。为解决未标注数据伪标签质量问题引入了原型引导网格采样策略通过双重检查机制选择更可靠的候选区域并根据目标面积自适应采样网格点提示。针对SAM对不同提示的敏感性提出了提示一致性正则化技术增强了不同提示下输出的一致性。该方法通用性强可扩展到其他医学特定基础模型或视觉基础模型。未来工作将探索更鲁棒的原型引导策略、更强的L类内异质性以及更先进的原型提取策略如增加每类原型数量。还将通过记忆库增强多样性和鲁棒性并采用强化学习自动优化超参数以实现端到端SSL医学图像分割。此外计划尝试更广泛的数据增强方法和更先进的微调策略以进一步提升性能。Conclusion结论05本文提出了一种交叉提示框架集成了原型引导网格采样和提示一致性正则化旨在将SAM无缝应用于半监督医学图像分割。该方法通过有效利用大量未标注数据在三个数据集上展现出卓越的性能尤其在标注数据极度稀缺时表现突出。本方法具有通用性易于扩展到医学特定基础模型及其他视觉基础模型。未来工作将侧重于研究更鲁棒的原型引导策略和更强的数据增强方法以进一步提升性能。Figure图06图1. 各种基于SAM的SSL医学图像分割方法的总体比较。第一类方法 (a) 将SAM作为静态独立组件用于为现成的半监督框架生成未标注图像的伪标签而第二类方法 (b) 在SSL场景中利用标注数据微调SAM以提高输出质量。相比之下我们提出的方法 (c) 通过配备了我们提出的交叉提示、自适应采样和提示一致性的双分支SAM架构无缝集成到SSL框架中并利用大量未标注数据对SAM进行进一步优化。图2. 我们提出的方法的概述。采用原型引导的自适应间隔网格采样策略的交叉提示损失 Lcrossu 和提示一致性正则化损失 Lcu 在未标注数据上对经过改进的双分支SAM进行微调同时在标注数据上使用监督损失 Lsl。Lcrossu 应用于一个分支使用原型引导网格采样策略生成的带提示输出与另一个分支的无提示输出之间。Lcu 减轻了SAM对不同提示的敏感性。Lsl 利用标注来监督标注数据的带提示和无提示输出。在此框架中图像编码器使用LoRA进行微调而提示编码器和掩膜解码器则进行完全微调。图3. 在BUSI数据集第1-2行、ISIC数据集第3-4行和ACDC数据集第5-6行上分别使用10、5和1个标注数据进行分割的结果。图4. 未标注图像的视觉示例说明在ACDC数据集上使用一个标注患者数据进行训练早期仅200次迭代时我们提出的原型引导网格采样策略的流程。第一行和第二行分别显示了我们双分支架构的第一和第二分支的结果除了第一列。精度定义为正确预测的像素数与预测为给定类别的总像素数之比。图5. (a) 训练过程中原始输出与原型引导交集之间的平均精度比较。(b) 不使用和使用原型引导交集进行网格采样的DSC结果。图6. 在ACDC数据集上使用一个标注患者的设置下不同超参数的DSC性能。(a) 交叉提示模块系数 λ1 的DSC性能以及 (b) PCR系数 λ2 的DSC性能。

相关文章:

基于SAM的交叉提示与自适应采样一致性用于半监督医学图像分割/文献速递-大模型与图像分割在医疗影像中应用

2026.3.16本研究提出了CPAC-SAM,一个基于SAM的交叉提示框架,通过原型引导的网格采样和提示一致性正则化,有效利用未标注数据进行SAM微调,显著提升了半监督医学图像分割的性能,尤其在标注数据极度稀缺时表现优异。Title…...

WebSocket核心技术全解析

Websocket 的核心概念 WebSocket 是一种在单个 TCP 连接上进行全双工通信的协议。与 HTTP 不同,WebSocket 允许服务器主动向客户端推送数据,避免了传统的轮询机制。它通过一次握手建立持久连接,显著降低了延迟和带宽消耗。 WebSocket 协议基于…...

Python一键生成家长会PPT相册

使用Python快速批量制作16:9家长会PPT相册 在家长会或学校活动中,经常需要将学生的照片整理成PPT相册展示。手动处理大量照片效率低下,Python的python-pptx库可以自动化完成这一任务,支持横版和竖版照片混排,并自动添加文件名标题…...

杭州柏来科技有限公司:7kW-2400kW 全功率充电桩源头厂家,打造全场景智慧充电解决方

在新能源充电基础设施向大功率化、智能化、场景化深度发展的当下,选择一家兼具核心技术自研、全场景产品布局、规模化产能供应的充电桩源头厂家,是物业、城投、能源企业、物流园区等合作方落地充电项目的核心关键。杭州柏来科技有限公司作为国内领先的分…...

MySQL【内置函数】

一、日期函数 1.1 基础获取时间 / 日期 -- 获取当前日期 select current_date(); -- 结果示例:2017-11-19 -- 获取当前时间 select current_time(); -- 结果示例:13:51:21 -- 获取当前时间戳(推荐now()) select current_timestam…...

别被 30 万 Star 冲昏头脑:实测信创版 OpenClaw,谁才是企业 LLM 落地的“真命天子”?

摘要 2026 年 3 月,开源智能体项目 OpenClaw(大龙虾)凭借 v2026.3.12 版本的“日更级”迭代和 30 万 GitHub Star 彻底破圈。然而,在信创国产化浪潮下,这款极客圈的“神作”能否真正啃下政企数字化转型的硬骨头&#x…...

2026护眼大路灯哪个牌子好用又便宜?护眼大路灯推荐排行榜前十名

最近护眼大路灯被越来越多人熟知,有不少宝子们都会留言问:2026护眼大路灯哪个牌子好用又便宜?作为一名家电测评博主,我也会经常接触护眼大路灯。护眼大路灯通过上下发光同时模拟自然光,能够呈现出宽广舒适且如何照明的…...

GEO,AI界的“大冤种”

技术的迭代,AI已经不单纯是内容的创作者,它在演变为经济活动的独立参与者。在自主代理技术的加持夏,这个看似完美的自动化商业闭环中,却出现了极具讽刺的一幕,聊天机器人自己投放广告,流量产生了点击发生了…...

水文模型研究范式:从大规模诊断到多范式融合

# 一、研究思路与内容概括## 研究思路本研究遵循"**从质疑常规→系统性实验→提供普适性工具**"的完整闭环:**1. 提出根本性质疑**传统"唯径流论"的模型评估方法是否可靠?隐含假设"只要能模拟好径流,模型内部 ET 过…...

融合 生成式AI × 多模态感知 × 数字孪生城市 × 智能决策系统重构城市治理与产业智能化模式

融合 生成式AI 多模态感知 数字孪生城市 智能决策系统 重构城市治理与产业智能化模式一、数字时代的空间智能基础设施随着人工智能、大数据与城市数字化建设不断推进,城市管理系统正从传统的信息化阶段进入智能化阶段。然而,目前绝大多数城市系统仍停…...

算法备案安全自评估报告模版分享

算法备案安全自评估报告是算法备案的核心技术合规文件,需完整覆盖算法全链路、风险识别、防控措施、合规承诺四大核心模块,做到技术清晰、风险真实、措施可落地、证据可追溯。 一、算法安全自评估报告核心内容 1. 算法基本信息 算法概况:名称…...

【IT】技术人如何系统学习AI大模型应用开发?非常详细收藏我这一篇就够了

从理论认知到全栈落地的完整指南 一、认知突破:理解大模型的技术本质(1-2周) 1.1 基础理论筑基 必学内容 大模型演进脉络:从Transformer到GPT-4的技术跃迁核心机制解析:注意力机制、位置编码、自监督学习关键能力边界…...

《国内开发者必看!Claude API Key获取及使用全攻略》

一、Claude API核心价值 Claude API 是 Anthropic 公司为开发者提供的人工智能接口服务,基于 Claude 大模型(如 Claude 3 Opus、Sonnet 等)构建,支持文本生成、代码处理、逻辑推理等多元场景。对于开发者而言,它不仅是…...

如何删除 iPhone 上的多个联系人?

如果您有数十个或几个联系人并希望快速删除它们,那么批量删除就是最佳选择。这将节省您的时间,并让您的联系人列表干净整洁,以方便新收到的联系人。在 iPhone 上删除多个联系人并不像听起来那么容易。然而,一个问题仍然萦绕在你的…...

直击痛点,校招怎么留住人才?

每年秋招、春招结束后,HR 部门的工作并没有真正画上句号。很多企业花了大量精力从高校中筛选出优秀的应届生,发出 Offer、签订三方协议,满心期待新鲜血液的注入——然而现实却一再给出沉重打击:Offer 被毁约、入职后三个月离职、试…...

C++类入门:从学生类到立方体类的实践

在C中,类(class)是面向对象编程的核心,它允许我们将数据(属性)和操作(方法)封装在一起。本文将通过多个代码示例,逐步讲解C类的基本概念、权限控制、封装特性以及成员函数…...

C语言的由来、发展、应用及特点全介绍,快来学习

关于C语言的介绍 C语言是基于一种被称作B语言的基础之上,克服了因B语言依赖机器且不存在数据类型等方面局限性而开发的语言。以下包含关于C语言的由来,关于C语言的发展,关于C语言的应用,关于C语言的特点等方面的知识,欢…...

28天每天2小时速通蓝桥杯国赛(1/28)

今天学习了滤波,串口,ds1302,数码管,按键,ne555,内存管理,并学习了keil中的基本调试方法第一周按照计划学习考点和理解模板,明天应该就差不多可以把所有考点资料学完,然后…...

对抗Facebook审核机制:如何钻系统空子

大家好!我是天工开户。刚开始跑的时候,我的素材总是被禁,搞得人又烦又浪费时间。我试了好多规避审核的方法,最后就固定下来两种:一个是商品目录法,另一个是语言切换法(通过改语言上传&#xff0…...

公司终于下手了:去 Qt 化第一刀,先砍 Modbus

这两年,很多公司嘴上还没喊“彻底放弃 Qt”, 但动作已经很诚实了。 新项目不想再上 Qt。 老项目能不扩就不扩。 只要一提新增功能,很多领导第一反应已经变成: 这次能不能别再继续绑 Qt 了? 说白了,Qt 现在…...

奇兵到家闪耀东莞名家具展:攻克“最后一公里”,别让售后熄灭品牌的光

三月的东莞厚街,春意盎然,人流如织。第55届国际名家具(东莞)展览会正如火如荼进行中,“聚光”之下,是东莞家具从“制造”向“品牌”跃升的雄心。但有一个尴尬的现实,许多东莞家具老板心知肚明&a…...

VHM:多功能且诚实的遥感视觉语言模型

图解VHM:多功能且诚实的遥感视觉语言模型 开篇导读 在遥感图像分析领域,一个令人兴奋的突破正在发生:视觉语言模型(VLMs)正在学习"看懂"卫星图像。但问题也随之而来——现有的模型要么"看"得不够全…...

mysql转postgres 字段定义备忘

create or replace function bool_to_int(boolean) returns int2 as $$ select CAST($1::int as int2); $$ language sql strict; create cast (bool as int2) with function bool_to_int(boolean) as implicit;...

字符串!!!!

1.在字符串中赋整数值 一定要注意是赋字符还是数字 &#xff01;&#xff01;数字也要加单引号变成字符2.很容易看错 tolower的头文件是#include<cctype>3.今天有好几次 把小写l看成数字1 以及大小写看错 这是字符串里面一出现就要避雷的&#xff01;&#xff01;&#x…...

GD60920你一定很少听说,但它可能就在你身边:智能照明应用解决方案分享(全文干货)

GD60920红外传感器 照明场景人体感应应用解决方案 精准感知 智能照明 一、项目背景 当前照明智能化已成为家居、工业、商业领域的主流趋势&#xff0c;人体感应照明作为节能化、便捷化的核心方案&#xff0c;可有效解决传统照明长亮耗电、手动控制繁琐等问题。 但传统红外…...

HTB - VariaType

10.129.8.159nmap扫描 sudo nmap --top-ports 10000 10.129.8.159 --min-rate1000 -oA ips_quick_TCP_nmapscan && sudo nmap --top-ports 10000 10.129.8.159 --min-rate1000 -sU -oA ips_quick_UDP_nmapscan && nmap -p- 10.129.8.159 -oA ips_full_TCP_nmap…...

Nginx 安全防护与 HTTPS 部署实战全解析

在互联网技术高速发展的当下&#xff0c;Web 服务的安全性和可靠性成为企业与开发者的核心关注重点。Nginx 作为高性能 Web 服务器和反向代理工具&#xff0c;凭借轻量级、高并发处理能力和灵活模块化设计&#xff0c;占据全球近三分之一的 Web 服务器市场份额。但随着 DDoS、S…...

10分钟搞定SCI插图的秘密武器

对于每一位奋斗在一线的科研人员来说&#xff0c;做实验、跑数据或许是家常便饭&#xff0c;但每当论文撰写进入尾声&#xff0c;明明有着惊艳的实验数据和扎实的创新观点&#xff0c;却因为一张“惨不忍睹”的配图&#xff0c;让整篇论文的档次大打折扣。这恐怕是许多科研人心…...

AI智能应用开发(Java)起点-终点 -1、java的前世今生andJava环境配置、jdk下载,以及Idea下载和基本应用

一、JAVA的诞生与成长 起源&#xff1a;Green Team与Java的诞生 Java的起源可以追溯到1990年代&#xff0c;当时Sun Microsystems成立了一个名为Green Team的特别小组&#xff0c;旨在开发一种新型软件以驱动消费电子设备。这个项目的核心成员包括后来被称为“Java之父”的Ja…...

从后台管理到 IoT 远程控表,这个 Spring Boot 3 开源项目把能耗管理链路做完整了

最近看了不少 Java 开源项目&#xff0c;有一个很明显的感受&#xff1a;很多项目页面做得不少&#xff0c;接口也挺全&#xff0c;但真往下看&#xff0c;要么偏后台 CRUD&#xff0c;要么只覆盖某个局 部能力&#xff0c;很难看到一条完整业务链路。 ems4j 给我的感觉不太一样…...