FSDiffReg:心脏图像的特征和分数扩散引导无监督形变图像配准
论文标题:
FSDiffReg: Feature-wise and Score-wise Diffusion-guided Unsupervised Deformable Image Registration for Cardiac Images
翻译:
FSDiffReg:心脏图像的特征和分数扩散引导无监督形变图像配准
摘要
无监督可变形图像配准是医学成像领域的一项具有挑战性的任务。在一系列基于深度学习的解决方案中,在保持变形拓扑的同时获得高质量的变形场仍然是一项艰巨的任务。
同时,扩散模型的潜在特征空间显示出潜在的变形语义建模。为了充分利用扩散模型指导配准任务的能力,我们提出了两个模块:
- 特征扩散引导模块(FDG)
- 分数扩散引导模块(SDG)
FDG使用扩散模型的多尺度语义特征来指导变形场的生成。
SDG使用扩散分数来指导优化过程,以在几乎没有任何额外计算的情况下保留变形拓扑。
FDG引入了一种直接特征扩散制导技术,利用交叉注意将扩散模型的中间特征集成到配准网络解码器的隐藏层中,从而产生变形场。此外,我们将特征引导嵌入到配准网络的多个层中,并在多个尺度上产生特征级变形场。最后,在获得多尺度形变场后,对其进行上采样和平均,生成全分辨率形变场进行配准
SDG通过基于扩散分数重新权衡基于相似性的无监督注册损失,为变形拓扑保存引入了明确的分数扩散指导。通过这种重称重方案,在优化过程中给予直接关注,以确保变形拓扑的保留。
Introduce
可变形图像配准是准确估计运动和固定图像对的相同解剖结构之间的非刚性体素对应关系(如变形场)的过程。快速、准确、逼真的图像配准算法对于提高临床实践的效率和准确性至关重要。通过观察病变等动态变化,医生可以更全面地为患者设计治疗方案。
传统的配准方法有:
VoxelMorph 以运动和固定的图像对作为输入,最大化图像对的相似度来训练配准网络。
为了获得更高的精度,大多数无监督方法采用具有多个子网络的级联网络或迭代优化策略。这些策略使得训练过程变得复杂,并且需要大量的计算资源。同时,为了获得更平滑、更真实的变形场,即拓扑保持,许多现有的工作引入了显式的微分同构约束或额外的循环一致性计算。
CycleMorph 在训练过程中利用双向配准一致性来保持拓扑结构
voxelmorphi-diff 采用了基于速度场的变形场和新的差胚估计
SYMNet 采用对称变形场估计来实现这一目标
论文的主要贡献
-
本文提出了一种新的基于特征的扩散引导模块(FDG),该模块利用扩散模型中的多尺度中间特征有效地指导配准网络生成变形场。
-
我们还提出了一个分数扩散引导模块(SDG),它利用扩散模型的分数函数在优化过程中指导变形拓扑保存,而不会产生任何额外的计算负担。
-
在心脏数据集上的实验结果验证了我们提出的方法的有效性。
Method
Baseline Registration Model
- 给定一个固定图像f、移动未对齐图像m和受扰动的噪声图像xt
- 我们将这个输入xin = {f, m, xt}输入配准网络的共享编码器Eβ,然后输入配准解码器Rθ。
- 配准解码器Rθ输出变形场φ,由我们的特征扩散引导模块Gσ引导
- 我们将m和ϕ馈送到空间变换层(STL)以生成扭曲的图像m(ϕ)。
- 通过对基于相似度的损失函数LscoreNCC进行优化,得到最终的配准模型。

a) FSDiffReg的工作流程。 b)特征扩散引导模块的过程说明。
特征扩散引导模块
- 主要组成是:辅助去噪扩散解码器Gσ
- 给定输入xin = {f, m, xt}, UNet共享编码器Eβ提取表示z
- z再被送入扩散解码器G和配准解码器R,得到中间特征映射对Fi = {(f i G, Fi R)}, i = 1,…,从解码器的第i层取N
- 值得注意的是,我们通过结合来自扩散解码器的制导来生成配准解码器的特征映射
分数扩散引导模块
- 给定由共享编码器z = Eβ(xin)编码的表示z,扩散解码器Gσ输出一个扩散分数估计S = Gσ(z)。然后,基于分数的扩散引导模块(SDG)使用该分数来重新权衡基于相似性的归一化互相关损失函数,
- 通过这种方式,SDG利用扩散分数明确地指出难以注册的区域,即变形拓扑难以保持的区域,然后在损失函数中分配更高的权重以获得更大的关注,反之亦然对于容易注册的区域。因此,SDG模块在没有额外约束的情况下,有效地将变形拓扑信息纳入优化过程
整体训练与推理
损失函数: 我们的网络在特征预测可变形域,然后输出配准的图像。我们的方法的总损失函数定义为


其中Ldiffusion为训练扩散解码器Gσ的辅助损失函数,t为xt的噪声级。我们提出的LscoreNCC鼓励在保持形变拓扑的同时最大限度地提高配准图像和参考图像之间的相似性。||∇φ ||2是变形场的常规平滑惩罚。λ和λ φ是超参数,我们在实验中经验地将它们设置为20。
Inference阶段: 我们将原始的参考图像f输入到网络中,而不是扰动后的图像xt,网络的总输入就变成了xin = {f, m, f}。
给定该网络输入xin,我们的网络首先在运动图像m和参考图像f之间产生变形场φ,并将运动图像m和变形场φ馈送到空间变换层(STL),产生配准的运动图像m(φ)。配准的运动图像是我们网络的最终输出。
实验和结果
数据集与预处理
我们使用公开可用的3D心脏MR数据集ACDC进行实验。该数据集包括100个具有相应分割图的4D时域心脏MRI数据。我们选择舒张末期的3D图像作为固定图像,选择收缩末期的图像作为运动图像。我们将所有扫描重新采样到1.5×1.5×3.15mm的体素间距,然后裁剪为128 × 128 × 32的体素大小。我们将所有图像的强度归一化为[−1,1]。训练集包含90对图像,其余10对图像组成测试集。
实施细节
框架由PyTorch库1.12.0实现的
使用DDPM-UNet的3D编码器作为我们的共享编码器
使用DDPM-UNet的3D解码器作为我们的扩散解码器
对于配准部分,我们只使用DDPM UNet的3D解码器作为配准解码器来生成变形场,而不是完整3D UNet。在扩散任务中,我们在2000个时间步长内逐渐将噪音时间表从10−6增加到10−2。我们使用Nvidia RTX3090 GPU和Adam优化算法来训练模型,其中λ=20,λξ=20,γ=1,批量大小B=1,学习率为2×10−4,最大时间为700个时期。
评估指标
我们采用了三种评估指标,即DICE、|J|≤0(%)和SD(|J|)来衡量图像配准性能,遵循现有的配准方法。DICE测量扭曲的运动图像和固定的参考图像之间的解剖分割图的空间重叠。Dice分数越高表示翘曲的运动图像和固定的参考图像之间的对准越好,从而反映了配准质量的提高|J|≤0(%)表示配准域的雅可比行列式中非正值的百分比。该度量表示缺乏一对一配准映射关系的体素的百分比,从而导致不切实际的变形和粗糙度。SD(|J|)是指配准域的雅可比行列式的标准偏差。较低的标准偏差表示配准场在整个图像上相对平滑和一致。
相关文章:
FSDiffReg:心脏图像的特征和分数扩散引导无监督形变图像配准
论文标题: FSDiffReg: Feature-wise and Score-wise Diffusion-guided Unsupervised Deformable Image Registration for Cardiac Images 翻译: FSDiffReg:心脏图像的特征和分数扩散引导无监督形变图像配准 摘要 无监督可变形图像配准是医学…...
音视频技术开发周刊 | 318
每周一期,纵览音视频技术领域的干货。 新闻投稿:contributelivevideostack.com。 日程揭晓!速览深圳站大会专题议程详解 LiveVideoStackCon 2023 音视频技术大会深圳站,保持着往届强大的讲师阵容以及高水准的演讲质量。两天的参会…...
asp.net docker-compose添加sql server
打开docker-compose.yml 添加 sqldata:image: mysql:8.1.0 打开docker-compose.override.yml 添加 sqldata:environment:- MYSQL_ROOT_PASSWORDPasswordports:- "8080:8080"volumes:- killsb-one-sqldata:/etc/mysql/conf.d 在docker里面就有了sql server容器镜像…...
uniapp 微信小程序 uni-file-picker上传图片报错 chooseAndUploadFile
这个问题真的很搞, 原因是微信开发者工具更新了,导致图片上传问题。 解决方法: 将微信开发者工具的基础库改为2.33.0一下即可。 在微信开发者工具详情 - 本地设置中(记得点击‘推送’按钮):...
《向量数据库指南》——用 Milvus Cloud和 NVIDIA Merlin 搭建高效推荐系统结论
如何搭建一个高效的推荐系统? 简单来说,现代推荐系统由训练/推理流水线(pipeline)组成,涉及数据获取、数据预处理、模型训练和调整检索、过滤、排名和评分相关的超参数等多个阶段。走遍这些流程之后,推荐系统能够给出高度个性化的推荐结果,从而提升产品的用户体验。 为…...
致:CSGO游戏搬砖人的一封信
最近大家还在坚持操作CSGO游戏搬砖项目不? 这个项目虽是稳赚项目,但也有行情好和行情不好的时候,平台的大中小各种活动的举办,都会对我们的项目造成一定影响。行情的上下波动势必然会影响卡价的波动,影响选品的快慢&a…...
MuLogin浏览器如何在一台设备上安全登录和管理多个LinkedIn账户?
一、LinkedIn多个账户的用处 LinkedIn作为世界上最大的专业人士社交平台,具有许多有用的功能,对于个人和企业来说都非常重要。以下是多个LinkedIn账户的一些典型用途: 1. 分行业账户:如果您在不同的行业从事职业活动,…...
STM32_project:led_beep
代码: 主要部分: #include "stm32f10x.h" // Device header #include "delay.h"// 给蜂鸣器IO口输出低电平,响,高,不向。 //int main (void) //{ // // 开启时钟 // RC…...
[go 反射] 入门
[go 反射] 入门 首先认识go 反射的两大概念,反射之路少不了他们 reflect.Type(接口)获取类型,和列名就找它reflect.Value(结构体)获取值,设置值找它 [tips] 通常是用这两者手底下的方法,reflect.Value结构体中有什么自行查看 …...
【计算机网络】数据链路层-MAC和ARP协议
文章目录 1. 认识以太网2. MAC协议MAC帧的格式MAC地址和IP地址的区别MTU 3. 局域网通信原理碰撞检测和避免 4. ARP协议ARP数据报的格式ARP缓存 1. 认识以太网 网络层解决的是跨网络点到点传输的问题,数据链路层解决的是同一网络中的通信。 数据链路层负责在同一局域…...
本周三商店更新:多款套装下线,四款升级武器带异色皮肤返厂
本周三将迎来26.2版本更新与11商店大更新,版本更新可点击26.2版本更新公告进行查看,这里不一一赘述了,下面大概罗列一下商店更新,有皮肤下架,大家还能趁最后时间入手,最重要的是四款升级武器返厂咯。 危险玩…...
WindowsServer2019-搭建FTP服务器
这里写自定义目录标题 一、基础配置IP地址安装FTP服务检查连通性Windows10连接FTP服务 二、了解和使用FTP具体模块及其配置1、FTP IP地址和域限制2、FTP SSL设置3、FTP当前会话4、FTP防火墙5、FTP目录浏览6、FTP请求筛选7、FTP日志8、FTP身份验证9、FTP授权规则10、FTP消息11、…...
国际阿里云服务器买哪种好用点?
在当时数字化年代,云核算已经成为了企业进行事务运营和数据存储的重要东西。而阿里云作为我国最大的云核算服务供给商,其服务器产品线也适当丰厚。那么,对于用户来说,阿里云服务器买哪种好用点呢?这需求依据个人和企业…...
2023NOIP A层联测25 总结
T1 让你构造 40 40 40\times40 4040 的只含 r,y,x 的矩阵,含有 r y x ryx ryx 的个数恰好为 n n n, n ≤ 2222 n\le2222 n≤2222。看完题后就开始想构造,一开始想构造 3 ∗ 3 3*3 3∗3, 5 ∗ 5 5*5 5∗5 的单位矩阵的,但是始…...
Thread类的基本操作(JAVA多线程)
线程是操作系统中的概念,操作系统内核实现了线程这样的机制,并提供了一些API供外部使用。 JAVA中 Thread类 将系统提供的API又近一步进行了抽象和封装,所以如果想要使用多线程就离不开 Thread 这个类。 线程的创建(Thread类) 在JAVA中 创建…...
Redis 的三种部署模式
提前叠个 buff:这个文章不涉及图(画起来比较麻烦),只是记录我的胡思乱想。 redis 从单点 -> 集群总共有三个部署模式:单机模式,主从模式,哨兵模式,集群模式 单机模式 新手入门模…...
【ArcGIS Pro二次开发】(73):使用NPOI库操作Excel
NPOI是一个开源的C#读写Excel、WORD等微软OLE2组件文档的项目。 NPOI可以在没有安装Office的情况下对Word或Excel文档进行读写操作。 相较于之前使用的Microsoft.Office.Interop.Excel,已经感觉到的优势,一是读写速度较快,虽然小数据量的读…...
python获取电脑所连接的wifi密码
电脑连接wifi后,很难直观地看到当前连接wifi的密码,需要借助命令行公管局才可以查看到相关信息。 CMD命令 查看所有已保存的wifi配置信息 netsh wlan show profiles查看某一个wifi的详细信息,需要输入wifi名称来查询 netsh wlan show pro…...
动态壁纸软件Live Wallpaper HD mac中文版功能特色
Live Wallpaper HD mac提供了一系列美丽的主题场景,将为您的桌面增添活力。从城市景观、日落到遥远的星系,每个屏幕都有特别的触感,可以定制您的天气小部件和时钟样式,并使用您喜爱的图片创建您自己的个性化壁纸。 Living Wallpap…...
Spring Boot 配置主从数据库实现读写分离
一、前言 现在的 Web 应用大都是读多写少。除了缓存以外还可以通过数据库 “主从复制” 架构,把读请求路由到从数据库节点上,实现读写分离,从而大大提高应用的吞吐量。 通常,我们在 Spring Boot 中只会用到一个数据源࿰…...
后进先出(LIFO)详解
LIFO 是 Last In, First Out 的缩写,中文译为后进先出。这是一种数据结构的工作原则,类似于一摞盘子或一叠书本: 最后放进去的元素最先出来 -想象往筒状容器里放盘子: (1)你放进的最后一个盘子(…...
无法与IP建立连接,未能下载VSCode服务器
如题,在远程连接服务器的时候突然遇到了这个提示。 查阅了一圈,发现是VSCode版本自动更新惹的祸!!! 在VSCode的帮助->关于这里发现前几天VSCode自动更新了,我的版本号变成了1.100.3 才导致了远程连接出…...
家政维修平台实战20:权限设计
目录 1 获取工人信息2 搭建工人入口3 权限判断总结 目前我们已经搭建好了基础的用户体系,主要是分成几个表,用户表我们是记录用户的基础信息,包括手机、昵称、头像。而工人和员工各有各的表。那么就有一个问题,不同的角色…...
el-switch文字内置
el-switch文字内置 效果 vue <div style"color:#ffffff;font-size:14px;float:left;margin-bottom:5px;margin-right:5px;">自动加载</div> <el-switch v-model"value" active-color"#3E99FB" inactive-color"#DCDFE6"…...
Qwen3-Embedding-0.6B深度解析:多语言语义检索的轻量级利器
第一章 引言:语义表示的新时代挑战与Qwen3的破局之路 1.1 文本嵌入的核心价值与技术演进 在人工智能领域,文本嵌入技术如同连接自然语言与机器理解的“神经突触”——它将人类语言转化为计算机可计算的语义向量,支撑着搜索引擎、推荐系统、…...
论文浅尝 | 基于判别指令微调生成式大语言模型的知识图谱补全方法(ISWC2024)
笔记整理:刘治强,浙江大学硕士生,研究方向为知识图谱表示学习,大语言模型 论文链接:http://arxiv.org/abs/2407.16127 发表会议:ISWC 2024 1. 动机 传统的知识图谱补全(KGC)模型通过…...
html-<abbr> 缩写或首字母缩略词
定义与作用 <abbr> 标签用于表示缩写或首字母缩略词,它可以帮助用户更好地理解缩写的含义,尤其是对于那些不熟悉该缩写的用户。 title 属性的内容提供了缩写的详细说明。当用户将鼠标悬停在缩写上时,会显示一个提示框。 示例&#x…...
Linux C语言网络编程详细入门教程:如何一步步实现TCP服务端与客户端通信
文章目录 Linux C语言网络编程详细入门教程:如何一步步实现TCP服务端与客户端通信前言一、网络通信基础概念二、服务端与客户端的完整流程图解三、每一步的详细讲解和代码示例1. 创建Socket(服务端和客户端都要)2. 绑定本地地址和端口&#x…...
nnUNet V2修改网络——暴力替换网络为UNet++
更换前,要用nnUNet V2跑通所用数据集,证明nnUNet V2、数据集、运行环境等没有问题 阅读nnU-Net V2 的 U-Net结构,初步了解要修改的网络,知己知彼,修改起来才能游刃有余。 U-Net存在两个局限,一是网络的最佳深度因应用场景而异,这取决于任务的难度和可用于训练的标注数…...
区块链技术概述
区块链技术是一种去中心化、分布式账本技术,通过密码学、共识机制和智能合约等核心组件,实现数据不可篡改、透明可追溯的系统。 一、核心技术 1. 去中心化 特点:数据存储在网络中的多个节点(计算机),而非…...
