当前位置: 首页 > news >正文

医疗机器人中的具身智能进展——自主超声策略模型的任务编码和局部探索

医疗机器人一直是具身智能的研究热点。医学图像、医疗触诊、血压血氧、心率脉搏和生物电信号等多模态生物医学信息,不断丰富着医疗机器人的感知范畴。

自主超声

“自主超声”属于具身智能医疗机器人领域中话题度较高的研究方向。作为临床检查的重要手段之一,传统医疗超声成像技术面临的主要问题为:长期重复性工作造成超声医师的肌体劳损;较长的培训周期导致专业超声医师的缺口持续增大;面对传染性疾病,医患隔离的需求难以满足。临床上,超声医师通过手眼配合和手感训练,锻炼出了对超声探头精准灵巧的操作手法,如图1所示。

图1
在这里插入图片描述

临床超声医师的专业性在于,一方面需要结合日积月累的专业医学知识,对超声图片进行实时的观察和判断,另一方面,超声医师的灵巧操作手法也需要因人而异,病人的高矮、胖瘦、性别、年龄,都会影响超声探头应被施加的压力和扫查方向。

研究进展

超声机器人系统大致可以区分为遥操作和自主式两种。在遥操作超声机器人系统中,超声扫查由超声医师通过直接动作映射进行远程控制。而在自主系统中,超声机器人须具备部分自主决定的能力,保证在超声医师尽量不干预的情况下完成扫查任务。例如,自主超声任务可以被定义为搜寻特定的区域或体积,通常需结合其他医学成像方式如磁共振成像(MRI)和计算机断层扫描(CT)。除此之外,一些研究将自主超声定义为路径跟踪任务,但是需事先在3D相机捕获的点云上进行标记。以上的方法非常依赖于超声医师预先定义的运动规则和引导。与之相比,更理想的自主超声系统应该能够学着去理解超声图像,然后自动完成规划以定位到超声图像。研究学者们也尝试用传统计算机视觉技术与深度学习方法来制定详尽的运动规划方案。此外,一些最新的研究也正在开发基于强化学习和模仿学习的策略模型,有可能在某些特点任务中替代超声医师。

问题与挑战

对于具有显著个体差异的患者群体而言,现有方法在安全性和可靠性方面仍然是一个问题,这归结于两个因素。首先,作为具身智能医疗机器人的研究方向之一,几种关键的临床医疗数据模态并未整合到现有的策略学习框架中,例如超声探头方向和其与患者皮肤的多维接触力。这些医疗数据模态都会显著影响超声扫查的质量,并在患者群体中表现出显著的个体差异性。其次,如何从分布内患者的策略模型外推泛化到分布外的超声技能,例如从年轻到年长、从瘦小到肥胖,从男性到女性,这一关键问题始终没有被提出、强调和验证。

解决思路

武汉大学的李淼教授带领其团队在国际期刊“IEEE Transactions on Automation Science and Engineering (TASE)”上发表了一篇题目为“Learning Freehand Ultrasound Through Multimodal Representation and Skill Adaptation”的文章。其主要贡献点在于,提出了一种多模态融合框架来隐性表征临床超声医师徒手示教的扫查技能,不需要额外地在超声图片中标注兴趣区域和器官轮廓,并综合考虑了超声图像、探头方向和接触力等数据模态。同时,提出了一种超声技能的自适应方案,改善了超声技能在具有显著个体差异性的患者群之间外推泛化的能力。

图2
在这里插入图片描述

图2展示了所提出的可学习和可泛化的自主超声工作流程。首先从临床场景中收集徒手超声的示教数据;在学习阶段,通过多模态融合框架将这些示教数据表征到低维空间中;在部署阶段,将离线建模的自主超声技能复现到徒手超声或机器人超声的应用中。

图3所示为临床场景中收集徒手超声的示教数据的硬件设备细节。除了使用视频捕捉设备获取实时超声图片,超声探头上搭载的惯性测量单元(IMU)和6D力/扭矩传感器能够获得超声探头的方向和接触力数据模态。临床实验场景如图4所示。

图3
在这里插入图片描述

图4
在这里插入图片描述

在多模态融合框架中,超声图像特性通过Masked Auto-Encoder(MAE)进行提取。预处理图像被表征为40维的特征向量,并与4维的探头姿态向量和6维的探头接触力向量进行拼接融合。完成示教数据的降维编码后,用高斯混合模型(GMM)进行建模和预测,如图5所示。

图5
在这里插入图片描述

图6
在这里插入图片描述

在图6所示的算法流程中,通过临床徒手示教的多模态时间序列被嵌入到潜在空间。利用概率模型对示教中的全局动作分布进行建模,并由此可以确定选择某一动作的概率,称之为“似然值”。动作的似然值可以被视为一个潜在的评价指标,似然值低的动作被判定为不可靠的预测结果,后续需利用局部搜索对其进行微调,使其更加接近可靠动作。局部搜索方法如图7所示,其中橙色、绿色、蓝色和紫色区域绘制了四个高斯分布。若预测值能够对应到任意高似然动作(例如A1),则表明该预测结果是可靠的。在此条件下,后续算法将执行逐步迭代过程,沿着条件概率的梯度方向找到局部最优解。而如果预测值位于低似然区域(例如B1),则被判定为不可靠动作。在这种情况下,由于缺乏类似的示教数据,概率空间中的局部似然值仅有着非常小的变化梯度,逐步迭代往往无法找到局部最优解。此时应进行局部探索以找到最近的高斯分布(例如从B1到B2),从而避免沿着条件概率梯度而遇到相对随机的结果(例如从B1到B∗)。

图7
在这里插入图片描述

局部搜索的方法很好地解决了离线学习的自主超声策略模型在部署阶段泛化和外推能力不足的问题,能够在完整的超声检查任务过程中取得接近于人类超声专家的决策能力。如图8所示为超声专家和所提出自主超声算法,在完成同样的患者左肾检查任务中的表现(灰色为人类专家的动作,橙色为自主超声算法的动作)。

图8
在这里插入图片描述

论文中开展了大规模临床实验,从总计24名志愿者中收集了120条示教轨迹,共包含53571组“临床左肾俯卧位检查”的多模态样本。志愿者中包含14名男性和10名女性,年龄跨度从19岁到67岁,BMI指标范围从16.4(瘦小)到26.7(超重)。除了“患者内”和“患者间”的验证方法,实验中提出了一系列相较于N则交叉验证更加复杂和困难的实验方式,将不同患者按照个体差异性划分到训练集和验证集中:将年龄偏小、身材瘦小、或者男性患者的数据作为训练集,而将年龄偏大、身材超重、或者女性患者的数据作为验证集,以此凸显在实际应用中可能面临的数据分布偏移的极端情况。如图9所示,相比于基准算法,论文中提出的自主超声算法框架取得了显著的性能表现和预测精度。

图9
在这里插入图片描述

论文同样验证了所提出的自主超声策略框架兼容一些流行的表征学习基础架构,并在超声图像质量欠佳的情况下表现出良好的训练稳定性。在未来的工作中,基于具身智能的自主超声机器人将更快地进入人们的视野。

相关文章:

医疗机器人中的具身智能进展——自主超声策略模型的任务编码和局部探索

医疗机器人一直是具身智能的研究热点。医学图像、医疗触诊、血压血氧、心率脉搏和生物电信号等多模态生物医学信息,不断丰富着医疗机器人的感知范畴。 自主超声 “自主超声”属于具身智能医疗机器人领域中话题度较高的研究方向。作为临床检查的重要手段之一&#…...

探索人工智能在电子商务平台与游戏发行商竞争中几种应用方式

过去 12 年来,电脑和视频游戏的发行策略发生了巨大变化。数字游戏的销量首次超过实体游戏的销量 在20132020 年的封锁进一步加速了这一趋势。例如,在意大利,封锁的第一周导致数字游戏下载量 暴涨174.9%. 展望未来,市场有望继续增…...

【Altium】AD-网络版一个用户非人为异常占用多个License的解决方法

【更多软件使用问题请点击亿道电子官方网站】 1、 文档目标 当出现一个用户同时占用多个授权,又无法单独释放一个授权的情况下,该如何解决。 2、 问题场景 一个用户获取网络版授权后,AD会自动重复获取授权,直到该license下所有授…...

*算法训练(leetcode)第二十五天 | 134. 加油站、135. 分发糖果、860. 柠檬水找零、406. 根据身高重建队列

刷题记录 134. 加油站135. 分发糖果860. 柠檬水找零406. 根据身高重建队列 134. 加油站 leetcode题目地址 记录全局剩余油量和当前剩余油量,当前剩余小于0时,其实位置是当前位置的后一个位置。若全局剩余油量为负,则说明整体油量不足以走完…...

乐鑫ESPC3 ESP8685 WiFi蓝牙模块透传程序设置教程,抛开繁琐AT指令,简单Web页面配置,即可实现透传

完整文档请下载规格书 TTL-WiFi 透传产品 使用手册 一. 产品概述 二. 接口定义 三. 软件透传WEB配置使用说明 3.1 STATUS配置界面 3.2 MODULE配置界面 n Serial(串口配置) n WiFi(WiFi配置) n Networks(网络…...

怎么样才能为公司申请OV证书?

OV证书,全称为组织验证型SSL证书(Organization Validation SSL Certificate),是一种高级别的SSL/TLS证书,用于加密网站通信并验证网站所属组织的合法身份。相比于基本的域名验证型证书(DV证书)&…...

Python的`queue`模块

队列(Queue) 在Python的queue模块中,Queue类是一个线程安全的队列实现,用于在多线程编程中安全地交换信息。它遵循先入先出(FIFO)的原则。Queue类提供了几种主要的方法: put(item): 将一个项目…...

牛客周赛 Round 50

A题&#xff1a;小红的最小最大 思路&#xff1a; 大水题 code&#xff1a; inline void solve() {int a, b, c; cin >> a >> b >> c;if (min(a, b) c > max(a, b)) cout << "YES\n";else cout << "NO\n";return; }…...

后端之路——登录校验

前言&#xff1a;Servlet 【登录校验】这个功能技术的基础是【会话技术】&#xff0c;那么在讲【会话技术】的时候必然要谈到【Cookie】和【Session】这两个东西&#xff0c;那么在这之前必须要先讲一下一个很重要但是很多人都会忽略的一个知识点&#xff1a;【Servlet】 什么是…...

无线网卡怎么连接台式电脑?让上网更便捷!

随着无线网络的普及&#xff0c;越来越多的台式电脑用户希望通过无线网卡连接到互联网。无线网卡为台式电脑提供了无线连接的便利性&#xff0c;避免了有线网络的束缚。本文将详细介绍无线网卡怎么连接台式电脑的四种方法&#xff0c;包括使用USB无线网卡、内置无线网卡以及使用…...

【45 Pandas+Pyecharts | 去哪儿海南旅游攻略数据分析可视化】

文章目录 &#x1f3f3;️‍&#x1f308; 1. 导入模块&#x1f3f3;️‍&#x1f308; 2. Pandas数据处理2.1 读取数据2.2 查看数据信息2.3 日期处理&#xff0c;提取年份、月份2.4 经费处理2.5 天数处理 &#x1f3f3;️‍&#x1f308; 3. Pyecharts数据可视化3.1 出发日期_…...

Vue3项目给ElementPlus设置中文的两个方案

介绍 在Vue3项目将ElementPlus切换为中文 1、在App.vue的文件中修改 <template><el-config-provider :locale"zhCn"><router-view></router-view></el-config-provider> </template><script lang"ts" setup>im…...

C#开发单实例应用程序并响应后续进程启动参数

C#默认的WinForm模板是不支持设置单实例的&#xff0c;也没有隔壁大哥VB.NET那样有个“生成单个实例应用程序”的勾选选项&#xff08;VB某些时候要比C#更方便&#xff09;&#xff0c;实现单实例可以有多种方法&#xff1a; 检测同名进程&#xff1a;Process.GetProcessesByNa…...

STM32智能机器人导航系统教程

目录 引言环境准备智能机器人导航系统基础代码实现&#xff1a;实现智能机器人导航系统 4.1 数据采集模块 4.2 数据处理与导航算法 4.3 通信与网络系统实现 4.4 用户界面与数据可视化应用场景&#xff1a;机器人导航应用与优化问题解决方案与优化收尾与总结 1. 引言 智能机器…...

Android 15 适配之16K Page Size :为什么它会是最坑的一个适配点

首先什么是 Page Size &#xff1f;一般意义上&#xff0c;页面(Page)指的就是 Linux 虚拟内存管理中使用的最小数据单位&#xff0c;页面大小(Page Size)就是虚拟地址空间中的页面大小&#xff0c; Linux 中进程的虚拟地址空间是由固定大小的页面组成。 Page Size 对于虚拟内…...

下载linux的吐槽

本来这几天放假了&#xff0c;想下一个linux玩一玩 教程&#xff08;我就是根据这个教程进行下载的&#xff0c;但是呢在进行修改BIOS 模式的 地方遇见了困难&#xff0c;也许是电脑修过的原因&#xff0c;我狂按F12 以及 FnF12都没有BIOS设置&#xff0c;只有一个让我选择用w…...

【HTML入门】第四课 - 换行、分割横线和html的注释

这一小节&#xff0c;我们继续说HTML的入门知识&#xff0c;包括换行、横线分割以及注释&#xff08;html的注释&#xff09;。 目录 1 换行 2 分割横线 3 html注释 1 换行 html中分为块元素和行内元素。这一小节呢&#xff0c;先不说这些元素们&#xff0c;我们先说一下换…...

基于Hadoop平台的电信客服数据的处理与分析④项目实现:任务15:数据生产

任务描述 电信数据生产是一个完整且严密的体系&#xff0c;这样可以保证数据的鲁棒性。在本项目的数据生产模块中&#xff0c;我们来模拟生产一些电信数据。同时&#xff0c;我们必须清楚电信数据的格式和数据结构&#xff0c;这样才能在后续的数据产生、存储、分析和展示环节…...

Kotlin中的数据类型

人不走空 &#x1f308;个人主页&#xff1a;人不走空 &#x1f496;系列专栏&#xff1a;算法专题 ⏰诗词歌赋&#xff1a;斯是陋室&#xff0c;惟吾德馨 目录 &#x1f308;个人主页&#xff1a;人不走空 &#x1f496;系列专栏&#xff1a;算法专题 ⏰诗词歌…...

提高交易决策质量,Anzo Capital昂首资本只需两个交易策略

要想提高交易决策质量&#xff0c;其实很简单&#xff0c;Anzo Capital昂首资本只需两个交易策略&#xff0c;结合价格行为和VSA(成交量与价格分析)就可以达成我们的目的。首先&#xff0c;理解这两个概念&#xff1a; 1. 价格行为&#xff1a;价格行为是市场价格变动的方式&a…...

从‘轨迹抖动’到‘借道避障’:一次看懂特斯拉FSD和国内Robotaxi的决策逻辑差异

特斯拉FSD与国内Robotaxi的决策逻辑差异&#xff1a;从轨迹抖动到借道避障的技术哲学 当一辆自动驾驶汽车在高速公路上遇到前方车辆突然切入时&#xff0c;特斯拉的摄像头会如何反应&#xff1f;而搭载激光雷达的国产Robotaxi又会做出什么不同的决策&#xff1f;这种差异不仅仅…...

手机也能跑AI?实测3B以下小模型在安卓/iOS端的部署教程(附性能对比)

手机端AI模型实战&#xff1a;3B以下小模型在安卓/iOS的部署与优化指南 当ChatGPT需要数据中心级算力支撑时&#xff0c;你可能没想到自己的手机也能运行类似技术。本文将带你探索移动端AI部署的完整方案——从Termux环境配置到CoreML模型转换&#xff0c;实测Redmi Note 12 Tu…...

前端CSS样式详细笔记

文章目录一、CSS基础概念1. 什么是CSS2. CSS三大核心特性3. CSS基本语法结构二、CSS引入方式三、CSS选择器详解1. 基础选择器2. 组合选择器3. 属性选择器4. 伪类与伪元素四、选择器优先级规则1. 优先级计算方法2. 优先级实战示例3. 优先级注意事项五、CSS盒模型1. 盒模型组成2.…...

用随机森林预测空气质量?先看看这6个特征谁说了算!(Python特征重要性分析与可视化实战)

随机森林特征重要性分析&#xff1a;解码空气质量预测的6大关键因素 当数据科学家们谈论空气质量预测时&#xff0c;常常陷入一个误区——过分关注模型的预测准确率&#xff0c;却忽视了模型背后的故事。想象一下&#xff0c;你花费数周时间调优的随机森林模型预测准确率达到了…...

电子电路实战:PWM转DAC的滤波参数优化策略

1. PWM转DAC的基础原理 PWM&#xff08;脉冲宽度调制&#xff09;转DAC&#xff08;数模转换&#xff09;是嵌入式系统中常见的低成本解决方案。简单来说&#xff0c;就是通过调节数字信号的占空比来模拟不同的电压值。比如一个3.3V的PWM信号&#xff0c;50%占空比就相当于1.65…...

5分钟掌握YetAnotherKeyDisplayer:专业按键可视化工具终极指南

5分钟掌握YetAnotherKeyDisplayer&#xff1a;专业按键可视化工具终极指南 【免费下载链接】YetAnotherKeyDisplayer The application for displaying pressed keys of the keyboard 项目地址: https://gitcode.com/gh_mirrors/ye/YetAnotherKeyDisplayer YetAnotherKey…...

Ostrakon-VL扫描终端真实案例:烘焙坊用AI识别原料保质期与库存预警

Ostrakon-VL扫描终端真实案例&#xff1a;烘焙坊用AI识别原料保质期与库存预警 1. 项目背景与痛点 在烘焙行业&#xff0c;原料管理一直是个令人头疼的问题。传统的手工记录方式存在以下典型问题&#xff1a; 保质期难追踪&#xff1a;面粉、奶油等原料包装上的日期标识五花…...

Qwen3.5-9B保姆级教程:从Conda环境到Gradio WebUI完整部署

Qwen3.5-9B保姆级教程&#xff1a;从Conda环境到Gradio WebUI完整部署 1. 项目概述 Qwen3.5-9B是一款拥有90亿参数的开源大语言模型&#xff0c;具备强大的逻辑推理、代码生成和多轮对话能力。该模型特别之处在于支持多模态理解&#xff08;图文输入&#xff09;和超长上下文…...

PyTorch 2.8镜像实际案例:电商场景中AI生成商品短视频的端到端实现

PyTorch 2.8镜像实际案例&#xff1a;电商场景中AI生成商品短视频的端到端实现 1. 电商短视频生成的技术挑战 在电商运营中&#xff0c;商品短视频已经成为提升转化率的关键因素。传统视频制作面临三个主要痛点&#xff1a; 人力成本高&#xff1a;专业视频制作团队单条视频…...

如何高效获取学术文献:Zotero-SciPDF自动下载插件完全指南

如何高效获取学术文献&#xff1a;Zotero-SciPDF自动下载插件完全指南 【免费下载链接】zotero-scipdf Download PDF from Sci-Hub automatically For Zotero7 项目地址: https://gitcode.com/gh_mirrors/zo/zotero-scipdf 作为学术研究工作者&#xff0c;你是否经常为查…...