医疗机器人中的具身智能进展——自主超声策略模型的任务编码和局部探索
医疗机器人一直是具身智能的研究热点。医学图像、医疗触诊、血压血氧、心率脉搏和生物电信号等多模态生物医学信息,不断丰富着医疗机器人的感知范畴。
自主超声
“自主超声”属于具身智能医疗机器人领域中话题度较高的研究方向。作为临床检查的重要手段之一,传统医疗超声成像技术面临的主要问题为:长期重复性工作造成超声医师的肌体劳损;较长的培训周期导致专业超声医师的缺口持续增大;面对传染性疾病,医患隔离的需求难以满足。临床上,超声医师通过手眼配合和手感训练,锻炼出了对超声探头精准灵巧的操作手法,如图1所示。
图1
临床超声医师的专业性在于,一方面需要结合日积月累的专业医学知识,对超声图片进行实时的观察和判断,另一方面,超声医师的灵巧操作手法也需要因人而异,病人的高矮、胖瘦、性别、年龄,都会影响超声探头应被施加的压力和扫查方向。
研究进展
超声机器人系统大致可以区分为遥操作和自主式两种。在遥操作超声机器人系统中,超声扫查由超声医师通过直接动作映射进行远程控制。而在自主系统中,超声机器人须具备部分自主决定的能力,保证在超声医师尽量不干预的情况下完成扫查任务。例如,自主超声任务可以被定义为搜寻特定的区域或体积,通常需结合其他医学成像方式如磁共振成像(MRI)和计算机断层扫描(CT)。除此之外,一些研究将自主超声定义为路径跟踪任务,但是需事先在3D相机捕获的点云上进行标记。以上的方法非常依赖于超声医师预先定义的运动规则和引导。与之相比,更理想的自主超声系统应该能够学着去理解超声图像,然后自动完成规划以定位到超声图像。研究学者们也尝试用传统计算机视觉技术与深度学习方法来制定详尽的运动规划方案。此外,一些最新的研究也正在开发基于强化学习和模仿学习的策略模型,有可能在某些特点任务中替代超声医师。
问题与挑战
对于具有显著个体差异的患者群体而言,现有方法在安全性和可靠性方面仍然是一个问题,这归结于两个因素。首先,作为具身智能医疗机器人的研究方向之一,几种关键的临床医疗数据模态并未整合到现有的策略学习框架中,例如超声探头方向和其与患者皮肤的多维接触力。这些医疗数据模态都会显著影响超声扫查的质量,并在患者群体中表现出显著的个体差异性。其次,如何从分布内患者的策略模型外推泛化到分布外的超声技能,例如从年轻到年长、从瘦小到肥胖,从男性到女性,这一关键问题始终没有被提出、强调和验证。
解决思路
武汉大学的李淼教授带领其团队在国际期刊“IEEE Transactions on Automation Science and Engineering (TASE)”上发表了一篇题目为“Learning Freehand Ultrasound Through Multimodal Representation and Skill Adaptation”的文章。其主要贡献点在于,提出了一种多模态融合框架来隐性表征临床超声医师徒手示教的扫查技能,不需要额外地在超声图片中标注兴趣区域和器官轮廓,并综合考虑了超声图像、探头方向和接触力等数据模态。同时,提出了一种超声技能的自适应方案,改善了超声技能在具有显著个体差异性的患者群之间外推泛化的能力。
图2
图2展示了所提出的可学习和可泛化的自主超声工作流程。首先从临床场景中收集徒手超声的示教数据;在学习阶段,通过多模态融合框架将这些示教数据表征到低维空间中;在部署阶段,将离线建模的自主超声技能复现到徒手超声或机器人超声的应用中。
图3所示为临床场景中收集徒手超声的示教数据的硬件设备细节。除了使用视频捕捉设备获取实时超声图片,超声探头上搭载的惯性测量单元(IMU)和6D力/扭矩传感器能够获得超声探头的方向和接触力数据模态。临床实验场景如图4所示。
图3
图4
在多模态融合框架中,超声图像特性通过Masked Auto-Encoder(MAE)进行提取。预处理图像被表征为40维的特征向量,并与4维的探头姿态向量和6维的探头接触力向量进行拼接融合。完成示教数据的降维编码后,用高斯混合模型(GMM)进行建模和预测,如图5所示。
图5
图6
在图6所示的算法流程中,通过临床徒手示教的多模态时间序列被嵌入到潜在空间。利用概率模型对示教中的全局动作分布进行建模,并由此可以确定选择某一动作的概率,称之为“似然值”。动作的似然值可以被视为一个潜在的评价指标,似然值低的动作被判定为不可靠的预测结果,后续需利用局部搜索对其进行微调,使其更加接近可靠动作。局部搜索方法如图7所示,其中橙色、绿色、蓝色和紫色区域绘制了四个高斯分布。若预测值能够对应到任意高似然动作(例如A1),则表明该预测结果是可靠的。在此条件下,后续算法将执行逐步迭代过程,沿着条件概率的梯度方向找到局部最优解。而如果预测值位于低似然区域(例如B1),则被判定为不可靠动作。在这种情况下,由于缺乏类似的示教数据,概率空间中的局部似然值仅有着非常小的变化梯度,逐步迭代往往无法找到局部最优解。此时应进行局部探索以找到最近的高斯分布(例如从B1到B2),从而避免沿着条件概率梯度而遇到相对随机的结果(例如从B1到B∗)。
图7
局部搜索的方法很好地解决了离线学习的自主超声策略模型在部署阶段泛化和外推能力不足的问题,能够在完整的超声检查任务过程中取得接近于人类超声专家的决策能力。如图8所示为超声专家和所提出自主超声算法,在完成同样的患者左肾检查任务中的表现(灰色为人类专家的动作,橙色为自主超声算法的动作)。
图8
论文中开展了大规模临床实验,从总计24名志愿者中收集了120条示教轨迹,共包含53571组“临床左肾俯卧位检查”的多模态样本。志愿者中包含14名男性和10名女性,年龄跨度从19岁到67岁,BMI指标范围从16.4(瘦小)到26.7(超重)。除了“患者内”和“患者间”的验证方法,实验中提出了一系列相较于N则交叉验证更加复杂和困难的实验方式,将不同患者按照个体差异性划分到训练集和验证集中:将年龄偏小、身材瘦小、或者男性患者的数据作为训练集,而将年龄偏大、身材超重、或者女性患者的数据作为验证集,以此凸显在实际应用中可能面临的数据分布偏移的极端情况。如图9所示,相比于基准算法,论文中提出的自主超声算法框架取得了显著的性能表现和预测精度。
图9
论文同样验证了所提出的自主超声策略框架兼容一些流行的表征学习基础架构,并在超声图像质量欠佳的情况下表现出良好的训练稳定性。在未来的工作中,基于具身智能的自主超声机器人将更快地进入人们的视野。
相关文章:

医疗机器人中的具身智能进展——自主超声策略模型的任务编码和局部探索
医疗机器人一直是具身智能的研究热点。医学图像、医疗触诊、血压血氧、心率脉搏和生物电信号等多模态生物医学信息,不断丰富着医疗机器人的感知范畴。 自主超声 “自主超声”属于具身智能医疗机器人领域中话题度较高的研究方向。作为临床检查的重要手段之一&#…...

探索人工智能在电子商务平台与游戏发行商竞争中几种应用方式
过去 12 年来,电脑和视频游戏的发行策略发生了巨大变化。数字游戏的销量首次超过实体游戏的销量 在20132020 年的封锁进一步加速了这一趋势。例如,在意大利,封锁的第一周导致数字游戏下载量 暴涨174.9%. 展望未来,市场有望继续增…...

【Altium】AD-网络版一个用户非人为异常占用多个License的解决方法
【更多软件使用问题请点击亿道电子官方网站】 1、 文档目标 当出现一个用户同时占用多个授权,又无法单独释放一个授权的情况下,该如何解决。 2、 问题场景 一个用户获取网络版授权后,AD会自动重复获取授权,直到该license下所有授…...
*算法训练(leetcode)第二十五天 | 134. 加油站、135. 分发糖果、860. 柠檬水找零、406. 根据身高重建队列
刷题记录 134. 加油站135. 分发糖果860. 柠檬水找零406. 根据身高重建队列 134. 加油站 leetcode题目地址 记录全局剩余油量和当前剩余油量,当前剩余小于0时,其实位置是当前位置的后一个位置。若全局剩余油量为负,则说明整体油量不足以走完…...

乐鑫ESPC3 ESP8685 WiFi蓝牙模块透传程序设置教程,抛开繁琐AT指令,简单Web页面配置,即可实现透传
完整文档请下载规格书 TTL-WiFi 透传产品 使用手册 一. 产品概述 二. 接口定义 三. 软件透传WEB配置使用说明 3.1 STATUS配置界面 3.2 MODULE配置界面 n Serial(串口配置) n WiFi(WiFi配置) n Networks(网络…...

怎么样才能为公司申请OV证书?
OV证书,全称为组织验证型SSL证书(Organization Validation SSL Certificate),是一种高级别的SSL/TLS证书,用于加密网站通信并验证网站所属组织的合法身份。相比于基本的域名验证型证书(DV证书)&…...
Python的`queue`模块
队列(Queue) 在Python的queue模块中,Queue类是一个线程安全的队列实现,用于在多线程编程中安全地交换信息。它遵循先入先出(FIFO)的原则。Queue类提供了几种主要的方法: put(item): 将一个项目…...
牛客周赛 Round 50
A题:小红的最小最大 思路: 大水题 code: inline void solve() {int a, b, c; cin >> a >> b >> c;if (min(a, b) c > max(a, b)) cout << "YES\n";else cout << "NO\n";return; }…...

后端之路——登录校验
前言:Servlet 【登录校验】这个功能技术的基础是【会话技术】,那么在讲【会话技术】的时候必然要谈到【Cookie】和【Session】这两个东西,那么在这之前必须要先讲一下一个很重要但是很多人都会忽略的一个知识点:【Servlet】 什么是…...

无线网卡怎么连接台式电脑?让上网更便捷!
随着无线网络的普及,越来越多的台式电脑用户希望通过无线网卡连接到互联网。无线网卡为台式电脑提供了无线连接的便利性,避免了有线网络的束缚。本文将详细介绍无线网卡怎么连接台式电脑的四种方法,包括使用USB无线网卡、内置无线网卡以及使用…...

【45 Pandas+Pyecharts | 去哪儿海南旅游攻略数据分析可视化】
文章目录 🏳️🌈 1. 导入模块🏳️🌈 2. Pandas数据处理2.1 读取数据2.2 查看数据信息2.3 日期处理,提取年份、月份2.4 经费处理2.5 天数处理 🏳️🌈 3. Pyecharts数据可视化3.1 出发日期_…...
Vue3项目给ElementPlus设置中文的两个方案
介绍 在Vue3项目将ElementPlus切换为中文 1、在App.vue的文件中修改 <template><el-config-provider :locale"zhCn"><router-view></router-view></el-config-provider> </template><script lang"ts" setup>im…...
C#开发单实例应用程序并响应后续进程启动参数
C#默认的WinForm模板是不支持设置单实例的,也没有隔壁大哥VB.NET那样有个“生成单个实例应用程序”的勾选选项(VB某些时候要比C#更方便),实现单实例可以有多种方法: 检测同名进程:Process.GetProcessesByNa…...

STM32智能机器人导航系统教程
目录 引言环境准备智能机器人导航系统基础代码实现:实现智能机器人导航系统 4.1 数据采集模块 4.2 数据处理与导航算法 4.3 通信与网络系统实现 4.4 用户界面与数据可视化应用场景:机器人导航应用与优化问题解决方案与优化收尾与总结 1. 引言 智能机器…...

Android 15 适配之16K Page Size :为什么它会是最坑的一个适配点
首先什么是 Page Size ?一般意义上,页面(Page)指的就是 Linux 虚拟内存管理中使用的最小数据单位,页面大小(Page Size)就是虚拟地址空间中的页面大小, Linux 中进程的虚拟地址空间是由固定大小的页面组成。 Page Size 对于虚拟内…...

下载linux的吐槽
本来这几天放假了,想下一个linux玩一玩 教程(我就是根据这个教程进行下载的,但是呢在进行修改BIOS 模式的 地方遇见了困难,也许是电脑修过的原因,我狂按F12 以及 FnF12都没有BIOS设置,只有一个让我选择用w…...

【HTML入门】第四课 - 换行、分割横线和html的注释
这一小节,我们继续说HTML的入门知识,包括换行、横线分割以及注释(html的注释)。 目录 1 换行 2 分割横线 3 html注释 1 换行 html中分为块元素和行内元素。这一小节呢,先不说这些元素们,我们先说一下换…...

基于Hadoop平台的电信客服数据的处理与分析④项目实现:任务15:数据生产
任务描述 电信数据生产是一个完整且严密的体系,这样可以保证数据的鲁棒性。在本项目的数据生产模块中,我们来模拟生产一些电信数据。同时,我们必须清楚电信数据的格式和数据结构,这样才能在后续的数据产生、存储、分析和展示环节…...

Kotlin中的数据类型
人不走空 🌈个人主页:人不走空 💖系列专栏:算法专题 ⏰诗词歌赋:斯是陋室,惟吾德馨 目录 🌈个人主页:人不走空 💖系列专栏:算法专题 ⏰诗词歌…...

提高交易决策质量,Anzo Capital昂首资本只需两个交易策略
要想提高交易决策质量,其实很简单,Anzo Capital昂首资本只需两个交易策略,结合价格行为和VSA(成交量与价格分析)就可以达成我们的目的。首先,理解这两个概念: 1. 价格行为:价格行为是市场价格变动的方式&a…...

深入浅出Asp.Net Core MVC应用开发系列-AspNetCore中的日志记录
ASP.NET Core 是一个跨平台的开源框架,用于在 Windows、macOS 或 Linux 上生成基于云的新式 Web 应用。 ASP.NET Core 中的日志记录 .NET 通过 ILogger API 支持高性能结构化日志记录,以帮助监视应用程序行为和诊断问题。 可以通过配置不同的记录提供程…...

7.4.分块查找
一.分块查找的算法思想: 1.实例: 以上述图片的顺序表为例, 该顺序表的数据元素从整体来看是乱序的,但如果把这些数据元素分成一块一块的小区间, 第一个区间[0,1]索引上的数据元素都是小于等于10的, 第二…...

Flask RESTful 示例
目录 1. 环境准备2. 安装依赖3. 修改main.py4. 运行应用5. API使用示例获取所有任务获取单个任务创建新任务更新任务删除任务 中文乱码问题: 下面创建一个简单的Flask RESTful API示例。首先,我们需要创建环境,安装必要的依赖,然后…...

基于Flask实现的医疗保险欺诈识别监测模型
基于Flask实现的医疗保险欺诈识别监测模型 项目截图 项目简介 社会医疗保险是国家通过立法形式强制实施,由雇主和个人按一定比例缴纳保险费,建立社会医疗保险基金,支付雇员医疗费用的一种医疗保险制度, 它是促进社会文明和进步的…...
Qt Widget类解析与代码注释
#include "widget.h" #include "ui_widget.h"Widget::Widget(QWidget *parent): QWidget(parent), ui(new Ui::Widget) {ui->setupUi(this); }Widget::~Widget() {delete ui; }//解释这串代码,写上注释 当然可以!这段代码是 Qt …...

CocosCreator 之 JavaScript/TypeScript和Java的相互交互
引擎版本: 3.8.1 语言: JavaScript/TypeScript、C、Java 环境:Window 参考:Java原生反射机制 您好,我是鹤九日! 回顾 在上篇文章中:CocosCreator Android项目接入UnityAds 广告SDK。 我们简单讲…...

Maven 概述、安装、配置、仓库、私服详解
目录 1、Maven 概述 1.1 Maven 的定义 1.2 Maven 解决的问题 1.3 Maven 的核心特性与优势 2、Maven 安装 2.1 下载 Maven 2.2 安装配置 Maven 2.3 测试安装 2.4 修改 Maven 本地仓库的默认路径 3、Maven 配置 3.1 配置本地仓库 3.2 配置 JDK 3.3 IDEA 配置本地 Ma…...
基于Java Swing的电子通讯录设计与实现:附系统托盘功能代码详解
JAVASQL电子通讯录带系统托盘 一、系统概述 本电子通讯录系统采用Java Swing开发桌面应用,结合SQLite数据库实现联系人管理功能,并集成系统托盘功能提升用户体验。系统支持联系人的增删改查、分组管理、搜索过滤等功能,同时可以最小化到系统…...

安宝特方案丨船舶智造的“AR+AI+作业标准化管理解决方案”(装配)
船舶制造装配管理现状:装配工作依赖人工经验,装配工人凭借长期实践积累的操作技巧完成零部件组装。企业通常制定了装配作业指导书,但在实际执行中,工人对指导书的理解和遵循程度参差不齐。 船舶装配过程中的挑战与需求 挑战 (1…...
Fabric V2.5 通用溯源系统——增加图片上传与下载功能
fabric-trace项目在发布一年后,部署量已突破1000次,为支持更多场景,现新增支持图片信息上链,本文对图片上传、下载功能代码进行梳理,包含智能合约、后端、前端部分。 一、智能合约修改 为了增加图片信息上链溯源,需要对底层数据结构进行修改,在此对智能合约中的农产品数…...