当前位置: 首页 > article >正文

IEEE/ASME Transactions on Mechatronics | 院士团队让移动机器人在复杂环境中学会主动避障

论文信息英文题目 Vector Field Augmented Reinforcement Learning for Adaptive Motion Planning of Mobile Robots中文题目面向移动机器人自适应运动规划的向量场增强强化学习作者 Yang Lu, Weijia Yao, Cong Li, Yongqian Xiao, Xin Xu, Xinglong Zhang, Yaonan Wang, Dingbang Xiao作者单位国防科技大学、湖南大学、湖南第一师范学院期刊IEEE/ASME Transactions on MechatronicsIF 6.4中科院一区JCR Q1发表时间 2025年9月26日链接 https://doi.org/10.1109/TMECH.2025.3593610引文格式 Lu Y, Yao W, Li C, et al. Vector field augmented reinforcement learning for adaptive motion planning of mobile robots[J]. IEEE/ASME Transactions on Mechatronics, 2026, 31(1): 191-205.01 全文速览移动机器人在复杂动态环境中运动规划既要快又要稳还要安全。现有方法各有短板MPC依赖精确模型在线优化计算量大RL数据效率低训练好了也未必能应对未知障碍。国防科技大学王耀南团队提出了一种向量场增强的强化学习VF-RL框架把传统向量场的“导航直觉”和数据驱动的RL的“自适应能力”拧在一起。图1展示了VF-RL的整体架构复合向量场提供实时安全引导模块A深度Koopman模型在线补偿动力学不确定性模块B滚动时域RL在安全边界和作动器约束下生成最优控制。图 1 VF-RL框架向量场引导 在线建模 滚动时域强化学习VF-RL的核心逻辑先让机器人知道“大概往哪走”向量场给出无碰撞参考路径再让RL在局部微调同时用稀疏高斯过程在线修正模型误差。仿真和实车实验表明VF-RL比LMPCC、MPC-CBF等优化方法计算更快0.01s/步路径更短且在动态障碍物、非结构化道路场景下均能稳定运行最高车速3m/s。核心亮点✅复合向量场再升级引入虚拟障碍物和指数平滑函数彻底解决传统向量场“突变”和“死锁”问题✅ Koopman 稀疏GP在线补偿用深度Koopman建立线性化模型再用稀疏高斯过程在线修正未建模动态✅滚动时域RL在预测时域内用核函数网络近似最优策略收敛性和稳定性均有理论证明✅实车验证红旗E-HS3平台静态/动态避障、路径跟踪、越野场景全通过✅跨平台通用四旋翼仿真同样验证证明框架对机器人类型不敏感02 研究内容 2.1 复合向量场给机器人一条“有提前量”的安全路径传统向量场在机器人进入障碍物反应区时指引方向会突然跳变导致机器人急转甚至失控。作者在原有复合向量场图2基础上引入了虚拟障碍物和指数平滑函数。图2展示了原复合向量场的行为在exR灰色、exQ∩inR绿色、inQ蓝色三个区域内机器人分别执行路径跟踪、混合跟踪避障、纯避障。但在黄色圆圈附近向量方向突变违反运动学约束。图 2 原复合向量场在黄色圆圈处发生突变改进后的设计如图3所示在真实障碍物灰色椭圆外围添加一个虚拟障碍物蓝色虚线椭圆二者之间的缓冲区域内向量场会平滑地将机器人引向虚拟障碍物的排斥边界使其提前偏转方向避免进入真实障碍物反应区时出现急弯。指数函数 \(s_i(\xi)\) 保证机器人在进入真实反应区后虚拟障碍物不再起作用。图 3 改进后的复合向量场虚拟障碍物提前引导方向最后将向量场预计算在网格地图上实时查表获取当前引导方向再根据最大向心加速度约束进行速度规划确保高速行驶不侧滑。 2.2 实时自适应建模深度Koopman 稀疏GP机器人动力学往往是非线性的且模型参数会随工况变化。作者先用深度神经网络学习Koopman算子把非线性系统映射到一个高维线性空间但这个离线模型仍然存在误差。于是引入稀疏高斯过程FITC用在线数据实时补偿将建模为GP得到补偿后的线性模型14并可以解析求出雅可比矩阵15。这个模块就是图1中的模块B让VF-RL能够在模型失配和外部扰动下依然保持稳定。图4对比了有/无在线模型补偿VF-RL w/ ML vs w/o ML的横向跟踪误差。可以看到w/ ML的平均误差显著更低尤其在里程后半段模型已在线更新差距更明显。图 4 在线模型补偿显著降低横向跟踪误差 2.3 滚动时域强化学习在安全边界内寻优在向量场给出的参考路径附近RL负责生成最优控制输入。作者设计了一个指数型障碍函数当机器人接近安全边界时代价指数上升。同时在预测时域内用两个核函数网络actor/critic近似最优值函数和最优策略并给出迭代更新规则31。Theorem 1 证明了值函数序列和控制序列收敛到最优解Theorem 2 通过构造Lyapunov函数证明了闭环系统稳定。图5直观展示了安全边界约束下的机器人轨迹不同时刻的快照清楚显示了车辆始终保持在允许区域内。图 5 安全边界约束下的轨迹快照 2.4 仿真与实车验证仿真1静态动态避障CarSim图6对比了VF-RL与LMPCC、MPC-CBF、RHRL-KDP、CFS五种方法。VF-RL提前偏转方向路径最平滑、长度最短MPC-CBF用圆形包络椭圆导致绕远CFS和LMPCC出现紧急避障导致超调RHRL-KDP受约束影响网络发散。表I定量显示VF-RL的综合代价J_MC最低45.84单步计算时间0.01s远低于其他方法的0.07~0.15s。图 6 五种方法避障轨迹对比仿真2多动态障碍物图7和表II中VF-RL路径长度最短48.37m、平均曲率最小0.178 m⁻¹计算效率依然最高。图 7 多动态障碍物场景结果仿真3四旋翼图8展示了VF-RL在四旋翼上的3D轨迹跟踪成功避开静态和突然出现的动态障碍物证明了框架对不同机器人平台的通用性。图 8 四旋翼3D避障轨迹实车实验红旗E-HS3图9展示了四个典型场景静态八字绕桩避障、多动态障碍物主动避让、带边界约束的路径跟踪、以及图10的越野场景。所有测试中车辆稳定运行最高车速3m/s证明了VF-RL在真实非结构化环境中的鲁棒性和实时性。图 9 红旗E-HS3实车实验结果图 10 越野场景俯视图03 创新点①向量场RL的深度耦合而非简单拼接以往向量场只作为路径规划器输出给下层控制器VF-RL把向量场嵌入RL的优化框架——向量场给出“安全方向”作为参考RL在此基础上修正。虚拟障碍物的引入让向量场本身也具备了“预判”能力彻底解决了传统向量场的死锁和突变问题。②在线模型补偿的工程化实现深度Koopman稀疏GP的组合既利用了Koopman的全局线性化优势又用GP在线补偿残差且雅可比矩阵可解析求导可直接用于RL的策略梯度。图8的对比很有说服力。③滚动时域RL的收敛性与稳定性证明在预测时域内用核函数网络近似最优策略并给出actor-critic的更新规则31Theorem 1和2分别证明了收敛性和稳定性这在RLMPC的混合方法中并不多见。④多平台、多场景的充分验证从CarSim仿真到四旋翼再到红旗实车从静态避障到动态避障再到越野道路实验设计非常全面。特别是实车3m/s的速度在非结构化越野场景中已经相当有挑战性。⑤计算效率的显著优势单步计算0.01s比传统非线性MPC0.15s快一个数量级。这意味着VF-RL可以跑在更低成本的嵌入式平台上工程部署潜力大。04 总结与展望这篇工作的最大启发是与其让RL从零摸索避障规则不如先给RL一个“安全驾驶手册”。向量场提供的就是这样一个手册——它不完美但方向正确RL负责在手册的基础上应对动态变化和模型误差。两者结合既保留了传统方法的可解释性和安全性又吸收了数据驱动方法的适应性。当然当前框架也有局限向量场生成的路径只考虑了运动学和向心加速度未完全满足高阶动力学约束RL策略的安全保证仍然是概率性的极端情况下可能失效。未来研究将聚焦于以下几个方向动力学的深度耦合当前向量场主要考虑几何路径和速度上限未来可融入更复杂的动力学约束如横摆角速度、侧向加速度变化率生成真正“可执行”的引导路径。安全备份策略RL策略的收敛性虽然理论上有保证但实际训练中仍可能偶发异常。可设计一个基于CBF或势函数的备份控制器在RL输出可疑时接管。多机器人协同将单机VF-RL扩展到多机器人场景向量场需要处理机器人之间的互斥避让RL则需要学习协调策略。端到端视觉-动作当前框架依赖状态观测位置、速度未来可直接从视觉输入端到端学习但需要解决向量场在图像空间中的定义问题。在您的机器人项目中您更倾向于使用纯优化方法如MPC还是学习方法如RL欢迎在评论区分享您的看法。声明本文仅供学术交流版权归原作者所有。如有错误或侵权请联系更正或删除欢迎留言探讨。

相关文章:

IEEE/ASME Transactions on Mechatronics | 院士团队让移动机器人在复杂环境中学会主动避障

论文信息 英文题目: Vector Field Augmented Reinforcement Learning for Adaptive Motion Planning of Mobile Robots 中文题目:面向移动机器人自适应运动规划的向量场增强强化学习 作者: Yang Lu, Weijia Yao, Cong Li, Yongqian Xia…...

DigitLed72xx库:工业级MAX7219/7221数码管驱动方案

1. DigitLed72xx 库概述:面向工业级 LED 显示控制的嵌入式驱动框架DigitLed72xx 是一款专为 MAX7219 和 MAX7221 七段数码管显示驱动芯片设计的轻量级、高可靠性嵌入式 C 库。该库并非简单的 Arduino 封装,其底层架构深度适配硬件 SPI 外设,支…...

【2026年最新600套毕设项目分享】基于微信小程序的科创微应用平台(30012)

有需要的同学,源代码和配套文档领取,加文章最下方的名片哦 一、项目演示 项目演示视频 二、资料介绍 完整源代码(前后端源代码SQL脚本)配套文档(LWPPT开题报告/任务书)远程调试控屏包运行一键启动项目&…...

【2026年最新600套毕设项目分享】微信小程序的医院核酸检测服务系统(30011)

有需要的同学,源代码和配套文档领取,加文章最下方的名片哦 一、项目演示 项目演示视频 二、资料介绍 完整源代码(前后端源代码SQL脚本)配套文档(LWPPT开题报告/任务书)远程调试控屏包运行一键启动项目&…...

2025_NIPS_CRRL: Learning Channel-invariant Neural Representations for High-performance Cross-day ...

文章核心总结 本文提出CRRL(Channel Rearrangement and Reconstruction Learning)框架,用于解决脑机接口(BCI)跨天解码中神经信号的通道级变异性问题,实现长期稳定解码。核心创新在于通过两个专用模块分别处理神经元丢失/新增、电极漂移两类变异,在多数据集上达成超两个…...

AI+声学:当物理规律遇见神经网络,如何颠覆传统模拟?

AI声学:当物理规律遇见神经网络,如何颠覆传统模拟? 引言 想象一下,模拟一个大型音乐厅的声场分布,传统方法可能需要超级计算机数小时的计算,而AI模型仅需秒级响应。这并非科幻,而是“AI for Sci…...

AI+电磁:当计算电磁学遇上人工智能,一场效率革命正在发生

AI电磁:当计算电磁学遇上人工智能,一场效率革命正在发生 引言 在6G通信、新能源汽车与高端芯片设计等领域,电磁仿真已成为不可或缺的“数字试验场”。然而,传统基于有限元(FEM)、时域有限差分&#xff08…...

软件系统规划步骤和可行性研究步骤

前者是系统开发初始阶段的宏观活动序列,后者则是规划阶段中的一项核心子任务。 一、软件系统规划步骤(典型过程) 系统规划通常属于软件生命周期的“项目立项与计划”阶段,常见步骤如下: 初步调查 识别项目机会、用户需求、业务痛点,明确系统建设的初步目标与范围。 问题…...

AI群演请就位—个人博客(一)

项目背景随着大语言模型能力的提升,AI在内容生成与互动体验中的应用日益广泛。传统互动叙事类产品(如互动小说、角色扮演游戏)主要依赖预设脚本与有限分支选择,存在剧情固化、重复体验感强、角色缺乏真实感等问题。大语言模型的出…...

C++零基础到工程实战(3.1):if语句、bool类型、算数逻辑比较运算符深入解析

目录 一、本节学习内容概要图 二、前言 三、if语句与逻辑判断 3.1 基础语法 (1)if 条件语句 (2)else if 与 else 3.2 常见错误 (1)多余分号导致逻辑块独立 (2)判断时误写赋…...

C++头文件详解:<iomanip> 头文件使用详解

目录 一、前言 二、浮点数精度控制 2.1 fixed 与 setprecision() (1)fixed 的作用 (2)setprecision(n) 的作用 (3)示例:RGB 转 YUV 计算 2.2 scientific 科学计数法 三、设置输出宽度与…...

CP880显示驱动库:车规级TFT-LCD底层控制与零拷贝实现

1. CP880显示驱动库深度解析:面向CARIAD车载信息娱乐系统的TFT-LCD底层控制方案1.1 库定位与工程背景CP880是专为大众集团CARIAD软件平台定制的嵌入式图形显示驱动库,核心目标是为车载信息娱乐系统(IVI)提供高可靠性、低延迟的TFT…...

OpenClaw+SecGPT-14B成本对比:自建模型比SaaS省下80%费用

OpenClawSecGPT-14B成本对比:自建模型比SaaS省下80%费用 1. 为什么我要做这个成本对比实验 去年我开始使用OpenClaw自动化处理日常安全扫描任务时,发现一个令人头疼的问题:每次调用商业安全API的费用高得惊人。作为一个独立安全研究员&…...

OpenClaw压力测试:百川2-13B-4bits连续处理1000个文件的稳定性

OpenClaw压力测试:百川2-13B-4bits连续处理1000个文件的稳定性 1. 测试背景与目标 去年冬天的一个深夜,我正被堆积如山的PDF合同审核工作折磨得焦头烂额。当时突发奇想:如果用AI自动处理这些文件会怎样?这个念头直接促成了本次压…...

JIT启用后CPU飙升200%?PHP 8.9生产环境避坑指南,含8类典型误配置清单

第一章:PHP 8.9 JIT 的核心机制与性能悖论PHP 8.9 并非官方发布的正式版本(截至 PHP 官方最新稳定版为 8.3),该标题中的 “8.9” 是一个假设性技术前瞻设定,用于探讨 JIT 编译器在 PHP 生态中持续演进所引发的底层机制…...

【单片机0.2】

文章目录六个9第一位和第六位亮六个灯亮轮播0-9中间两个灯亮轮播0-9亮灯123456小数点13.14.15六个9 #include<reg52.h> // 头文件// 定义锁存器控制引脚 sbit dulaP3^4; // 锁存器U2&#xff08;段选&#xff09; sbit welaP1^6; // 锁存器U2&#xff08;位选&#xff0…...

作业二6位数码管显示

文章目录1.效果图:显示6个91.代码2.效果图&#xff1a;第1、6位显示72.代码3.效果图&#xff1a;6位0到9轮流显示3.代码4.效果图&#xff1a;中间两位0到9轮流显示4.代码5.效果图&#xff08;显示1&#xff0c;2&#xff0c;3&#xff0c;4&#xff0c;5&#xff0c;6&#xff…...

Keep平台API开发实战指南:从设计理念到生产落地

Keep平台API开发实战指南&#xff1a;从设计理念到生产落地 【免费下载链接】keep The open-source AIOps and alert management platform 项目地址: https://gitcode.com/GitHub_Trending/kee/keep 一、API设计理念&#xff1a;构建灵活的告警管理生态 在现代运维体系…...

账号没有明显违规却突然受限很多时候问题藏在哪些地方

无声的雷区&#xff1a;当你的账号悄然“触线”在数字生活的日常中&#xff0c;或许你曾经历过这样的瞬间&#xff1a;登录熟悉的平台&#xff0c;却收到一条冰冷提示——“账号功能受限”。你反复检查&#xff0c;确信自己没有发布违规内容、没有恶意刷屏、没有触及那些明晃晃…...

AccelStepper:Arduino步进电机精准控制与多轴协同解决方案

AccelStepper&#xff1a;Arduino步进电机精准控制与多轴协同解决方案 【免费下载链接】AccelStepper Fork of AccelStepper 项目地址: https://gitcode.com/gh_mirrors/acc/AccelStepper 在自动化控制领域&#xff0c;步进电机的精准驱动是实现精密运动的核心。AccelSt…...

HarmonyOS-ArkTS-新手完整复现-含环境配置

HarmonyOS ArkTS 新手完整复现&#xff1a;从环境配置到网络列表 App&#xff08;超细步骤&#xff09; 欢迎访问开源鸿蒙 PC 开发者社区&#xff08;https://harmonypc.csdn.net/&#xff09;。 摘要 本文面向零基础/初学者&#xff0c;完整讲清&#xff1a; 如何在 Window…...

MDCL:不换设备,不降功率,电费减少三分之一——发射机技术内核(二)

上一篇讲了固态发射机的模块级效率已经到了90%——硬件层面的省电空间接近极限。但AM调制本身还藏着一个巨大的效率漏洞&#xff1a;载波。 载波的浪费 AM调制有一个教科书级别的效率缺陷&#xff1a;载波本身不携带任何信息。 在标准双边带AM中&#xff0c;所有音频信息都在…...

25套HTML数据可视化大屏模板|覆盖智慧交通、医疗、城市、政务等11大行业应用

温馨提示&#xff1a;文末有联系方式25套行业级HTML可视化大屏源码合集 本提供25套高还原度、响应式设计的HTML数据可视化大屏源码&#xff0c;全部基于纯前端技术&#xff08;HTML/CSS/JS&#xff09;构建&#xff0c;无需后端依赖&#xff0c;可快速部署至各类内网或公有云环…...

OpenClaw定时任务专家:Gemma-3-12b-it自动化日报生成系统

OpenClaw定时任务专家&#xff1a;Gemma-3-12b-it自动化日报生成系统 1. 为什么需要自动化日报系统 作为技术团队的负责人&#xff0c;我每天最头疼的就是收集各成员的日报。传统的做法是让每个人手动填写模板&#xff0c;但执行效果总是不尽如人意——有人忘记提交&#xff…...

阿姆智创15.6寸工业工控触摸一体机,赋能机器视觉与SMT产线场景,源头工厂ODM定制方案

在电子制造高速发展的今天&#xff0c;机器视觉检测与SMT贴片生产线已成为智能制造的重要载体&#xff0c;对工业控制终端的显示精度、运算性能、接口拓展及环境适应性提出了更高要求。阿姆智创15.6寸工业工控触摸一体机&#xff0c;以高清显示、工业级稳定性能、全场景接口配置…...

全球首发 | 「AI智能库」正式官宣,智库智能重新定义仓库!

智库智能 江苏智库智能科技有限公司创立于2017年&#xff0c;是全球托盘仓储机器人领航者&#xff0c;专注于托盘仓储机器人的研发设计和生产交付&#xff0c;拥有机器人本体、业务系统、核心算法、交付系统等全价值链研发能力。公司已推出多款托盘仓储机器人及智能仓储软件…...

2026届最火的六大AI学术平台实测分析

Ai论文网站排名&#xff08;开题报告、文献综述、降aigc率、降重综合对比&#xff09; TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 当下&#xff0c;各种各样的AI生成内容检测工具越来越广泛地被使用&#xff0c;这给那些依靠…...

资源捕获与媒体解析:猫抓插件效率革命全指南

资源捕获与媒体解析&#xff1a;猫抓插件效率革命全指南 【免费下载链接】cat-catch 猫抓 浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 在数字内容爆炸的时代&#xff0c;我们每天…...

Sketch Measure插件完全指南:如何用设计规范提升团队协作效率

Sketch Measure插件完全指南&#xff1a;如何用设计规范提升团队协作效率 【免费下载链接】sketch-measure Make it a fun to create spec for developers and teammates 项目地址: https://gitcode.com/gh_mirrors/sk/sketch-measure Sketch Measure是一款专为设计师和…...

如何在openKylin 2.0 SP2中安装Qt(v0.2.2)(上)

作者&#xff1a;沈传越&#xff0c;赵文硕 明德融创工作室&#xff08;Minter Fusion Studio, MFS&#xff09; 出品 本文的所有步骤均经过测试复现 如何在openKylin 2.0 SP2中安装Qt&#xff08;v0.2.2&#xff09;&#xff08;下&#xff09; Qt是一款著名的桌面图形化系…...