当前位置: 首页 > article >正文

从零开始自主「起身站立」,上海AI Lab发布最新控制算法,机器人:起猛了

来源 | 机器之心

近日,上海 AI Lab 具身智能中心研究团队在机器人控制领域取得了最新突破,提出的 HoST(Humanoid Standing-up Control)算法,成功让人形机器人在多种复杂环境中实现了自主站起,并展现出强大的抗干扰能力。

这一创新不仅解决了机器人从坐姿到站姿的转换难题,还为未来人形机器人在家庭、医疗、救援等场景中的广泛应用奠定了基础。

通过强化学习框架和多项技术优化,HoST 算法在仿真和真实环境中均表现出色,为人形机器人应对实际环境中的失衡恢复、动态平衡等挑战提供了创新解决方案,进一步推动具身智能技术的实用化进程。

图片

  • 项目主页:https://taohuang13.github.io/humanoid-standingup.github.io/

  • 论文地址:https://arxiv.org/abs/2502.08378

设想人形机器人能否做到:从沙发上站起,走向桌子,拿起一杯咖啡。尽管最近的工作赋予了它们强大的运动和操作能力,但是沙发上站起这一环节,相对而言缺乏了研究。

大多数工作假设机器人从一个预定义好的站立姿势开始,执行后续任务。研究者认为,学会人形机器人站起控制能够应对上述坐立姿态转换,或是跌倒后站起等场景,有助于进一步提升人形机器人的落地场景。

和此前依赖于预定义轨迹或是忽视真机硬件限制的控制算法不同,HoST 的研究团队提出了一套从零开始、不依赖预定于轨迹的强化学习框架,能够在仿真环境中学会从多种姿势下成功站起,并且能够直接部署到真实机器人上。

图片

核心技术

图片

HoST 算法框架

奖励函数设计与策略优化

不同于行走与操作,站起这一控制任务动态性更强,对上下半身的动态性要求更高。特别的,对于强化学习算法而言,需要克服随时间变化的接触点、多阶段技能学习、精确的身体角动量控制,无疑对奖励函数的设计与策略优化带来了极大的困难。

为此,研究者们设计了多种奖励函数,并将其归类到了四种奖励组:任务奖励、风格奖励、约束奖励与后任务奖励。

图片

为了能更好的平衡各个奖励函数,研究者们紧接着采用了多评论家技术,对每一个奖励函数组分别进行汇报估计,并对每个奖励函数组赋予不同权重,来最终优化控制策略。

图片

探索策略

即使有了合理的奖励函数设计,研究者们依旧观测到了强化学习在探索上遇到的困难。

研究团队从科学家对婴儿的研究中发现,外界的帮助有助于婴儿学习许多动作技能。受此启发,研究者们设计了基于课程的辅助力探索策略。

在训练初期,基于机器人额外的向上的辅助力,帮助其更容易的站起,探索到高质量的学习样本。随着机器人逐步掌握站起能力,这一辅助力会逐步减小至零,使得机器人最终学习到无辅助力帮助下的站起控制。这一设计极大的加快了学习效率。

运动约束

研究者们观测到机器人容易学到剧烈的站起策略,为了克服这一问题,他们引入了动作缩放系数(动作界限),该缩放系数决定了 PD 控制器中的目标关节角与当前关节角的最大偏差,从而隐式的约束关节最大的力矩与速度该缩放系数初始被设置为 1。随着学习的进行,该缩放系数逐渐减弱至 0.25。

图片

此外,研究者们还观测到了站起过程中的行为抖动。为了避免这个问题,他们在值函数网络和策略网络优化时采用了平滑约束方法(L2C2)。

图片

真机策略迁移

为了模拟真实世界中可能见到的初始姿势,研究者们在仿真训练中设计了四种地形:平地、平台、斜坡和靠墙,以模拟真实世界中常见到的环境。

另外,为了减小物理仿真与现实中的物理参数差异,研究者们还采用了域随机化(domain randomization)的技术,在仿真中给予某些物理参数一些随机噪声,例如质心的偏移、base 重力等。

实验评估

仿真环境站起动作质量

为了更好的评估站起动作,研究人员首先提出了四个量化指标:成功率、双脚移动距离、动作平滑度和消耗能量。基于此,他们首先对 HoST 与其消融版本在仿真中进行了比较。结果如下表显示,多评论家、辅助力探索、运动约束均对策略学习有着显著的影响。

例如,机器人在缺少前两者的情况下,无法在大多数地形上成功学到站起技能;缺少运动约束会使得站起动作不够平滑。这些验证了上述技术设计的重要性。

图片

真实环境站起动作质量

接着,研究者们将控制策略直接部署到机器人 Unitree G1 上,并且在室内外多种场景进行了测试。如下图所示,在多种地形上均实现了成功站起,包括木质平台、草地、平台、斜坡、靠树、石子路等。

图片

其中,在室内场景下,研究者还对比了平滑约束对真机表现的影响。如下图所示,平滑约束显著提升了站起动作的平滑度与其成功率。

图片

图片

鲁棒性测试

在负重、外部冲击力、软质地面障碍物以及随机扭矩丢失等复杂外部干扰条件下,HoST 依然能够保持稳定站立、从摔倒中迅速恢复,并维持动态平衡。

图片

图片

相关文章:

从零开始自主「起身站立」,上海AI Lab发布最新控制算法,机器人:起猛了

来源 | 机器之心 近日,上海 AI Lab 具身智能中心研究团队在机器人控制领域取得了最新突破,提出的 HoST(Humanoid Standing-up Control)算法,成功让人形机器人在多种复杂环境中实现了自主站起,并展现出强大…...

基于Python socket库构建的基于 P2P 的文件共享系统示例

基于 P2P 的文件共享系统 实现方式: 使用 Python 的socket库构建 P2P 网络,节点之间通过 TCP 或 UDP 协议进行通信。每个节点维护一个文件列表,并向其他节点广播自己拥有的文件信息。当一个节点需要某个文件时,它会向网络中的其…...

【Kubernetes】API server 限流 之 maxinflight.go

这个文件实现了一个基于信号量(Channel)的简单限流器。 基础知识 总共有四种channel 带缓冲的channel nonMutatingChan、mutatingChan 都是带缓冲的channel ,这类channel 的特点是: 这允许最多 mutatingLimit /nonMutatingLimit 个请求同时获取令牌并执…...

Solr中得Core和Collection的作用和关系

Solr中得Core和Collection的作用和关系 一, 总结 在Apache Solr中,Core和Collection 是两个核心概念,他们分别用于单机模式和分布式模式(SolrCloud)中,用于管理和组织数据。 二,Core 定义&am…...

AI驱动的自动化留给人类的时间不多了

时间紧迫!时间紧迫!时间紧迫! 关于AI工作流催生的行业任务自动化时间窗口,结合技术成熟度、成本效益、行业特性等维度,可划分为以下阶段: 一、技术渗透阶段(2025-2028年) 高重复性任…...

嵌入式Qt的动平衡仪完整设计方案

一、系统架构总览 #mermaid-svg-R5q0e12ntMzsskep {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-R5q0e12ntMzsskep .error-icon{fill:#552222;}#mermaid-svg-R5q0e12ntMzsskep .error-text{fill:#552222;stroke:#5…...

使用 Containerd 通过 HTTP 协议拉取 Harbor 私有镜像仓库的镜像

在 Kubernetes 1.24及以上版本环境中,docker不再被支持,主要使用Containerd 是常用的容器运行。默认情况下,Containerd 使用 HTTPS 协议与镜像仓库通信。然而,在某些场景下(如测试环境或内部网络)&#xff…...

Python解决“比赛配对”问题

Python解决“比赛配对”问题 问题描述测试样例解决思路代码 问题描述 小R正在组织一个比赛,比赛中有 n 支队伍参赛。比赛遵循以下独特的赛制: 如果当前队伍数为 偶数,那么每支队伍都会与另一支队伍配对。总共进行 n / 2 场比赛,…...

Dify在Ubuntu20.04系统的部署

文章目录 一、dify 介绍1.核心功能优势2.应用场景 二、dify 安装(docker方式)1.代码库下载2.配置文件修改3.启动docker 容器 三、遇到问题与解决1.使用sudo docker compose up -d报错2.使用service docker start报错 一、dify 介绍 Dify 是一款开源的大语言模型(LL…...

达梦:内存相关参数

目录 28个相关参数1. 内存池相关MEMORY_POOLMEMORY_N_POOLSMEMORY_BAK_POOL 2. 大缓冲区相关HUGE_BUFFERHUGE_BUFFER_POOLS 3. 共享缓冲区相关BUFFERBUFFER_POOLSBUFFER_MODEMAX_BUFFER 4. 快速池相关FAST_POOL_PAGES 5. 回收池相关RECYCLE_POOLS 6. 回滚段池相关ROLLSEG_POOLS…...

计算机毕设-基于springboot的融合多源高校画像数据与协同过滤算法的高考择校推荐系统的设计与实现(附源码+lw+ppt+开题报告)

博主介绍:✌多个项目实战经验、多个大型网购商城开发经验、在某机构指导学员上千名、专注于本行业领域✌ 技术范围:Java实战项目、Python实战项目、微信小程序/安卓实战项目、爬虫大数据实战项目、Nodejs实战项目、PHP实战项目、.NET实战项目、Golang实战…...

《Qt动画编程实战:轻松实现头像旋转效果》

《Qt动画编程实战:轻松实现头像旋转效果》 Qt 提供了丰富的动画框架,可以轻松实现各种平滑的动画效果。其中,旋转动画是一种常见的 UI 交互方式,广泛应用于加载指示器、按钮动画、场景变换等。本篇文章将详细介绍如何使用 Qt 实现…...

SpringBoot3—快速入门

一、简介 (1)前置知识 Java17Spring、SpringMVC、MyBatisMaven、IDEA (2)环境要求 (3)SpringBoot3是什么 核心概念:Spring Boot 底层是 Spring,能简单、快速地创建一个独立的、生…...

【Eureka 缓存机制】

今天简单介绍一下Eureka server 的缓存机制吧✌️✌️✌️ 一、先来个小剧场:服务发现的"拖延症" 想象你是个外卖小哥(客户端),每次接单都要打电话问调度中心(Eureka Server):“现在…...

Python基于机器学习的微博舆情情感分析系统,微博评论情感分析可视化系统(全新升级)

大家好,今天为大家带来的是Python基于机器学习的微博舆情情感分析系统,微博评论情感分析可视化系统,这个系统在原本的系统上进行优化升级。 算法从开源框架的 snlow ,到支持机器学习的 lstm 算法可以手动输入语句,进行…...

Matlab地图绘制教程第2期—水陆填充图

上一期分享了海岸线图的绘制方法: 本着由浅入深的理念,本期再来分享一下水陆填充图的绘制方法。 先来看一下成品效果: 特别提示:Matlab地图绘制教程系列,旨在降低大家使用Matlab进行地图类科研绘图的门槛,…...

云创智城YunCharge 新能源二轮、四轮充电解决方案(云快充、万马爱充、中电联、OCPP1.6J等多个私有单车、汽车充电协议)之新能源充电行业系统说明书

云创智城YunCharge 新能源充电行业系统说明书 ⚡官方文档 ⚡官网地址 1. 引言 随着全球环境保护和能源危机的加剧,新能源汽车行业得到了快速发展,充电基础设施建设也随之蓬勃发展。新能源充电行业系统旨在提供高效、便捷的充电服务,满足电…...

(八)Java-Collection

一、Collection接口 1.特点 Collection实现子类可以存放多个元素,每个元素可以是Object; 有些Collection的实现类,可以存放重复的元素,有些不可以; 有些Collection的实现类,有些是有序的(Li…...

小程序高度问题背景scss

不同的机型&#xff0c;他的比例啥的都会不一样&#xff0c;同样的rpx也会有不同的效果。所以这里选择了取消高度。 <view class"box-border" :style"{padding-top: ${navHeight}px,}"><!-- 已登录 --><view v-if"userStore.userInfo&…...

HTML 日常开发常用标签

文章目录 HTML 日常开发常用标签1、基本结构标签2、内容标签3、多媒体标签4、表单标签5、列表和定义标签6、表格标签7、链接和图像8、元数据9、语义化标签&#xff08;HTML5新增&#xff09;10、框架和内联11、交互12、过时或不推荐使用的标签 HTML 日常开发常用标签 1、基本结…...

vue3表单验证的时候访问接口如果有值就通过否则不通过.主动去触发校验

页面有个身份证号码的校验。校验完身份证格式是否符合之后还要去访问接口查询这个用户是否存在。如果存在才通过验证。否则就校验不通过 <el-form ref"ruleFormRef" :model"form" label-width"140px" label-position"right" label…...

Cuppa CMS v1.0 任意文件读取(CVE-2022-25401)

漏洞简介&#xff1a; Cuppa CMS v1.0 administrator/templates/default/html/windows/right.php文件存在任意文件读取漏洞 漏洞环境&#xff1a; 春秋云镜中的漏洞靶标&#xff0c;CVE编号为CVE-2022-25401 漏洞复现 弱口令行不通 直接访问administrator/templates/defau…...

C# Dictionary 使用指南

C# Dictionary 使用指南 1. 简介 Dictionary<TKey, TValue> 是 C# 中一个非常常用的泛型集合类&#xff0c;用于存储键值对&#xff08;Key-Value Pair&#xff09;。它可以根据键快速查找对应的值&#xff0c;因此在需要快速查找和检索数据的场景下非常高效。 2. 基本…...

基于Spark的电商供应链系统的设计与实现

目录 1.研究背景与意义 2、国内外研究现状 3、相关理论与技术 &#xff08;一&#xff09;分布式计算系统Spark &#xff08;二&#xff09;数据仓库Hive &#xff08;三&#xff09;读取服务器本地磁盘的日志数据Flume &#xff08;四&#xff09;分布式消息队列Kafka …...

MYSQL数据备份与恢复(mysqldump)

MySQL备份之mysqldump 表级别备份还原 格式&#xff1a;mysqldump [OPTIONS] database [tables] 实例&#xff1a;把db_user数据库中的tb_student数据表进行备份 备份&#xff1a;#mysqldump db_user tb_student > /tmp/sqlbak/tb_student.sql -p 还原&#xff1a;#mysql 数…...

从零开始用react + tailwindcs + express + mongodb实现一个聊天程序(二)

1.安装mogondb数据库 参考MongoDB安装配置教程&#xff08;详细版&#xff09;_mongodb安装详细步骤-CSDN博客 安装mondbcompass数据库连接工具 参考https://www.mongodb.com/zh-cn/docs/compass/current/connect/ 2.后端服务 1.创建src文件夹 并在src文件夹下创建 index…...

server.servlet.session.timeout: 12h(HTTP 会话的超时时间为 12 小时)

从你提供的配置文件&#xff08;应该是 Spring Boot 的 application.yml 或 application.properties 文件&#xff09;来看&#xff0c;以下部分与会话超时时间相关&#xff1a; server:servlet:session:timeout: 12h # timeout: 30cookie:name: VENDER_SID会话超时时间的…...

MySQL--聚集索引、辅助索引、回表查询和覆盖索引的原理

在MySQL中&#xff0c;索引是提高查询性能的核心工具。理解聚集索引、辅助索引、回表查询和覆盖索引的原理&#xff0c;对于优化数据性能至关重要。以下是对这些概念的详细解释以及优化方法。 一、聚集索引&#xff08;Clustered Index&#xff09; 聚集索引决定了表中数据的…...

使用vscode导出Markdown的PDF无法显示数学公式的问题

我的硬件环境是M2的MacBook air&#xff0c;在vscode中使用了Markdown PDF来导出md文件对应的PDF。但不管导出html还是PDF文件&#xff0c;数学公式都是显示的源代码。 我看了许多教程&#xff0c;给的是这个方法&#xff1a;在md文件对应的html文件中加上以下代码&#xff1a…...

从“记住我”到 Web 认证:Cookie、JWT 和 Session 的故事

文章目录 1. 初识 HTTP&#xff1a;一场没有记忆的对话2. Cookie&#xff1a;网站的“记忆” &#x1f36a;3. Session&#xff1a;服务端的“记忆” &#x1f3af;4. JWT&#xff1a;让用户自己带着“身份证” &#x1f511;5. Cookie vs Session vs JWT 总结 &#x1f4ca;6.…...