迪士尼机器人BD-X 概况
这些机器人代表着迪士尼故事叙述与非凡创新的完美结合。它们不仅栩栩如生,还配备了先进的技术。
-迪士尼幻想工程研发部高级副总裁凯尔·劳克林
幕景
BDX 机器人是由华特迪士尼公司的研究和幻想工程部门利用NVIDIA人工智能技术 (AI)开发的现实世界机器人,这是他们与 NVIDIA 和Google DeepMind AI 实验室合作的一部分。最初的机器人开发不到一年,用两个操纵杆手动操作,但它们比迪士尼现有的电子动画系统更复杂,因为幻想工程师使用基于艺术家动画的强化学习,让机器人通过实时模拟在各种地形上导航时以模仿的动作移动。每个机器人都有两台 NVIDIA Jetson 电脑,头部和颈部有 4 个执行器,每条腿有 5 个执行器。每个单元都由 3D 打印的组件、传感器、摄像头和 LED 组成。[ 3 ] 2023 年10 月 ,迪士尼幻想工程师向大家揭开了它们神秘的面纱,当时三台“训练中的机器人”在加州迪士尼乐园的星球大战:银河边缘主题园区漫游。 “游戏测试”表明,这些机器人可以在不平坦的地面上行走,跳舞时不会失去平衡,并能根据预设的反应与客人“互动”。[ 4 ]
BDX 机器人随后于2025 年3月 8 日在 Disney Experience SXSW 大会上亮相,幻想工程师们在会上解释了他们通过强化学习和模拟技术研发机器人的过程。乔恩·费儒随后透露,BDX 机器人将出现在2026 年的电影《曼达洛人》和《格罗古》中。它们还将于 2025 年登陆佛罗里达州的华特迪士尼世界、巴黎迪士尼乐园[ 10 ] ,届时将用铣削零件取代 3D 打印零件以适应佛罗里达的炎热天气。[ 3 ]十天后的3 月 18日,在 NVIDIA 的AI 大会上,首席执行官黄仁勋宣布,公司正与 Google DeepMind 和迪士尼研究院合作,进一步开发 Newton,这是一款先进的物理引擎,可让 AI 模型进行精确而高速的训练。一台名为“蓝色”的 BDX 机器人与黄仁勋一起在舞台上亮相,与 Newton 一起运行。[ 11 ] NVIDIA 的开源了蓝色BDX(Blue Open-Source Robot)。
disney 对机器人的思考
我们始终从角色入手。科技只是工具——我们用它来服务于故事和情感。对于BDX,这意味着要思考角色如何移动、如何表达情感,以及游客如何与他们进行有意义的互动。从他们的身体比例,到头部倾斜的方式,再到双脚落地的方式,我们精心设计,力求营造逼真的氛围。此外,我们还加入了人性化的元素:幕后木偶师将角色的细微变化展现得淋漓尽致,让角色栩栩如生。
在迪士尼,我们打造的并非工厂或配送中心的机器人——我们打造的是能让你拥有情感的机器人。这是一个截然不同的挑战。我们正在将情商引入机器人领域,并且正在大规模推进。在此过程中,我们与更广泛的机器人社区分享新的思维方式。这提醒我们,这个行业的未来不仅仅在于机器人能做什么,而在于它们能成为什么样的人。
强化学习让我们能够实现一些令人惊叹的成就:在实际制造机器人之前,我们可以在模拟环境中训练数百个版本的机器人。这意味着更快的迭代速度、更智能的移动方式,以及更多时间专注于真正重要的事情——创造一个引人入胜的角色。它缩短了从创意到情感联系的路径,这对于我们这些故事讲述者来说意义非凡。
BDX 完美诠释了我们的理念:故事至上,科技服务于故事。创新之处在于,我们现在能够在实时、面向宾客的环境中展现出更佳的响应能力、更逼真的肢体语言和更迷人的魅力。这并非噱头或昙花一现的瞬间——而是一个不断发展的角色平台。而我们才刚刚起步。
英伟达牛顿开源物理引擎
迪士尼正在利用一款名为“牛顿”(Newton)的全新人工智能物理引擎来增强其下一代机器人角色,包括迪士尼乐园里的BDX机器人。“牛顿”由迪士尼研究院、NVIDIA和谷歌DeepMind合作开发,旨在提升机器人的模拟能力和性能。
Newton 是一个开源物理引擎,旨在帮助机器人在复杂环境中学习和操作。迪士尼幻想工程正在利用这个平台改进其机器人角色的移动、互动以及与游客互动的方式。
Newton 引擎基于 NVIDIA Warp 构建,该系统利用 NVIDIA GPU 技术加速机器人模拟。它还集成了 MuJoCo-Warp,后者是一款专为处理复杂机器人动力学而设计的物理引擎,可实现更快、更精确的运动。
GR00T N1
GR00T N1 模型作为基础工具提供,全球开发者可以对其进行预训练,以用于各种机器人应用。NVIDIA 创始人兼首席执行官黄仁勋表示:“通用机器人的时代已经到来。借助 NVIDIA Isaac GR00T N1 以及全新的数据生成和机器人学习框架,世界各地的机器人开发者将开启 AI 时代的下一个前沿。”
GR00T N1 模型采用受人类认知启发的双系统架构。“系统 1”模拟类似于人类反射的直觉动作,而“系统 2”则借助视觉语言模型,允许进行更慢、更周到的决策。系统 1 从人类演示数据和通过 NVIDIA Omniverse 平台生成的合成数据中进行学习。
Agility Robotics、Boston Dynamics、Mentee Robotics 和 NEURA Robotics 等领先的机器人公司都是 GR00T N1 的早期采用者。
BDX内部结构
从机械结构看,每个腿有5 个自由度,脖子和头有4个自由度,头上的天线有一个自由度。
内部有一个通信板,一个电池模块,一个IMU,两台英伟达jetson 计算机放置在头部。一个无线接收机(低功耗LoRa),连接遥控器,两个深度传感器。
一些细节
其它一些数据
总重量 15.4 公斤,其中:
躯干部分5.8公斤
脖子和头2.4 公斤
每条腿 3.6 公斤
高度: 0.66 米
膝盖 峰值扭矩:34Nm,速度 20rad
脖子 峰值扭矩 24Nm
使用两种执行器
半直驱驱动器(Quasi Direct Drive)通常是无刷电机+行星减速机结构
相关文章:

迪士尼机器人BD-X 概况
这些机器人代表着迪士尼故事叙述与非凡创新的完美结合。它们不仅栩栩如生,还配备了先进的技术。 -迪士尼幻想工程研发部高级副总裁凯尔劳克林 幕景 BDX 机器人是由华特迪士尼公司的研究和幻想工程部门利用NVIDIA人工智能技术 (AI)开发的现实世界机器人,…...

UE5骨骼插槽蓝图
首先在人物骨骼处添加插槽并命名,然后再选择添加预览资产把你要的模型(静态网格体)放上去。 选择绑定的骨骼再去右边相对位置、旋转等调整物体。 再去人物蓝图里面写就ok了...
移动应用开发:自定义 View 处理大量数据的性能与交互优化方案
实现 1 万条数据下流畅滑动与灵敏交互的完美平衡。 一、数据渲染优化:从 1 万条到丝滑体验 (一)视图复用机制 视图复用是提升大量数据渲染性能的关键策略。以一个简单的自定义列表视图为例,我们可以构建如下的复用池管理机制&a…...

绘制拖拽html
<!DOCTYPE html> <html lang"zh-CN"> <head> <meta charset"UTF-8" /> <meta name"viewport" content"widthdevice-width, initial-scale1" /> <title>拖拽绘制矩形框 - 可移动可调整大小</ti…...
C++结构体介绍
结构体的定义 在C中,结构体(struct)是一种用户定义的数据类型,允许将不同类型的数据组合在一起。结构体的定义使用struct关键字,后跟结构体名称和一对花括号{},花括号内包含成员变量的声明。 struct Pers…...

ggplot2 | GO barplot with gene list
1. 效果图 2. 代码 数据是GO的输出结果,本文使用的是 metascape 输出的excel挑选的若干行。 # 1. 读取数据 datread.csv("E:\\research\\scPolyA-seq2\\GO-APA-Timepoint\\test.csv", sep"\t") head(dat)# 2. 选择所需要的列 dat.usedat[, c(…...
PostgreSQL 的 pg_advisory_lock 函数
PostgreSQL 的 pg_advisory_lock 函数 pg_advisory_lock 是 PostgreSQL 提供的一种应用级锁机制,它不锁定具体的数据库对象(如表或行),而是通过数字键值来协调应用间的并发控制。 锁的基本概念 PostgreSQL 提供两种咨询锁(advi…...
docker 镜像的导出和导入(导出完整镜像和导出容器快照)
一、导出原始镜像 1. 使用 docker save 导出完整镜像 适用场景:保留镜像的所有层、元数据、标签和历史记录,适合迁移或备份完整镜像环境。 操作命令 docker save -o <导出文件名.tar> <镜像名:标签>示例:docker save -o milvu…...

系统思考:短期困境与长期收益
最近在项目中,一直有学员会提到一个议题,如何平衡当前困境和长期收益? 我的思考是在商业和人生的路上,我们常常听到“鱼和熊掌不可兼得”的说法,似乎短期利益和长期目标注定是对立的。但事实上,鱼与熊掌是…...
4.2【LLaMA-Factory实战】金融财报分析系统:从数据到部署的全流程实践
【LLaMA-Factory实战】金融财报分析系统:从数据到部署的全流程实践 一、引言 在金融领域,财报分析是投资决策的核心环节。传统分析方法面临信息提取效率低、风险识别不全面等挑战。本文基于LLaMA-Factory框架,详细介绍如何构建一个专业的金…...

Cjson格式解析与接入AI大模型
JSON格式的解析与构造 基本概念 JSON是JavaScript Object Notation的简称,中文含义为“JavaScript 对象表示法”,它是一种数据交换的文本格式,而不是一种编程语言。 JSON 是一种轻量级的数据交换格式,采用完全独立于编程语言的…...

基于英特尔 RealSense D455 结构光相机实现裂缝尺寸以及深度测量
目录 一,相机参数规格 二,结合YOLO实例分割实现裂缝尺寸以及深度测量 2.1 应用场景 2.2 实现流程 2.3 效果展示 2.4 精度验证 2.5 实物裂缝尺寸以及深度测量效果展示 一,相机参数规格 英特尔 RealSense D455 是英特尔 RealSense D400 系…...

Nacos源码—7.Nacos升级gRPC分析四
大纲 5.服务变动时如何通知订阅的客户端 6.微服务实例信息如何同步集群节点 6.微服务实例信息如何同步集群节点 (1)服务端处理服务注册时会发布一个ClientChangedEvent事件 (2)ClientChangedEvent事件的处理源码 (3)集群节点处理数据同步请求的源码 (1)服务端处理服务注册…...

TIME - MoE 模型代码 3.2——Time-MoE-main/time_moe/datasets/time_moe_dataset.py
源码:GitHub - Time-MoE/Time-MoE: [ICLR 2025 Spotlight] Official implementation of "Time-MoE: Billion-Scale Time Series Foundation Models with Mixture of Experts" 这段代码定义了一个用于时间序列数据处理的 TimeMoEDataset 类,支…...

【某OTA网站】phantom-token 1004
新版1004 phantom-token 请求头中包含phantom-token 定位到 window.signature 熟悉的vmp 和xhs一样 最新环境检测点 最新检测 canvas 下的 toDataURL方法较严 过程中 会用setAttribute给canvas 设置width height 从而使toDataURL返回不同的值 如果写死toDataURL的返回值…...

OrangePi Zero 3学习笔记(Android篇)2 - 第一个C程序
目录 1. 创建项目文件夹 2. 创建c/cpp文件 3. 创建Android.mk/Android.bp文件 3.1 Android.mk 3.2 Android.bp 4. 编译 5. adb push 6. 打包到image中 在AOSP里面添加一个C或C程序,这个程序在Android中需要通过shell的方式运行。 1. 创建项目文件夹 首先需…...

DeepResearch深度搜索实现方法调研
DeepResearch深度搜索实现方法调研 Deep Research 有三个核心能力 能力一:自主规划解决问题的搜索路径(生成子问题,queries,检索)能力二:在探索路径时动态调整搜索方向(刘亦菲最好的一部电影是…...
使用大语言模型进行机器人规划(Robot planning with LLMs)
李升伟 编译 长期规划在机器人学领域可以从经典控制方法与大型语言模型在现实世界知识能力的结合中获益。 在20世纪80年代,机器人学和人工智能(AI)领域的专家提出了莫雷奇悖论,观察到人类看似简单的涉及移动和感知的任务&#x…...

【论文阅读】基于客户端数据子空间主角度的聚类联邦学习分布相似性高效识别
Efficient distribution similarity identification in clustered federated learning via principal angles between client data subspaces -- 基于客户端数据子空间主角度的聚类联邦学习分布相似性高效识别 论文来源TLDR背景与问题两个子空间之间的主角(Principa…...

Elasticsearch知识汇总之ElasticSearch部署
五 ElasticSearch部署 部署Elasticsearch,可以在任何 Linux、MacOS 或 Windows 机器上运行 Elasticsearch。在Docker 容器 中运行 Elasticsearch 。使用Elastic Cloud on Kubernetes 设置和管理 Elasticsearch、Kibana、Elastic Agent 以及 Kubernetes 上的 Elasti…...

ROBOVERSE:面向可扩展和可泛化机器人学习的统一平台、数据集和基准
25年4月来自UC Berkeley、北大、USC、UMich、UIUC、Stanford、CMU、UCLA 和 北京通用 AI 研究院(BIGAI)的论文“ROBOVERSE: Towards a Unified Platform, Dataset and Benchmark for Scalable and Generalizable Robot Learning”。 数据扩展和标准化评…...
LVGL的核心:lv_timer_handler
文章目录 🧠 一句话总结 LVGL 的运行核心:🔁 1. while(1) 主循环中的 lv_task_handler()⏱️ 2. lv_timer_handler() 定时器调度核心✅ 并发控制✅ 关键行为流程:🌀 任务执行逻辑:🧮 计算下一次…...

(41)VTK C++开发示例 ---qt使用vtk最小示例
文章目录 1. 概述2. CMake链接VTK3. main.cpp文件4. 演示效果 更多精彩内容👉内容导航 👈👉VTK开发 👈 1. 概述 本文演示了在Qt中使用VTK的最小示例程序,使用VTK创建显示一个锥体; 采用Cmake作为构建工具&a…...
⭐️⭐️⭐️【课时1:大模型是什么?】学习总结 ⭐️⭐️⭐️ for《大模型Clouder认证:基于百炼平台构建智能体应用》认证
一、学习目标 概要 通过学习《课时1:大模型是什么?》,全面了解大模型的基础概念、核心特点、发展脉络及阿里云在大模型领域的布局,为后续基于百炼平台构建智能体应用的实践操作打下坚实的理论基础。 具体目标列表 理解人工智能到大模型的演变逻辑,明确大模型在AI发展历…...

OS7.【Linux】基本指令入门(6)
目录 1.zip和unzip 配置指令 使用 两个名词:打包和压缩 打包 压缩 Linux下的操作演示 压缩和解压缩文件 压缩和解压缩目录 -d选项 2.tar Linux下的打包和压缩方案简介 czf选项 xzf选项 -C选项 tzf选项 3.bc 4.uname 不带选项的uname -a选项 -r选项 -v选项…...

国标GB28181视频平台EasyCVR安防系统部署知识:如何解决异地监控集中管理和组网问题
在企业、连锁机构及园区管理等场景中,异地监控集中管控与快速组网需求日益迫切。弱电项目人员和企业管理者亟需整合分散监控资源,实现跨区域统一管理与实时查看。 一、解决方案 案例一:运营商专线方案 利用运营商专线,连接各分…...

O2O上门服务如何颠覆传统足浴行业?真实案例分析
在湖南经营传统足浴店的张总最近遇到了件让他哭笑不得的事。原本他的门店生意还算稳定,虽然这两年行情不好,但靠着老顾客还能勉强维持。可谁想到,一次好心帮忙,竟让他发现了行业的新天地。 几年前,张总的一位做砂石生意…...

金仓数据库永久增量备份技术原理与操作
先用一张图说明一下常见的备份方式 为什么需要永久增量备份 传统的数据库备份方案通常是间隔7天对数据库做一次全量备份(完整备份),每天会基于全量备份做一次增量备份,如此循环,这种备份方案在全备数据量过大场景下…...

19、HashTable(哈希)、位图的实现和布隆过滤器的介绍
一、了解哈希【散列表】 1、哈希的结构 在STL中,HashTable是一个重要的底层数据结构, 无序关联容器包括unordered_set, unordered_map内部都是基于哈希表实现 哈希表又称散列表,一种以「key-value」形式存储数据的数据结构。哈希函数:负责将…...
函数级重构:如何写出高可读性的方法?
1. 引言:为什么方法级别的重构如此重要? 在软件开发中,方法(函数)是程序逻辑的基本单元。一个高质量的方法不仅决定了程序是否能正常运行,更直接影响到: 代码的可读性:能否让其他开发者快速理解可维护性:未来修改是否容易出错可测试性:是否便于编写单元测试协作效率…...