“野生钢铁侠 “ 稚晖君一连亮出5 款智元人形机器人,地表最强!
打麻将、拆快递、纽扣穿针,还能做 30KG 重物提拉!
沉寂一年,稚晖君带着他的二代机器人全家桶重磅回归,秀出的各种新技能令人眼前一亮。
智东西 8 月 18 日报道,今日," 野生钢铁侠 " 稚晖君一连亮出5 款智元人形机器人,全程整活儿,前有机器人开瓶盖、倒可乐、搬重物,后有机器人上场主持、穿针、搓麻将、推销卖车,最后还有老父亲稚晖君陪伴 " 夹子手机器娃 " 蹒跚学步的感人成长 Vlog,并甩出 "0 元购" 终极大招。
智元不仅首次定义具身智能的五级技术演进路线图,而且公布了最新商业化进展:团队面向量产做了大量的正向设计分析、系统方案重构、核心部件自研;远征系列产品规模量产正在进行,接收到来自制造业、交互服务行业等不同客户的大量订单,整个团队都在加班加点准备批量交付。
稚晖君还秀了一波大格局,化身 " 赛博源神 ",从数据集、设计图纸、软件框架、中间件源码到运控算法,通通开源,要让人人可造人形机器人。
智元机器人此次发布了 "远征" 与 "灵犀" 两个系列,共 5 款商用机器人新品,包括远征 A2、远征 A2-W、远征 A2-Max、灵犀 X1以及灵犀 X1-W。
发布会一开场,稚晖君直接和远征 A2 机器人家族的几位成员演了一出 " 人机小品 "。
远征 A2 系列秀出不少新技能,比如远征 A2-W 机器人用开瓶器开可乐瓶、操作榨汁机做出一杯 " 葡汽可乐 "、精准将榨汁机中的饮料倒入杯中。
" 大力士 " 远征 A2-Max 则原地抱起 80 多斤的重物。整体来看,机器人的肢体动作流畅灵巧,相比去年 8 月首次出场时,显然娴熟了许多,但动作属实有点太过缓慢,光是做饮料就花了整整 3 分钟。
演完小品后,稚晖君转身走入发布会现场,一台远征 A2 机器人直接登台当主持人,介绍了远征 A2 系列机器人家族。
远征 A2 系列包括远征 A2、远征 A2-W和远征 A2-Max三款机器人,分别针对交互服务、柔性制造和重载特种场景,内嵌大语言模型,可实现超拟人音色语音对话,各种技能都可以持续学习。
▲远征 A2 语音交互现场演示
作为今天发布会的 "One More Thing",稚晖君亮出自家的首款模块化机器人灵犀 X1,它个头不大,可以看作是 " 青春版 " 机器人,在成本方面有大幅优化。
稚晖君带领不到 10 人的团队,在不到 3 个月的时间里,就把灵犀 X1 从概念做成了整机。灵犀 X1 从组装完成到今天,还不到两周的时间,因此是 " 还没满月就出来干活了 "。
值得一提的是,灵犀 X1 有个 "机机模式",手机可以直接放到机器人里,做机器人的 " 大脑 ",这个 " 脑洞 " 确实够大。
灵犀 X1 的屏幕可以定制画面,比如显示稚晖君自己的脸,颇有一种机器人带上了 Vision Pro 的既视感。
为了避免 " 价格战 ",稚晖君直接给灵犀 X1 定价为 "0 元 ",全面开源。
在应用场景方面,远征 A2 可以在 4S 店内作销售导购,多语言交流,了解用户需求,例如听到顾客想喝水就去拿水,路上可以自动避障;在工厂里,远征 A2 基本可以完成质检上料、货架摆放货物等工作。
一、全身40+主动自由度,灵巧手19自由度,四大子域核心系统
人形机器人远征 A2全身采用外骨骼设计,身高体重都与成年人类相仿,可续航超 2 小时,行走速度每秒 1 米。
在外形方面,远征 A2 比上一代远征 A1 更像人了,脑袋更圆、四肢比例更协调,腿部形态从 A1 的反屈膝设计变为了正屈膝。
远征 A2-W由一个人形上半身和背后的机械身体组成,主要用于工业制造领域,其主动自由度 22 个,续航超过 5 小时,每秒可行走 1.5 米以上。双臂写作、多模态感知、持久作业等是远征 A2-W 针对制造场景进行的针对性优化。
远征 A2-Max最大的特点就是力大无穷,其主动自由度达到 53 个,双臂可称重 80 斤以上。
远征 A2 系列产品的工业设计采用了家族化 ID 语言,有助于实现量产以及独特的视觉识别特征。
在核心零部件上,远征 A2 系列借鉴新能源汽车的系统,将机器人的核心系统划分为动力域、感知域、通信域、控制域四个子域。
在动力域方面,远征 A2 的关节模组在上一代的基础上面向量产做了大量的优化和测试,其中部分关节电机的峰值扭矩可以达到 512 Nm。
视触觉灵巧手也全面升级,拥有 19 个自由度,其中 12 个为主动关节。
基于灵活的手部关节和视觉、触觉感知,灵巧手现在可以轻松拧螺丝、拆快递。
通用的物品抓取更是不在话下,还能双手配合倒水。
纽扣穿针这样的精细活,灵巧手也能轻松实现。
远征 A2 拥有 7 自由度双臂,单臂自由度达到 3+2+2+N,臂展 60 厘米。双臂内置六维力传感器,可以配合实现更复杂的操作。
感知域方面,远征 A2 增加了激光雷达、全景相机等传感器,可实现全域安全、局部避障。基于自研的系统算法,机器人对环境的理解也大幅提升。
通信域方面,智元团队自研了一套轻量化、高性能的智能机器人通信框架 AimRT,可以完全不依赖第三方中间件。
值得一提的是,这一框架将在下个月底全面开源。
控制域方面,远征 A2 在去年 Model base 的基础上增加了数据驱动的 Learning base,使用两种方式共同驱动机器人的行为优化,行走起来更稳定自然。
在运动算法层面,智元构建了一套由自然语言指令集驱动,可以适配不同机器人硬件的 AgentOS。
基于机器人本体,AgentOS 定义了技能库,通过多模态大模型去定义机器人的状态,再由任务执行器来驱动各种原子技能去进行任务操作,然后再进行反馈来获取这信号。
AgentOS 目前还在预研初期,不过从开头的自制饮料等演示来看,它已经实现了比较好的任务编排效果。
远征 A2 的整体框架参考强化学习来构建,整个机器人是一个软硬件非常复杂的系统,既涉及到内部各个硬件模块的协同和部署,也需要软件跟算法做高效的配合
智元构建了开放软硬件平台 AIMA,将远征 A2 的复杂系统的二次开发能力,开放给外部更多的开发者,共同去构建整个生态。
二、交互服务、柔性制造领域落地,自研数据采集全流程开源
稚晖君首次公布了智元机器人的具身智能技术演进路线图,从 G1 到 G5 分别对应基础自动化、通用原子技能、端到端操作技能、端到端操作大模型以及最终的AGI,类似自动驾驶领域的 L1、L2、L3 分级。
去年一年,智元机器人在 G2、G3 阶段并行研发,其中基于 G2 的原子能力已经实现实际场景的落地应用。
例如在交互服务场景中,远征 A2 可以针对客户进行精准营销。在汽车 4S 店内,它可以作为导购为客户提供服务。基于记忆能力,远征 A2 能够知道顾客上次看中的是哪款车,并主动推荐体验。
基于多模态大模型,远征 A2 能对不同意图指令精准识别。比如当小朋友说口渴了,远征 A2 会主动询问需要什么饮品,并取回来交给她。
在行进的路上,远征 A2 还能智能避障,躲开碰到的人或物品。
基于语言动作大模型,远征 A2 可以端到端生成自然动作,比如说 "1 万现金优惠 " 时,它非常自然地比了个 1 的手势。
虽然从人形机器人演进的角度来看,远征 A2 已经实现了很大的进步,但仅凭其现在慢吞吞的说话和做事效率,离替代人类销售还差得远。
在柔性制造场景中,远征 A2-W 可以基于多模态感知、双臂协作、原子模块化等能力,实现工件投料、上下料、质检、搬运等,还能在不同工序间自动转场。
智元具身智能数据系统 AIDEA是稚晖君放出的另一个关键大招,包括仿真平台、机器学习平台、功能部署平台、数据平台,可以说是智元机器人从实验室到工厂再到量产商用的关键基础。
具身领域有一个很大的痛点,就是真实场景数据稀缺。它不像大语言模型有海量的互联网免费数据,也不像自动驾驶每天有上百万汽车在路上采集到的真实数据。
为了解决这一痛点,智元自研了具身智能数据系统 AIDEA,形成了一套全流程稳定可靠的数据采集方案。
AIDEA 将在今年 Q4 全面开源百万条真机、千万条仿真数据集,此外,今年下半年智元将会落地百台以上机器人专门用于数据采集。
三、首个模块化机器人灵犀 X1 亮相,团队不到 10 人,2 个月从概念到整机
在发布会临近尾声的时候,稚晖君还带来了一个One more thing:智元机器人首个模块化机器人灵犀 X1,就藏在发布会开头远征 A2-Max 举起的箱子里。
灵犀 X1 由智元 X-Lab打造,这是智元于 6 月新成立的一个实验室,也叫 "稚晖君实验室",专门做一些前沿技术创新类研究。这台灵犀 X1,是由不到 10 个人,在两个多月的时间内从无到有自研得到的。
灵犀 X1 身高 133 厘米,体重不到 66 斤,十分小巧。其手臂使用串并联混合结构,整臂重量只有 2kg,这使得它可以支持更灵活的运动、更高效的控制。
灵犀 X1 还创新推出 "机机模式",也就是机器人 + 手机,把手机放到机器人的 " 头 " 里来做大脑,让手机本身的麦克风、扬声器、屏幕等硬件,以及网络、AI 算力等软件能力,为机器人带来新的突破。
通过在远征系列上积累的各种研发经验,灵犀 X1 上也自研了两款全新的关节,其全身 30 多个自由度,均由这两款关节提供支持,做到了极致的标准化。
灵犀 X1 也推出了用于数据采集的机器人灵犀 X1-W,相比远征 A2-W 成本更低。
就像稚晖君本人一样,智元机器人可谓是将开源贯彻到底。灵犀 X1 的本体设计图纸、软件框架、中间件源码,以及基础运控算法都将全面开源。
四、沉寂一年,华为天才少年 " 闷声干大事 "
自智元机器人首款人形机器人远征 A1 发布,刚好过去一整年的时间。如果说远征 A1 是从零到一的突破,那么这次发布的远征 A2,则是在从 1 到 100 的 AGI 之路上,迈出的重要一步。
智元机器人成立于去年 2 月,致力于研发具身智能机器人产品及应用生态。带着创始人之一稚晖君的光环,智元机器人从诞生之初就备受科技圈关注。
稚晖君本名彭志辉,本硕均毕业于电子科技大学,毕业后曾在 OPPO 研究院 AI 实验室担任算法工程师,随后在 2020 年加入 " 华为天才少年计划 ",从事昇腾 AI 芯片和 AI 算法相关研究工作。
那一年的华为天才少年,总共有 6 名。
▲稚晖君华为天才少年签约纪念
稚晖君的另一个身份,是科技圈知名 up 主,因在 B 站发布的一系列硬核科技产品视频而闻名。
视频中的他软硬件 " 通吃 ",从写代码、画电路图,到建模、装配全部 DIY,独立制作了给葡萄缝针的钢铁侠机械臂、" 能够自己行走 " 不摔跤的自行车、模块化机械键盘等有趣的项目。
▲稚晖军 B 站主页
2022 年 12 月,稚晖君宣布已从华为离职创业,次年 2 月就正式成立了智元机器人(上海智元新创技术有限公司),作为联合创始人之一担任 CTO 和首席架构师。
智元机器人也备受资本青睐,目前已完成 A3 轮融资,投资方包括比亚迪、BV 百度风投、红杉中国、高瓴创投等知名企业或机构,估值也早在去年就超过 10 亿美元,晋升独角兽。
结语:人形机器人明星独角兽重磅 " 回归 "
就在上周,美国人形机器人创企 Figure 刚刚发布第二代机器人 Figure 02,要做 " 地表最强人形机器人 "。Figure 02 第四代手部拥有 16 个自由度,比特斯拉的擎天柱二代多了 5 个,而远征 A2 则更胜一筹达到 19 个。
在自媒体时代,稚晖君就时常 " 闷声干大事 ",半年做一个项目惊艳全场。在过去一年中,智元机器人一直比较低调,此次时隔一年再办发布会,稚晖君果然没让大家失望,不仅甩出超强远征 A2 全家桶,还带来了灵犀 X1 这一惊喜新品。光是现场演示,就已经打败了一大半同类产品。
在生态方面,智元看起来是要走和稚晖君本人同样的开源路线,让更多开发者参与进来,共同为远征 A2、灵犀 X1 的迭代添砖加瓦。
相关文章:

“野生钢铁侠 “ 稚晖君一连亮出5 款智元人形机器人,地表最强!
打麻将、拆快递、纽扣穿针,还能做 30KG 重物提拉! 沉寂一年,稚晖君带着他的二代机器人全家桶重磅回归,秀出的各种新技能令人眼前一亮。 智东西 8 月 18 日报道,今日," 野生钢铁侠 " 稚晖君一连亮…...

JSON Web Token (JWT): 理解与应用
JWT(JSON Web Token)是一种开放标准(RFC 7519),它定义了一种紧凑且自包含的方式,用于在各方之间以JSON对象的形式安全地传输信息。JWT通常用于身份验证和授权目的,因为它可以使用JSON对象在各方…...
LeetCode面试题Day12|LC209 长度最小的子数组、LC30 串联所有单词的子串
题目一: 指路: . - 力扣(LeetCode)209 长度最小的子数组 思路与分析: 滑动窗口,目的在于降低算法的时间复杂度,每次只维护一定长度的数组而非原数组的全部元素。那么既然需要长度࿰…...

【开端】JAVA泛型类的使用
一、这是一个类 public class CommonVo<D extends CommonDao> implements Serializable { 我们来探讨一样 CommonVo<D extends CommonDao> 这个尖括号里到底能写啥。 首先这是一个泛型类型D ,D类继承了CommonDao,说明尖括号里只要放入一…...

mp3转换器免费有哪些?6个音频转换器助你一键转换各种音频
音乐如同生活的调味剂,让每一个平凡瞬间都跃动着不凡的旋律。 但有时候,当你想把这些歌曲放到你的设备上时,却发现格式不兼容,无法播放。 别担心!接下来,我们将介绍几款免费mp3转换工具,它们能…...

力扣爆刷第174天之TOP200五连刷136=140(最小k数、字典序、跳跃游戏)
力扣爆刷第174天之TOP200五连刷136140(最小k数、字典序、跳跃游戏) 文章目录 力扣爆刷第174天之TOP200五连刷136140(最小k数、字典序、跳跃游戏)一、LCR 159. 库存管理 III二、450. 删除二叉搜索树中的节点三、440. 字典序的第K小…...

蚁群算法原理与实战(Python、MATLAB、C++)
蚁群算法 1.蚁群算法来源 蚁群算法(Ant Colony Optimization,简称ACO)是一种模拟自然界中蚂蚁寻找食物路径行为的优化算法,主要用于解决组合优化问题。它的灵感来源于意大利学者Marco Dorigo在1992年提出的蚂蚁系统模型。 蚁群算…...

HTML静态网页成品作业(HTML+CSS)——非遗阜阳剪纸介绍设计制作(1个页面)
🎉不定期分享源码,关注不丢失哦 文章目录 一、作品介绍二、作品演示三、代码目录四、网站代码HTML部分代码 五、源码获取 一、作品介绍 🏷️本套采用HTMLCSS,未使用Javacsript代码,共有1个页面。 二、作品演示 三、代…...

如何做萤石开放平台的物联网卡定向?
除了用萤石自带的4G卡外,我们也可以自己去电信、移动和联通办物联网卡连接萤石云平台。 1、说在前面 注意:以下流程必须全部走完,卡放在设备上才能连接到萤石云平台。 2、大致流程 登录官网→下载协议→盖章(包括骑缝章&#…...
ptrade排坑日记——定时任务执行后,文件权限会变化。
前言 今天要和大家分享的是使用ptrade的定时任务过后,执行的时候,文件权限会发生变化! 一、问题描述 定时任务执行后, /home/fly/data/fundamentals_daily/all.pickle、/home/fly/data/valuation_new/all.pickle 文件权限会从…...

TILs 评分:TCGA 肿瘤浸润淋巴细胞病理切片深度学习评分!图片下载与可视化
生信碱移 病理切片的TILs评分 TCGA 数据库是最大的肿瘤组学公开数据库之一。尽管如此,更多的研究往往仅局限于关注 TCGA 中各类肿瘤样本的上游组学信息或基本病理特征,而忽略了对样本数字化 H&E 病理染色图像的进一步应用。 ▲ TCGA中肿瘤样本的病…...
【运维】如何在浏览器中查看和管理 Cookie 信息?
如何在浏览器中查看和管理 Cookie 信息 引言 Cookie 是我们日常浏览网页时经常遇到的一个重要概念。它们用于存储用户的登录状态、偏好设置以及其他相关信息,帮助网站提供个性化的体验。然而,很多人并不清楚如何在浏览器中找到并查看这些 Cookie 信息。本文将带您了解如何在…...

Selenium实战:深度解析Python中嵌套Frame与iFrame的定位与切换技巧,解决Selenium定位不到的问题
在Web自动化测试中,处理网页中的Frame和iFrame是常见的挑战之一。这些元素在网页中扮演着承载独立HTML文档的角色,使得直接定位或操作其中的元素变得复杂。Python的Selenium库提供了强大的工具来应对这些挑战,本文将详细介绍如何使用Selenium…...
机器学习笔记六-朴素贝叶斯
朴素贝叶斯(Naive Bayes) 是一种基于贝叶斯定理的简单而强大的分类算法,特别适用于文本分类等高维数据集。它被称为“朴素”,因为它假设特征之间是相互独立的,这在现实中可能不完全成立,但这种假设在许多实…...

解决Vue3+Ts打包项目时会生成很多的map文件
正常打包会生成.js和.map文件 怎么去解决它呢? 正常来说我们会在vite.config.ts配置我们的项目打包方式,如下:(我这里的target:es2022是为了支持模块中顶层await的使用) // Vite 配置文件 export default…...

MeterSphere接口测试脚本断言
MeterSphere接口测试脚本断言 我们在接口自动化测试过程中,经常遇到无论我们传入什么数据信息,只要响应体报文中某个字段为不固定的特定信息(如:或1或2或3),就符合预期,流程就可以继续…...

探索顶级PDF水印API:PDFBlocks(2024年更新)
引言 在一个敏感信息常常面临风险的时代,能够轻松高效地保护文档的能力至关重要。PDF水印已成为企业和个人寻求保护其知识产权、确保文件保密性的基本工具。 PDFBlocks 文字水印 API是什么? PDFBlocks API 提供了一个强大的解决方案,用于在…...
c语言开源库之uthash用法
目录 (1)uthash介绍和下载地址 (2)uthash基本用法 1.定义自己要使用的哈希表结构体 2.初始化哈希表的头指针 3.插入数据(不同key类型对应不同函数) 4.查找数据(不同key类型对应不同函数&a…...

OurTV v3.1.1 — 完全免费,播放流畅的电视直播软件
OurTV是一款专业的魔改大屏版开源电视直播软件,与“我的电视”类似,内含丰富的电视频道,完全免费且无广告,画质清晰,播放流畅,提供良好的观影体验。此外,该软件还提供手机版。 链接:…...

精武杯的部分复现
标红的为答案 计算机手机部分 1、请综合分析计算机和⼿机检材,计算机最近⼀次登录的账户名是?admin 2.请综合分析计算机和⼿机检材,计算机最近⼀次插⼊的USB存储设备串号是?S3JKNX0JA05097Y 3.请综合分析计算机和⼿机检材,谢弘…...
React Native 导航系统实战(React Navigation)
导航系统实战(React Navigation) React Navigation 是 React Native 应用中最常用的导航库之一,它提供了多种导航模式,如堆栈导航(Stack Navigator)、标签导航(Tab Navigator)和抽屉…...

Mybatis逆向工程,动态创建实体类、条件扩展类、Mapper接口、Mapper.xml映射文件
今天呢,博主的学习进度也是步入了Java Mybatis 框架,目前正在逐步杨帆旗航。 那么接下来就给大家出一期有关 Mybatis 逆向工程的教学,希望能对大家有所帮助,也特别欢迎大家指点不足之处,小生很乐意接受正确的建议&…...
渲染学进阶内容——模型
最近在写模组的时候发现渲染器里面离不开模型的定义,在渲染的第二篇文章中简单的讲解了一下关于模型部分的内容,其实不管是方块还是方块实体,都离不开模型的内容 🧱 一、CubeListBuilder 功能解析 CubeListBuilder 是 Minecraft Java 版模型系统的核心构建器,用于动态创…...

(二)原型模式
原型的功能是将一个已经存在的对象作为源目标,其余对象都是通过这个源目标创建。发挥复制的作用就是原型模式的核心思想。 一、源型模式的定义 原型模式是指第二次创建对象可以通过复制已经存在的原型对象来实现,忽略对象创建过程中的其它细节。 📌 核心特点: 避免重复初…...

DIY|Mac 搭建 ESP-IDF 开发环境及编译小智 AI
前一阵子在百度 AI 开发者大会上,看到基于小智 AI DIY 玩具的演示,感觉有点意思,想着自己也来试试。 如果只是想烧录现成的固件,乐鑫官方除了提供了 Windows 版本的 Flash 下载工具 之外,还提供了基于网页版的 ESP LA…...
【决胜公务员考试】求职OMG——见面课测验1
2025最新版!!!6.8截至答题,大家注意呀! 博主码字不易点个关注吧,祝期末顺利~~ 1.单选题(2分) 下列说法错误的是:( B ) A.选调生属于公务员系统 B.公务员属于事业编 C.选调生有基层锻炼的要求 D…...

ArcGIS Pro制作水平横向图例+多级标注
今天介绍下载ArcGIS Pro中如何设置水平横向图例。 之前我们介绍了ArcGIS的横向图例制作:ArcGIS横向、多列图例、顺序重排、符号居中、批量更改图例符号等等(ArcGIS出图图例8大技巧),那这次我们看看ArcGIS Pro如何更加快捷的操作。…...
Xen Server服务器释放磁盘空间
disk.sh #!/bin/bashcd /run/sr-mount/e54f0646-ae11-0457-b64f-eba4673b824c # 全部虚拟机物理磁盘文件存储 a$(ls -l | awk {print $NF} | cut -d. -f1) # 使用中的虚拟机物理磁盘文件 b$(xe vm-disk-list --multiple | grep uuid | awk {print $NF})printf "%s\n"…...

day36-多路IO复用
一、基本概念 (服务器多客户端模型) 定义:单线程或单进程同时监测若干个文件描述符是否可以执行IO操作的能力 作用:应用程序通常需要处理来自多条事件流中的事件,比如我现在用的电脑,需要同时处理键盘鼠标…...
MySQL 索引底层结构揭秘:B-Tree 与 B+Tree 的区别与应用
文章目录 一、背景知识:什么是 B-Tree 和 BTree? B-Tree(平衡多路查找树) BTree(B-Tree 的变种) 二、结构对比:一张图看懂 三、为什么 MySQL InnoDB 选择 BTree? 1. 范围查询更快 2…...