当前位置: 首页 > article >正文

一年磨一剑,今年最炸机器人Demo来了!1亿美元种子轮团队出手,单个模型解锁单手打蛋解魔方弹钢琴

henry 发自 凹非寺量子位 | 公众号 QbitAI看过的人已经傻眼了因为这可能是今年为止最炸的机器人demo。刚刚Genesis AI发布首个机器人基础模型GENE-26.5让机器人能自主打鸡蛋拧试管盖弹钢琴玩魔方切番茄。全程自主运行1倍速同一个模型。亮相后前1x副总裁Eric Jang宋舒然教授等业内大佬纷纷转发评论表示赞叹。如果你对这个半路杀出的团队感到陌生下面这个gif可能会让你想起些什么。一年多以前他们在GitHub上发布了那个炸穿互联网的Genesis物理引擎。一句话生成物理世界28.6k Star学术圈半壁江山参与。创始团队在2025年中拿了1.05亿美元种子轮出来创业沉默了将近一年。现在回来了。今年为止最炸的机器人demoGENE-26.5的demo大概是机器人领域今年到目前为止最值得认真看的咱们来速通一下。烹饪场景四分钟20个子任务串成完整流水线。单手打蛋五指配合控制裂纹走向。双手切番茄一只手调整角度另一只手下刀。毛巾、盐磨、打蛋器、刀、铲、煎锅轮番上阵。搞笑的是打完鸡蛋他还拿毛巾擦了一下手怪干净的……实验室移液操作从抓移液器到装离心机全流程毫米级精度。最难的是拧试管盖和手内换握姿势。解魔方双臂协作连续空中翻转实时闭环。此前不靠专用夹具完成魔方的标杆还是2019年OpenAI那只单手Genesis称这是通用双臂系统的首次。△图源OpenAI做冰沙语言指令驱动的长序列任务固体、可变形物体、液体全涉及。吸管翻转测试极脆弱半透明物体的处理最后一步手内翻转需要多根手指高度同步。多物体抓取单手同时抓四个不同尺寸物体四种抓握方式并行展示灵巧手相比传统夹爪的效率差距。线束整理汽车产业的「圣杯任务」。双手操控柔性线缆打捆、挂架、缠胶带公认最难的工业操控任务之一。弹钢琴Rush-E约130BPM专门压测控制栈极限策略用RL在仿真中单独训练。以上大多数复杂技能GENE只需要不到1小时的任务专属机器人数据不到200个episode。值得一提的是Genesis CEO周衔在接受Business Insider采访时表示烹饪大多数步骤成功率在90%到95%但单手打蛋和用刀转移切好的番茄只有50%到60%。整体操作速度大约是人类的六七成。全栈怎么做的Genesis博客里说了一句话把整个技术思路讲透了操控不是一个纯模型训练问题是一个系统问题。任何一层的短板都会传导到整个系统。所以他们选择每一层都自己做。硬件一双和人手一样大的手Genesis在demo中使用的灵巧手20个可反向驱动的自由度与人手1:1尺寸匹配手掌和手指覆盖柔软材料模拟皮肤接触力学。这种设计让人手动作可以直接映射到机械手上不需要复杂的重定向算法。值得一提的是不少业内人士指出这双手与国内灵巧手公司舞肌科技Wuji Tech的产品高度相似。Genesis官方博客将其称为Genesis Hand 1.0但未详细说明硬件来源。回到手的尺寸上为什么要做到与人手1:1是因为机器人领域存在一个叫「具身差距」的老问题人手和机械手形态不一样人类动作数据就没法直接迁移到机器人上。Genesis的解法很粗暴把手做成一模一样差距就消失了。控制栈也一并重写。Genesis把机械臂供应商的出厂控制器整个换掉自研中间件跑在PREEMPT_RT实时内核上EtherCAT通信500Hz端到端延迟最低压到3毫秒。原厂控制器画一个15厘米的圆追踪误差20毫米换上Genesis的控制器后降到2毫米提升一个数量级。单关节追踪延迟从80毫秒降到9毫秒。这层的意义在于当训练数据来自人类动作而不是机器人遥操作时控制系统的延迟和误差会在训练信号和实际执行之间制造鸿沟。延迟越低人类数据就越好用。数据让工人上班顺便采集在数据采集方面Genesis主要采用一双与灵巧手配套的数据采集手套。机器人手和人手尺寸一致手套记录的手指运动可以无损映射到机器人上不需要复杂的重定向算法。硬件成本是传统方案的百分之一采集效率是遥操作的五倍。数据引擎总共有三层来源。手套数据提供最高保真度的手部运动和触觉信号。第一人称视频捕捉自然行为和任务多样性。第三人称互联网视频提供海量覆盖。三层数据在质量和规模上做了帕累托分布Genesis和合作伙伴已经收集了超过20万小时的多模态数据。Genesis总裁Gervet对TechCrunch说了一句有意思的话这只手套可以让实验室技术员、制造业工人在干日常工作的时候顺便采集数据不打断工作流。当然TechCrunch也追问了一个尖锐的问题工人会愿意戴着手套和摄像头来训练最终可能取代自己的机器人吗Gervet的回答是这个得看客户和员工之间怎么谈具体细节还没敲定。模型一个统一的轨迹联合分布GENE-26.5的模型目标是学一个能同时吸收语言、视觉、本体感觉、触觉和动作的统一模型。用flow matching对轨迹建模联合分布捕捉多模态的未来可能性。几个关键设计。第一支持异构、部分可观测数据的可扩展训练第一人称视频流、手套数据、机器人控制数据、互联网视频不需要显式对齐就能一起训练。第二同一个模型处理所有任务控制、状态估计、逆动力学、目标推断都变成对联合分布的条件查询缺失的模态通过去噪推断。第三可以灵活吸收预训练模型的先验VLM提供语义理解世界模型提供时序和物理动态。简单说就是一个模型吃所有模态的数据做所有类型的任务。demo里展示的几个场景除了钢琴演奏是单独用RL训练的之外其余全部共享同一套权重。训练和评估仿真是加速器Genesis团队在博客里放了三张scaling曲线透露了训练recipe的关键信息。预训练阶段open-loop评估显示模型规模和计算量增加时验证损失持续下降符合经典的scaling law。但他们强调open-loop指标对机器人来说远远不够关键是closed-loop表现就是模型的动作会影响后续观测的闭环场景。这里Genesis物理引擎的老本行就派上用场了。他们用最新版Genesis World仿真器做大规模闭环评估不需要在仿真数据上做任何co-training仿真环境的保真度已经足够直接评估真实世界训练的模型。每个数据点对应200个评估设置和超过150小时的机器人执行时间整张图如果在真实世界跑需要2700个人-机器人小时。结论是预训练数据量越大zero-shot泛化能力越强。到fine-tuning阶段回到真实世界。他们专门构造了预训练中完全没见过的新任务在超低数据量条件下测试每个任务只用20到30分钟的数据。demo里展示的那些复杂技能大多数只需要不到1小时的任务专属机器人数据换算下来不到200个episode。预训练规模越大fine-tuning也越快、数据需求越少、最终表现越好。周衔对TechCrunch说模型迭代速度的真正瓶颈是评估仿真帮他们大幅加速了这个循环。从物理引擎到通用机器人2024年底CMU博士周衔牵头开源了Genesis物理引擎。这款纯Python仿真平台比英伟达Isaac Gym快10到80倍GitHub上迅速成为最大的具身智能开源项目吸引了20多个研究机构参与。周衔本科毕业于新加坡南洋理工是Genesis物理引擎的发起人。2025年初Genesis AI在法国注册成立由周衔担任CEO总裁是Théophile Gervet同样来自CMU曾在具身智能独角兽Skild AI任早期研究员后加入Mistral AI做研究科学家。两人师出同门导师都是Katerina Fragkiadaki。成立几个月后团队拿到1.05亿美元种子轮Eclipse和Khosla Ventures领投谷歌前CEO Eric Schmidt、法国电信大亨Xavier Niel个人参投法国国家投资银行Bpifrance也在投资方名单里。作为参考此前具身智能赛道最大的种子轮是Physical Intelligence的7000万美元。拿到钱之后团队没有急着发产品而是花了将近一年时间闷头搭全栈。今天GENE-26.5。模型、硬件、控制栈、仿真器一次性全部亮相。团队从创始时的几个人扩展到60人巴黎、加州、伦敦三地办公欧美大约四六开。已经收集了超过20万小时的多模态数据正在与多个行业客户洽谈合作。周衔告诉TechCrunch接下来很快会公布第一个通用机器人全身的不只是手。参考链接[1]https://x.com/gs_ai_/status/2052050956272230577[2]https://x.com/zhou_xian_/status/2052051823742312861[3]https://www.aol.com/articles/look-hands-genesis-ai-says-130001205.html[4]https://github.com/Genesis-Embodied-AI/genesis-world[5]https://www.genesis.ai/blog/gene-26-5-advancing-robotic-manipulation-to-human-level[6]https://techcrunch.com/2026/05/06/khosla-backed-robotics-startup-genesis-ai-has-gone-full-stack-demo-shows/一键三连「点赞」「转发」「小心心」欢迎在评论区留下你的想法—完—5月20日我们将在北京金茂万丽酒店举办一年一度的中国AIGC产业峰会。首波嘉宾阵容已公布昆仑万维方汉、智谱吴玮杰、EverMind邓亚峰、风行在线易正朝、百度秒哒朱广翔、Fusion Fund张璐、香港大学黄超、MarsWave冯雷都来了了解详情请你和我们一起不再只是讨论AI的未来而是现在就用起来。 报名参会一键关注 点亮星标

相关文章:

一年磨一剑,今年最炸机器人Demo来了!1亿美元种子轮团队出手,单个模型解锁单手打蛋解魔方弹钢琴

henry 发自 凹非寺量子位 | 公众号 QbitAI看过的人已经傻眼了,因为这可能是今年为止最炸的机器人demo。刚刚,Genesis AI发布首个机器人基础模型GENE-26.5,让机器人能自主打鸡蛋,拧试管盖,弹钢琴,玩魔方&…...

教育机构在AI课程实验中采用Taotoken管理学生模型调用的实践

教育机构在AI课程实验中采用Taotoken管理学生模型调用的实践 在高校或职业培训机构的AI课程中,让学生亲手调用大模型API完成实验是提升实践能力的关键环节。然而,直接让学生使用个人账户或共享密钥会带来成本不可控、权限混乱、行为难以追溯等一系列管理…...

2026 生物医药融资技术趋势:AI 制药、CGT、ADC 成资本主战场

一、核心数据截至 2026 年 5 月 7 日,全球生物医药行业融资活动呈现显著回暖态势,中国市场表现尤为突出。根据医药魔方等行业报告,2026 年第一季度 1-3 月核心数据如下:进入 4 月,市场热度不减,深圳泽安生物…...

坤和静界·春藤计划:一场针对青少年休学的标准化心理干预实

青少年休学问题正在变得不容忽视。有调查显示,在患有抑郁症等精神障碍的儿童青少年中,超过半数有过休学经历,首次休学的平均年龄只有13.74岁。而在休学之后,近六成家长对复学感到焦急,却找不到系统性的解决方案。 市面…...

为AI智能体注入Power BI专家级能力:OpenClaw技能包全解析

1. 项目概述:为AI智能体注入Power BI专家级能力 如果你正在探索如何让AI助手(或者说,智能体)真正理解并操作像Power BI这样复杂的企业级商业智能工具,那么你很可能已经遇到了瓶颈。传统的提示词工程往往只能让大语言模…...

CC-Switch 下载、安装与使用全指南(2026.5.7--最新v3.14.1)

CC-Switch 下载、安装与使用全指南(2026最新v3.14.1) CC-Switch 是跨平台AI API一键切换管理器,统一管理 Claude Code、DeepSeek、Kimi、智谱、MiniMax 等模型,不用改环境变量、不用手动改配置文件,VS Code/终端一键切…...

开源 | 我是怎么用 ai-memory 让 Cursor 每次开新对话都自动知道项目背景的

开源 | 我是怎么用 ai-memory 让 Cursor 每次开新对话都自动知道项目背景的开源地址:https://github.com/hyxnj666-creator/ai-memory npm:npx ai-memory-clilatest(内置免费模型,无需配置 API Key) 协议:M…...

基于AI与RPA的智能求职自动化系统设计与实现

1. 项目概述:当求职自动化遇上AI与RPA最近在技术社区里,看到不少朋友在讨论一个叫auto_job__find__chatgpt__rpa的项目。光看这个标题,就让我这个在招聘和自动化领域摸爬滚打了十来年的老鸟眼前一亮。这名字拆开来看,auto_job_fin…...

SQL Server如何实现编写表与字段注释_Navicat兼容操作步骤

ASSM表空间不能设为MANUAL,因LMT不支持手动段管理,10g执行SEGMENT SPACE MANAGEMENT MANUAL会报ORA-12913;新建表空间必须用AUTO,FREELIST在LMT下无效。ASSM 表空间为什么不能关自动段管理本地管理表空间(lmt&#xff…...

用SystemVerilog玩转约束:除了`inside`和`dist`,你还能这样写条件约束

用SystemVerilog玩转约束:超越基础语法的创意实践 在芯片验证的世界里,随机测试就像一把瑞士军刀——它能帮你发现那些手工测试难以触及的角落。但真正的高手都知道,随机测试的质量取决于约束的质量。当你在验证PCIe或DDR这类复杂协议时&…...

5分钟搞懂BERT tokenizer:用encode_plus为你的NLP模型准备‘标准餐’(附PyTorch/TF代码适配)

5分钟搞懂BERT tokenizer:用encode_plus为你的NLP模型准备‘标准餐’(附PyTorch/TF代码适配) 想象一下,你正在为一位挑剔的米其林大厨准备食材——每一片蔬菜的厚度、每一块肉的纹理都必须精确到毫米级。在自然语言处理&#xff0…...

AI编程助手选型指南:从GitHub Awesome清单到高效开发实践

1. 项目概述与价值定位最近在GitHub上闲逛,又发现了一个宝藏仓库——CodandoTV维护的“awesome-ai-coding-assistants”。作为一名在代码堆里摸爬滚打了十多年的老开发,我第一眼看到这个标题就来了兴趣。这不仅仅是一个简单的工具列表,它更像…...

OpenClawWeChat:基于Wechaty的插件化微信机器人开发与部署实战

1. 项目概述与核心价值最近在折腾微信机器人,想找一个能稳定、灵活地处理消息,还能对接各种外部服务的方案。市面上工具不少,但要么功能单一,要么配置复杂,要么就是稳定性堪忧,动不动就被风控。直到我深度体…...

SQL中如何对聚合后的数据进行二次计算_GROUP BY与算术组合

GROUP BY后不能在同层SELECT或HAVING中直接复用聚合结果做二次计算,需用子查询或CTE先聚合再运算,并注意NULLIF防除零、COALESCE处理空值、ROUND控制精度及WHERE/HAVING分工。GROUP BY 后不能直接用聚合字段做算术运算写 SELECT SUM(a) * 2 FROM t GROUP…...

浏览器自动化技能化实践:从Selenium到模块化流程编排

1. 项目概述:从“技能”到“浏览器自动化”的桥梁最近在折腾浏览器自动化的时候,发现了一个挺有意思的仓库,叫browser-act/skills。乍一看这个名字,你可能会有点懵:“技能”和“浏览器自动化”有什么关系?这…...

从IDF 2012看英特尔技术十字路口:Haswell能效革命与Atom移动困局

1. 从IDF 2012看英特尔的技术十字路口:Haswell的辉煌与Atom的迷雾 2012年9月的旧金山,空气中弥漫着一股熟悉的、属于硅谷的躁动。英特尔开发者论坛(IDF)即将拉开帷幕,而就在同周,苹果也计划发布新品。对于当…...

Vue3项目里用ArcGIS SDK加载地图,保姆级配置流程(含样式避坑)

Vue3项目集成ArcGIS SDK全流程指南:从配置到样式优化实战 在当今数据驱动的时代,地理信息系统(GIS)已成为现代Web应用不可或缺的一部分。作为行业领先的GIS平台,ArcGIS提供了强大的JavaScript SDK,而Vue3的响应式特性和组合式API则…...

突破OBS音频局限:揭秘如何为直播软件添加专业级VST插件支持

突破OBS音频局限:揭秘如何为直播软件添加专业级VST插件支持 【免费下载链接】obs-vst Use VST plugins in OBS 项目地址: https://gitcode.com/gh_mirrors/ob/obs-vst 想要在OBS Studio中实现专业级的音频处理,却受限于内置的基础滤镜&#xff1f…...

如何高效修复损坏视频:智能MP4修复工具Untrunc实用指南

如何高效修复损坏视频:智能MP4修复工具Untrunc实用指南 【免费下载链接】untrunc Restore a damaged (truncated) mp4, m4v, mov, 3gp video. Provided you have a similar not broken video. 项目地址: https://gitcode.com/gh_mirrors/unt/untrunc 你是否曾…...

地铁站台门控系统集成方案:三菱Q系列PLC以太网通讯与上位机联动实例

一、行业背景与项目概况1.1 行业背景与核心需求轨道交通站台设备管控核心需求聚焦于安全可靠与高效运维:一是实现站台各类设备协同控制,保障屏蔽门与列车联动、应急报警快速响应,杜绝安全隐患;二是支持现场操作与中控室远程管控协…...

如何实现跨平台输入法词库迁移?深蓝词库转换技术架构解析

如何实现跨平台输入法词库迁移?深蓝词库转换技术架构解析 【免费下载链接】imewlconverter ”深蓝词库转换“ 一款开源免费的输入法词库转换程序 项目地址: https://gitcode.com/gh_mirrors/im/imewlconverter 在数字化工作环境中,输入法的个性化…...

搞网络安全的,谁还没几个压箱底绝活?可AI来了以后呢?

前两天跟几个同事在路边摊撸串,聊起今年这波AI浪潮,大家伙儿眼里的光明显暗了不少。以前在圈子里混,手里没几个压箱底的绝活儿根本站不住脚。不管是熬大夜脱个壳,还是手工抠那个Payload,那都是实打实的本事。可现在呢&…...

账户维护、登出与多模态文件独立接口

1&#xff09;登出&#xff1a;Header 或 Query 传 TokenPostMapping("/logout")public Result<Void> logout(RequestHeader(value "Authorization", required false) String authorization,RequestParam(value "token", required fal…...

高盐废水处理:一项成熟技术解析

行业痛点分析2026年&#xff0c;高盐废水处理仍是工业环保领域的核心挑战。数据显示&#xff0c;我国每年产生的高盐废水超过200亿吨&#xff0c;其中食品加工、化工、制药等行业贡献显著。根据《环境工程学报》2024年的一项研究&#xff0c;当盐浓度超过0.2%时&#xff0c;普通…...

发票识别OCR API接入详解:自动提取发票全字段并接入财务系统(附Python/JS/PHP示例)

发票识别OCR API接入详解&#xff1a;自动提取发票全字段并接入财务系统&#xff08;附Python/JS/PHP示例&#xff09; 企业财务场景中有一个长期存在的低效问题&#xff1a;发票信息录入全靠人工——每天处理几十到上百张发票&#xff0c;逐张录入金额、日期、税号等信息&…...

ARM Trace单元架构与异常追踪技术解析

1. ARM Trace单元架构概述在现代处理器设计中&#xff0c;Trace单元作为调试基础设施的核心组件&#xff0c;承担着实时记录指令执行流的重任。与传统的断点调试不同&#xff0c;Trace技术通过非侵入式的方式捕获处理器运行时的完整行为&#xff0c;为系统级问题诊断提供了时间…...

70 岁吕良伟分享科学养生:逆龄状态来自 16+8 轻断食与营养均衡实践

近日&#xff0c;演员吕良伟以 70 岁依然稳健挺拔的身心状态&#xff0c;成为大众关注的健康生活方式标杆。经专业生理年龄评估&#xff0c;其心血管、免疫、内分泌等关键机能均保持青壮年水准&#xff0c;展现出长期科学养生的显著成果。面对外界关注的养生秘诀&#xff0c;吕…...

别再傻傻打全称了!LaTeX/BibTeX用户如何一键搞定IEEE引用格式(含期刊会议缩写库)

LaTeX/BibTeX高效引用&#xff1a;IEEE期刊会议缩写自动化解决方案 引言 每次在LaTeX论文中引用IEEE文献时&#xff0c;你是否都要手动输入完整的期刊会议名称&#xff1f;当参考文献列表中出现格式不统一的缩写时&#xff0c;审稿人会不会皱眉&#xff1f;作为计算机、电子工程…...

下一代物联网基站硬件设计:从异构计算到信号完整性的工程实践

1. 下一代网络基站工程设计的核心挑战与思路拆解十年前&#xff0c;当Lawrence Latif在EE Times上探讨物联网对下一代基站的要求时&#xff0c;他精准地预见了我们今天面临的许多问题。站在一个硬件工程师的角度回看&#xff0c;那篇文章更像是一份精准的“需求预测清单”。如今…...

ProdMan:为AI原生PM打造的结构化工作流与产品记忆框架

1. 项目概述&#xff1a;一个为AI原生产品经理设计的结构化工作流框架如果你正在用Claude Code、Cursor这类AI编码助手来构建产品&#xff0c;那你一定经历过这种循环&#xff1a;每次打开一个新对话&#xff0c;都得把产品背景、用户画像、技术栈限制从头到尾再解释一遍&#…...