当前位置: 首页 > article >正文

Robin机器人感知系统与持续学习技术

“Robin 面对的是一个万物皆在变化的世界”一套先进的感知系统能够检测并学习自身错误使 Robin 机器人能够在生产规模下从杂乱的包裹堆中选取单个物品。作者Alan S. Brown2022年4月18日阅读时间9分钟相关内容某机构的机器人手臂在安全性和技术方面取得突破虽然这些系统看起来与其他机械臂类似但它们嵌入了先进技术这些技术将在未来几年塑造某机构的机器人舰队。2021年10月的模型1— 该模型漏掉了两个黑色包裹和一个被遮挡的包裹。过去经典的计算机视觉算法会系统地将场景分割成单个元素这是一种缓慢且计算量大的方法。监督式机器学习使这一过程更加高效。2022年2月的模型3— 所有包裹均被正确检测。Robin 的感知系统从能够识别边缘、平面等物体元素的预训练模型开始。接下来它被训练用于识别履约中心分拣区域内出现的包裹类型。当提供大量样本图像时机器学习模型学习效果最佳。然而尽管每天运送数百万个包裹Chandrashekhar 的团队最初发现很难找到足够的训练数据来捕捉传送带上不断滚动的盒子和包裹的巨大变化。“所有东西都混杂在一起大小形状各异有的叠在其他上面有的在阴影中”Chandrashekhar 说。“在节假日期间你可能会看到小黄人或 Billie Eilish 的图案混在我们通常的棕色和白色包裹中。胶带也可能会变化。”“有时一个包裹和另一个包裹之间的差异甚至人类都难以分辨。你可能有一个白色信封叠在另一个白色信封上两者都皱巴巴的你无法分辨一个在哪里结束另一个从哪里开始”她解释道。为了训练 Robin 的模型理解其所见研究人员收集了数千张图像在盒子、黄色、棕色和白色邮件包装以及标签等特征周围绘制线条并添加描述。然后团队使用这些带注释的图像持续重新训练机器人。训练在模拟生产环境中继续进行机器人在实时传送带上使用测试包裹工作。每当 Robin 未能识别物体或完成抓取时研究人员会注释这些错误并将其添加到训练集中。这种持续的训练方案显著提高了机器人的效率。持续学习在这些测试中Robin 的成功率显著提高但研究人员仍追求近乎完美的表现。“我们希望非常擅长处理这些随机边缘问题它们在测试中只出现几次但在大规模现场运行时会更频繁地发生”Chandrashekhar 说。由于 Robin 在测试中的高准确率研究人员发现很难找到足够多的错误来创建用于进一步训练的数据集。“一开始我们必须想象机器人会如何犯错以便创造可用于改进模型的数据类型”Chandrashekhar 解释道。某机构团队还监控了 Robin 对其决策的置信度。例如感知模型可能表明它对发现一个包裹很有信心但对其归类为特定包裹类型则信心不足。Chandrashekhar 的团队开发了一个框架确保那些低置信度的图像被自动发送给人工进行注释然后再添加回训练集。Robin 机械臂分拣包裹这也有助于某机构提高效率。在 Robin 拿起一个包裹之前它必须首先分割一个杂乱的场景决定要抓取哪个包裹计算如何接近该包裹并选择使用其八个吸盘中的多少个来拾取它。选择太多可能会提起多个包裹选择太少可能会掉落货物。该决策所需的远不止计算机视觉。“关于抓取什么以及在哪里抓取的决策是通过学习系统、优化、几何推理和三维理解的结合来完成的”某机构机器人人工智能部门的首席应用科学家 Nick Hudson 解释道。“有许多相互作用的组件它们都需要适应不同站点和地区所见的差异。”“效率和良好决策之间总是存在权衡”Swan 继续说。“这是一个重大的扩展挑战。我们在离线状态下做了大量实验使用非常杂乱的场景和其他情况来减慢机器人的速度以改进我们的算法。当我们满意时会在机群的一小部分上运行。如果表现良好就会推广到所有机器人。”软件研发经理 Sicong Zhao 表示这些推广之所以成为可能还因为软件被重写以支持定期更新。“软件是模块化的。这样我们可以升级一个组件而不影响其他组件。它还允许多个团队同时进行不同的改进。”这种模块化使得感知系统的关键部分能够每周自动重新训练两次。这也并非易事。Robin 拥有数万行代码因此 Zhao 的团队花了数月时间才充分理解这些代码行之间的交互以便将其组件模块化。这项努力是值得的。它使 Robin 更易于升级并将最终实现根据需要频繁地自动更新机群同时减少运营中断。下一代机器人感知Swan 解释说这些持续改进对于在某机构规模上部署 Robin 至关重要。团队的目标是每周自动更新 Robin 机器人机群数次。“我们正在增加对 Robin 的使用”Swan 说。“要做到这一点我们必须继续提高 Robin 处理那些随机边缘情况的能力使其永远不会分拣错误拥有出色的运动规划并以其手臂能承受的最快安全速度移动——所有这些都要有余力。”这意味着更多的创新。以包裹识别为例。Robin 的感知系统需要能够发现一堆包裹并知道从最上面的开始以避免弄翻整堆。“Robin 也有如何做到这一点的感觉但我们需要机器学习来加速 Robin 决定最有可能成功抓取哪一个的方式因为我们不断添加新型包装”Zhao 解释道。Chandrashekhar 相信基于机器人和包裹运动物理学的更强大的数字仿真将实现更快的创新。“当我们谈论可变形容器如软质邮件包装中的水瓶时这非常困难”她说。“但我们正在接近目标。”更长远地她希望看到能够自我学习的机器人它们能自学减少错误并更快地从错误中恢复。自我学习也将使机器人更易于使用。“部署机器人不应需要博士学位”Swan 说。“让这个机群自动适应是一个独特的机会”Hudson 同意道。“关于如何实现这一点还有一些开放性问题包括是否应该让单个机器人自行适应。机群已经使用全球收集的数据更新了其物体理解能力。我们如何也能让单个机器人适应它们在本地看到的问题——例如如果一个吸盘被堵塞或撕裂”不过Swan 最终希望利用某机构机器人研究人员所学到的知识来创造新型机器人。“我们仅仅触及了机器人可能性的表面”他说。关于作者Alan S. BrownAlan Brown 撰写关于工程、技术和科学领域的文章。FINISHED更多精彩内容 请关注我的个人公众号 公众号办公AI智能小助手或者 我的个人博客 https://blog.qife122.com/对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号网络安全技术点滴分享

相关文章:

Robin机器人感知系统与持续学习技术

“Robin 面对的是一个万物皆在变化的世界” 一套先进的感知系统能够检测并学习自身错误,使 Robin 机器人能够在生产规模下从杂乱的包裹堆中选取单个物品。 作者:Alan S. Brown 2022年4月18日 阅读时间:9分钟 相关内容 某机构的机器人手臂在安…...

Composite(组合)模式

意图:将对象组合成树形结构以表示“部分-整体”的层次结构。Composite使得用户对单个对象和组合对象的使用具有一致性 结构: 适用性:表示对象的部分-整体层欠结构,使得用户忽略组合对象与单个对象的不同,方便软件开发者统一地使用组合结构中的所有对象。…...

基于OpenCV的航天器自主对接算法原型

南加州大学SURE项目学生开发算法原型,助力航天器对接自动化 作为在新泽西州长大、并在加拿大就读寄宿学校的学生,Derek Chibuzor年少时经常乘坐飞机。这段旅行经历激发了他对飞行的持久兴趣。进入南加州大学后,Chibuzor选择主修航空航天工程。…...

Go channel使用模式与最佳实践

Go语言中的channel是一种强大的并发原语,它不仅是goroutine之间通信的桥梁,更是实现高效并发模式的核心工具。无论是数据传递、同步控制还是任务编排,channel都能以简洁优雅的方式解决问题。本文将深入探讨几种典型的使用模式与最佳实践&…...

嵌入式开发自动化实践与效率提升

1. 嵌入式开发中的重复工作困境作为一名在嵌入式领域摸爬滚打多年的工程师,我深知这个行业的痛点——那些看似简单却消耗大量精力的重复性工作。从版本构建到代码移植,从环境配置到测试验证,这些工作就像影子一样伴随着每个开发者的日常。刚入…...

OpenClaw 实战:让AI 页面“秒开即用”,实现 Vibecoding 真正闭环

我为什么会发出这个疑问呢?是因为我研究Web开发中的一个问题时,HTTP请求体在 Filter(过滤器)处被读取了之后,在 Controller(控制层)就读不到值了,使用 RequestBody 的时候。 无论是字…...

2026年大数据专业数据分析学习指南

一、核心技术与工具2026年主流大数据技术栈(如Spark、Flink、Hadoop生态) 实时数据处理与批处理技术对比 云原生数据分析平台(AWS/GCP/Azure解决方案) 机器学习与深度学习在数据分析中的融合应用二、数学与统计基础概率论与数理统…...

第3课 神经网络基础

神经网络,本质上是模仿生物神经元网络构建的人工模型,由人工神经元(或节点)相互连接形成网络或电路。这些节点间的连接的方式与人类神经元网络相似,能够高效传递并处理输入信息,是深度学习领域的核心基础。 神经网络的核心结构由输入层、隐含层和输出层三部分组成:每个节…...

单片机AD采样十大滤波算法详解与应用

1. 单片机AD采样滤波算法概述在嵌入式系统开发中,ADC采样是获取模拟信号的关键环节。然而实际应用中,采样值常会受到各种干扰影响,导致数据波动甚至错误。作为一名有着十年嵌入式开发经验的工程师,我总结了十种最实用的AD采样滤波…...

工业4.0下LED可见光通信(VLC)在智能车间的应用实践

1. 项目背景与需求分析在工业4.0时代背景下,现代工厂车间的设备智能化改造面临着一个关键挑战:如何在复杂电磁环境中实现稳定可靠的数据传输。传统无线通信方案(如Wi-Fi、ZigBee等)在金属结构密集、电机设备众多的车间环境中&…...

罗技PUBG鼠标宏压枪技术全解析:从核心挑战到落地实践

罗技PUBG鼠标宏压枪技术全解析:从核心挑战到落地实践 【免费下载链接】logitech-pubg PUBG no recoil script for Logitech gaming mouse / 绝地求生 罗技 鼠标宏 项目地址: https://gitcode.com/gh_mirrors/lo/logitech-pubg 在PUBG等战术射击游戏中&#x…...

AI 赋能自动化测试实战:从用例生成到 CI/CD 全流程落地

文章目录一、前言二、AI 赋能自动化测试的 5 大核心能力1. 智能测试用例生成2. 智能元素定位与脚本自愈3. 智能执行与异常自适应4. 智能缺陷检测与根因定位5. 测试用例库智能维护三、落地路径:0 到 1 搭建 AI 自动化测试体系阶段 1:工具选型与环境搭建&a…...

空洞骑士模组管理新体验:Scarab让模组安装变得简单高效

空洞骑士模组管理新体验:Scarab让模组安装变得简单高效 【免费下载链接】Scarab An installer for Hollow Knight mods written in Avalonia. 项目地址: https://gitcode.com/gh_mirrors/sc/Scarab 你是否曾经因为空洞骑士模组安装的复杂性而感到困扰&#x…...

触发器导致的DG库日志同步中断

触发器导致的DG库日志同步中断 第一次排查 问题复现 问题解决 第一次排查 主库服务器宕机重启后,到备库的日志传输中断,备库一直在等某个日志,主库上有这个日志文件,但是不会自动传输到备库上。 主库日志一直在刷ORA-16191和ORA-1017的报错: FAL[server, ARC0]: Error …...

Go Context 控制流与生命周期管理

Go Context 控制流与生命周期管理 在现代分布式系统中,控制流与生命周期管理是开发者必须面对的核心挑战之一。Go语言通过context包提供了一种优雅的解决方案,帮助开发者管理请求的取消、超时和跨协程的数据传递。无论是微服务调用、数据库查询还是HTTP…...

Agent 记忆全景综述:20+顶尖机构联合出品,Agent memory看这一篇就够了

用 GPT 或 Claude 做过长对话的人大概都踩过这个坑:聊了半个小时,AI 把你前面说过的事情忘干净了。你不得不把背景重新解释一遍。 这还是人机对话,忍一忍也就算了。 但如果是 agent 在自主执行任务呢?记不住"这个 API 上次…...

健身私教AI:OpenClaw+Qwen3.5-9B定制个人训练计划与饮食建议

健身私教AI:OpenClawQwen3.5-9B定制个人训练计划与饮食建议 1. 为什么需要AI健身私教? 去年冬天体检报告上的"轻度脂肪肝"三个字,成了我决定认真健身的最后一根稻草。作为程序员,我试过各种健身APP,但总感…...

别再只用Speedtest了!自建LibreSpeed测速站,监控家庭宽带/公司内网真实表现

自建网络测速站:用LibreSpeed打造精准带宽监控系统 每次看到运营商宣传的"千兆宽带",你是否怀疑过实际使用中根本达不到承诺速度?公共测速网站的结果总让人将信将疑——它们可能被ISP特殊优化,或是受限于服务器位置。更…...

Vue微商城实战:从零搭建高效开发环境与核心配置

1. 环境准备:搭建Vue开发基础 第一次用Vue做微商城项目时,我对着官方文档折腾了半天环境配置,结果运行时报错一片红。后来才发现是node版本和脚手架不兼容的问题。这里分享下我总结的零失败配置方案,帮你避开90%的初期坑点。 首先…...

2026年4月,天府新区,成都装修公司哪家好,北京我爱我家装饰(成都旗舰店)

引言在快速发展的天府新区,装修选择成为了许多家庭和业主的首要问题。无论是新房装修、老房翻新还是局部改造,如何选择一家既专业又可靠的装修公司,确保从设计到施工的每个环节都令人满意,是大家最为关心的问题。本文将通过实际案…...

GT511C3指纹模块嵌入式驱动开发与工程实践

1. GT511C3指纹识别模块底层驱动技术解析GT511C3是由Digital Persona公司推出的高性能光学指纹识别模块,广泛应用于门禁系统、考勤终端、金融支付设备及嵌入式身份认证场景。该模块基于ARM7TDMI内核主控,集成专用图像处理引擎与模板匹配协处理器&#xf…...

2026最权威的十大AI辅助写作平台横评

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 基于深度学习模型的论文一键生成技术,可快速整合文献资料,能提取核心…...

Linux进程(下)

上一篇文章介绍了进程的概念和进程的状态,但进程的知识还有很多,本文继续进行讲解。进程的管理指令之前提到过许多对进程进行管理的指令,但没有进行讲解,在这里统一聊聊。核心指令有四个 ps,top,kill&#…...

2025届毕业生推荐的十大降AI率神器实际效果

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 在当下的学术写作情形里,论文AI网站主要是提供文献检索、提纲生成、段落润色以及…...

Agent间数据流与控制流分离:构建可复用的协作架构

Agent间数据流与控制流分离:构建可复用的协作架构 一、 摘要/引言 1.1 开门见山:从一场“失控的Multi-Agent协作”讲起 上周六,我帮同事复盘他们团队的电商智能客服Agent集群上线事故——那天下午6点到8点,正好是618预热的第三波“整点蹲优惠券码”活动,负责规则推理优惠…...

OpenClaw内存优化:Qwen2.5-VL-7B在4GB显卡上的运行秘诀

OpenClaw内存优化:Qwen2.5-VL-7B在4GB显卡上的运行秘诀 1. 当多模态大模型遇上小显存显卡 上周三凌晨2点,我的MacBook Pro风扇突然狂转——屏幕上是OpenClaw控制台不断弹出的显存不足警告。当时我正在尝试用Qwen2.5-VL-7B处理一批产品截图,…...

电机速度计算

1. M法计算速度值详解:原理、公式与应用 概述 M法,也称为频率测量法,是一种通过在固定时间内统计脉冲数量来计算速度的常用方法。这种方法特别适用于中高速运动的测量场景,在电机控制、编码器测速等领域有着广泛的应用。 &#x1…...

计算机毕业设计 | SpringBoot+vue文理医院预约挂号系(附源码+论文)

1,绪论 1.1 研究背景与意义 信息化管理模式是将行业中的工作流程由人工服务,逐渐转换为使用计算机技术的信息化管理服务。这种管理模式发展迅速,使用起来非常简单容易,用户甚至不用掌握相关的专业知识,根据教程指导即…...

计算机毕业设计 | 基于node(Koa)+vue 高校宿舍管理系统 宿舍可视化全能宿管(附源码)

1,绪论 1.1 项目背景 随着科技的发展,智能化管理越来越重要。大学生在宿舍的时间超过了1/3,因此良好的宿舍管理对学生的生活和学习极为关键。学生宿舍管理系统能够合理安排新生分配宿舍,不浪费公共资源,减轻学校管理…...

通达信主窗口显示股票所属板块及概念语句的3种实用方法(附完整代码)

通达信主窗口高效显示股票板块与概念的3种实战方案 在股票交易软件中,快速识别个股所属的行业板块和热门概念是每位投资者的基本功。通达信作为国内主流证券分析平台,其自定义显示功能可以让关键信息一目了然。本文将分享三种不同复杂度的实现方式&#…...