当前位置: 首页 > news >正文

新型人工智能技术让机器人的识别能力大幅提升

原创 | 文 BFT机器人 

图片

在德克萨斯大学达拉斯分校的智能机器人和视觉实验室里,一个机器人在桌子上移动一包黄油玩具。通过达拉斯分校计算机科学家团队开发的新系统,机器人每推动一次,就能学会识别物体。

新系统允许机器人多次推动物体,直到收集到一系列图像,进而使系统能够分割序列中的所有物体,直到机器人识别出这些物体。以前的方法都是依靠机器人的一次推动或抓取来 "学习 "物体。

该团队在7月10日至14日于美国加利福尼亚州圣克拉拉市举行的机器人:科学与系统会议上发表了研究论文。会议论文的评选标准是论文的新颖性、技术质量、重要性、潜在影响和清晰度。

机器人能做饭、收拾餐桌和清空洗碗机的日子还很遥远。但该研究小组的机器人系统取得了重大进展,它利用人工智能帮助机器人更好地识别和记忆物体,论文的资深作者于翔博士说。

Erik Jonsson工程与计算机科学学院计算机科学助理教授项博士说:"如果你要求机器人拿起杯子或给你拿一瓶水,机器人就需要识别这些物体。”

图片

UTD研究人员的技术旨在帮助机器人检测家庭等环境中的各种物体,并归纳或识别类似的常见物品,如不同品牌、形状或大小的水瓶。

在Xiang的实验室里有一个储物箱,里面装满了常见食品的玩具包装,如意大利面条、番茄酱和胡萝卜等,用来训练名为Ramp的实验室机器人。Ramp是一个Fetch Robotics移动机械手机器人,站在一个圆形的移动平台上,大约有4英尺高。Ramp有一个长长的机械臂,上面有七个关节。末端是一只方形的 "手",有两个手指,可以抓取物体。

Xiang说,机器人学习识别物品的方式与儿童学习与玩具互动的方式类似。推动物体后,机器人就学会了识别物体。有了这些数据,我们就可以训练人工智能模型,这样机器人下次再看到这个物体时,就不需要再推它了。到第二次看到这个物体时,它就会直接把它捡起来。

研究人员的方法新颖之处在于,机器人会对每个物品推15到20次,而以前的交互式感知方法只使用一次推力。Xiang说,多次推动可以让机器人用包含深度传感器的RGB-D摄像头拍摄更多照片,从而更详细地了解每件物品。这就减少了出错的可能性。

研究人员表示,这种长时间机器人交互进行物体识别的系统,可以显著提高机器人识别日常生活中各类物品的能力。这对机器人完成家务等复杂任务,提升其视觉和认知能力大有裨益。

后续研究将继续提升机器人的其他功能,如运动规划和控制,以实现更复杂的任务,例如分类回收物品等。这项技术进步有望加速机器人进入日常生活,服务人类需求。

作者 | Tina

排版 | 春花

审核 | 柒柒

若您对该文章内容有任何疑问,请与我们联系,将及时回应。想要了解更多资讯,请关注BFT智能机器人系统~

相关文章:

新型人工智能技术让机器人的识别能力大幅提升

原创 | 文 BFT机器人 在德克萨斯大学达拉斯分校的智能机器人和视觉实验室里,一个机器人在桌子上移动一包黄油玩具。通过达拉斯分校计算机科学家团队开发的新系统,机器人每推动一次,就能学会识别物体。 新系统允许机器人多次推动物体&#xf…...

聚观早报|蚂蚁集团发布“蚁天鉴”;vivo X100系列即将亮相

【聚观365】9月12日消息 蚂蚁集团发布“蚁天鉴” vivo X100系列即将亮相 台积电8月份营收59亿美元 8月公共充电桩环比增加6.1万台 吴泳铭接替张勇出任阿里云代理董事长与CEO 蚂蚁集团发布“蚁天鉴” 蚂蚁集团发布大模型安全一体化解决方案“蚁天鉴”。该方案包含了大模型…...

读高性能MySQL(第4版)笔记05_优化服务器设置

1. 除非遇到异常情况,否则不需要调整配置 1.1. 不要“调优”服务器,不要使用比率、公式或“调优脚本”作为设置配置变量的基础 1.1.1. 在互联网上搜索配置建议并不总是一个好主意,你会在博客、论坛等找到很多糟糕的建议 1.1.2. 很难判断谁…...

Spring Boot跨域问题简介

什么是跨域问题? 在Web开发中,跨域指的是在浏览器中访问一个不同于当前域名的资源。浏览器出于安全考虑,限制了这种跨域资源的访问。具体来说,当浏览器使用XMLHttpRequest或Fetch API发送跨域请求时,目标服务器必须在…...

【Java】过滤器和拦截器区别

文章目录 前言1、过滤器 (Filter)2、拦截器 (Interceptor)3、我们不一样3.1、实现原理不同3.2、使用范围不同3.3、触发时机不同 4、拦截的请求范围不同5、注入Bean情况不同6、控制执行顺序不同总结 前言 准备环境 我们在项目中同时配置 拦截器 和 过滤器。 1、过滤器 (Filter…...

es滚动查询分析和使用步骤

ES在进行普通的查询时,默认只会查询出来10条数据。我们通过设置es中的size可以将最终的查询结果从10增加到10000。如果需要查询数据量大于es的翻页限制或者需要将es的数据进行导出又当如何? Elasticsearch提供了一种称为"滚动查询"&#xff08…...

飞书公式总结

文本处理函数 飞书中的表格,需要实现 内容内容1条件1内容2条件2内容3条件3今天是周一;可以出去玩今天是周一能今天天气不错不能可以出去玩能 条件1,2,3为能时,把对应的内容1,内容2,内容3复制到内容 TEX…...

vue3.2 导出pdf文件或表格数据

要在Vue 3中导出PDF文件,你可以使用第三方库来处理PDF生成和导出。一个常用的库是jspdf,它允许你在客户端或服务器端生成PDF文档。 以下是在Vue 3中使用jspdf库导出PDF文件的基本步骤: 第一步首先,安装jspdf库。你可以使用npm或ya…...

Linux学习--MySQL学习之查询语句

所有实现基于mysql8.0.26实现,事例代码 1:常用函数 字符函数数学函数日期函数聚集函数数学计算if函数case函数 函数:MySQL服务内置命令 语法:函数名(表头名) select格式 SELECT 函数(表头名) FROM 库名.表名; SE…...

三、视频设备的枚举以及插拔检测

一、前言 本章主要讲述,如何获取设备名称以及guid,采集设备的采集格式识别,设备的插拔 设备列表以及属性的获取使用的directshow(后续的MediaFoundation无法获取OBS摄像头) 设备的插拔使用的是QT 捕获系统消息,捕获到设备插拔后&a…...

Qt开发_调用OpenCV(4.x)完成人脸检测并绘制马赛克(摄像头实时数据)

一、前言 这个基于Qt和OpenCV的人脸检测和人脸打码项目是通过实时视频流中的人脸识别来保护隐私。 该项目目的是保护隐私并确保人脸数据安全。在某些情况下,使用实时视频流进行人脸检测和识别可能涉及对个人隐私的侵犯。通过在图像中打码人脸区域,可以避免未经许可的人脸出…...

ssl证书有效期为什么越来越短?

随着互联网的发展和网络安全意识的提升,SSL证书在保护网络通信安全方面起到了极为重要的作用。SSL证书通过加密通信数据,确保信息在传输过程中不被窃取或篡改,为用户提供了安全可靠的网络环境。然而,近年来SSL证书的有效期不断缩短…...

XFF漏洞利用([SWPUCTF 2021 新赛]Do_you_know_http)

原理 常见的存在HTTP头注入的参数 User-Agent:使得服务器能够识别客户使用的操作系统,浏览器版本等.(很多数据量大的网站中会记录客户使用的操作系统或浏览器版本等存入数据库中) Cookie:网站为了辨别用户身份进行se…...

Java——》JVM对原生的锁做了哪些优化

推荐链接: 总结——》【Java】 总结——》【Mysql】 总结——》【Redis】 总结——》【Kafka】 总结——》【Spring】 总结——》【SpringBoot】 总结——》【MyBatis、MyBatis-Plus】 总结——》【Linux】 总结——》【MongoD…...

华为云云耀云服务器L实例评测|用docker搭建frp服务测试

华为云云耀云服务器L实例评测|用docker搭建frp服务测试 0. 环境 华为云耀云L实例EulerOS 1. 安装docker 检查yum源,本EulerOS的源在这里: cd /etc/yum.repos.d 更新源 yum makecache 安装 yum install -y docker-engine 运行测试 d…...

群狼调研(长沙满意度调查专业公司)开展公交车乘客满意度调查

在城市的喧嚣中,公交车是我们日常出行的重要工具。那么,公交车的服务是否满足我们的期待?它还有哪些改进的空间?在这篇文章中,群狼调研**(长沙汽车制造商满意度调查)**通过一个深入的公交车乘客满意度调查,为您解答这些问题。 …...

Spring与OAuth2:实现第三方认证和授权的最佳实践

🌷🍁 博主猫头虎(🐅🐾)带您 Go to New World✨🍁 🦄 博客首页——🐅🐾猫头虎的博客🎐 🐳 《面试题大全专栏》 🦕 文章图文…...

Mysql的定时备份与恢复

MySQL定时备份与还原 MySQL备份方案 物理备份:这种备份方式将数据库的实际文件复制到另一个位置。常见的物理备份工具包括mysqldump和Percona XtraBackup。具体操作如下: 使用mysqldump 命令备份数据库: mysqldump -u username -p database_…...

学习Java基础面试题第五天

一、Java面试题第五天 1.spring字符串的最大长度 转自:String字符串的最大长度是多少?在学习和开发过程中,我们经常会讨论 short ,int 和 long 这些基本数据类型的取值范围,但是对于 String 类型我们好像很少注意它的…...

(10)(10.9) 术语表(一)

文章目录 前言 1 2.4Ghz 2 AGL 3 AHRS 4 APM 5 AMA 6 Arduino 7 APM (AutoPilot Mega) 8 ATC 9 Copter 10 Plane 11 Rover 12 BEC 13 Bootloader 14 COA 15 DCM 16 Eagle file 17 ESC 18 Firmware 19 FPV 20 FTDI 前言 !Note 术语表未编入索…...

AMD APU异构计算与能效优化技术解析

1. 异构计算时代的能效革命:AMD APU技术深度解析 在半导体行业摸爬滚打十几年,我亲眼见证了处理器能效比从单纯依赖制程进步到架构创新的转变。2014年AMD提出的25x20计划(到2020年实现APU能效提升25倍)曾被视为天方夜谭&#xff0…...

轻量级负载均衡器Codex-lb:云原生场景下的部署与调优实践

1. 项目概述:一个轻量级的负载均衡解决方案 最近在折腾一些个人项目和小型服务部署时,我遇到了一个挺实际的问题:如何在不引入复杂架构和运维负担的前提下,为多个后端服务实例提供一个统一的、可靠的入口。你可能也遇到过类似场景…...

AMD锐龙SMU调试工具:从新手到专家的完整调优指南

AMD锐龙SMU调试工具:从新手到专家的完整调优指南 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: https://gitcode…...

基于MCP协议的金融数据服务器:为AI量化分析提供标准化数据接口

1. 项目概述:一个为金融量化分析而生的MCP服务器如果你和我一样,在金融数据分析和量化策略开发的路上摸爬滚打过几年,那你一定对“数据获取”这个老大难问题深有体会。无论是想回测一个简单的双均线策略,还是构建一个复杂的多因子…...

ARM NEON SIMD指令集:VMAX与VMIN深度解析与优化

1. ARM SIMD指令集概述在ARM架构中,SIMD(Single Instruction Multiple Data)技术通过NEON协处理器实现,它提供了128位的向量寄存器(Q0-Q15)和对应的64位视图(D0-D31)。这些寄存器可以…...

学术写作AI工具排雷指南:5款主流产品深度评测(涵盖毕业与发刊需求)

每逢毕业季,无论是图书馆还是自习室,总能看到为论文熬夜奋战的身影。随着人工智能的发展,使用AI工具辅助提升科研效率已成为许多本硕博学生的常规操作。然而,不少人却陷入了一个误区:以为随便找个对话型AI就能搞定一切…...

Java 注解底层原理、组合注解实现与 AOP 协同机制全解析

Java 注解底层原理与 AOP 协同工作机制 系统性总结 本文严格基于 Java 注解底层原理及 AOP 结合使用的核心技术论述,对知识点进行系统性梳理、重组与优化。全文遵循元注解构建组合注解 → 注解编译与运行底层机制 → 注解AOP 协同工作原理 → 实战问题与解决方案的逻…...

长沙化妆培训哪家专业

在长沙学化妆,很多人都会问:“哪家更靠谱?”其实,选培训机构,关键不是看广告打得多响,而是看它能不能真正帮你学到能上手、能就业的本事。今天想跟你聊聊一个在本地口碑不错的机构——尚美新时代美业培训&a…...

【限时开放】ChatGPT-Sora 2联合推理链搭建教程:含Prompt模板库、错误码速查表与延迟压测数据(仅存96小时)

更多请点击: https://intelliparadigm.com 第一章:ChatGPT-Sora 2联合推理链的核心架构与演进逻辑 ChatGPT-Sora 2联合推理链代表了多模态大模型协同推理范式的重大跃迁——它并非简单地将语言模型与视频生成模型并联调用,而是构建了语义对齐…...

从原理到实战:阻容降压电路的设计要点与避坑指南

1. 阻容降压电路基础认知 第一次接触阻容降压电路是在五年前的一个智能插座项目上,当时为了把220V交流电转换成5V直流给单片机供电,团队在开关电源和阻容降压方案之间犹豫了很久。最终因为成本控制选择了后者,这个决定让我深刻体会到了阻容降…...