当前位置: 首页 > news >正文

【AI视野·今日Robot 机器人论文速览 第七十一期】Fri, 5 Jan 2024

AI视野·今日CS.Robotics 机器人学论文速览
Fri, 5 Jan 2024
Totally 11 papers
👉上期速览✈更多精彩请移步主页

在这里插入图片描述

Daily Robotics Papers

Machine Learning in Robotic Ultrasound Imaging: Challenges and Perspectives
Authors Yuan Bi, Zhongliang Jiang, Felix Duelmer, Dianye Huang, Nassir Navab
本文回顾了智能机器人超声超声成像系统的最新进展。我们首先介绍机器人超声成像中常用的机器人机制和控制技术及其临床应用。随后,我们重点关注机器学习技术在机器人超声检查师开发中的部署,强调旨在增强这些系统智能的关键发展。实现自主行动推理的方法分为两类:依赖隐式环境数据解释的方法和使用显式解释的方法。在整个探索过程中,我们还讨论了实际挑战,包括与医疗数据稀缺性、深入了解所涉及的物理方面的需要以及有效的数据表示方法相关的挑战。

AERIAL-CORE: AI-Powered Aerial Robots for Inspection and Maintenance of Electrical Power Infrastructures
Authors Anibal Ollero, Alejandro Suarez, Christos Papaioannidis, Ioannis Pitas, Juan M. Marredo, Viet Duong, Emad Ebeid, Vit Kratky, Martin Saska, Chloe Hanoune, Amr Afifi, Antonio Franchi, Charalampos Vourtsis, Dario Floreano, Goran Vasiljevic, Stjepan Bogdan, Alvaro Caballero, Fabio Ruggiero, Vincenzo Lippiello, Carlos Matilla, Giovanni Cioffi, Davide Scaramuzza, Jose R. Martinez de Dios, Begona C. Arrue, Carlos Martin, Krzysztof Zurad, Carlos Gaitan, Jacob Rodriguez, Antonio Munoz, Antidio Viguria
大型基础设施很容易因老化、环境影响和大量使用而老化。通过定期检查和维护确保其安全对于防止严重影响公共安全和环境的事件至关重要。这在电力网络的背景下尤其重要,电力网络虽然对于能源供应至关重要,但也可能是森林火灾的根源。智能无人机有可能彻底改变检查和维护,消除人类操作员的风险,提高生产力,减少检查时间并提高数据收集质量。然而,目前空中机器人技术的大多数方法和技术主要是在室内试验台或严格控制条件下的室外环境中进行试验的,并且始终在人类操作员的视线范围内。此外,这些方法和技术通常是孤立评估的,缺乏全面的集成。本文介绍了第一个结合了各种创新空中机器人的自主系统。该系统专为超出视线范围的大范围检查而设计,具有用于维护任务的空中机械手,并包括用于在高处工作的操作员的支撑机制。

How Do Pedestrians' Perception Change toward Autonomous Vehicles during Unmarked Midblock Multilane Crossings: Role of AV Operation and Signal Indication
Authors Fengjiao Zou, Jennifer Harper Ogle, Patrick Gerard, Weimin Jin
阻碍行人广泛接受自动驾驶汽车的主要障碍之一是他们对自动驾驶汽车的理解有限。本研究采用虚拟现实 VR 为行人提供一个身临其境的环境,以便在无标记的中路多车道交叉口期间与自动驾驶汽车互动并理解自动驾驶汽车。对各种自动驾驶汽车驾驶行为进行建模,以显示带有黄色信号指示的谈判行为或带有蓝色信号指示的不让行行为。本文旨在研究自动驾驶汽车行为和信号、行人过去行为等各种因素对行人对自动驾驶汽车感知变化的影响。 VR 实验前后,参与者完成了评估他们对自动驾驶汽车看法的调查,重点关注态度和系统有效性两个主要方面。 Wilcoxon 签名排名测试结果表明,在 VR 实验之后,行人对自动驾驶汽车的整体态度评分和对自动驾驶系统有效性的信任度均显着提高。值得注意的是,对黄色信号表现出更大信任的个人更倾向于对自动驾驶汽车表现出更高的态度分数,并增强他们对自动驾驶系统有效性的信任。这表明黄色信号灯的设计让行人对与自动驾驶汽车的互动更有信心。此外,与那些具有更积极的过路行为的行人相比,表现出更积极的过路行为的行人不太可能改变对自动驾驶汽车的看法。

Enabling Digitalization in Modular Robotic Systems Integration
Authors Daniella Tola
将机器人系统集成到生产线中是一个耗时的过程。在数字化时代,新技术的研发对于改进集成流程至关重要。众多挑战,包括缺乏标准化以及复杂的利益相关者关系,使机器人系统集成的过程变得复杂。该过程通常包括机器人系统的获取、集成和部署。本论文重点关注有助于自动化和简化机器人系统集成的三个领域。在与采集相关的第一个领域,演示了基于约束的配置器,它解决了机器人设备之间的兼容性挑战,并使配置过程自动化。这降低了集成不兼容设备的风险,并减少了配置阶段对专家的需求。在与集成相关的第二个领域中,研究了可互操作的建模格式(统一机器人描述格式 URDF),并进行了详细分析,揭示了显着的不一致和关键的改进。这种格式广泛用于机器人的运动学建模和 3D 可视化,并且其模型可以跨仿真工具重复使用。改进这种格式使广泛的用户受益,包括机器人工程师、研究人员和学生。在与部署相关的第三个领域,探索了机器人系统的数字孪生DT,因为它们可以提高效率并减少停机时间。对 DT 进行了全面的文献综述,并开发了模块化机器人系统的案例研究。这项研究可以加速 DT 在机器人行业的采用。

Mobile ALOHA: Learning Bimanual Mobile Manipulation with Low-Cost Whole-Body Teleoperation
Authors Zipeng Fu, Tony Z. Zhao, Chelsea Finn
从人类演示中进行的模仿学习在机器人技术中表现出了令人印象深刻的表现。然而,大多数结果都集中在桌面操作上,缺乏一般有用任务所需的移动性和灵活性。在这项工作中,我们开发了一种用于模仿需要全身控制的双手移动操作任务的系统。我们首先推出 Mobile ALOHA,这是一种用于数据收集的低成本全身远程操作系统。它通过移动底座和全身远程操作界面增强了 ALOHA 系统。然后,我们使用 Mobile ALOHA 收集的数据执行监督行为克隆,并发现与现有静态 ALOHA 数据集的协同训练可以提高移动操作任务的性能。每项任务进行 50 次演示,协同训练可将成功率提高多达 90 倍,使 Mobile ALOHA 能够自主完成复杂的移动操作任务,例如炒虾和上菜、打开两门壁柜存放沉重的烹饪锅、呼叫并进入电梯,并使用厨房水龙头轻轻冲洗用过的锅。

On Time-Indexing as Inductive Bias in Deep RL for Sequential Manipulation Tasks
Authors M. Nomaan Qureshi, Ben Eisner, David Held
在解决复杂的操纵任务时,操纵策略通常需要学习一组不同的技能来完成这些任务。这组技能通常是多模态的,每个技能可能具有截然不同的动作和状态分布。标准深度策略学习算法通常将策略建模为具有单个输出头确定性或随机性的深度神经网络。这种结构需要网络学习在内部模式之间切换,这可能导致样本效率较低和性能较差。在本文中,我们探索了一种简单的结构,有利于许多操作任务所需的技能学习。具体来说,我们提出了一种策略架构,可以在固定的时间内顺序执行不同的动作头,从而能够学习基本技能,例如伸手和抓握。

ODIN: A Single Model for 2D and 3D Perception
Authors Ayush Jain, Pushkal Katara, Nikolaos Gkanatsios, Adam W. Harley, Gabriel Sarch, Kriti Aggarwal, Vishrav Chaudhary, Katerina Fragkiadaki
ScanNet 等当代 3D 感知基准的最先进模型使用和标签数据集提供了 3D 点云,这些点云是通过感测的多视图 RGB D 图像的后处理获得的。它们通常在域中进行训练,放弃大规模 2D 预训练,并优于以 RGB D 多视图图像为特征的替代方案。使用姿势图像的方法与后处理的 3D 点云的方法之间的性能差距让人更加相信 2D 和 3D 感知需要不同的模型架构。在本文中,我们挑战了这一观点,并提出了 ODIN Omni Dimensional INstance 分割,这是一种可以分割和标记 2D RGB 图像和 3D 点云的模型,使用在 2D 视图内和 3D 跨视图信息融合之间交替的转换器架构。我们的模型通过所涉及标记的位置编码来区分 2D 和 3D 特征操作,该编码捕获 2D 补丁标记的像素坐标和 3D 特征标记的 3D 坐标。 ODIN 在 ScanNet200、Matterport3D 和 AI2THOR 3D 实例分割基准上实现了最先进的性能,在 ScanNet、S3DIS 和 COCO 上实现了具有竞争力的性能。当使用感测到的 3D 点云代替从 3D 网格采样的点云时,它的性能大大优于以前的所有工作。当在可指导的具体代理架构中用作 3D 感知引擎时,它为对话基准的 TEACh 动作设定了新的技术水平。

Direction of Arrival Estimation Using Microphone Array Processing for Moving Humanoid Robots
Authors Vladimir Tourbabin, Boaz Rafaely
近年来,人形机器人的听觉系统受到越来越多的关注。该系统通常通过麦克风阵列来获取周围的声场。然后使用各种方法处理阵列采集的信号。广泛应用的方法之一是到达方向估计。传统的到达方向估计方法假设在估计期间阵列固定在给定位置。然而,对于安装在移动人形机器人上的阵列来说,情况不一定如此。如果没有适当考虑阵列运动,可能会在估计的到达方向上引入显着的误差。当前的论文提出了一种考虑运动的信号模型。基于该模型,提出了两种处理方法。第一个补偿机器人的运动。第二种方法适用于周期性信号,并利用运动来将性能提高到超出固定阵列的水平。提供了数值模拟和实验研究,证明运动补偿方法几乎消除了与运动相关的误差。

Inherently robust suboptimal MPC for autonomous racing with anytime feasible SQP
Authors Logan Numerow, Andrea Zanelli, Andrea Carron, Melanie N. Zeilinger
近年来,自动驾驶等应用对高性能控制器的需求不断增长,推动了针对特定控制问题的优化例程的开发。在本文中,我们提出了一种高效的不精确模型预测控制 MPC 策略,用于具有固有鲁棒性的自主微型赛车。我们依赖于一种可行的顺序二次规划 SQP 算法,该算法能够生成可行的中间迭代,以便求解器可以在任意次数的迭代后停止,而不会危及递归的可行性。通过这种方式,我们提供了一种计算次优但可行的解决方案的策略,其计算足迹远低于基于局部最优解决方案计算的最先进方法。在对终端集和系统可控性属性的适当假设下,我们可以说,对于影响系统动态的任何足够小的扰动,可以保证递归可行性。我们在模拟中验证了所提出策略的有效性,并将其部署到自动微型赛车的物理实验中。仿真和实验结果都表明,与采用提前终止而不提供可行解的策略相比,使用可行的 SQP 方法,可以通过适度的额外计算工作来获得可行解。

Estimating continuous data of wrist joint angles using ultrasound images
Authors Yo Kobayashi, Yoshihiro Katagi
超声波成像最近被引入作为联合运动估计的传感接口。使用超声图像作为估计方法有望提高辅助设备和人机界面的控制性能。本研究旨在使用超声图像估计连续的腕关节角度。具体来说,在实验中,在伸展屈曲运动期间获得关节角度信息,并获取相关肌肉的超声图像。利用从超声图像获得的特征,使用多元线性回归模型来估计关节角度。使用来自超声图像的光流获得的特征点的坐标被用作多元线性回归模型的解释变量。每个参与者都对模型进行了每次试验的训练和测试,以验证估计的准确性。结果显示,所有试验的估计精度的平均值和标准差为均方根误差 RMSE 1.82 pm 0.54 deg,决定系数 R2 0.985 pm 0.009。

Perceptions of Humanoid Robots in Caregiving: A Study of Skilled Nursing Home and Long Term Care Administrators
Authors Rana Imtiaz, Arshia Khan
随着人口老龄化的加剧和医护人员短缺的加剧,研究其他照顾老龄化人口的方法的必要性也随之增加。其中一种方法是使用人形机器人来照顾 65 岁以上人群的社交、情感和身体健康。了解熟练的长期护理院管理员对人形机器人在护理方面的看法至关重要,因为他们的见解影响着机器人的实施及其对居民福祉和生活质量的潜在影响。作者对 269 名疗养院管理人员进行了调查,以了解他们对在疗养院设施中使用人形机器人的看法。数据经过编码,结果显示,高管们热衷于探索其他护理途径,例如机器人技术,以增强疗养院照顾居民的能力。定性分析揭示了在疗养院中集成人形机器人的不同观点。虽然承认提高参与度和员工支持等好处,但对成本、对人类互动的影响以及对机器人有效性的怀疑仍然存在。这凸显了复杂的财务、技术和人力障碍,并强调了战略实施的必要性。

Chinese Abs From Machine Translation

Papers from arxiv.org

更多精彩请移步主页


pic from pexels.com

相关文章:

【AI视野·今日Robot 机器人论文速览 第七十一期】Fri, 5 Jan 2024

AI视野今日CS.Robotics 机器人学论文速览 Fri, 5 Jan 2024 Totally 11 papers 👉上期速览✈更多精彩请移步主页 Daily Robotics Papers Machine Learning in Robotic Ultrasound Imaging: Challenges and Perspectives Authors Yuan Bi, Zhongliang Jiang, Felix D…...

xtu oj 1334 Least Common Multiple

题目描述 一个集合,任取3个不同的元素,求其最小公倍数中最小的值是多少? 输入 第一行是样例数T(1≤T≤100)。 每个样例的第一行是一个整数n(3≤n≤50),表示集合元素的个数。 每个样例的第二行是n个整数a1,a2,…,an,1≤ai≤106。…...

【论文笔记】End-to-End Diffusion Latent Optimization Improves Classifier Guidance

Abstract Classifier guidance为图像生成带来了控制,但是需要训练新的噪声感知模型(noise-aware models)来获得准确的梯度,或使用最终生成的一步去噪近似,这会导致梯度错位(misaligned gradients)和次优控制(sub-optimal control)。 梯度错位…...

【HarmonyOS4.0】第四篇-ArkUI基础实战

一、ArkUI框架简介 ArkUI开发框架是方舟开发框架的简称,它是一套构建 HarmonyOS / OpenHarmony 应用界面的声明式UI开发框架,它使用极简的UI信息语法、丰富的UI组件以及实时界面语言工具,帮助开发者提升应用界面开发效率 30%,开发…...

每日一题——LeetCode1128.等价多米诺骨牌对的数量

先尝试暴力解法&#xff1a; var numEquivDominoPairs function(dominoes) {var count0for(let i0;i<dominoes.length-1;i){for(let ji1;j<dominoes.length;j){if((dominoes[i][0]dominoes[j][0] && dominoes[i][1]dominoes[j][1]) || (dominoes[i][0]dominoes…...

关联规则分析(Apriori算法2

目录 1.核心术语&#xff1a;2.强关联规则&#xff1a;小结&#xff1a; 1.核心术语&#xff1a; 支持度&#xff08;Support&#xff09;&#xff1a;指项集出现的频繁程度&#xff08;相当于项集出现的概率&#xff09; 最小支持度有绝对值和占比两种表示方式 置信度&#…...

数据仓库(2)-认识数仓

1、数据仓库是什么 数据仓库 &#xff0c;由数据仓库之父比尔恩门&#xff08;Bill Inmon&#xff09;于1990年提出&#xff0c;主要功能仍是将组织透过资讯系统之联机事务处理(OLTP)经年累月所累积的大量资料&#xff0c;透过数据仓库理论所特有的资料储存架构&#xff0c;做…...

C#编程-实现委托

实现委托 委托是可以存储对方法的引用的对象。在C#中,委托允许您动态地改变类中方法的引用。 考虑咖啡售货机的示例,它配置不同口味的咖啡,例如卡布奇诺咖啡和黑咖啡。在选择所需口味的咖啡时,售货机决定混合各种成分,例如奶粉、咖啡粉、热水、卡布奇诺咖啡粉。所有的材…...

Ubuntu18.04 Qt 实现MQTT

什么是MQTT&#xff1f; 作用是什么&#xff08;适用场景&#xff09;&#xff1f; 与其他通讯协议相比&#xff0c;优缺点在那里&#xff1f; 一.安装 MQTT 服务器 使用 EMQ X&#xff08;开源且可视化管理&#xff09; 下载 EMQX 下载的是 emqx-5.0.26-ubuntu18.04-…...

【软件测试】学习笔记-不同视角的软件性能与性能指标

本篇文章探讨新的测试主题&#xff1a;性能测试&#xff0c;因为性能测试的专业性很强&#xff0c;所以我会以从0到1的入门者视角&#xff0c;系统性地阐述性能测试的方法以及应用领域&#xff0c;用实例去诠释各种性能指标。 本篇文章站在全局的视角&#xff0c;帮你梳理软件性…...

Spring MVC组件

1.DispatcherServlet前端控制器 用户请求到达前端控制器&#xff0c;它就相当于mvc模式中的c&#xff0c;dispatcherServlet 是整个流程控制的中心&#xff0c;由它调用其它组件处理用户的请求&#xff0c;dispatcherServlet 的存在降低了组件之间的耦合性。 2.HandlerMappin…...

vue文件在<template>中使用多个<el-main>报错(已解决)

目录 1.原理 2. 根据你的需求&#xff0c;自定义每个 组件的内容。你可以在 标签内部插入文本、其他组件、样式等。 3. 根据需要添加样式或其他属性到每个 组件。你可以使用 class、style 或其他属性来自定义每个组件的外观和行为。 4.一个可以运行的总代码如下 5.我的一…...

【PlantUML】- 时序图

写在前面 本篇文章&#xff0c;我们来介绍一下PlantUML的时序图。这个相对类图来讲&#xff0c;比较简单&#xff0c;也不需要布局。读完文章&#xff0c;相信你就能实际操作了。 目录 写在前面一、基本概念二、具体步骤1.环境说明2.元素3.语法4.示例 三、参考资料写在后面系列…...

openai自定义API操作 API (openai.custom):OpenAI API 实现电商平台的智能库存管理

在电商行业中&#xff0c;库存管理是至关重要的环节之一。一个高效的库存管理系统可以确保商品的正常供应&#xff0c;避免缺货或积压现象&#xff0c;从而提高销售效率和客户满意度。然而&#xff0c;传统的库存管理方式往往存在一些问题&#xff0c;如数据不准确、响应不及时…...

宠物服务新篇章:预约小程序带来的变革

随着科技的进步和互联网的普及&#xff0c;小程序已经成为了一种非常受欢迎的应用形式。对于宠物门店来说&#xff0c;开发一个预约小程序可以大大提高客户体验和管理效率。下面是一份宠物门店预约小程序的开发指南。 浏览器搜索乔拓云&#xff0c;登录乔拓云网后台&#xff0c…...

谷歌最新医学领域LLM大模型:AMIE

2024年1月11日Google 研究院发布最新医疗大模型AMIE&#xff1a;用于诊断医学推理和对话的研究人工智能系统。 文章链接&#xff1a;Articulate Medical Intelligence Explorer (AMIE) giuthub&#xff1a;目前代码未开源 关于大模型之前有过一篇总结&#xff1a;大语言模型(L…...

路由器02_静态路由DHCP

一、静态路由 &#xff11;、静态路由特点 由管理员手工配置&#xff0c;是单向的&#xff0c;缺乏灵活性 &#xff12;、默认路由 默认路由是一种比较特殊静态路由&#xff0c;一般用于末节&#xff08;末梢&#xff09;网络&#xff0c;直接指定目标为任何地方 二、静态…...

Mysql 递归查询所有子节点,hutool树形结构封装

工作中经常会有像目录&#xff0c;部门的多级结构&#xff0c;记录一下查询自己点的方式&#xff0c;留着复制粘贴 方式1&#xff1a; SELECT* FROMcus_department WHEREFIND_IN_SET( id, pid ) > 0;UNIONSELECTcd.* FROM( SELECT * FROM cus_department WHERE pid IS …...

【代码随想录04】24. 两两交换链表中的节点 19. 删除链表的倒数第 N 个结点 面试题 02.07. 链表相交 142. 环形链表 II

24. 两两交换链表中的节点 题目描述 给你一个链表&#xff0c;两两交换其中相邻的节点&#xff0c;并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本题&#xff08;即&#xff0c;只能进行节点交换&#xff09;。 做题思路 可以设置虚拟头结点cur和画图…...

Pandas实战100例 | 案例 25: 计算相关系数

案例 25: 计算相关系数 知识点讲解 在统计分析中&#xff0c;了解变量之间的关系是非常重要的。相关系数是衡量变量之间线性相关程度的一种方法。Pandas 提供了 corr 方法来计算列之间的相关系数。 相关系数: 相关系数的值范围在 -1 到 1 之间。接近 1 表示正相关&#xff0…...

vue文本识别“\n“换行问题的解决方式

一、通过 css属性 实现 设置 white-space: pre-wrap; 代码如下&#xff1a; <div style"white-space: pre-wrap;">({含有\n的字符串}}</div> 扩展&#xff1a; white-space属性值&#xff1a; 值描述normal默认。空白会被浏览器忽略。pre空白会被浏…...

【QT-UI】

1.使用手动连接&#xff0c;将登录框中的取消按钮使用qt4版本的连接到自定义的槽函数中&#xff0c;在自定义的槽函数中调用关闭函数 #include "mainwindow.h" #include "ui_mainwindow.h"MainWindow::MainWindow(QWidget *parent): QMainWindow(parent), …...

MyBatisPlus逆向工程

依赖 <!--Mybatis-plus逆向生成器依赖--><dependency><groupId>com.baomidou</groupId><artifactId>mybatis-plus-generator</artifactId><version>3.4.1</version></dependency><!--Mybatis-plus逆向生成器的Freema…...

创建ESP32开源WiFi MAC(介质访问控制)层

内置WiFi 内置的 WiFi.h 库将使我们能够轻松使用 ESP32 板的 WiFi 功能。 连接到 Wi-Fi 接入点&#xff1a; #include <WiFi.h>const char* ssid "yourNetworkName"; const char* password "yourNetworkPassword";void setup(){Serial.begin(11…...

LeetCode 2723. 两个 Promise 对象相加

给定两个 promise 对象 promise1 和 promise2&#xff0c;返回一个新的 promise。promise1 和 promise2 都会被解析为一个数字。返回的 Promise 应该解析为这两个数字的和。 示例 1&#xff1a; 输入&#xff1a; promise1 new Promise(resolve > setTimeout(() > res…...

Flutter--常用技术文档

配置 清华大学flutter镜像 export PUB_HOSTED_URLhttps://mirrors.tuna.tsinghua.edu.cn/dart-pub export FLUTTER_STORAGE_BASE_URLhttps://mirrors.tuna.tsinghua.edu.cn/flutter 社区镜象 export PUB_HOSTED_URLhttps://pub.flutter-io.cn export FLUTTER_STORAGE_BASE_UR…...

行分类问题

行分类问题可以应用于多个领域和问题&#xff0c;其中一些示例包括&#xff1a; 文本分类&#xff1a; 在自然语言处理中&#xff0c;可以将文本分为不同的类别&#xff0c;例如情感分析、主题分类等。每个文本可以被视为一个“行”&#xff0c;而分类任务就是对每个行进行分类…...

java常见面试题:如何使用Java进行XML解析和生成?

在Java中&#xff0c;有几种不同的方式可以进行XML的解析和生成。以下是使用Java进行XML解析和生成的基本步骤&#xff1a; 解析XML&#xff1a; DOM (Document Object Model): 这是最常用的解析方法。它将整个XML文档加载到内存中&#xff0c;并允许你通过编程方式遍历和操作它…...

【LabVIEW FPGA入门】LabVIEW FPGA实现I2S解码器

该示例演示了如何使用 LabVIEW FPGA 解码 IS 信号。该代码可用于大多数支持高速数字输入的LabVIEW FPGA 目标&#xff08;例如R 系列、CompactRIO&#xff09;。IS 用于对系统和组件内的数字音频数据进行编码。例如&#xff0c;MP3 播放器或 DVD 播放器内部的数字音频通常使用 …...

linux 安装sipp

sudo apt-get install libnet1-dev libpcap0.8-dev openssl libssl-dev 从 sipp - Browse /sipp/3.2 at SourceForge.net 下载最新版的sipp.svn.tar.gz&#xff0c;解压之后就得到一个rpm文件 tar -zxvf sipp.svn.tar.gz cd sipp make pcapplay_ossl...