解锁机器人视觉与人工智能的潜力,从“盲人机器”改造成有视觉能力的机器人(下)
机器视觉产业链全景回顾
视觉引导机器人生态系统或产业链分为三个层次。
上游(供应商)
该机器人视觉系统的上游包括使其得以运行的硬件和软件提供商。硬件提供商提供工业相机、图像采集卡、图像处理器、光源设备(LED)、镜头、光学附件、配件等。
另一方面,软件提供商则提供机器视觉软件和算法,这其中包括视觉处理软件、算法平台及其库、图像处理软件等。
中游(机器人设备制造与系统集成)
在中游阶段,我们会把这些硬件和软件部件结合起来,制造出能够进行视觉引导、识别、测量和检测的设备。之后,我们还会对这些设备进行进一步的整合,以形成可以直接用于机器人导航、安全检查、质量检测等多个方面的现成解决方案。
下游(应用)
这些解决方案可以应用于多个行业,如电子、半导体、食品、饮品和屏显制造业,用于安全和质量检测,也可以应用于汽车行业,实现自动驾驶、驾驶辅助功能以及自动化电池充电。
机器人视觉是如何工作的?
在机器人被部署到工业生产线之前,必须先对其进行训练,使其能够识别物体。完成这部分训练后,系统的工作流程如下。我们以一台通常处于等待或待机状态的工业机器人为例。
1.工件定位检测器始终处于开启状态,当物体移动到摄像机视野中心附近时,它能够感知到。一旦检测到物体,它就会向图像采集卡发送激活信号或触发脉冲。
2.图像采集卡根据预设程序和延迟,向摄像机和照明系统发送启动脉冲,以启动它们。
3.如果摄像机处于激活状态,它会停止当前的扫描并开始新的一帧扫描。但如果它处于待机状态,启动脉冲会触发它开始帧扫描。视觉摄像机在扫描帧之前会打开曝光机制,并且您可以提前配置曝光时间来控制帧扫描。
4.另一个启动脉冲会打开LED照明,图像采集卡确保照明时间与摄像机的曝光时间相匹配。
5.曝光后,图像帧扫描和输出开始,图像传感器产生模拟视频信号。
6.图像采集卡将模拟信号转换为数字信号。但如果摄像机是数字的,则此步骤不必要。然后,图像采集卡将数字图像存储在计算机的内存中。
7.卡中的处理器使用人工智能算法对图像进行分析识别,以获得X、Y、Z测量值或逻辑控制值等。
8.图像处理的结果被发送到生产线控制单元,该单元会根据需要进行任何校正操作。典型的操作包括定位和运动调整。
机器人视觉与计算机视觉:有何不同?
这两者之间界限微妙。计算机视觉是一个更为宽泛的术语,它涵盖了机器人视觉和机器视觉,并涉及从图像中提取信息以理解其上的像素数据或物体。简而言之,计算机视觉主要是关于图像上的物体检测。
但机器人视觉是计算机视觉的一个子集,它更侧重于工程和科学领域(而计算机视觉则更多属于研究领域)。因此,机器人视觉必须融入其他算法和技术,以使机器人能够与周围环境进行物理交互。例如,运动学和参考坐标系校准使机器人能够移动、抓取物体并避开周围障碍物。
机器视觉经常与机器人视觉互换使用,但两者略有不同。作为计算机视觉的另一个子集,这一工程领域指的是视觉在工业中的应用,以处理特定应用,如过程控制、自动化检测和机器人引导(这一特定功能)。
机器人视觉的应用
由于机器人视觉涵盖了机器人眼睛所能执行的所有视觉功能,因此它提供了这些独立的机器视觉能力。
图像识别:这一应用场景主要适用于二维码和条形码,有助于提高生产效率。
图像检测:在印刷和产品质量检测中,颜色对比和定位等功能依赖于图像检测。
视觉定位:这种机器视觉应用帮助机器人找到检测到的物体的位置,以便进行抓取或移动,如在包装过程中。
物体分类:机器人还可以对捕获、识别和处理后的图像进行分类,这有助于根据等级、尺寸或缺陷对产品进行分拣。
物体测量:这是一种非接触式应用,有助于测量或计算齿轮、连接器引脚、汽车零部件等。它避免了接触式测量可能造成的二次损伤。
为什么在机器人视觉中使用人工智能?
人工智能或机器学习在机器人视觉的模式和物体检测中引入了智能,从而带来了以下好处。
增强柔性制造
由于内置了智能和训练功能,机器人可以适应不同的光照条件、位置和环境,同时仍然能够准确操作。例如,如果其他操作变量(如深度和光照)存在差异,则经过颜色检测训练的机器人在检测颜色时将提供更高的准确性和检测率。
人工智能还使得机器人能够从过去的错误中学习并进行自我校准以提高效率。人类也可以指出它所犯的错误,以便进行强化学习,从而更快地校准系统。
然而,人工智能的视觉准确性仍然存在局限性,因为其错误率约为15%。因此,有必要进行人工复检以确保达到高质量标准。这可能会显著增加生产成本。但随着技术的成熟,错误率有望降低,如果低于5%的阈值,人工智能和机器人/机器视觉可能就不再需要人工复检。
提升工业机器人能力
机器学习还可以增强工业机器人的抗干扰和误差补偿能力。例如,在使用传统机器人对汽车表面进行抛光时,该过程必须遵循固定程序。如果有人为干扰,车辆可能会带着缺陷离开油漆车间。但人工智能使机器人能够感知这些变化并补偿任何误差,从而使抛光过程达到所需的结果。
机器人还可以通过自我校准自动优化这一生产过程以提高效率。当与物联网配对时,人工智能可以使用传感器数据进行大数据分析,以使生产线尽可能高效。
这些智能机器人也是可重复使用的,因为某些任务或程序可以应用于制造车间的多个过程。例如,抛光机器人可以对汽车、自行车和其他产品进行抛光,因为表面质量是最重要的考虑因素。因此,无需对这些机器人进行重新编程以执行这些任务。
机器人视觉的发展趋势
三维成像:三维视觉使机器人能够识别和抓取大量随机放置的部件,以优化抓取操作的效率。
高光谱成像:这种成像技术通过检查颜色等变量来可视化不同材料中的分子结构,从而能够分析化学材料。它还可以监测缺陷或检测杂质,例如在肉类生产中通过检查颜色来检测塑料。
工业检测中的热成像:热成像可以与普通相机配对,提供全面的检测系统,以在测试汽车或电子产品时监测温度变化。这个额外的“眼睛”能看到普通眼睛看不到的东西。
云端深度学习:机器人视觉还可以为云端深度学习算法提供大量数据进行推理。尽管广域网存在延迟和安全问题,但5G和大规模机器类型通信(mMTC)提供了快速且安全的通信,使得云端处理更加可行,从而有可能实现“轻量级”机器人。
东胜物联嵌入式视觉AI系统级模块(SoM)
东胜物联在构建机器人视觉方面功能最强大的系统级模块(SoM)是RK3588J。在机器人视觉产业链中,该产品属于上游层级(硬件部分),因此您可以安装必要的软件并将其与其他所需硬件进行接口连接,以为您的客户构建ROS计算机视觉系统解决方案。
该SoM内置了6 TOPS的NPU来运行AI算法,并支持大型离线模型、物体识别(包括人脸识别)、单目测距以及灵活的计算扩展,以处理不同的任务。
在数据输入方面,该SoM的MIPI CSI支持最多8个摄像头输入,并配备了USB端口以运行照明功能。摄像头或其支撑臂也需要移动,而RK3588J具有CAN接口,可实现精确的电机控制。如果机器人是可移动的,此接口还可以移动轮子并控制电机的速度。
东胜物联在机器视觉嵌入式主板定制领域经验丰富,提供从硬件设计、BSP开发到软件应用及测试用例的全面支持。
【扩展阅读】
【喜报】浙江东胜物联技术有限公司加入深圳市物联网产业协会理事单位_浙江东胜物联技术有限公司深圳分公司-CSDN博客
相关文章:

解锁机器人视觉与人工智能的潜力,从“盲人机器”改造成有视觉能力的机器人(下)
机器视觉产业链全景回顾 视觉引导机器人生态系统或产业链分为三个层次。 上游(供应商) 该机器人视觉系统的上游包括使其得以运行的硬件和软件提供商。硬件提供商提供工业相机、图像采集卡、图像处理器、光源设备(LED)、镜头、光…...

CORS预检请求配置流程图 srpingboot和uniapp
首先要会判断预检请求 还是简单请求 简单请求 预检请求 #mermaid-svg-1R9nYRa7P9Pll4AK {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-1R9nYRa7P9Pll4AK .error-icon{fill:#552222;}#mermaid-svg-1R9nYRa7P9Pll4…...

用Spring AI 做智能客服,基于私有知识库和RAG技术
Java智能客服系统运用RAG技术提升答疑精准度 基于Spring ai 的 RAG(检索增强生成)技术,Java智能客服系统能够利用私有知识库中的信息提供更准确的答疑服务。 它的核心思路是: 首先,将客服QA以Word形式导入到系统中&…...

TemporalBench:一个专注于细粒度时间理解的多模态视频理解的新基准。
2024-10-15,由威斯康星大学麦迪逊分校、微软研究院雷德蒙德等机构联合创建了TemporalBench,它通过大约10K个视频问答对,提供了一个独特的测试平台,用以评估各种时间理解和推理能力,如动作频率、运动幅度、事件顺序等。…...

网友提问:网上申请流量卡不通过怎么办?
网上申请流量卡不通过怎么办?网上办理流量卡不通过,说明你不符合办理此套餐的要求,可以选择其他套餐,或者其他运营商的流量卡申请试试。 我们不管是在京*、淘*、拼**哪个网站申请的流量卡,提交的申请信息都是由运营商…...

JavaWeb 22.Node.js_简介和安装
有时候,后退原来是向前 —— 24.10.7 一、什么是Node.js Node.js 是一个于 Chrome V8 的 JavaScript 运行时环境,可以使 JavaScript 运行在服务器端。使用 Node.js,可以方便地开发服务器端应用程序,如 Web 应用、API、后端服务&a…...

APIJSON的使用
APIJSON是一个用于简化后端接口开发的工具,在Java中可以按照以下步骤使用: 1. 引入依赖 在Java项目中,需要引入APIJSON的相关依赖。如果使用Maven,可以在pom.xml文件中添加以下依赖: <dependency><groupId…...

简单三步完成 Telegram 生态的 Web3 冷启动
在竞争激烈的 Web3 领域,强有力的启动往往能决定成败。Telegram 无疑当下最火热的流量池,是很多 Web3 项目冷启动阶段的必选项。 但眼看着好多项目在 Telegram 生态火速获取百万级甚至千万级别的用户,自己的项目要怎么开始做增长,…...

Go Wails 学习笔记:创建第一个项目
文章目录 1. 安装 Wails2. 创建 Wails 项目3. 项目结构4. 运行项目5. 构建项目6. 部署和发布总结 Wails 是一个用于构建跨平台桌面应用程序的框架,允许开发者使用前端技术(如 HTML、CSS、JavaScript)以及 Go 语言来开发桌面应用。本文基于官方…...

Postman使用-基础篇
前言 本教程将结合业界广为推崇和使用的RestAPI设计典范Github API,详细介绍Postman接口测试工具的使用方法和实战技巧。 在开始这个教程之前,先聊一下为什么接口测试在现软件行业如此重要? 为什么我们要学习Postman? 现代软件…...

LeetCode 202.快乐数
LeetCode 202.快乐数 C 思路: 用快慢指针来进行解答,可以将其看做一个回环链表,慢指针完成一次平方和操作,快指针完成两次平方和操作,当快慢指针相遇时,判断快慢指针是否为1(为1以后无论怎么取平方和都会为…...

Redis-03 持久化(RDB, AOF,混合持久化)及原理
1,持久化 Redis的持久化是必须的,当Redis服务宕机后,如果没有持久化,重启服务后redis中的数据都将丢失,所有的数据操作都将直连数据库,系统性能会大幅降低,所以在使用Redis做缓存服务时必须持久…...

TikTok账号策略:IP和网络环境的要求分析
在当今社交媒体迅猛发展的时代,TikTok作为一款短视频平台,凭借其独特的算法和庞大的用户基础,吸引了越来越多的内容创作者和营销人员。成功地运营一个TikTok账号,除了优质的内容创作外,良好的IP和网络环境也至关重要。…...

vue后台管理系统从0到1(5)
文章目录 vue后台管理系统从0到1(5)完善侧边栏修改bug渲染header导航栏 vue后台管理系统从0到1(5) 接上一期,我们需要完善我们的侧边狼 完善侧边栏 我们在 element 组件中可以看见,这一个侧边栏是符合我们…...

OpenAI的新功能Canvas,效果还不错
时隔两年,ChatGPT终迎来界面全新升级! 这一次,OpenAI官宣推出类似 Anthropic 的 Artifacts 的界面交互功能 canvas,并称这是一种使用 ChatGPT 写作和编程的新方式。不论是写作,还是编码,都可以开启全新的交…...

了解一些常用的Javascript对象方法
javascript 的对象包含许多有用的方法,可以帮助开发人员轻松操作对象。让我们通过简短的解释和示例来了解一些最重要的内容 object.create()object.assign()object.keys()object.values()object.entries()object.freeze()object.seal()object.preventextensions()o…...

【知识科普】GraphQL一个强大的API查询语言
文章目录 概述📚 GraphQL 的类型系统是如何工作的?🔍 能否举例说明 GraphQL 的类型系统在实际应用中是如何工作的?位置步骤 1: 定义类型步骤 2: 实现解析器步骤 3: 客户端查询步骤 4: 执行查询 🛠️ 在实际开发中&…...

Spring Boot 整合达梦
Maven 依赖 <dependency><groupId>com.dameng</groupId><artifactId>DmJdbcDriver18</artifactId><version>8.1.2.192</version></dependency> yml配置 datasource:master:url: jdbc:dm://192.168.211.113:30236username: WE…...

Vue.js 组件开发基本步骤
Vue.js 是一个构建用户界面的渐进式框架,它被设计为能够轻松地被集成进项目的部分功能,或者用于构建完整的前端应用。组件化是 Vue.js 的核心概念之一,它允许开发者将界面拆分成独立、可复用的组件,每个组件负责应用中的一小部分功…...

博客搭建之路:hexo使用next主题渲染流程图
文章目录 hexo使用next主题渲染流程图 hexo使用next主题渲染流程图 hexo版本5.0.2 npm版本6.14.7 next版本7.8.0 next主题的配置文件中搜索找到mermaid,把enable配置改为true mermaid:enable: true# Available themes: default | dark | forest | neutraltheme: de…...

【数据结构与算法】线性表顺序存储结构
文章目录 一.顺序表的存储结构定义1.1定义1.2 图示1.3结构代码*C语言的内存动态分配 二.顺序表基本运算*参数传递2.1建立2.2初始化(InitList(&L))2.3销毁(DestroyList(&L))2.4判断线性表是否为空表(ListEmpty(L))2.5求线性表的长度(ListLength(L))2.6输出线性表(DispLi…...

Unix Standardization and Implementations
Unix标准化 在Unix未制定较为完备的标准时,各个平台的系统调用方式各异,所开发出的应用程序存在可移植性差的特点,因此人们呼吁指定一套Unix标准来规范接口,增加应用程序的可移植性。所谓Unix标准即适用于Unix环境下的一系列函数…...

Windows 与 Java 环境下的 Redis 利用分析
1 前言 在最近的一次攻防演练中,遇到了两个未授权访问的 Redis 实例。起初以为可以直接利用,但后来发现竟然是Windows Java (Tomcat)。因为网上没有看到相关的利用文章,所以在经过摸索,成功解决之后决定简单写一写。 本文介绍了…...

机器视觉系统硬件组成之工业相机篇
工业相机是一种非常重要的机器视觉器件,它能够将被采集的图像信息通过电路转换成电信号,再通过模数转换器(ADC)将其转化为数字信号,最后以标准的视频信号输出。工业相机在机器视觉领域得到了广泛应用,包括质…...

离线安装bitnami-gitlab8.8.4+汉化
注意: 常规安装gitlab需要联网,而按装bitnami-gitlab无需联网(bitnami-gitlab用于内网环境无法联网时安装gitlab,两者是一个东西只是名字不一样)bitnami-gitlab-8.8.4版本可以汉化成功新用户注册账户无需激活也可以直接登录,因为…...

亚马逊日本站推出AI日语listing功能,Listing一键发布,轻松无忧!
随着大数据与人工智能技术的成熟,AI在电商的应用也越来越多,各大电商平台都在陆续引进AI人工智能,有客服方面的,也有发布Listing方面的。 10月17日消息,亚马逊日本站近日宣布推出一项支持日语的人工智能listing功能&am…...

Golang | Leetcode Golang题解之第475题供暖器
题目: 题解: func findRadius(houses, heaters []int) (ans int) {sort.Ints(houses)sort.Ints(heaters)j : 0for _, house : range houses {dis : abs(house - heaters[j])for j1 < len(heaters) && abs(house-heaters[j]) > abs(house-…...

【Vue】Vue3.0 (十二)、watchEffect 和watch的区别及使用
上篇文章: 【Vue】Vue3.0 (十二)、watch对ref定义的基本类型、对象类型;reactive定义的对象类型的监视使用 🏡作者主页:点击! 🤖Vue专栏:点击! ⏰️创作时间&…...

PHP-laravel框架
laravel框架 laravel 搭建与路由基础 基本路由与视图路由 视图使用控制器模板分配变量...

永恒之蓝漏洞
MS17-010是微软于2017年3月发布的一个安全补丁,旨在修复Windows操作系统中的一个严重漏洞,该漏洞被称为“永恒之蓝”(EternalBlue)。这个漏洞影响了Windows的Server Message Block(SMB)协议,允许…...