当前位置: 首页 > news >正文

Halcon深度学习网络模型简介

        HALCON为分类和语义分割提供了预训练的神经网络。当训练自定义网络时,这些神经网络是很好的起点。它们已经在一个大型图像数据集上进行了预训练。对于异常检测,HALCON提供了初始模型。

     

用于 3D 抓取点检测的模型

       为 3D 抓取点检测提供了以下网络:

'pretrained_dl_3d_gripping_point.hdl'

       网络最多需要 5 个类型的图像 :real

       'image':强度(灰度值)图像

       'x':X 图像(值需要从左到右增加)

       'y':Y 图像(值需要从上到下增加)

       ‘z’: z图像(值需要从靠近传感器的点增加到远点;例如,如果数据是在相机坐标系中给出的情况)

       ' normals':2D 映射

       此外,网络需要某些图像属性(对于上面提到的所有输入图像)。可以使用get_dl_model_param检索相应的值。默认值:

       “image_width”: 640

       “image_height”: 480

       网络架构允许对图像尺寸进行更改。

异常检测模型

      异常检测主要检测数据中的离群点,异常数据的特征值与正常数据的特征值距离较远。

      提供了以下网络用于异常检测:

'initial_dl_anomaly_medium.hdl'

      此神经网络旨在提高内存和运行时效率。

      网络期望图像是这种类型的。此外,网络需要某些图像属性。可以使用realget_dl_model_param检索相应的值。默认值:       

      “image_width”:480

      “image_height”: 480

      “image_num_channels”: 3

      “image_range_min”: -2

      “image_range_max”: 2

      网络架构允许更改图像尺寸,但是‘image_width’和‘image_height’的大小必须是32像素的倍数,因此最少为32像素

'initial_dl_anomaly_large.hdl'

      这种神经网络被认为更适合于更复杂的异常检测任务。这样做的代价是需要更多的时间和内存。

    网络期望图像是这种类型的。此外,网络需要某些图像属性。可以使用realget_dl_model_param检索相应的值。默认值:  

      “image_width”: 480

      “image_height”: 480

      “image_num_channels”: 3

      “image_range_min”: -2

      “image_range_max”: 2

      网络架构允许更改图像尺寸,但是‘image_width’和‘image_height’的大小必须是32像素的倍数,因此最少为32像素。

全局上下文异常检测模型

       “全局上下文异常值检测”是一种独一无二的技术,能够“理解”整个图像的逻辑内容。 与 HALCON 先前异常值检测功能一样,新的“全局上下文异常检测”只需要训练无缺陷图像,无需数据标记。 这项技术可以检测组件缺失、变形或者排布错位等异常,在半导体生产中的印刷电路板检测场景、印刷痕迹的检测场景也有非常优秀的表现。

      为全局上下文异常检测提供了以下网络:

“pretrained_dl_anomaly_global_context.hdl”

      网络期望图像是这种类型的。此外,网络需要某些图像属性。可以使用realget_dl_model_param检索相应的值。默认值:

      “image_width”:256

      “image_height”:256

      “image_num_channels”:3

      “image_range_min”:-127.0

      “image_range_max”:128.0

分类模型:

      提供以下预训练神经网络用于分类,并可作为检测的骨干:

'pretrained_dl_classifier_alexnet.hdl':

      这个神经网络是为简单的分类任务而设计的。它的特点是第一层卷积核比其他具有类似分类性能的网络(例如pretrained_dl_classifier_compact.hdl)中的卷积核要大。这可能有利于特征提取。

      此分类器期望图像属于该类型。此外,该网络是为某些图像属性设计的。可以使用realget_dl_model_param检索相应的值。默认值:

      “image_width”: 224

      “image_height”: 224

      “image_num_channels”: 3

      “image_range_min”: -127.0

      “image_range_max”: 128.0

      网络架构允许对图像尺寸进行更改。‘image_width’和‘image_height’不应小于29像素。没有最大图像大小限制,但是大的图像大小会显著增加内存需求和运行时间。改变图像大小将重新初始化完全连接层的权重,因此需要重新训练。

      请注意,可以通过融合卷积层和ReLU层来改善该网络的运行时间,参见set_dl_model_param和参数‘fuse_conv_relu’。

“pretrained_dl_classifier_compact.hdl”:

      这种神经网络被设计成具有更高的内存和运行效率。

      分类器期望图像属于该类型。此外,网络需要某些图像属性。可以使用realget_dl_model_param检索相应的值。默认值:

      “image_width”:224

      “image_height”:224

      “image_num_channels”:3

      “image_range_min”:-127.0

      “image_range_max”:128.0

      该网络不包含任何完全连接的层。网络架构允许对图像尺寸进行更改。‘image_width’和‘image_height’不应小于15像素。

“pretrained_dl_classifier_enhanced.hdl”:

      这个神经网络比pretrained_dl_classifier_compact有更多的隐藏层。因此被认为更适合于更复杂的分类任务。这样做的代价是需要更多的时间和内存。

      分类器期望图像属于该类型。此外,网络需要某些图像属性。可以使用realget_dl_model_param检索相应的值。默认值:

      “image_width”:224

      “image_height”:224

      “image_num_channels”:3

      “image_range_min”:-127.0

      “image_range_max”:128.0

      网络架构允许对图像尺寸进行更改。‘image_width’和‘image_height’不应小于47像素。没有最大图像大小限制,但是大的图像大小会显著增加内存需求和运行时间。改变图像大小将重新初始化完全连接层的权重,因此需要重新训练。

'pretrained_dl_classifier_mobilenet_v2.hdl':

      这个分类器是一个小而低功耗的模型,因为什么原因它更适合于移动和嵌入式视觉应用。

      分类器期望图像属于该类型。此外,网络需要某些图像属性。可以使用realget_dl_model_param检索相应的值。默认值:

      “image_width”:224

      “image_height”:224

      “image_num_channels”:3

      “image_range_min”:-127.0

      “image_range_max”:128.0

      网络架构允许对图像尺寸进行更改。‘image_width’和‘image_height’不应小于32像素。没有最大图像大小限制,但是大的图像大小会显著增加内存需求和运行时间。

      在GPU上,网络架构可以从特殊的优化中受益匪浅,没有这些优化,网络就会明显变慢。

'pretrained_dl_classifier_resnet18.hdl':

      随着神经网络pretrained_dl_classifier_enhanced。这个分类器适用于更复杂的任务。然而,由于其特殊的结构,它提供了使训练更稳定和内部更鲁棒的优势。与神经网络pretrained_dl_classifier_resnet50相比。它不那么复杂,推理时间也更快。

      分类器期望图像属于该类型。此外,网络需要某些图像属性。可以使用realget_dl_model_param检索相应的值。默认值:

      “image_width”:224

      “image_height”:224

      “image_num_channels”:3

      “image_range_min”:-127.0

      “image_range_max”:128.0

      网络架构允许对图像尺寸进行更改。‘image_width’和‘image_height’不应小于32像素。没有最大图像大小限制,但是大的图像大小会显著增加内存需求和运行时间。尽管是完全连接层,图像大小的改变并不会导致权重的重新初始化。

'pretrained_dl_classifier_resnet50.hdl':

        随着神经网络pretrained_dl_classifier_enhanced。这个分类器适用于更复杂的任务。然而,由于其特殊的结构,它提供了使训练更稳定和内部更鲁棒的优势。

      分类器期望图像属于该类型。此外,网络需要某些图像属性。可以使用realget_dl_model_param检索相应的值。默认值:

      “image_width”:224

      “image_height”:224

      “image_num_channels”:3

      “image_range_min”:-127.0

      “image_range_max”:128.0

      网络架构允许对图像尺寸进行更改。‘image_width’和‘image_height’不应小于32像素。没有最大图像大小限制,但是大的图像大小会显著增加内存需求和运行时间。尽管是完全连接层,图像大小的改变并不会导致权重的重新初始化。

语义分割模型

      语义分割结合了图像分类、目标检测和图像分割,通过一定的方法将图像分割成具有一定语义含义的区域块,并识别出每个区域块的语义类别,实现从底层到高层的语义推理过程,最终得到一幅具有逐像素语义标注的分割图像。

      以下预训练神经网络用于语义 分割:

'pretrained_dl_edge_extractor.hdl':

      该神经网络是为边缘提取而设计和预训练的。因此,该模型适用于两类问题,一类用于边缘,一类用于背景。

      该网络期望图像是该类型的。此外,该网络是为某些图像属性设计的。可以使用realget_dl_model_param检索相应的值。默认值:

      “image_width”:512

      “image_height”:512

      “image_num_channels”:1

      “image_range_min”:-127.0

      “image_range_max”:128.0

      “num_classes”:2

      网络架构允许更改图像尺寸,但是‘image_width’和‘image_height’的大小必须是16像素的倍数,因此最少为16像素。

“pretrained_dl_segmentation_compact.hdl”:

      该神经网络设计用于处理具有详细结构的分割任务,并且仅使用少量内存并且运行时效率高。

      网络架构允许更改图像尺寸,但要求最小的“image_width”和“image_height”为21像素。

“pretrained_dl_segmentation_enhanced.hdl”:

      ​​​​​​​ 这个神经网络比pretrained_dl_segmentation_compact有更多的隐藏层。因此更适合于包括更复杂场景在内的分割任务。

      网络架构允许更改图像尺寸,但要求最小的image_width和image_height为47像素。

Deep OCR 模型

      为 Deep OCR 提供了以下预训练神经网络:

'pretrained_deep_ocr_recognition.hdl':

      该神经网络是深度OCR模型的预训练识别组件。它被设计用来识别被裁剪成单个单词的图像上的单词。这是深度OCR的识别部分,可以再训练。

      该网络期望图像是该类型的。此外,该网络是为某些图像属性设计的。可以使用realget_dl_model_param检索相应的值。默认值:

      “image_width”:120

      “image_height”:32

      “image_num_channels”:1

      “image_range_min”:-1.0

      “image_range_max”:1.0

      网络架构允许改变图像宽度‘image_width’。图像高度‘image_height’不能更改。参数‘image_width’非常重要:它的值可以减少或增加以适应单词的预期长度,例如,由于每个字符的平均宽度。更大的image_width将消耗更多的时间和内存资源。图像宽度‘image_width’可以在训练后更改。

相关文章:

Halcon深度学习网络模型简介

HALCON为分类和语义分割提供了预训练的神经网络。当训练自定义网络时,这些神经网络是很好的起点。它们已经在一个大型图像数据集上进行了预训练。对于异常检测,HALCON提供了初始模型。 用于 3D 抓取点检测的模型 为 3D 抓取点检测提供了以下网络&#xf…...

ROM修改进阶教程------安卓14 安卓15去除app签名验证的几种操作步骤 详细图文解析

在安卓14 安卓15的固件中。如果修改了系统级别的app。那么就会触发安卓14 15的应用签名验证。要么会导致修改的固件会进不去系统,或者进入系统有bug。博文将从几方面来解析去除安卓14 15应用签名验证的几种方法。 💝💝💝通过博文了解: 1💝💝💝-----安卓14去除…...

基于集成Whisper 与 Pepper-GPT改进人机交互体验并实现顺畅通信

摘要 随着技术以令人眼花缭乱的速度发展,使人机交互更加顺畅比以往任何时候都更加重要。为了应对这一挑战,一个新领域应运而生:人机交互(HRI)。有效的人机交互被认为是实现技术效益的关键。 用户体验(UX&…...

C++设计模式精选面试题及参考答案

目录 什么是单例模式?它的应用场景是什么?如何保证单例模式线程安全? 什么是工厂方法模式?如何与简单工厂模式进行比较? 抽象工厂模式和工厂方法模式有什么区别?请给出实际应用场景。 什么是建造者模式?它和工厂模式有什么不同? 在什么情况下使用单例模式?如何在…...

Linux下的vim和gdb

vim: vim是编译功能强大,多模式的编译器。实际中vim有很多种模式,但是常用的就三种模式: 1、正常/普通/命令模式(Normal mode)控制屏幕光标的移动,字符、字或行的删除,移动复制某区段及进入Insert mode下…...

(蓝桥杯C/C++)——搜索

一、回溯法 1.回溯法简介 回溯法一般使用 ** DFS(深度优先搜索) ** 实现,DFS是一种遍历或搜索图、树或图像等数据结构的算法,当然这个图、树未必要存储下来(隐式处理就是回溯法),常见的是通过某种关系构造出的搜索树,搜索树一般…...

【网页设计】HTML5 和 CSS3 提高

目标 能够说出 3~5 个 HTML5 新增布局和表单标签能够说出 CSS3 的新增特性有哪些 1. HTML5 的新特性 注:该部分所有内容可参考菜鸟教程菜鸟教程 - 学的不仅是技术,更是梦想! (runoob.com) HTML5 的新增特性主要是针对于以前的不足&#xf…...

FastGPT部署通义千问Qwen和智谱glm模型|OneAPI配置免费的第三方API

继这篇博客之后 从零开始FastGPT本地部署|Windows 有同学问,不想在多个平台申请API-Key,不好管理且要付费,有木有白嫖方案呀? 答:有啊。用硅基流动。 注册方法看这篇 【1024送福利】硅基流动送2000万token啦&#xff0…...

https网站 请求http图片报错:net::ERR_SSL_PROTOCOL_ERROR

问题描述 场景: https网站,请求http图片资源报错:net::ERR_SSL_PROTOCOL_ERROR 原因: Chrome 81 中,对混合内容资源加载策略进行了改变,会自动升级到 https:// ,如果无法通过 https:// 加载&am…...

攻防世界38-FlatScience-CTFWeb

攻防世界38-FlatScience-Web 点开这个here看到一堆pdf,感觉没用&#xff0c;扫描一下 试试弱口令先 源码里有&#xff1a; 好吧0.0 试试存不存在sql注入 根本没回显&#xff0c;转战login.php先 输入1’,发现sql注入 看到提示 访问后得源码 <?php ob_start(); ?>…...

探索 JNI - Rust 与 Java 互调实战

真正的救赎&#xff0c;并非厮杀后的胜利&#xff0c;而是能在苦难之中&#xff0c;找到生的力量和内心的安宁。 ——加缪Albert Camus 一、Rust Java &#xff1f; Java 和 Rust 是两种现代编程语言&#xff0c;各自具有独特的优势&#xff0c;适用于不同的应用场景。 1、…...

网络安全-Linux基础(bash脚本)

文章目录 bash脚本编写基础使用的脚本解析器/bin/bash&#xff08;声明&#xff09;bash脚本需要拥有执行权限bash脚本语法输入与输出函数的封装条件判断语句条件符号 循环语句模块化编程 Linux进程操作查看寻找进程终止进程暂停与恢复进程后台运行 bash脚本编写系统内存资源占…...

Lucene 和 Elasticsearch 中更好的二进制量化 (BBQ)

作者&#xff1a;来自 Elastic Benjamin Trent Lucene 和 Elasticsearch 中更好的二进制量化 (BBQ)。 嵌入模型输出 float32 向量&#xff0c;通常对于高效处理和实际应用来说太大。Elasticsearch 支持 int8 标量量化&#xff0c;以减小向量大小&#xff0c;同时保持性能。其他…...

jmeter基础05_第1个http请求

本节课使用网站“httpbin.org”进行基础的http请求全流程。 请求获取httpbin.org的首页&#xff1a; 请求方法&#xff1a;GET URL&#xff1a;http://httpbin.org 参数&#xff1a;无 1、操作步骤 ① 打开jmeter&#xff1a;命令行窗口输入“jmeter”并回车。 ② 添加线程组…...

C++builder中的人工智能(25):AI中的C++多线程std::thread

主要是为Ai算法中要使用到C的多线程&#xff0c;这是使用C11中的多线程std::thread。 在现代数学、物理和计算机科学中&#xff0c;优化和加速应用程序开发在编程中非常重要&#xff0c;以加快计算速度。多核心CPU和GPU通过核心和晶体管的数量得到了高度发展&#xff0c;为当今…...

RestSharp基本使用方法

关于RestSharp RestSharp is a library that allows you to make REST and HTTP calls in .NET applications. It supports serialization, parameters, async functions, and more. RestSharp是C#的一个WepApi库&#xff0c;支持通用的Web接口处理&#xff0c;支持序列化、参数…...

MySQL与Oracle对比及区别

一、比较 1、MySQL的特点 性能卓越&#xff0c;服务稳定&#xff0c;很少出现异常宕机&#xff1b; 开放源代码无版本制约&#xff0c;自主性及使用成本低&#xff1b; 历史悠久&#xff0c;社区和用户非常活跃&#xff0c;遇到问题及时寻求帮助&#xff1b; 软件体积小&#…...

NCC前端调用查询弹框

系统自带的查询模板 弹框 调启使用默认的 查询模板 是在 单据模板的 列表模板中&#xff0c;有个查询区域 &#xff0c;查询区域就是查询模板内容如果在列表页做客开 新增按钮 调启查询模板 无问题&#xff0c;但是目前需求是需要再卡片页面下调启系统标准的调启模板代码 //调…...

【高中生讲机器学习】25. AdaBoost 算法详解+推导来啦!

创建时间&#xff1a;2024-11-08 首发时间&#xff1a;2024-11-13 最后编辑时间&#xff1a;2024-11-13 作者&#xff1a;Geeker_LStar 你好呀~这里是 Geeker_LStar 的人工智能学习专栏&#xff0c;很高兴遇见你~ 我是 Geeker_LStar&#xff0c;一名高一学生&#xff0c;热爱计…...

第三十七章 Vue之编程式导航及跳转传参

目录 一、编程式导航跳转方式 1.1. path 路径跳转 1.1.1. 使用方式 1.1.2. 完整代码 1.1.2.1. main.js 1.1.2.2. App.vue 1.1.2.3. index.js 1.1.2.4. Home.vue 1.1.2.5. Search.vue 1.2. name 命名路由跳转 1.2.1. 使用方式 1.2.2. 完整代码 1.2.2.1. main.js 1…...

桌面高颜值时钟工具,支持置顶鼠标穿透

软件介绍 今天要说的这款工具叫WithClock&#xff0c;它是一个时钟工具。这款工具的设计特别简洁&#xff0c;看着很舒服&#xff0c;没什么多余的东西&#xff0c;颜值也挺高。 功能操作 它支持鼠标穿透&#xff0c;你只需要在时钟上点右键&#xff0c;选择“置顶”&#xf…...

PKSM终极指南:从第一世代到第八世代的宝可梦存档管理神器

PKSM终极指南&#xff1a;从第一世代到第八世代的宝可梦存档管理神器 【免费下载链接】PKSM Gen I to GenVIII save manager. 项目地址: https://gitcode.com/gh_mirrors/pk/PKSM PKSM是一款功能强大的免费开源宝可梦存档管理工具&#xff0c;支持从第一世代到第八世代的…...

Granite TimeSeries FlowState R1高可用部署架构:基于Kubernetes的容器化方案

Granite TimeSeries FlowState R1高可用部署架构&#xff1a;基于Kubernetes的容器化方案 如果你正在为时间序列预测模型的生产部署而头疼&#xff0c;担心服务不稳定、无法应对流量高峰&#xff0c;那么这篇文章就是为你准备的。今天&#xff0c;我们来聊聊如何把一个强大的时…...

一站式屏幕神器eSearch:如何5分钟打造你的智能工作流?

一站式屏幕神器eSearch&#xff1a;如何5分钟打造你的智能工作流&#xff1f; 【免费下载链接】eSearch 截屏 离线OCR 搜索翻译 以图搜图 贴图 录屏 万向滚动截屏 屏幕翻译 Screenshot Offline OCR Search Translate Search for picture Paste the picture on the screen Scree…...

如何用QtScrcpy实现跨平台Android设备高效投屏与控制

如何用QtScrcpy实现跨平台Android设备高效投屏与控制 【免费下载链接】QtScrcpy Android实时投屏软件&#xff0c;此应用程序提供USB(或通过TCP/IP)连接的Android设备的显示和控制。它不需要任何root访问权限 项目地址: https://gitcode.com/barry-ran/QtScrcpy 在数字化…...

bilibili-api完全指南:评论数据爬取的4个突破式解决方案

bilibili-api完全指南&#xff1a;评论数据爬取的4个突破式解决方案 【免费下载链接】bilibili-api 哔哩哔哩常用API调用。支持视频、番剧、用户、频道、音频等功能。原仓库地址&#xff1a;https://github.com/MoyuScript/bilibili-api 项目地址: https://gitcode.com/gh_mi…...

临床数据建模实战:Lasso回归在蛋白质组学中的5个关键应用技巧

临床数据建模实战&#xff1a;Lasso回归在蛋白质组学中的5个关键应用技巧 蛋白质组学数据的高维度特性让传统统计方法束手无策——当检测指标数量达到数千甚至上万时&#xff0c;如何从海量蛋白质中识别出真正有临床意义的生物标志物&#xff1f;这正是Lasso回归大显身手的领域…...

实战演练:在快马平台用codex生成一个完整的react用户管理组件

今天想和大家分享一个实战案例&#xff1a;如何在InsCode(快马)平台用Codex快速生成一个React用户管理组件。整个过程比我预想的顺畅很多&#xff0c;特别适合需要快速原型开发的场景。 项目需求拆解 用户管理是后台系统的标配功能&#xff0c;这次要实现三个核心模块&#xff…...

iOS 版本nethack如何更换图形包-iNetHack2

这个iNetHack2这个应该我都没有找到设置按钮。后来无意中在贴吧中看到的。原来它的设置竟然在iOS的系统设置之中&#xff0c;是我少见多怪了&#xff0c;这可能是我见过的App 第1个在系统设置中设置的。UI中的Tileset 设置成Tiles32的界面风格就与nethack官方的UI一致了。...

GitHub协作开发:AnythingtoRealCharacters2511动漫转真人开源项目实践

GitHub协作开发&#xff1a;AnythingtoRealCharacters2511动漫转真人开源项目实践 1. 项目介绍与准备 AnythingtoRealCharacters2511是一个专门将动漫角色转换为真实人像的开源项目&#xff0c;基于先进的AI图像生成技术。这个项目在GitHub上开源&#xff0c;让开发者可以共同…...