当前位置: 首页 > news >正文

【超音速 专利 CN117576413A】基于全连接网络分类模型的AI涂布抓边处理方法及系统

申请号CN202311568976.4
公开号(公开)CN117576413A
申请日2023.11.22
申请人(公开)超音速人工智能科技股份有限公司
发明人(公开)张俊峰(总); 杨培文(总); 沈俊羽; 张小村

我的理解

步骤一:获取涂布边缘图像并提取对应的关键点特征;
步骤二:采用卷积以及全连接操作对所述关键点特征进行分析,通过分类头确定关键点的纵坐标、横坐标以及可见性;
步骤三:构建全连接网络分类模型并训练至损失函数收敛,将所述关键点的纵坐标、横坐标以及可见性输入到所述全连接网络分类模型,提取出虚边、融合边和实边在涂布边缘图像边缘处的关键点坐标;
步骤四:将涂布边缘图像的关键点的纵坐标、横坐标以及可见性并输入到完成训练的全连接网络分类模型进行检测并获取虚边、融合边和实边在涂布边缘图像边缘处的关键点坐标,根据关键点坐标确定虚边、融合边和实边的位置。
2.根据权利要求1所述的基于全连接网络分类模型的AI涂布抓边处理方法,其特征在于,所述获取涂布边缘图像并提取对应的关键点特征,包含以下步骤:
获取涂布原始图像并进行预处理将图片转换为统一的格式,所述预处理包括以下一种或多种方式:缩放、裁剪、灰度增强、对比度增强;
通过边缘提取算法确定预处理后的涂布原始图像的第一边缘位置,以第一边缘位置为中心对涂布原始图像进行裁剪,生成涂布边缘图像;
对所述涂布边缘图像进行数据标注,使用带有预训练模型的特征提取网络提取所述涂布边缘图像的关键点特征。
步骤四.根据权利要求1所述的基于全连接网络分类模型的AI涂布抓边处理方法,其特征在于,所述采用卷积以及全连接操作对所述关键点特征进行分析,通过分类头确定关键点的纵坐标、横坐标以及可见性,包括:
所述分类头包含纵坐标分类头、横坐标分类头以及可见性分类头;
通过纵坐标分类头确定关键点的纵坐标,通过横坐标分类头确定关键点的横坐标,通过可见性分类头确定关键点的可见性。
步骤五.根据权利要求3所述的基于全连接网络分类模型的AI涂布抓边处理方法,其特征在于,所述采用卷积以及全连接操作对所述关键点特征进行分析,通过分类头确定关键点的纵坐标、横坐标以及可见性,还包含:
纵坐标分类头通过一维卷积以及全连接操作将图像特征变换成N个一维向量,表示关键点的纵坐标;
横坐标分类头通过一维卷积以及全连接操作将图像特征变换成N个一维向量,表示关键点的横坐标;
可见性分类头通过二维卷积以及全连接操作将图像特征变换成一个长度为N的一维向量,表示关键点的可见性。
步骤六.根据权利要求4所述的基于全连接网络分类模型的AI涂布抓边处理方法,其特征在于,所述通过纵坐标分类头确定关键点的纵坐标,通过横坐标分类头确定关键点的横坐标,通过可见性分类头确定关键点的可见性,还包含:
纵坐标分类头首先对提取的关键点特征通过二维卷积和ReLU激活函数压缩特征;将压缩特征的横坐标方向特征进行展平,进行全连接操作及ReLU激活函数,将其特征维度转变为涂布边缘图像高度的ɑ倍;进行尺度不变的横坐标方向一维卷积操作,得到关键点的纵坐标分类头输出结果;
横坐标分类头首先对提取的关键点特征通过二维卷积和ReLU激活函数压缩特征;接下来将压缩特征的纵坐标方向特征进行展平,进行全连接操作及ReLU激活函数,将其特征维度转变为原图像宽度的ɑ倍;最后,进行尺度不变的纵坐标方向一维卷积操作,得到关键点的横坐标分类头输出结果;
可见性分类头首先对提取的关键点特征经过两次二维卷积将特征长宽进行压缩,再将其进行全局池化、展平、以及全连接操作后得到关键点的可见性分类头输出结果。
步骤七.根据权利要求1所述的基于全连接网络分类模型的AI涂布抓边处理方法,其特征在于,所述获取涂布边缘图像并提取对应的关键点特征,包含:
获取涂布边缘图像,在图像边缘逐渐向外填充特定颜色的像素,每一圈像素的颜色均相同,并保持相邻圈层之间的色度差和饱和度差设定在特定范围内;
将图像标注数据中位于图像边缘的关键点标签移至填充的像素区域最外圈。
步骤八.根据权利要求6所述的基于全连接网络分类模型的AI涂布抓边处理方法,其特征在于,包含:
所述全连接网络分类模型进行推理时需要根据不同关键点类型将预测的关键点移至图像边缘处;
所述全连接网络分类模型提取的关键点包括虚边、实边、融合边在图像边缘位置的两个关键点坐标,根据两点确定一条直线的原理确定虚边、融合边和实边的位置。
步骤九.一种基于全连接网络分类模型的AI涂布抓边处理系统,包括:
处理模块,用于获取涂布边缘图像并提取对应的关键点特征;
分析模块,采用卷积以及全连接操作对所述关键点特征进行分析,通过分类头确定关键点的纵坐标、横坐标以及可见性;
训练模块,构建全连接网络分类模型并训练至损失函数收敛,将所述关键点的纵坐标、横坐标以及可见性输入到所述全连接网络分类模型,提取出虚边、融合边和实边在涂布边缘图像边缘处的关键点坐标;
检测模块,将涂布边缘图像的关键点的纵坐标、横坐标以及可见性并输入到完成训练的全连接网络分类模型进行检测并获取虚边、融合边和实边在涂布边缘图像边缘处的关键点坐标,根据关键点坐标确定虚边、融合边和实边的位置。
步骤十.一种计算机设备,其特征在于,包括处理器和存储器,所述存储器用于存储可执行的指令,所述指令用于控制所述处理器执行根据权利要求1至7中任一项所述的方法。
步骤十二.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序在被处理器执行时实现如权利要求1至7中任一项所述的方法。


如果有不明白的,请加文末QQ群。

扩展阅读

视频课程

先学简单的课程,请移步CSDN学院,听白银讲师(也就是鄙人)的讲解。
https://edu.csdn.net/course/detail/38771

如何你想快速形成战斗了,为老板分忧,请学习C#入职培训、C++入职培训等课程
https://edu.csdn.net/lecturer/6176

相关推荐

我想对大家说的话
《喜缺全书算法册》以原理、正确性证明、总结为主。
按类别查阅鄙人的算法文章,请点击《算法与数据汇总》。
有效学习:明确的目标 及时的反馈 拉伸区(难度合适) 专注
闻缺陷则喜(喜缺)是一个美好的愿望,早发现问题,早修改问题,给老板节约钱。
子墨子言之:事无终始,无务多业。也就是我们常说的专业的人做专业的事。
如果程序是一条龙,那算法就是他的是睛

测试环境

操作系统:win7 开发环境: VS2019 C++17
或者 操作系统:win10 开发环境: VS2022 C++17
如无特殊说明,本算法用**C++**实现。

相关文章:

【超音速 专利 CN117576413A】基于全连接网络分类模型的AI涂布抓边处理方法及系统

申请号CN202311568976.4公开号(公开)CN117576413A申请日2023.11.22申请人(公开)超音速人工智能科技股份有限公司发明人(公开)张俊峰(总); 杨培文(总); 沈俊羽…...

iPhone数据恢复篇:iPhone 数据恢复软件有哪些

问题:iPhone 15 最好的免费恢复软件是什么?我一直在寻找一个恢复程序来恢复从iPhone中意外删除的照片,联系人和消息,但是我有很多选择。 谷歌一下,你会发现许多付费或免费的iPhone数据恢复工具,声称它们可…...

Html5+Css3学习笔记

Html5 CSS3 一、概念 1.什么是html5 html: Hyper Text Markup Language ( 超文本标记语言) 文本:记事本 超文本: 文字、图片、音频、视频、动画等等(网页) html语言经过浏览器的编译显示成超文本 开发者使用5种浏览器&#xf…...

WPF学习(2) -- 样式基础

一、代码 <Window x:Class"学习.MainWindow"xmlns"http://schemas.microsoft.com/winfx/2006/xaml/presentation"xmlns:x"http://schemas.microsoft.com/winfx/2006/xaml"xmlns:d"http://schemas.microsoft.com/expression/blend/2008&…...

独家揭秘!五大内网穿透神器,访问你的私有服务

本文精心筛选了五款炙手可热的内网穿透工具&#xff0c;它们各怀绝技&#xff0c;无论您是企业用户、独立开发者&#xff0c;还是技术探索者&#xff0c;这篇文章都物有所值&#xff0c;废话不多说&#xff0c;主角们即将上场。 目录 1. 巴比达 - 安全至上的企业护航者 2. 花…...

Ubuntu 编译和运行ZLMediaKit

摘要 本文描述了如何在Ubuntu上构建ZLMediaKIt项目源码&#xff0c;以及如何体验其WebRTC推流和播放功能。 实验环境 操作系统版本&#xff1a;Ubuntu 22.04.3 LTS gcc版本&#xff1a;11.4.0 g版本&#xff1a;11.4.0 依赖库安装 #让ZLMediaKit媒体服务器具备WebRTC流转发…...

基于JavaSpringBoot+Vue+uniapp微信小程序校园宿舍管理系统设计与实现

基于JavaSpringBootVueuniapp微信小程序实现校园宿舍管理系统设计与实现 目录 第一章 绪论 1.1 研究背景 1.2 研究现状 1.3 研究内容 第二章 相关技术介绍 2.1 Java语言 2.2 HTML网页技术 2.3 MySQL数据库 2.4 Springboot 框架介绍 2.5 VueJS介绍 2.6 ElementUI介绍…...

Hive的基本操作(创建与修改)

必备知识 数据类型 基本类型 类型写法字符char, varchar, string✔整数tinyint, smallint, int✔, bigint✔小数float, double, numeric(m,n), decimal(m,n)✔布尔值boolean✔时间date✔, timestamp✔ 复杂类型(集合类型) 1、数组&#xff1a;array<T> 面向用户提供…...

Linux开发讲课37--- ARM的22个常用概念

1. ARM中一些常见英文缩写解释 MSB&#xff1a;最高有效位&#xff1b; LSB&#xff1a;最低有效位&#xff1b; AHB&#xff1a;先进的高性能总线&#xff1b; VPB&#xff1a;连接片内外设功能的VLSI外设总线&#xff1b; EMC&#xff1a;外部存储器…...

7-1、2、3 IPFS介绍使用及浏览器交互(react+区块链实战)

7-1、2、3 IPFS介绍使用及浏览器交互&#xff08;react区块链实战&#xff09; 7-1 ipfs介绍7-2 IPFS-desktop使用7-3 reactipfs-api浏览器和ipfs交互 7-1 ipfs介绍 IPFS区块链上的文件系统 https://ipfs.io/ 这个网站本身是需要科学上网的 Ipfs是点对点的分布式系统 无限…...

CentOS 7 中出现 cannot open Packages database in /var/lib/rpm 错误

转载自:https://www.jianshu.com/p/423306f43e72 # 进入 rpmdb 所在目录 [roothostbase ~]# cd /var/lib/rpm [roothostbase rpm]# ls Basenames __db.001 __db.003 Group Name Packages Requirename Sigmd5 Conflictname __db.002 Dirnames Ins…...

【java深入学习第6章】深入解析Spring事件监听机制

在Spring框架中&#xff0c;事件监听机制是一个强大且灵活的功能&#xff0c;允许我们在应用程序中发布和监听事件。这种机制可以帮助我们实现松耦合的设计&#xff0c;使得不同模块之间的通信更加灵活和可维护。本文将详细介绍Spring的事件监听机制&#xff0c;并通过代码示例…...

Flask与Celery实现Python调度服务

文章目录 Flask与Celery实现Python调度服务一、前言1.组件2.场景说明3.环境 二、安装依赖1.安装Anaconda3.安装redis2.安装依赖包 三、具体实现1.目录结构2.业务流程3.配置文件4.Celery程序5.Flask程序6.测试脚本7.程序启动1&#xff09;Windows开发调试2&#xff09;Linux服务…...

Eureka应用场景和优势

Eureka是一款由Netflix开源的服务注册与发现框架&#xff0c;在微服务架构中扮演着至关重要的角色。以下是Eureka的应用场景和优势&#xff1a; Eureka的应用场景 Eureka主要应用于微服务架构中&#xff0c;特别是在大型、复杂的分布式系统中&#xff0c;用于管理和发现服务。…...

prompt第三讲-PromptTemplate

文章目录 前提回顾PromptTemplateprompt 模板定义以f-string渲染格式以mustache渲染格式以jinja2渲染格式直接实例化PromptTemplatePromptTemplate核心变量 prompt value生成invokeformat_prompt(不建议使用)format(不建议使用) batchstreamainvoke PromptTemplate核心方法part…...

卷积神经网络图像识别车辆类型

卷积神经网络图像识别车辆类型 1、图像 自行车: 汽车: 摩托车: 2、数据集目录 3、流程 1、获取数据,把图像转成矩阵,并随机划分训练集、测试集 2、把标签转为数值,将标签向量转换为二值矩阵 3、图像数据归一化,0-1之间的值 4、构造卷积神经网络 5、设置图像输入…...

【接口设计】用 Swagger 实现接口文档

用 Swagger 实现接口文档 1.配置 Swagger1.1 添加 Swagger 依赖1.2 创建 Swagger 配置类 2.编写接口文档 在项目开发中&#xff0c;一般都是由前后端工程师共同定义接口&#xff0c;编写接口文档&#xff0c;之后大家根据这个接口文档进行开发、维护。为了便于编写和维护稳定&a…...

TensorFlow系列:第四讲:MobileNetV2实战

一. 加载数据集 编写工具类&#xff0c;实现数据集的加载 import keras""" 加载数据集工具类 """class DatasetLoader:def __init__(self, path_url, image_size(224, 224), batch_size32, class_modecategorical):self.path_url path_urlself…...

Redis+Caffeine 实现两级缓存实战

RedisCaffeine 实现两级缓存 背景 ​ 事情的开始是这样的&#xff0c;前段时间接了个需求&#xff0c;给公司的商城官网提供一个查询预计送达时间的接口。接口很简单&#xff0c;根据请求传的城市仓库发货时间查询快递的预计送达时间。因为商城下单就会调用这个接口&#xff…...

SpringBoot:SpringBoot中如何实现对Http接口进行监控

一、前言 Spring Boot Actuator是Spring Boot提供的一个模块&#xff0c;用于监控和管理Spring Boot应用程序的运行时信息。它提供了一组监控端点&#xff08;endpoints&#xff09;&#xff0c;用于获取应用程序的健康状态、性能指标、配置信息等&#xff0c;并支持通过 HTTP …...

提升前端效率:用快马实践vibe coding快速生成沉浸式番茄钟应用

最近在尝试提升前端开发效率时&#xff0c;发现了一种很有意思的开发方式——vibe coding。简单来说&#xff0c;就是通过描述想要的界面氛围和交互感觉&#xff0c;快速生成对应的功能代码。这种方式特别适合需要快速验证想法或者搭建基础框架的场景。 今天就用InsCode(快马)…...

Elasticsearch-PHP聚合分析终极指南:7步掌握数据统计与可视化

Elasticsearch-PHP聚合分析终极指南&#xff1a;7步掌握数据统计与可视化 【免费下载链接】elasticsearch-php Official PHP client for Elasticsearch. 项目地址: https://gitcode.com/gh_mirrors/el/elasticsearch-php Elasticsearch-PHP是官方PHP客户端&#xff0c;提…...

保姆级教程:用PyTorch从零复现DeepLab v3+(附MobileNet v2/Xception双Backbone代码详解)

从零构建DeepLab v3语义分割模型&#xff1a;MobileNet v2/Xception双主干网络实战指南 1. 语义分割与DeepLab v3架构精要 语义分割作为计算机视觉领域的核心任务之一&#xff0c;要求模型对图像中的每个像素进行分类&#xff0c;实现像素级的语义理解。不同于传统的图像分类…...

你的Bootloader安全吗?给STM32F103的Ymodem升级加上AES加密和CRC32校验(附完整代码)

STM32F103 Bootloader安全加固实战&#xff1a;AES加密与CRC32校验的Ymodem升级方案 在物联网设备快速普及的今天&#xff0c;固件升级已成为设备维护的常规操作。然而&#xff0c;传统Ymodem协议在传输安全性方面的不足&#xff0c;使得固件在传输过程中面临被窃取或篡改的风险…...

告别驱动臃肿:Radeon Software Slimmer轻量优化实现显卡性能释放

告别驱动臃肿&#xff1a;Radeon Software Slimmer轻量优化实现显卡性能释放 【免费下载链接】RadeonSoftwareSlimmer Radeon Software Slimmer is a utility to trim down the bloat with Radeon Software for AMD GPUs on Microsoft Windows. 项目地址: https://gitcode.co…...

解锁5大核心能力:BetterJoy让Switch手柄在PC实现专业级控制

解锁5大核心能力&#xff1a;BetterJoy让Switch手柄在PC实现专业级控制 【免费下载链接】BetterJoy Allows the Nintendo Switch Pro Controller, Joycons and SNES controller to be used with CEMU, Citra, Dolphin, Yuzu and as generic XInput 项目地址: https://gitcode…...

如何用QtScrcpy实现跨平台Android设备高效控制:从连接到精通的完整指南

如何用QtScrcpy实现跨平台Android设备高效控制&#xff1a;从连接到精通的完整指南 【免费下载链接】QtScrcpy Android real-time display control software 项目地址: https://gitcode.com/GitHub_Trending/qt/QtScrcpy QtScrcpy是一款功能强大的跨平台Android控制工具…...

口碑好的3D动画源头厂家哪家专业

咱做3D动画的时候&#xff0c;都想找个专业靠谱的源头厂家。毕竟质量有保障&#xff0c;价格也会更实惠。那么现在市场上口碑好的3D动画源头厂家都有哪些呢&#xff1f;今天就带大家好好分析一下&#xff0c;顺便给大家推荐一家我觉得超棒的厂家——玄熠数字视觉科技&#xff0…...

实战部署JetBrains IDE试用期重置:自动化清理与插件开发全流程

实战部署JetBrains IDE试用期重置&#xff1a;自动化清理与插件开发全流程 【免费下载链接】ide-eval-resetter 项目地址: https://gitcode.com/gh_mirrors/id/ide-eval-resetter JetBrains IDE试用期重置工具是一个开源项目&#xff0c;专门用于清除IntelliJ IDEA、Py…...

Node.js企业级应用部署与运维完整方案:Google Cloud Platform实战指南

Node.js企业级应用部署与运维完整方案&#xff1a;Google Cloud Platform实战指南 【免费下载链接】nodejs-docs-samples Node.js samples for Google Cloud Platform products. 项目地址: https://gitcode.com/gh_mirrors/no/nodejs-docs-samples 想要构建稳定可靠的No…...