当前位置：首页 > news >正文

【工业机器人】工业异常检测大模型AnomalyGPT

news 2026/2/10 17:55:07

AnomalyGPT

工业异常检测视觉大模型AnomalyGPT

AnomalyGPT: Detecting Industrial Anomalies using Large Vision-Language Models

AnomalyGPT是一种基于大视觉语言模型（LVLM）的新型工业异常检测（IAD）方法。它利用LVLM的能力来理解和处理图像，从而实现高精度和高效率的工业异常检测。AnomalyGPT的主要特点包括：

模型核心：AnomalyGPT的核心是一种新颖的会话式IAD大视觉语言模型，主要用于检测工业异常并使用图像精确定位其确切位置。
消除手动阈值调整：与传统的IAD方法不同，AnomalyGPT不需要手动设置阈值来区分正常样本和异常样本，从而提高了其实际应用的可行性。
像素级异常定位：AnomalyGPT模型部署了一个基于轻量级特征匹配的图像解码器，支持少镜头IAD框架和无监督IAD框架，实现像素级异常定位输出。
训练数据模拟：为了训练AnomalyGPT，研究人员使用模拟异常数据生成方法，例如泊松图像编辑和剪切粘贴技术，来创建模拟异常图像。
性能表现：AnomalyGPT在MVTec-AD数据集上实现了最先进的性能，准确率达到86.1%，图像级AUC为94.1%，像素级AUC为95.3%。
支持多轮对话：AnomalyGPT支持多轮对话，使其能够根据用户的反馈和需求进行交互式异常检测和定位。

AnomalyGPT的结合了LVLM在理解和处理图像方面的优势，以及其在工业异常检测任务中的应用，为工业自动化和智能制造领域提供了重要的技术支持。

零样本提示词直接检测缺陷

以下是一些关键的优势：

高精度检测：利用LVLM强大的图像理解和处理能力，AnomalyGPT能够实现高精度的异常检测，这在复杂的工业环境中尤为重要。
无需手动阈值调整：传统的IAD方法通常需要手动设置阈值来区分正常和异常样本，这不仅耗时而且容易出错。AnomalyGPT通过模型自动学习，消除了这一需求，提高了检测的准确性和效率。
像素级异常定位：AnomalyGPT能够提供像素级的异常定位，这有助于精确识别和修复问题，特别是在需要对异常进行精确处理的应用中。
少镜头和无监督学习框架：AnomalyGPT支持少镜头和无监督学习框架，这意味着它可以在有限的标注数据或无标注数据的情况下进行训练和部署，这在实际工业应用中非常有价值。
强大的泛化能力：由于LVLM的泛化能力，AnomalyGPT能够处理多种类型的工业图像和数据，适应不同的工业环境和任务。

它可以在以下几个方面发挥作用：

质量控制：在制造业中，AnomalyGPT可以用于检测产品表面的缺陷，如划痕、凹痕或颜色不均，确保产品质量。
预测性维护：在生产线中，AnomalyGPT可以帮助检测设备或组件的异常，从而提前进行维护，避免意外停机。
供应链管理：在物流和供应链管理中，AnomalyGPT可用于监控货物的状态，检测包装损坏或其他潜在问题。
安全监控：在安全敏感的环境中，AnomalyGPT可以用于监控视频 feed，实时检测异常行为或危险情况。
医疗影像分析：在医疗领域，AnomalyGPT可以帮助分析X光片、MRI图像等，以检测病变或其他异常情况。
环境监测：在环境监测中，AnomalyGPT可以用于分析卫星图像或无人机拍摄的照片，以检测土地变化或污染情况。

【工业机器人】工业异常检测大模型AnomalyGPT

AnomalyGPT 工业异常检测视觉大模型AnomalyGPT AnomalyGPT: Detecting Industrial Anomalies using Large Vision-Language Models AnomalyGPT是一种基于大视觉语言模型（LVLM）的新型工业异常检测（IAD）方法。它利用LVLM的能力来理…...

编程日记 2024/8/21 17:13:11

【PGCCC】PostgreSQL案例：planning time超长问题分析#PG初级

在使用 PostgreSQL 时，查询的执行计划（planning time）有时会出现异常长的情况，这可能会影响数据库的整体性能。分析和解决这种问题可以从多个角度入手，以下是常见原因和相应的解决思路： 1. 统计信息不准确…...

编程日记 2024/8/21 17:10:08

【图文并茂】ant design pro 如何给后端发送 json web token - 请求拦截器的使用

上一节有讲过【图文并茂】ant design pro 如何对接后端个人信息接口还差一个东西，去获取个人信息的时候，是要发送 token 的，不然会报 403. 就是说在你登录之后才去获得个人信息。这样后端才能知道是谁的信息。 token 就代码了某个人。 …...

编程日记 2024/8/21 17:09:06

【微信小程序】自定义组件 - behaviors

1. 什么是 behaviors 2. behaviors 的工作方式 3. 创建 behavior 调用 Behavior(Object object) 方法即可创建一个共享的 behavior 实例对象，供所有的组件使用： 4. 导入并使用 behavior 5. behavior 中所有可用的节点 6. 同名字段的覆盖和组合规则* 关…...

编程日记 2024/8/21 17:06:02

Linux ubuntu 24.04 安装运行《帝国时代3》免安装绿色版游戏，解决 “Could not load DATAP.BAR”等问题

Linux ubuntu 24.04 安装运行《帝国时代3》游戏，解决 “Could not load DATAP.BAR" 等问题《帝国时代 3》是一款比较经典的即时战斗游戏，伴随了我半个高中时代，周末有时间就去泡网吧，可惜玩的都是简单人机，高难…...

编程日记 2024/8/21 17:03:59

Springboot 图片因为 server.servlet.context-path: /api 所以 url是这个的时候 http://127.0.0.1:9100/api/staticfiles/image/dd56a59d-da84-441a-8dac-1d97f9e42090.jpeg 配置代码的前面的 /api 是不要写的 package com.gk.study.config;import org.springframework.conte…...

编程日记 2024/8/21 17:02:58

LIMS实验室管理系统如何实现数据自动采集

随着科研技术的不断发展，LIMS实验室管理系统的应用也愈来愈广，已经成为现代化实验室管理不可或缺的工具。LIMS实验室管理系统未与仪器设备对接前，仪器设备产生的数据都是通过人工录入到系统中，再经过人工审核形成最终的数据报告。…...

编程日记 2024/8/21 17:00:52

全自动商用油炸锅介绍：

全自动商用油炸锅‌是一种专门为商业用途设计的厨房设备，旨在高效、节能、卫生地完成大量食品的油炸加工。这种设备通常采用油水混合技术，能够自动过滤残渣，延长换油周期，从而大大降低用油成本。全自动商用油炸锅适合中、小型油炸…...

编程日记 2024/8/21 16:58:50

CE修改器的简单使用

前言这个系列目前是出于兴趣爱好，最终目的是为了可以用代码控制修改单机游戏。这篇文章的对象是《植物大战僵尸杂交版》，其余游戏类似。博客仅做技术研究使用，禁止用作商业用途。 1，安装CE修改器到官网进行下载&#xff…...

编程日记 2024/8/21 16:57:48

element-plus el-cascader懒加载怎么指定对应的label和value。最后一级怎么判断？

<el-cascader:props"props"placeholder"请选择现地址所在地"v-model"currentaddress"ref"currentaddressRef"change"currentaddressChange"style"width:100%"clearable/> 懒加载需要用到props。 const pro…...

编程日记 2024/8/21 16:55:46

pdf查看密码

pdf有两种密码方式，一种是打开后进入文件内容页面后需要密码才能进行修改等操作，网上有很多方式进行移除密码操作，第二种是打开就需要密码，我这里简单记录一个暴力破解的方式，仅供参考 import PyPDF2 import itertools…...

编程日记 2024/8/21 16:54:44

从bbl和overleaf版本解决Arxiv提交后缺失参考文献Citation on page undefined on input line

debug 食用指南：框架/语言：问题描述：解决方案：问题原因：版本解决方案： 安利时间： 食用指南： 框架使用过程中的问题首先要注意版本发布时间造成方法弃用当你在CSDN等网站查找不到最…...

编程日记 2024/8/21 16:53:43

Flutter【01】状态管理

声明式编程 Flutter 应用是声明式的，这也就意味着 Flutter 构建的用户界面就是应用的当前状态。当你的 Flutter 应用的状态发生改变时（例如，用户在设置界面中点击了一个开关选项）你改变了状态，这将会触发用户界面…...

编程日记 2024/8/21 16:52:41

（转载）使用zed相机录制视频

参照下面这个链接 https://blog.csdn.net/peng_258/article/details/127457199?ops_request_misc&request_id&biz_id102&utm_termzed2%E5%BD%95%E5%88%B6%E6%95%B0%E6%8D%AE%E9%9B%86&utm_mediumdistribute.pc_search_result.none-task-blog-2~all~sobaiduweb…...

编程日记 2024/8/21 16:50:39

C/C++中奇妙的类型转换

1.引言大家在学习C语言的时候，有没有遇见过类似于下面这样的代码呢？ // 整形转bool int count 10; while(count--) {cout << count << endl; }// 指针转bool int* ptr cur; while(ptr) {//…… } 众所周知，while循环的判断…...

编程日记 2024/8/21 16:48:36

嵌入式AI快速入门课程-K510篇 (第三篇环境搭建及开发板操作)

第三篇环境搭建及开发板操作文章目录第三篇环境搭建及开发板操作1.配置VMware使用桥接网卡1.1 vmware设置1.2 虚拟网络编辑器设置 2.安装软件2.2 安装 Windows 软件2.3 使用MobaXterm远程登录Ubuntu2.4 使用FileZilla在Windows和Ubuntu之间传文件2.5编程示例：Ub…...

编程日记 2024/8/21 16:47:35

C++第三十九弹---C++ STL中的无序容器：unordered_set与unordered_map使用详解

✨个人主页： 熬夜学编程的小林 💗系列专栏： 【C语言详解】【数据结构详解】【C详解】目录 1 unordered_set 1.1 unordered_set的接口说明 1.1.1 unordered_set的构造 1.1.2. unordered_set的容量 1.1.3. unordered_set的迭代器 1.1…...

编程日记 2024/8/21 16:43:28

数学建模起步感受（赛前15天）

0基础直接上手数模，因为大一！年轻就是无所畏惧！开个玩笑，因为数模比赛比一年少一年… 抱着不打也是浪费的态度，我开始着手准备首先python啥也不会，知道有元组这玩意… 仅仅在刷软考题的时候遇到python选择…...

编程日记 2024/8/21 16:42:27

【YOLO5 项目实战】（4）红外目标检测

欢迎关注『youcans动手学模型』系列本专栏内容和资源同步到 GitHub/youcans 【YOLO5 项目实战】（1）YOLO5 环境配置与测试【YOLO5 项目实战】（2）使用自己的数据集训练目标检测模型【YOLO5 项目实战】（3）P…...

编程日记 2024/8/21 16:38:19

游泳耳机哪个牌子好？角逐必选榜的4大王者游泳耳机测评解析！

在选择游泳耳机时，许多消费者往往会被市场上五花八门的产品所困扰。特别是那些标榜能够防水防潮的产品，但实际上它们往往缺乏核心技术支持，存在很高的损伤风险。据调查，超过90%的用户反映，市面上的游泳耳机常常无法达到…...

编程日记 2024/8/21 16:34:13

DockerHub与私有镜像仓库在容器化中的应用与管理

哈喽，大家好，我是左手python！ Docker Hub的应用与管理 Docker Hub的基本概念与使用方法 Docker Hub是Docker官方提供的一个公共镜像仓库，用户可以在其中找到各种操作系统、软件和应用的镜像。开发者可以通过Docker Hub轻松获取所…...

编程新知 2025/10/8 10:56:25

【Linux】C语言执行shell指令

在C语言中执行Shell指令在C语言中，有几种方法可以执行Shell指令： 1. 使用system()函数这是最简单的方法，包含在stdlib.h头文件中： #include <stdlib.h>int main() {system("ls -l"); // 执行ls -l命令retu…...

编程新知 2025/11/20 18:42:48

鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个医院挂号小程序

一、开发准备环境搭建： 安装DevEco Studio 3.0或更高版本配置HarmonyOS SDK申请开发者账号项目创建： File > New > Create Project > Application (选择"Empty Ability") 二、核心功能实现 1. 医院科室展示 /…...

编程新知 2025/9/5 12:16:40

数据链路层的主要功能是什么

数据链路层（OSI模型第2层）的核心功能是在相邻网络节点（如交换机、主机）间提供可靠的数据帧传输服务，主要职责包括： 🔑 核心功能详解： 帧封装与解封装封装： 将网络层下发…...

编程新知 2026/2/1 7:31:51

鱼香ros docker配置镜像报错：https://registry-1.docker.io/v2/

使用鱼香ros一件安装docker时的https://registry-1.docker.io/v2/问题一键安装指令 wget http://fishros.com/install -O fishros && . fishros出现问题：docker pull 失败网络不同，需要使用镜像源按照如下步骤操作 sudo vi /etc/docker/dae…...

编程新知 2025/12/31 6:28:08

HashMap中的put方法执行流程（流程图）

1 put操作整体流程 HashMap 的 put 操作是其最核心的功能之一。在 JDK 1.8 及以后版本中，其主要逻辑封装在 putVal 这个内部方法中。整个过程大致如下： 初始判断与哈希计算： 首先，putVal 方法会检查当前的 table（也就…...

编程新知 2026/2/8 3:32:52

Aspose.PDF 限制绕过方案：Java 字节码技术实战分享（仅供学习）

Aspose.PDF 限制绕过方案：Java 字节码技术实战分享（仅供学习） 一、Aspose.PDF 简介二、说明（⚠️仅供学习与研究使用）三、技术流程总览四、准备工作1. 下载 Jar 包2. Maven 项目依赖配置五、字节码修改实现代码&#…...

编程新知 2026/2/6 22:13:44

安宝特案例丨Vuzix AR智能眼镜集成专业软件，助力卢森堡医院药房转型，赢得辉瑞创新奖

在Vuzix M400 AR智能眼镜的助力下，卢森堡罗伯特舒曼医院（the Robert Schuman Hospitals, HRS）凭借在无菌制剂生产流程中引入增强现实技术（AR）创新项目，荣获了2024年6月7日由卢森堡医院药剂师协会&#xff0…...

编程新知 2026/2/9 2:41:28

PAN/FPN

import torch import torch.nn as nn import torch.nn.functional as F import mathclass LowResQueryHighResKVAttention(nn.Module):"""方案 1: 低分辨率特征 (Query) 查询高分辨率特征 (Key, Value).输出分辨率与低分辨率输入相同。"""def __…...

编程新知 2025/10/20 4:39:36

Go 语言并发编程基础：无缓冲与有缓冲通道

在上一章节中，我们了解了 Channel 的基本用法。本章将重点分析 Go 中通道的两种类型 —— 无缓冲通道与有缓冲通道，它们在并发编程中各具特点和应用场景。一、通道的基本分类类型定义形式特点无缓冲通道make(chan T)发送和接收都必须准备好&#xff0…...

编程新知 2026/1/29 3:25:02

工业异常检测视觉大模型AnomalyGPT

AnomalyGPT: Detecting Industrial Anomalies using Large Vision-Language Models

相关文章：