当前位置: 首页 > news >正文

AI工业大模型报告:体系架构、关键技术与典型应用

研究意义

随着新一代人工智能的发展, 大模型(如 GPT-4o 等)凭借大规模训练数据、网络参数和算 力涌现出强大的生成能力、泛化能力和自然交互能力, 展现出改变工业世界的巨大潜力. 尽管大模型 已在自然语言等多个领域取得突破性进展, 但其在工业应用中的探索仍处于初级阶段, 当前工业大模 型的系统性研究仍属空白. 工业应用中特有的异质数据模态、复杂多样的专业化场景、长流程的关 联性决策、以及对于可信性实时性的高要求, 使得通用大模型无法直接用于解决复杂的工业问题, 亟 需开展全新的工业大模型基础理论和关键技术研究. 本文系统地探讨了工业大模型的挑战问题、概 念内涵、体系架构、构建方法、关键技术与典型应用. 从五个挑战问题的分析出发, 提出了工业大模 型的全新定义和体系架构;同时, 提出了工业大模型的四阶段构建方法, 阐述了工业大模型核心关键 技术;然后, 基于所提出的工业大模型六种核心应用能力, 探讨了面向产品全生命周期的工业大模型 典型应用场景, 并给出了”基石“工业大模型原型系统在生成式人工智能方面的应用实例;最后, 探 讨和展望了工业大模型未来的研究方向和开放性问题. 本文将为工业大模型这一全新研究方向的开 辟与发展, 提供基础理论、关键技术和行业应用的全面指导。

本文工作

近年来, 大模型(如 GPT-4o 等)凭借大规模训练数据、大规模参数、大规模算力涌现出传统 AI 模型所不具备的强大的生成能力 [1]、泛化能力和交互能力, 在语言的理解和生成、图像的识别和 生成等任务中展现了令人惊叹的能力. 在自然语言处理领域 [2] , 大模型能够生成高质量的文本并完。成复杂的对话任务;在计算机视觉领域 [3] , 大模型能够实现精准的图像识别并生成高保真的图像或 视频. 此外, 大模型还在医学 [4]、教育 [5] 等专业领域展现出巨大的应用潜力, 通过对领域数据的学 习, 提供准确的问答、诊断、预测和决策支持. 大模型已成为迈向通用人工智能的里程碑技术 [4,6] . 工业制造业是立国之本和强国之基, 建设制造强国是我国的重大战略决策. 在新一代信息通信 技术的推动下, 制造业正从数字化网络化迈向智能化的全新发展阶段 [7] . 如何推进人工智能赋能新 型工业化, 培育面向工业领域的大模型, 推动人工智能与实体经济深度融合, 成为当前重要的国家创 新战略. 欧美发达国家已开始探索大模型在工业领域的应用. 例如, 西门子采用 ChatGPT 来自动生 成可编程逻辑控制器(PLC)代码 [8] , OpenAI 采用多模态大模型操控机器人并尝试在宝马制造车间 从事简单的抓取工作 [9] , 英伟达正在基于大模型打造通用人形机器人平台 [10] . 当前国内外的研究主 要是利用已有的通用大模型尤其是大语言模型, 尝试来解决工业制造业的具体问题. 学术界和产业 界对于工业大模型的巨大发展潜力抱有极高的期待. 然而, 工业制造业的复杂性, 使得工业大模型的 发展面临以下严峻挑战.

挑战一:工业跨模态协同难. 通用大模型擅长处理文本、图像、视频等常见数据模态, 来源于互 联网等公开数据获取渠道, 然而通用大模型对于工业制造业难以获取的特有数据模态如 CAX 模型、 传感信号、工艺文件、机器指令等知之甚少. 工业场景中多模态数据融合处理时存在异质性和同步 性问题, 例如不同类型的传感数据有不同的采样率和数据格式, 存在信息冗余和语义不一致性, 大模 型难以对复杂异质的工业数据模态进行有效对齐和协同. 导致这一问题的原因是大模型缺乏对工业 复杂模态数据特性的深刻理解, 导致其在跨模态数据协同处理上能力有限.

挑战二:工业高可信输出难. 通用大模型对于输出的精准性可靠性没有统一的严格要求, 能够容 忍一定程度的幻觉现象. 而工业应用要求极高的准确性和可靠性, 如机械臂协作装配的精确控制等. 现有大模型建立在概率预测的基础上, 输出结果不确定性高, 难以满足工业任务的高精度要求. 导致 这一问题的原因是大模型的概率特性和非目标驱动特性, 导致其难以学习到任务背后的工业机理和 规律. 此外, 多任务优化与单任务的冲突使得模型在处理高精度任务时可能出现信息冲突和遗忘, 降 低了单任务的性能.

挑战三:工业多场景泛化难. 通用大模型当前常见的文本或图像内容生成、知识问答等应用场 景具有较为统一的底层逻辑, 并且大多可基于对话界面完成场景任务. 而工业领域产品全生命周期 涵盖多类不同的应用场景, 例如研发设计、生产制造、试验测试、运维服务等, 不同行业不同场景任 务需求各异, 且生产任务需要机器设备执行才能完成, 大模型难以适应复杂多变的工业场景. 导致这 一问题的原因是大模型对于工业多学科跨领域专业知识的泛化能力不足, 并且工业场景中存在大量 硬件设备交互任务, 导致当前大模型主流应用范式无法适应复杂的工业场景.

挑战四:工业多流程关联难. 通用大模型应用场景涉及的多流程关联逻辑性任务较少. 而工业 制造业应用则离不开具有内在关联的多流程业务, 各个流程任务之间的关联和依赖关系往往非常复 杂, 例如跨企业多工序多因素耦合的质量问题追溯与根因分析, 如何实现多个流程任务的有效关联和 协同是一个重要挑战. 对于复杂的工业流程语境和任务间的动态关系, 大模型难以全面理解和认知. 导致这一问题的原因是大模型缺乏对复杂流程的深层次任务关联和长期记忆能力, 导致其难以有效 处理多流程任务.

挑战五:工业高实时推理难. 通用大模型对于应用的实时性没有统一的高要求. 而工业现场应 用如设备控制等具有严格的实时性要求(例如毫秒级), 同时又受到算力设施的限制, 因此大模型在工业边缘实时应用中面临资源受限的挑战. 现有轻量化方法如模型剪枝、量化等, 虽然在压缩率和加 速效果方面取得了一定进展, 但仍然无法满足工业边缘轻量实时应用的高要求. 导致这一问题的原 因大模型具有庞大的参数规模并且需要激活大部分的计算单元来执行工业任务, 难以在工业边缘有 限的计算资源下实时运行.

从上述挑战分析可见, 当前通用大模型无法直接用于解决复杂的工业问题, 因此工业大模型并不 是通用大模型在工业领域的一套垂直应用解决方案, 而亟需开展全新的工业大模型基础理论和关键 技术研究, 当前国内外关于工业大模型的系统性研究仍属空白. 本文提出了工业大模型的全新定义, 提出了工业大模型体系架构, 包括基础设施层、基座层、模型层、交互层、应用层;同时, 提出了工 业大模型的四阶段构建方法, 阐述了工业大模型核心关键技术;基于所提出的工业大模型六种核心 应用能力, 探讨了面向工业制造业全生命周期的大模型典型应用场景, 并给出了”基石“工业大模型 原型系统在生成式人工智能方面的应用实例;最后, 探讨和展望了工业大模型未来的研究方向和开 放性问题.

构建方法

工业大模型是面向工业产品全生命周期应用的、具有大规模参数的深度学习模型体系, 包 括工业基座大模型、工业任务导向大模型、工业行业领域大模型等不同层次和类别的模型系统, 具有 工业数据和机理知识融合驱动、工业专业化内容生成、高可信高可靠输出、工业多场景跨域任务学 习与自适应、工业多模态融合交互、人-智能体-工业系统协同、算力与效率灵活适配等主要特征, 具 备智能问答、场景认知、过程决策、终端控制、内容生成、科学发现等核心任务能力, 能够适配离散 行业和流程行业不同行业领域、不同工业任务, 为产品研发设计、生产制造、试验测试、经营管理、 运维服务等全业务域智能化升级提供基于大模型的新应用范式和新方法技术.

工业大模型的构建主要包括以下4个阶段:工业数据制备,工业基座模型训练,工业任务/行业模型适配,工业场景交互应用,如图2所示。

应用场景

与通用大模型不同,工业大模型面向工业应用的需求,在其独特的架构和训练方法的支持下,形成6种核心应用能力,包括智能问答、场景认知、过程决策、终端控制、内容生成和科学发现。工业大模型贯穿产品全生命周期、围绕六项核心应用能力的典型应用场景。工业大模型在实际工业生产流程中可以将工业智能体作为载体之一,与工业场景中所涉及的人员与工业赛博物理系统进行交互完成特定任务。

相关文章:

AI工业大模型报告:体系架构、关键技术与典型应用

研究意义 随着新一代人工智能的发展, 大模型(如 GPT-4o 等)凭借大规模训练数据、网络参数和算 力涌现出强大的生成能力、泛化能力和自然交互能力, 展现出改变工业世界的巨大潜力. 尽管大模型 已在自然语言等多个领域取得突破性进展, 但其在工业应用中的…...

深入理解接口测试:实用指南与最佳实践5.0(五)

✨博客主页: https://blog.csdn.net/m0_63815035?typeblog 💗《博客内容》:.NET、Java.测试开发、Python、Android、Go、Node、Android前端小程序等相关领域知识 📢博客专栏: https://blog.csdn.net/m0_63815035/cat…...

常用List工具类(取交集、并集等等)

支持操作: 根据指定字段,获取两个对象集合的交集、补集、并集等将对象中的多个字段值,抽取到一个List中 import java.lang.reflect.Field; import java.util.*; import java.util.concurrent.ConcurrentHashMap; import java.util.function…...

4 C++ 复合类型:引用和指针

复合类型是指基于其它类型定义的类型。C 有几种复合类型,包括引用、指针。 1 引用 引用(reference)为对象起了另外一个名字,引用类型引用另外一种类型。通过将声明符写成&d的形式来定义引用类型,其中d是声明的变量…...

ABAP关于PS模块CJ20N中项目物料的屏幕和字段增强CI_RSADD

网上搜关于CJ20N的屏幕增强,基本都是关于项目定义(CI_PROJ)、项目WBS(CI_PRPS)、项目网络活动工序(CI_AFVU)的字段与屏幕增强,几乎没有关于项目物料(CI_RSADD)的字段屏幕增强,我在这里做一个分享。 主要逻辑:实现badi增强,并自建一个函数组后创建屏幕,在badi里面调用…...

探索IDE的无限可能:使用技巧与插件推荐

在软件开发的世界里,集成开发环境(IDE)是开发者的得力助手,它不仅提供了代码编辑、编译、调试等功能,还通过各种插件扩展了其功能,使得开发工作更加高效和便捷。本文将带你探索IDE的使用技巧和一些实用的插…...

自动化生成测试用例:利用OpenAI提升电商网站测试覆盖率

导语 自动化生成测试用例是软件测试领域一个强大的应用,通过OpenAI的语言模型,测试工程师可以快速生成高质量的测试用例,尤其是在处理边界条件和极端情况时,提升测试覆盖率。本篇文章将结合一个典型的电商网站案例,介绍…...

时间序列关于可解释性值得关注的论文汇总-第2篇

前言 这是时序可解释性论文汇总的第二篇,第一篇见这里(后台回复:“论文合集”可直接获取整理的文章)。深度学习的可解释性研究一直是热门,而时间序列的可解释性同样非常重要。这是因为时序模型被大量应用到特定领域&a…...

Vulnhub:DC-4靶机渗透——土豆片的靶机渗透练习

攻击机:kali 靶机:DC-4 一,信息收集 1.主机发现 找寻同网段下存活的主机 arp-scan -l2.端口扫描 查看此主机上有哪些开放端口 nmap -sV -p- 192.168.126.136发现22,80端口,远程连接跟网站(大概&…...

【云原生系列--Longhorn的部署】

Longhorn部署手册 1.部署longhorn longhorn架构图: 1.1部署环境要求 kubernetes版本要大于v1.21 每个节点都必须装open-iscsi ,Longhorn依赖于 iscsiadm主机为 Kubernetes 提供持久卷。 apt-get install -y open-iscsiRWX 支持要求每个节点都安装 N…...

Java集合(Collection+Map)

Java集合&#xff08;CollectionMap&#xff09; 为什么要使用集合&#xff1f;泛型 <>集合框架单列集合CollectionCollection遍历方式List&#xff1a;有序、可重复、有索引ArrayListLinkedListVector&#xff08;已经淘汰&#xff0c;不会再用&#xff09; Set&#xf…...

微信小程序02-页面制作

微信小程序页面制作指南 目录 微信小程序页面制作 1. 个人信息展示小程序 案例分析 需求背景&#xff1a;许多大学生毕业后需要求职&#xff0c;因此制作一个展示个人信息的微信小程序对招聘人员快速了解求职者非常有帮助。页面布局&#xff1a;页面分为头像区域和详细信息…...

zabbix监控端界面时间与服务器时间不对应

1. 修改系统时间 # tzselect Please select a continent, ocean, "coord", or "TZ".1) Africa2) Americas3) Antarctica4) Asia5) Atlantic Ocean6) Australia7) Europe8) Indian Ocean9) Pacific Ocean 10) coord - I want to use geographical coordina…...

端对端加密是如何通过SDK防御实现的?

端对端加密&#xff08;End-to-End Encryption&#xff0c;E2EE&#xff09;是一种确保数据在传输过程中不被第三方截获和篡改的技术。随着网络安全威胁的日益增多&#xff0c;端对端加密在即时通讯、文件传输等领域变得越来越重要。本文将详细介绍如何通过SDK&#xff08;Soft…...

Flutter:input输入框

输入框&#xff1a; // 是否显示关闭按钮 bool _showClear false; // 文字编辑控制器&#xff0c;监听搜索框的变化。 final TextEditingController _controller TextEditingController(); // 输入框发生变化事件 void _onChange(String value){if(value.length > 0){setS…...

RabbitMQ 与 PHP Swoole 实现

RabbitMQ 与 PHP Swoole 的结合实现 一、概述 RabbitMQ 是一个开源的消息队列中间件&#xff0c;允许通过异步消息传递来解耦应用程序的各个部分。Swoole 是一个高性能的 PHP 扩展&#xff0c;支持异步编程和协程&#xff0c;适用于构建高并发的网络服务。将 RabbitMQ 与 Swo…...

【计算机体系架构】 MESI缓冲一致性

高并发学习参考 https://blog.csdn.net/MrYushiwen/article/details/123049838 https://cloud.tencent.com/developer/article/2197857 ESI 是指Cache 行的三种一致性状态&#xff1a;E&#xff08;Exclusive&#xff0c;独占&#xff09;&#xff0c;S&#xff08;Shared&…...

STM32设计学生宿舍监测控制系统

目录 前言 一、本设计主要实现哪些很“开门”功能&#xff1f; 二、电路设计原理图 电路图采用Altium Designer进行设计&#xff1a; 三、实物设计图 四、程序源代码设计 五、获取资料内容 前言 随着科技的飞速发展和智能化时代的到来&#xff0c;学生宿舍的安全、舒适…...

企业生产环境-麒麟V10(ARM架构)操作系统部署kafka高可用集群

前言&#xff1a;Apache Kafka是一个分布式流处理平台&#xff0c;由LinkedIn开发并捐赠给Apache软件基金会。它主要用于构建实时数据流管道和流应用。Kafka具有高吞吐量、可扩展性和容错性的特点&#xff0c;适用于处理大量数据。 以下是Kafka的一些核心概念和特性&#xff1…...

awk(常用)

这个有点难 O.o 一、awk # 语法 awk 参数 模式 {动作} 文件# 第一列&#xff0c;包含p的 $1~"p" # 第一列&#xff0c;不包含p的 $1!~"p" # 开始时干嘛&#xff0c;结束时干嘛 awk BEGIN{开始时做的事}END{结束时做的事}{print $0} 文件 1、内置变量&…...

【WiFi帧结构】

文章目录 帧结构MAC头部管理帧 帧结构 Wi-Fi的帧分为三部分组成&#xff1a;MAC头部frame bodyFCS&#xff0c;其中MAC是固定格式的&#xff0c;frame body是可变长度。 MAC头部有frame control&#xff0c;duration&#xff0c;address1&#xff0c;address2&#xff0c;addre…...

linux arm系统烧录

1、打开瑞芯微程序 2、按住linux arm 的 recover按键 插入电源 3、当瑞芯微检测到有设备 4、松开recover按键 5、选择升级固件 6、点击固件选择本地刷机的linux arm 镜像 7、点击升级 &#xff08;忘了有没有这步了 估计有&#xff09; 刷机程序 和 镜像 就不提供了。要刷的时…...

【android bluetooth 框架分析 04】【bt-framework 层详解 1】【BluetoothProperties介绍】

1. BluetoothProperties介绍 libsysprop/srcs/android/sysprop/BluetoothProperties.sysprop BluetoothProperties.sysprop 是 Android AOSP 中的一种 系统属性定义文件&#xff08;System Property Definition File&#xff09;&#xff0c;用于声明和管理 Bluetooth 模块相…...

Java 加密常用的各种算法及其选择

在数字化时代&#xff0c;数据安全至关重要&#xff0c;Java 作为广泛应用的编程语言&#xff0c;提供了丰富的加密算法来保障数据的保密性、完整性和真实性。了解这些常用加密算法及其适用场景&#xff0c;有助于开发者在不同的业务需求中做出正确的选择。​ 一、对称加密算法…...

12.找到字符串中所有字母异位词

&#x1f9e0; 题目解析 题目描述&#xff1a; 给定两个字符串 s 和 p&#xff0c;找出 s 中所有 p 的字母异位词的起始索引。 返回的答案以数组形式表示。 字母异位词定义&#xff1a; 若两个字符串包含的字符种类和出现次数完全相同&#xff0c;顺序无所谓&#xff0c;则互为…...

涂鸦T5AI手搓语音、emoji、otto机器人从入门到实战

“&#x1f916;手搓TuyaAI语音指令 &#x1f60d;秒变表情包大师&#xff0c;让萌系Otto机器人&#x1f525;玩出智能新花样&#xff01;开整&#xff01;” &#x1f916; Otto机器人 → 直接点明主体 手搓TuyaAI语音 → 强调 自主编程/自定义 语音控制&#xff08;TuyaAI…...

工业自动化时代的精准装配革新:迁移科技3D视觉系统如何重塑机器人定位装配

AI3D视觉的工业赋能者 迁移科技成立于2017年&#xff0c;作为行业领先的3D工业相机及视觉系统供应商&#xff0c;累计完成数亿元融资。其核心技术覆盖硬件设计、算法优化及软件集成&#xff0c;通过稳定、易用、高回报的AI3D视觉系统&#xff0c;为汽车、新能源、金属制造等行…...

Mysql8 忘记密码重置,以及问题解决

1.使用免密登录 找到配置MySQL文件&#xff0c;我的文件路径是/etc/mysql/my.cnf&#xff0c;有的人的是/etc/mysql/mysql.cnf 在里最后加入 skip-grant-tables重启MySQL服务 service mysql restartShutting down MySQL… SUCCESS! Starting MySQL… SUCCESS! 重启成功 2.登…...

mac 安装homebrew (nvm 及git)

mac 安装nvm 及git 万恶之源 mac 安装这些东西离不开Xcode。及homebrew 一、先说安装git步骤 通用&#xff1a; 方法一&#xff1a;使用 Homebrew 安装 Git&#xff08;推荐&#xff09; 步骤如下&#xff1a;打开终端&#xff08;Terminal.app&#xff09; 1.安装 Homebrew…...

群晖NAS如何在虚拟机创建飞牛NAS

套件中心下载安装Virtual Machine Manager 创建虚拟机 配置虚拟机 飞牛官网下载 https://iso.liveupdate.fnnas.com/x86_64/trim/fnos-0.9.2-863.iso 群晖NAS如何在虚拟机创建飞牛NAS - 个人信息分享...