当前位置: 首页 > news >正文

AI 重构工业制造的故事 我们从大模型开始讲起

在数字化浪潮的推动下,工业制造领域正经历着一场前所未有的变革。人工智能(AI)作为这场变革的关键推动者之一,正以惊人的速度颠覆传统制造业。而大模型作为AI时代最先进的科技工具之一,或将成为引领这场变革的利器,为制造业注入全新活力。

近日,阿加犀创始人、CEO孙晓刚受邀做客虎嗅智库「502线上同行」研讨会,聚焦AI工业大模型的初代落地实践,分享了阿加犀的边缘端大模型部署解决方案与AI工业质检解决方案。

在过去一年里,大模型呈现出了爆发式增长态势。国内外科技大厂都陆续推出了相关产品,将触角伸入教育、医疗、工业、办公等多个领域——“百模大战”已经开启应用场景PK战。

但是,要从聊天问答的通用大模型变成能够解决复杂问题的专业大模型,并真正落地到行业应用场景中,绝非易事。

数据与成本 工业大模型难以跨越的鸿沟

对于工业制造这样要求高可靠性、高准确性与高精密化的领域而言,厂商在将大模型应用到实际产线上时,不仅会考虑数据隐私和安全性,更会重点关注成本问题。

数据安全隐患

数据是训练大模型的基础原料,其质量和数量直接影响着大模型的性能与价值。

而工业是我国国民经济的重要支柱产业,其日常运营中涉及到大量的数据操作,如生产、研发、销售等,都可能与企业的商业机密和客户隐私密切相关。因此相较其他行业而言,工业场景中的数据不透明、难获取,且更具碎片化、多样性和复杂性。

也正是由于涉及企业的部分核心业务,从高质量数据里"调教"和"生长"出来的工业大模型必须满足更高的数据安全性和隐私性,故将其放在边缘端进行推理运算或将成为更优于云端的选择。

使用成本昂贵

大模型的使用成本相当昂贵。"ChatGPT每进行一次对话就耗费1毛钱成本"的玩笑并非空穴来风,据业界人士分析,千亿模型每个月的服务器成本就可能高达几千万美元。即便是为普通AI模型寻求服务器租赁服务,其算力与带宽费用也在每年几十万上下。

再者,因AI算力需求旺盛、供给紧张,阿里云官网已于近日暂停出租A100,未来或将停止或减少对外出租A/H服务器算力。东北证券研究所认为,行业供求矛盾升级,算力租赁行业将进入新一轮涨价周期。

对于工业厂商而言,成本是竞争力和命脉,更是可持续发展的关键。尤其是在劳动力相对廉价的中低端产业链上,"大模型使用成本居高不下"几乎就等同于"AI永远无法真正成为生产力",这就意味工业大模型的应用只能成为部分国企和龙头企业的"探索",难以惠及全行业。

在如此困境下,如何转换思路寻求其他算力资源并将其"压榨"出最大价值,就成了大模型顺利落地工业应用场景的关键命题。

加速奔向边缘端 大模型落地有了新出路

在"工业大模型的初代落地实践"研讨会上,阿加犀创始人、CEO孙晓刚条分缕析地阐述了大模型在工业场景中落地应用面临的难点,并分享了阿加犀大模型边缘端部署解决方案和AI工业质检解决方案。

相比大多数被炒得火热的AI芯片而言,边缘端芯片在价格上首先有着极大优势。但问题来了,大模型能在这样的设备上顺利跑起来吗?

答案是肯定的。阿加犀打造了行业领先的AI工具链:一方面能够对大模型本身进行转换和量化压缩优化,并补全AI算子,另一方面通过SoC性能调度充分释放边缘端芯片算力,提升AI运算效率。

在AI工具链的赋能下,阿加犀利用多块手机供应链芯片打造了一个边缘端AI推理集群,该集群的推理速度跟市面上的主流AI服务器不相上下,成本却仅为原方案的1/3。在降本增效的基础上,工业大模型的应用落地才有望迎来更快的进展,从而真正普惠到更多厂商、更多生产线。

"我们现在已经将阿里通义千问大模型落地到了边缘端芯片,并且跑出了很好的性能和流畅的体验。"

边缘端推理运行Qwen大模型·2023云栖大会

除通义千问以外,阿加犀还在边缘端芯片上实现了LLaMA-2、百川大模型、RedPajama、ChatGLM2、Vicuna、清华智谱等大语言模型的流畅运行;并将SAM模型、AnomalyGPT等开源视觉大模型进行调优后部署在边缘端,应用于工业质检场景中,高效完成分割、异常检测等任务。

基于大模型原理,阿加犀还结合自研模型训练平台AI Creator,进一步探索在工业质检场景中自动训练、生成模型的路径,包括利用大模型生成模拟检测图像的负样本,补齐负样本难获取、数量稀缺的短板,等等。

当然,随着工业4.0时代的到来,智能机器人与大模型的结合也为生产制造带来了无限机遇。在这方面,阿加犀也做了很多探索。

"我们有专门做机器人解决方案的部门,目前正在迁移一些多模态大模型到机械臂上,让它具备视觉识别能力和学习思考能力,而不是单纯依靠机械指令完成任务。"

将具备自主进化能力的多模态AI大模型接入基于阿加犀一芯多用解决方案设计的机器人,有望使其在单SoC满足机器人多场景、智能化需求的高性价比基础上,为用户提供更加精准化、个性化的服务。

大模型落地工业场景的进程已经拉开序幕,从某种意义上来说,只有打通整个产业链上不同的流程环节,才能最大程度实现成本的降低和效率的提升。

阿加犀也期待能与更多合作伙伴携手构建健全、完善的产业生态,共同应对资源投入、数据协作、技术协同等难题,推动工业生产方式向数字化、智能化转变,让AI真正成为生产力,为提升我国产业水平创造长远价值!

参考资料:

《“百模大战”开启应用场景比拼 短期内大规模落地仍受成本制约》,来源:财联社·科创板日报。

《阿里云A100暂停出租,算力租赁供给紧张,关注行业的三个变化》,来源:金融界。

相关文章:

AI 重构工业制造的故事 我们从大模型开始讲起

在数字化浪潮的推动下,工业制造领域正经历着一场前所未有的变革。人工智能(AI)作为这场变革的关键推动者之一,正以惊人的速度颠覆传统制造业。而大模型作为AI时代最先进的科技工具之一,或将成为引领这场变革的利器&…...

easyExcel 注解开发 快速以及简单上手 以及包含工具类

easyExcel 简单快速使用 1. mevan 这里版本我这里选的是 poi 4.1.2和 ali的easyexcel 的 3.3.1。 因为阿里easy是根据poi的依赖开发的有关系,两者需要对应要不然就会有很多bug和错误在运行时发生。需要版本对应,然而就是easy的代码也会有bug这个版本是比…...

VS2010配置opencv2.4.10

1.下载opencv2.4.10,百度网盘链接如下: 链接:https://pan.baidu.com/s/1UdoQJbRUEB_G2urT703xYQ 提取码:7lbd 2.运行opencv-2.4.10.exe,将文件提取到一个自定义目录里: 3.添加系统环境变量 在“系统变量…...

Android:控制按键灯亮灭【button-backlight】

/frameworks/base/services/core/java/com/android/server/policy/PhoneWindowManager.java 1.导包 import java.io.DataOutputStream; import java.io.FileOutputStream; Handler mHandler3; 2.新建handler对象 public void init(Context context, IWindowManager windowMan…...

1、nmap常用命令

文章目录 1. 主机存活探测2. 常见端口扫描、服务版本探测、服务器版本识别3. 全端口(TCP/UDP)扫描4. 最详细的端口扫描5. 三种TCP扫描方式(1)TCP connect 扫描(2)TCP SYN扫描(3)TCP …...

Redis缓存设计典型问题

目录 缓存穿透 缓存失效(击穿) 缓存雪崩 热点缓存key重建优化 缓存与数据库双写不一致 缓存穿透 缓存穿透是指查询一个根本不存在的数据, 缓存层和存储层都不会命中, 通常出于容错的考虑, 如果从存储层查不到数据…...

【python】python基础速通系列2-python程序中的积木块

【组成Python的几个单位】 变量:指向值的名称。或者说变量是一个名称,这个名称指向一个具体的指。比如n=17,就说这个叫做n的变量的值是17。表达式:是值,变量和运算符的组合。如果把变量理解为名词,那么表达式就是把名词连起来的动词形容词。比如:n+25。语句:代码的基本…...

本地开启https,配置nodeJs服务

服务端和客户端各有一对公钥和私钥,使用公钥加密的数据只能用私钥解密,建立https传输之前,客户端和服务端互换公钥。客户端发送数据前使用服务端公钥加密,服务端接收到数据后使用私钥解密,反之亦如此。 1. 公钥私钥的…...

项目中的svg图标的封装与使用

1.安装 npm install vite-plugin-svg-icons -D2.在vite.config.ts中配置 **所有的svg图标都必须放在assets/icons // 引入svg import { createSvgIconsPlugin } from vite-plugin-svg-iconsexport default defineConfig({plugins: [vue(),createSvgIconsPlugin({iconDirs: [p…...

文件服务器迁移

文件服务器迁移还是比较简单的 win server加域 导出配额文件 选中所有项,点击导出 导出共享文件夹权限列表 导出文件夹的权限表,留作备用。需要用到“icacls” icacls c:\windows\* /save aclfile /t # C:\Windows 目录及其子目录中所有文件的 DAC…...

虹科Pico汽车示波器 | 汽车免拆检修 | 2011款瑞麒M1车发动机起动困难、加速无力

一、故障现象 一辆2011款瑞麒M1车,搭载SQR317F发动机,累计行驶里程约为10.4万km。该车因发动机起动困难、抖动、动力不足、热机易熄火等故障进厂维修。用故障检测仪检测,发动机控制单元(ECU)中存储有故障代码“P0340相…...

深度学习之图像分类(十五)DINAT: Dilated Neighborhood Attention Transformer详解(一)

Dilated Neighborhood Attention Transformer Abstract Transformers 迅速成为跨模态、领域和任务中应用最广泛的深度学习架构之一。在视觉领域,除了对普通Transformer的持续努力外,分层Transformer也因其性能和易于集成到现有框架中而受到重视。这些模…...

和数集团出席中科院上海高研院​第三十三期“高研交叉论坛”信息能源融合专场

2023年11月21日,中国科学院上海高等研究院第三十三期“高研交叉论坛”信息能源融合专场在上海高研院成功举办。本次论坛由中国科学院上海高等研究院智能信息通信技术研究与发展中心、中国科学院低碳转化科学与工程重点实验室、中科院和数智能区块链与能源系统应用联…...

GitHub----使用记录

一、上传文件到仓库 1、首先新建一个github仓库 然后先记住这一句指令 2、下载git工具 https://git-scm.com/downloads 下载工具安装不用运行 3、使用git工具上传文件并推送 找到你想上传的文件的位置,右击git Bush here git init :初始化这个仓…...

大数据平台/大数据技术与原理-实验报告--实战HDFS

实验名称 实战HDFS 实验性质 (必修、选修) 必修 实验类型(验证、设计、创新、综合) 综合 实验课时 2 实验日期 2023.10.23-2023.10.27 实验仪器设备以及实验软硬件要求 专业实验室(配有centos7.5系统的linu…...

C#中的事件(委托的发布和订阅、事件的发布和订阅、EventHandler类、Windows事件)

目录 一、委托的发布和订阅 1.订阅操作符号“"和取消订阅操作符号“-” 2.示例源码 二、事件的发布和订阅 三、EventHandler类 四、Windows事件 C#中的事件是指某个类的对象在运行过程中遇到的一些特定事情,而这些特定的事情有必要通知给这个对象的使用者…...

世微 舞台灯深度调光 大功率 dc-dc降压恒流驱动IC APS54083

产品描述 APS54083 是一款 PWM 工作模式,高效率、外围简单、外置功率 MOS 管,适用于 5-220V 输入高精度降压 LED 恒流驱动芯片。输出最大功率150W最大电流 6A。APS54083 可实现线性调光和 PWM 调光,线性调光脚有效电压范围 0.5-2.5V.PWM 调光频率范围 10…...

【nlp】3.3 Transformer论文复现:2. 编码器部分(掩码张量、多头注意力机制、前馈全连接层)

Transformer论文复现:2. 编码器部分(掩码张量、多头注意力机制、前馈全连接层) 2 编码器复现2.1 编码器介绍2.2 掩码张量2.2.1 掩码张量介绍2.2.2 掩码张量的作用2.2.3 生成掩码张量的代码实现2.2.4 掩码张量的可视化2.2.5 掩码张量总结2.3 注意力机制2.3.1 注意力计算规则的…...

vue3中shallowReactive与shallowRef

shallowReactive与shallowRef shallowReactive: 只处理了对象内最外层属性的响应式(也就是浅响应式) shallowRef: 只处理了value的响应式, 不进行对象的reactive处理 总结: reactive与ref实现的是深度响应式, 而shallowReactive与shallowRef是浅响应式。 什么时候用浅响应…...

蓝桥杯-动态规划-子数组问题

目录 一、乘积最大数组 二、乘积为正数的最长子数组长度 三、等差数列划分 四、最长湍流子数组 心得: 最重要的还是状态表示,我们需要根据题的意思,来分析出不同的题,不同的情况,来分析需要多少个状态 一、乘积最…...

Pixel Language Portal保姆级教程:从Docker拉取到16-bit HUD状态栏调试的完整流程

Pixel Language Portal保姆级教程:从Docker拉取到16-bit HUD状态栏调试的完整流程 1. 工具介绍与准备 Pixel Language Portal(像素语言跨维传送门)是一款基于腾讯Hunyuan-MT-7B引擎构建的创新翻译工具。它将传统翻译体验转变为16-bit像素冒…...

EmbeddingGemma-300m在Ollama中的应用:专利技术图谱自动生成

EmbeddingGemma-300m在Ollama中的应用:专利技术图谱自动生成 1. 专利分析的技术挑战与解决方案 专利工程师每天面对堆积如山的专利文档,传统人工分类方法效率低下且容易遗漏关键信息。以通信领域为例,一份典型的专利摘要可能包含"基于…...

【音视频流媒体进阶:从网络到 WebRTC】第14篇-QUIC/HTTP3 在流媒体中的应用

QUIC/HTTP3 在流媒体中的应用 前言 在前几篇文章中,我们学习了 HLS、DASH 这类基于 HTTP 的自适应流媒体协议,以及 SRT 这种基于 UDP 的低延迟传输方案。它们各自解决了流媒体分发链路上的不同痛点,但底层传输层的根本矛盾始终存在——TCP 有队头阻塞,UDP 要自建可靠性。…...

Cosmos-Reason1-7B模型API调用实战:Python环境下的异步并发处理

Cosmos-Reason1-7B模型API调用实战:Python环境下的异步并发处理 如果你正在处理大批量的文本推理任务,比如同时分析成百上千份文档,或者需要快速响应一个在线服务的并发请求,那么传统的同步API调用方式可能会让你感到力不从心。等…...

Lychee Rerank MM智能助手场景:支持图文提问的本地化多模态搜索引擎构建指南

Lychee Rerank MM智能助手场景:支持图文提问的本地化多模态搜索引擎构建指南 1. 项目概述与核心价值 Lychee Rerank MM是一个基于Qwen2.5-VL构建的高性能多模态重排序系统,由哈工大(深圳)自然语言处理团队开发。这个系统专门解决…...

如何用NES.css打造复古游戏风表单提交反馈:完整微交互指南

如何用NES.css打造复古游戏风表单提交反馈:完整微交互指南 【免费下载链接】NES.css NES-style CSS Framework | ファミコン風CSSフレームワーク 项目地址: https://gitcode.com/gh_mirrors/ne/NES.css NES.css作为一款经典的红白机风格CSS框架,让…...

协程执行顺序与作用域解析

在 Kotlin 协程编程中,理解协程的执行顺序和作用域是开发高效并发程序的关键。通过一个简单的例子,我们可以深入理解 coroutineScope 和 launch 函数在协程执行顺序中的角色。 示例代码 以下是一个展示协程执行顺序的 Kotlin 代码: import kotlinx.coroutines.*fun main(…...

数据摄取构建模块简介(预览版)(一)弛

一、语言特性:Java 26 与模式匹配进化 1.1 Java 26 语言级别支持 IDEA 2026.1 EAP 最引人注目的变化之一,就是新增 Java 26 语言级别支持。这意味着开发者可以提前体验和测试即将在 JDK 26 中正式发布的语言特性。 其中最重要的变化是对 JEP 530 的全面支…...

人工智能工程师应掌握的核心技能与工具

随着人工智能(AI)领域的持续拓展,对专业 AI 工程师的需求呈指数级增长。无论你是刚入行,还是希望实现职业进阶,扎实掌握特定技能与工具都至关重要。本文将详解每位 AI 工程师想要在这一充满活力且竞争激烈的领域立足所…...

异步知识库索引管线:与在线问答链路解耦架构介绍(离线构建,在线查询)分层索引、Elasticsearch

文章目录异步知识库索引管线:与在线问答链路解耦的架构实践一、核心思想:离线构建,在线查询二、整体架构图(逻辑)三、索引管线详解(异步部分)1️⃣ 数据接入(Ingestion)2…...