当前位置: 首页 > news >正文

AI 重构工业制造的故事 我们从大模型开始讲起

在数字化浪潮的推动下,工业制造领域正经历着一场前所未有的变革。人工智能(AI)作为这场变革的关键推动者之一,正以惊人的速度颠覆传统制造业。而大模型作为AI时代最先进的科技工具之一,或将成为引领这场变革的利器,为制造业注入全新活力。

近日,阿加犀创始人、CEO孙晓刚受邀做客虎嗅智库「502线上同行」研讨会,聚焦AI工业大模型的初代落地实践,分享了阿加犀的边缘端大模型部署解决方案与AI工业质检解决方案。

在过去一年里,大模型呈现出了爆发式增长态势。国内外科技大厂都陆续推出了相关产品,将触角伸入教育、医疗、工业、办公等多个领域——“百模大战”已经开启应用场景PK战。

但是,要从聊天问答的通用大模型变成能够解决复杂问题的专业大模型,并真正落地到行业应用场景中,绝非易事。

数据与成本 工业大模型难以跨越的鸿沟

对于工业制造这样要求高可靠性、高准确性与高精密化的领域而言,厂商在将大模型应用到实际产线上时,不仅会考虑数据隐私和安全性,更会重点关注成本问题。

数据安全隐患

数据是训练大模型的基础原料,其质量和数量直接影响着大模型的性能与价值。

而工业是我国国民经济的重要支柱产业,其日常运营中涉及到大量的数据操作,如生产、研发、销售等,都可能与企业的商业机密和客户隐私密切相关。因此相较其他行业而言,工业场景中的数据不透明、难获取,且更具碎片化、多样性和复杂性。

也正是由于涉及企业的部分核心业务,从高质量数据里"调教"和"生长"出来的工业大模型必须满足更高的数据安全性和隐私性,故将其放在边缘端进行推理运算或将成为更优于云端的选择。

使用成本昂贵

大模型的使用成本相当昂贵。"ChatGPT每进行一次对话就耗费1毛钱成本"的玩笑并非空穴来风,据业界人士分析,千亿模型每个月的服务器成本就可能高达几千万美元。即便是为普通AI模型寻求服务器租赁服务,其算力与带宽费用也在每年几十万上下。

再者,因AI算力需求旺盛、供给紧张,阿里云官网已于近日暂停出租A100,未来或将停止或减少对外出租A/H服务器算力。东北证券研究所认为,行业供求矛盾升级,算力租赁行业将进入新一轮涨价周期。

对于工业厂商而言,成本是竞争力和命脉,更是可持续发展的关键。尤其是在劳动力相对廉价的中低端产业链上,"大模型使用成本居高不下"几乎就等同于"AI永远无法真正成为生产力",这就意味工业大模型的应用只能成为部分国企和龙头企业的"探索",难以惠及全行业。

在如此困境下,如何转换思路寻求其他算力资源并将其"压榨"出最大价值,就成了大模型顺利落地工业应用场景的关键命题。

加速奔向边缘端 大模型落地有了新出路

在"工业大模型的初代落地实践"研讨会上,阿加犀创始人、CEO孙晓刚条分缕析地阐述了大模型在工业场景中落地应用面临的难点,并分享了阿加犀大模型边缘端部署解决方案和AI工业质检解决方案。

相比大多数被炒得火热的AI芯片而言,边缘端芯片在价格上首先有着极大优势。但问题来了,大模型能在这样的设备上顺利跑起来吗?

答案是肯定的。阿加犀打造了行业领先的AI工具链:一方面能够对大模型本身进行转换和量化压缩优化,并补全AI算子,另一方面通过SoC性能调度充分释放边缘端芯片算力,提升AI运算效率。

在AI工具链的赋能下,阿加犀利用多块手机供应链芯片打造了一个边缘端AI推理集群,该集群的推理速度跟市面上的主流AI服务器不相上下,成本却仅为原方案的1/3。在降本增效的基础上,工业大模型的应用落地才有望迎来更快的进展,从而真正普惠到更多厂商、更多生产线。

"我们现在已经将阿里通义千问大模型落地到了边缘端芯片,并且跑出了很好的性能和流畅的体验。"

边缘端推理运行Qwen大模型·2023云栖大会

除通义千问以外,阿加犀还在边缘端芯片上实现了LLaMA-2、百川大模型、RedPajama、ChatGLM2、Vicuna、清华智谱等大语言模型的流畅运行;并将SAM模型、AnomalyGPT等开源视觉大模型进行调优后部署在边缘端,应用于工业质检场景中,高效完成分割、异常检测等任务。

基于大模型原理,阿加犀还结合自研模型训练平台AI Creator,进一步探索在工业质检场景中自动训练、生成模型的路径,包括利用大模型生成模拟检测图像的负样本,补齐负样本难获取、数量稀缺的短板,等等。

当然,随着工业4.0时代的到来,智能机器人与大模型的结合也为生产制造带来了无限机遇。在这方面,阿加犀也做了很多探索。

"我们有专门做机器人解决方案的部门,目前正在迁移一些多模态大模型到机械臂上,让它具备视觉识别能力和学习思考能力,而不是单纯依靠机械指令完成任务。"

将具备自主进化能力的多模态AI大模型接入基于阿加犀一芯多用解决方案设计的机器人,有望使其在单SoC满足机器人多场景、智能化需求的高性价比基础上,为用户提供更加精准化、个性化的服务。

大模型落地工业场景的进程已经拉开序幕,从某种意义上来说,只有打通整个产业链上不同的流程环节,才能最大程度实现成本的降低和效率的提升。

阿加犀也期待能与更多合作伙伴携手构建健全、完善的产业生态,共同应对资源投入、数据协作、技术协同等难题,推动工业生产方式向数字化、智能化转变,让AI真正成为生产力,为提升我国产业水平创造长远价值!

参考资料:

《“百模大战”开启应用场景比拼 短期内大规模落地仍受成本制约》,来源:财联社·科创板日报。

《阿里云A100暂停出租,算力租赁供给紧张,关注行业的三个变化》,来源:金融界。

相关文章:

AI 重构工业制造的故事 我们从大模型开始讲起

在数字化浪潮的推动下,工业制造领域正经历着一场前所未有的变革。人工智能(AI)作为这场变革的关键推动者之一,正以惊人的速度颠覆传统制造业。而大模型作为AI时代最先进的科技工具之一,或将成为引领这场变革的利器&…...

easyExcel 注解开发 快速以及简单上手 以及包含工具类

easyExcel 简单快速使用 1. mevan 这里版本我这里选的是 poi 4.1.2和 ali的easyexcel 的 3.3.1。 因为阿里easy是根据poi的依赖开发的有关系,两者需要对应要不然就会有很多bug和错误在运行时发生。需要版本对应,然而就是easy的代码也会有bug这个版本是比…...

VS2010配置opencv2.4.10

1.下载opencv2.4.10,百度网盘链接如下: 链接:https://pan.baidu.com/s/1UdoQJbRUEB_G2urT703xYQ 提取码:7lbd 2.运行opencv-2.4.10.exe,将文件提取到一个自定义目录里: 3.添加系统环境变量 在“系统变量…...

Android:控制按键灯亮灭【button-backlight】

/frameworks/base/services/core/java/com/android/server/policy/PhoneWindowManager.java 1.导包 import java.io.DataOutputStream; import java.io.FileOutputStream; Handler mHandler3; 2.新建handler对象 public void init(Context context, IWindowManager windowMan…...

1、nmap常用命令

文章目录 1. 主机存活探测2. 常见端口扫描、服务版本探测、服务器版本识别3. 全端口(TCP/UDP)扫描4. 最详细的端口扫描5. 三种TCP扫描方式(1)TCP connect 扫描(2)TCP SYN扫描(3)TCP …...

Redis缓存设计典型问题

目录 缓存穿透 缓存失效(击穿) 缓存雪崩 热点缓存key重建优化 缓存与数据库双写不一致 缓存穿透 缓存穿透是指查询一个根本不存在的数据, 缓存层和存储层都不会命中, 通常出于容错的考虑, 如果从存储层查不到数据…...

【python】python基础速通系列2-python程序中的积木块

【组成Python的几个单位】 变量:指向值的名称。或者说变量是一个名称,这个名称指向一个具体的指。比如n=17,就说这个叫做n的变量的值是17。表达式:是值,变量和运算符的组合。如果把变量理解为名词,那么表达式就是把名词连起来的动词形容词。比如:n+25。语句:代码的基本…...

本地开启https,配置nodeJs服务

服务端和客户端各有一对公钥和私钥,使用公钥加密的数据只能用私钥解密,建立https传输之前,客户端和服务端互换公钥。客户端发送数据前使用服务端公钥加密,服务端接收到数据后使用私钥解密,反之亦如此。 1. 公钥私钥的…...

项目中的svg图标的封装与使用

1.安装 npm install vite-plugin-svg-icons -D2.在vite.config.ts中配置 **所有的svg图标都必须放在assets/icons // 引入svg import { createSvgIconsPlugin } from vite-plugin-svg-iconsexport default defineConfig({plugins: [vue(),createSvgIconsPlugin({iconDirs: [p…...

文件服务器迁移

文件服务器迁移还是比较简单的 win server加域 导出配额文件 选中所有项,点击导出 导出共享文件夹权限列表 导出文件夹的权限表,留作备用。需要用到“icacls” icacls c:\windows\* /save aclfile /t # C:\Windows 目录及其子目录中所有文件的 DAC…...

虹科Pico汽车示波器 | 汽车免拆检修 | 2011款瑞麒M1车发动机起动困难、加速无力

一、故障现象 一辆2011款瑞麒M1车,搭载SQR317F发动机,累计行驶里程约为10.4万km。该车因发动机起动困难、抖动、动力不足、热机易熄火等故障进厂维修。用故障检测仪检测,发动机控制单元(ECU)中存储有故障代码“P0340相…...

深度学习之图像分类(十五)DINAT: Dilated Neighborhood Attention Transformer详解(一)

Dilated Neighborhood Attention Transformer Abstract Transformers 迅速成为跨模态、领域和任务中应用最广泛的深度学习架构之一。在视觉领域,除了对普通Transformer的持续努力外,分层Transformer也因其性能和易于集成到现有框架中而受到重视。这些模…...

和数集团出席中科院上海高研院​第三十三期“高研交叉论坛”信息能源融合专场

2023年11月21日,中国科学院上海高等研究院第三十三期“高研交叉论坛”信息能源融合专场在上海高研院成功举办。本次论坛由中国科学院上海高等研究院智能信息通信技术研究与发展中心、中国科学院低碳转化科学与工程重点实验室、中科院和数智能区块链与能源系统应用联…...

GitHub----使用记录

一、上传文件到仓库 1、首先新建一个github仓库 然后先记住这一句指令 2、下载git工具 https://git-scm.com/downloads 下载工具安装不用运行 3、使用git工具上传文件并推送 找到你想上传的文件的位置,右击git Bush here git init :初始化这个仓…...

大数据平台/大数据技术与原理-实验报告--实战HDFS

实验名称 实战HDFS 实验性质 (必修、选修) 必修 实验类型(验证、设计、创新、综合) 综合 实验课时 2 实验日期 2023.10.23-2023.10.27 实验仪器设备以及实验软硬件要求 专业实验室(配有centos7.5系统的linu…...

C#中的事件(委托的发布和订阅、事件的发布和订阅、EventHandler类、Windows事件)

目录 一、委托的发布和订阅 1.订阅操作符号“"和取消订阅操作符号“-” 2.示例源码 二、事件的发布和订阅 三、EventHandler类 四、Windows事件 C#中的事件是指某个类的对象在运行过程中遇到的一些特定事情,而这些特定的事情有必要通知给这个对象的使用者…...

世微 舞台灯深度调光 大功率 dc-dc降压恒流驱动IC APS54083

产品描述 APS54083 是一款 PWM 工作模式,高效率、外围简单、外置功率 MOS 管,适用于 5-220V 输入高精度降压 LED 恒流驱动芯片。输出最大功率150W最大电流 6A。APS54083 可实现线性调光和 PWM 调光,线性调光脚有效电压范围 0.5-2.5V.PWM 调光频率范围 10…...

【nlp】3.3 Transformer论文复现:2. 编码器部分(掩码张量、多头注意力机制、前馈全连接层)

Transformer论文复现:2. 编码器部分(掩码张量、多头注意力机制、前馈全连接层) 2 编码器复现2.1 编码器介绍2.2 掩码张量2.2.1 掩码张量介绍2.2.2 掩码张量的作用2.2.3 生成掩码张量的代码实现2.2.4 掩码张量的可视化2.2.5 掩码张量总结2.3 注意力机制2.3.1 注意力计算规则的…...

vue3中shallowReactive与shallowRef

shallowReactive与shallowRef shallowReactive: 只处理了对象内最外层属性的响应式(也就是浅响应式) shallowRef: 只处理了value的响应式, 不进行对象的reactive处理 总结: reactive与ref实现的是深度响应式, 而shallowReactive与shallowRef是浅响应式。 什么时候用浅响应…...

蓝桥杯-动态规划-子数组问题

目录 一、乘积最大数组 二、乘积为正数的最长子数组长度 三、等差数列划分 四、最长湍流子数组 心得: 最重要的还是状态表示,我们需要根据题的意思,来分析出不同的题,不同的情况,来分析需要多少个状态 一、乘积最…...

mongodb源码分析session执行handleRequest命令find过程

mongo/transport/service_state_machine.cpp已经分析startSession创建ASIOSession过程,并且验证connection是否超过限制ASIOSession和connection是循环接受客户端命令,把数据流转换成Message,状态转变流程是:State::Created 》 St…...

(转)什么是DockerCompose?它有什么作用?

一、什么是DockerCompose? DockerCompose可以基于Compose文件帮我们快速的部署分布式应用,而无需手动一个个创建和运行容器。 Compose文件是一个文本文件,通过指令定义集群中的每个容器如何运行。 DockerCompose就是把DockerFile转换成指令去运行。 …...

Spring数据访问模块设计

前面我们已经完成了IoC和web模块的设计,聪明的码友立马就知道了,该到数据访问模块了,要不就这俩玩个6啊,查库势在必行,至此,它来了。 一、核心设计理念 1、痛点在哪 应用离不开数据(数据库、No…...

智能AI电话机器人系统的识别能力现状与发展水平

一、引言 随着人工智能技术的飞速发展,AI电话机器人系统已经从简单的自动应答工具演变为具备复杂交互能力的智能助手。这类系统结合了语音识别、自然语言处理、情感计算和机器学习等多项前沿技术,在客户服务、营销推广、信息查询等领域发挥着越来越重要…...

GruntJS-前端自动化任务运行器从入门到实战

Grunt 完全指南:从入门到实战 一、Grunt 是什么? Grunt是一个基于 Node.js 的前端自动化任务运行器,主要用于自动化执行项目开发中重复性高的任务,例如文件压缩、代码编译、语法检查、单元测试、文件合并等。通过配置简洁的任务…...

招商蛇口 | 执笔CID,启幕低密生活新境

作为中国城市生长的力量,招商蛇口以“美好生活承载者”为使命,深耕全球111座城市,以央企担当匠造时代理想人居。从深圳湾的开拓基因到西安高新CID的战略落子,招商蛇口始终与城市发展同频共振,以建筑诠释对土地与生活的…...

STM32HAL库USART源代码解析及应用

STM32HAL库USART源代码解析 前言STM32CubeIDE配置串口USART和UART的选择使用模式参数设置GPIO配置DMA配置中断配置硬件流控制使能生成代码解析和使用方法串口初始化__UART_HandleTypeDef结构体浅析HAL库代码实际使用方法使用轮询方式发送使用轮询方式接收使用中断方式发送使用中…...

从物理机到云原生:全面解析计算虚拟化技术的演进与应用

前言:我的虚拟化技术探索之旅 我最早接触"虚拟机"的概念是从Java开始的——JVM(Java Virtual Machine)让"一次编写,到处运行"成为可能。这个软件层面的虚拟化让我着迷,但直到后来接触VMware和Doc…...

Unity VR/MR开发-VR开发与传统3D开发的差异

视频讲解链接:【XR马斯维】VR/MR开发与传统3D开发的差异【UnityVR/MR开发教程--入门】_哔哩哔哩_bilibili...

Cursor AI 账号纯净度维护与高效注册指南

Cursor AI 账号纯净度维护与高效注册指南:解决限制问题的实战方案 风车无限免费邮箱系统网页端使用说明|快速获取邮箱|cursor|windsurf|augment 问题背景 在成功解决 Cursor 环境配置问题后,许多开发者仍面临账号纯净度不足导致的限制问题。无论使用 16…...