产业,到底需要什么大模型?
[
产业究竟需要怎样的大模型?关于这个问题,本文作者便提出了他的看法,并总结了产业大模型目前阶段的三点落地挑战。一起来看看,或许可以帮助你更好地理解大模型与行业、与产业的融合。
写下这篇的起因,是前不久的一件事。
我们参与了一个大模型与行业结合的主题论坛。活动结束之后,来自行业主办方的一位代表跟我们交流时却说:“你们一直在说大模型。到底什么是大模型?多大才算大?为什么不能用小模型?”
这一系列问题又一次让我们意识到,智能化的供需双方很多时候根本处在两套话语体系。你这边Transfomer、Agent的说了半天,那边可能还在好奇大模型这三个字到底是怎么来的。
这种隔膜,在AI时代尤为严重。因为AI技术涉及的链条更长,做算法的、做云的、做硬件的、做IT解决方案的,以及最后买单的,大家可能在各说各的,谁也没打算真正理解谁。
今天,各家都在说产业大模型、行业大模型。确实从技术逻辑上看,很容易发现大模型能够给很多行业带来巨大的生产力释放,而从技术路线上看,中国企业对智能化的接受度更高、需求更强烈。大模型走向产业实现数实融合,是中国AI最具特色的一条脉络,在数字中国的大背景下具有极强的宏观战略意义。
做了8年产品经理后,我是这么看产品经理的我个人是从非常初级的产品经理做起,再到负责一个大产品的项目管理,现在有幸跳出了日常基础的工作更多的去看产品的PMF,product strategy…查看详情 >
但在实践中,这条路却充满了挑战与误解。
毕竟AI算法公司做toB,十家有九家做不成。在大模型toB的新机会窗口前,我们首先要确定产业究竟需要怎样的大模型?
一、产业大模型,就不是一种模型
AI公司做大模型结合行业,最大的误区在于搞不清供需关系。
诚然,目前行业对大模型的认可与接纳程度已经比较好,但智能化项目依旧是一个绝对的买方市场。技术供应商需要去适配最终用户的需求、能力、背景,甚至沟通话术和商业习惯。
但由于做AI大模型的公司,涌入了大量互联网领域的人才和资金。互联网的供需逻辑是单点供应对大量需求,我有一招鲜天下涌进来。而大模型在很多行业的适配又是很容易就能想到的。比如工厂需求配料分析,银行需要投资分析,那我的大模型不是都能分析吗?
于是,在这样的“风口思维”下,很多AI公司陷入了一个巨大的误区:他们认为我有大模型,各行业的客户都应该来找我。我推出两三个行业的案例,其他行业都应该认可。我的这个大模型哪里都能用,所以它就叫产业大模型。
无论这些AI从业者是真的相信大模型等于产业万金油,还是仅仅是故意吹成这样。在产业客户看来,这一幕就等于胡说八道。他们会觉得,金融业用的技术,关我煤矿什么事?如果有一种食品,说是猫能吃牛能吃人也能吃,你敢吃吗?
产业需要大模型做的第一件事,就是不要笼统的天差地别的各个行业归纳为“产业”两个字就结束了。即使在某个行业内,大模型都仅仅能解决行业的一个或几个问题,更不可能有一种模型能够“包治百业”。
做IT的都知道,有产品更要有服务,懂技术更要懂行业。但做AI的企业,尤其是拿着热钱涌入大模型赛场的企业,普遍对产业需求的差异性缺乏了解和尊重。
当然,不同行业对大模型的需求也有共通之处。比如对基础的对话、CV、多模态能力。但更多的情况下,每个行业的只能用意愿、基础数字能力,乃至安全需求、时延需求、运维需求都不相同。在今天的阶段,一种大模型能够在具体行业内复制推广已经非常不容易,更别想一口吃下几个甚至几十个行业。
产业智能化,优先级永远是产业大于智能化。
二、不提硬件和工程化,约等于瞎耽误功夫
很多做数字化、智能化的企业,在看了客户环境之后会奇怪这么一件事:客户花了大钱买回来的东西,其实就是很简单的软件封在一个盒子里,然后按照行业要求做了点按钮、UI之类的东西。甚至这些软件很多都是国外很古早的开源软件进行再封装,技术上早就落后了。这时他们会感叹,行业客户的钱可真好骗啊。
可是问题来了,如果我们换个角度思考这个问题,要是没有这层封装,企业要怎么用呢?难道一家工厂、一座矿山、一片林场,要招来和培养一大堆云计算、AI算法层面的人才?而且要让这些数字化人才指导整个企业的生产、运营和销售?这显然是不靠谱的。
所以,一个有点反常识的事实是,相比于天花乱坠的先进技术,行业用户往往更在乎那层“壳”。那层壳就说硬件化和工程化,是将技术能力按照最终的使用需求进行封装、管理和维护。虽然最后组装出来的东西可能很难用,可能不先进,但对于行业用户来说,有的用,员工能学会,才是智能化的最重要条件。
在讨论行业大模型时,今天也经常会陷入这个误区。从业者往往过分关注算法层的领先性、国际性,跟参数规模和测试纪录较劲,把目光聚焦在软件上。但行业需要大模型做的,是跟此前的数字系统较劲,跟使用成本较劲,跟操作门槛较劲。这就需要大模型考虑硬件环境、网络环境、存算资源、操作系统,甚至考虑部署环境的电力供应、湿度、温度。
产业大模型要做的第二件事,是必须兼顾硬件适配和工程化问题。
大模型能否落地,都在说要找准场景。但什么是场景?最后能起作用的那个地方才叫场景。
绝大部分企业,都不是IT为导向。甚至大部分企业根本无法派专人去仔细了解什么是大模型。这个事情在漫长的时间里都无法改变。
山不会过来看你,所以你要去看山。
很多人把大模型比作一座金矿,那么训练大模型仅仅是挖到金矿,通过工程化方法,讲大模型融入到行业已有的数字化基础设施,才是把金矿运出山。
三、专家下工厂,终究要不得
很多AI厂商无论是在给客户讲故事,还是面向公众做传播,总是会提起这么一段:你们不要担心,我们有专家有博士后扎根行业。下工厂,下农田,一驻守就是几个月。
如果你是大模型的潜在行业用户,那么这个故事听听就算了。专家驻厂确实是真的,但那个厂极大概率不是你的厂。
事实上,AI专家亲临产业一线,是缩短行业需求与大模型供给之间的有效路径。这也是一个产业智能化必经的发展过程。
但这个过程必然也只能是暂时性的,不可能长久。试想一下,如今大模型正在风口浪尖,专家们都是什么身价?一个专家组入驻现场,就这个薪资成本哪家实体企业能撑得住?
AI企业所宣称的专家驻厂,其实是在做案例、做测试。一般都是和行业内的头部客户合作,厂商愿意以亏损为代价把模型跑通,观察有哪些具体问题。
**专家可以下厂,但专家肯定不能经年累月驻守一家又一家工厂。**这是AI厂商进入某行业时的标准动作,但往往会有意无意被理解为一个常规动作,可真要只能依赖专家下厂来推广大模型,那么AI永远也无法落地,因为这个成本谁也承受不起。
产业大模型要做的第三件事,是技术具有行业内的低门槛可复制性,不能大量依赖人工进行订制化合作。
尤其需要注意的是,目前阶段大中型企业在智能化上的投资愈发谨慎,试错成本不能过高。实验性与不确定性太强的大模型落地方案,在目前阶段已经很难得到大客户认同,更遑论成千上万的中小客户,更是不可能依赖重人工投入的方式来推动。
总结一下,产业大模型目前阶段的落地挑战有三点:
- AI厂商总把大模型想象为万金油,但行业需要的是理解和专注。
- AI厂商总是关注算法创新,但行业需要的是工程化和可操作。
- AI厂商大量宣传依靠人才能力跑通的个案,但行业需要的是低成本和可复制。
大模型落地产业,正是旭日东升时,但也要有意识去清扫一些积雪,而回到用户界面,往往就能找到更多问题的答案。
相关文章:

产业,到底需要什么大模型?
[ 产业究竟需要怎样的大模型?关于这个问题,本文作者便提出了他的看法,并总结了产业大模型目前阶段的三点落地挑战。一起来看看,或许可以帮助你更好地理解大模型与行业、与产业的融合。 写下这篇的起因,是前不久的一件事…...

每日5题Day17 - LeetCode 81 - 85
每一步向前都是向自己的梦想更近一步,坚持不懈,勇往直前! 第一题:81. 搜索旋转排序数组 II - 力扣(LeetCode) class Solution {public boolean search(int[] nums, int target) {int n nums.length;if (n…...
后端开发面经系列 --中望C++面经
中望C面经,全部内容! 公众号:阿Q技术站 文章目录 中望C面经,全部内容!一面 8.15 时长45min1、介绍项目相关2、gdb怎么调试的?打断点用什么指令?3、gcc的编译过程4、cmake添加头文件搜索路径用…...

德国西门子论未来质量管理 - 如何与明天相遇?
未来制造业的质量 -- 如何用软件方案满足质量要求 作者:Bill Butcher 翻译&编辑:数字化营销工兵 【前言】在Frost&Sullivan最近发表的一份白皮书中,他们讨论了制造业的质量投资。质量是制造过程的关键要素,但似乎比其他…...

webpack快速入门---webpack的安装和基本使用
webpack是什么 本质上,webpack 是一个用于现代 JavaScript 应用程序的 静态模块打包工具。当 webpack 处理应用程序时,它会在内部从一个或多个入口点构建一个 依赖图(dependency graph),然后将你项目中所需的每一个模块组合成一个或多个 bund…...

后端开发面经系列 -- 华为C++一面面经
HUAWEI – C一面面经 公众号:阿Q技术站 来源:https://www.nowcoder.com/feed/main/detail/b8113ff340d7444985b32a73c207c826 1、计网的协议分几层?分别叫什么? OSI七层模型 物理层 (Physical Layer): 负责物理设备之间的原始比…...

csrf漏洞与ssrf漏洞
环境:用kali搭建的pikachu靶场 一.CSRF 1.CSRF漏洞简介 跨站请求伪造(CSRF)漏洞是一种Web应用程序安全漏洞,攻击者通过伪装成受信任用户的请求来执行未经授权的操作。这可能导致用户在不知情的情况下执行某些敏感操作࿰…...

AWS EC2服务器开启root密码,SSH登录
1) EC2 Instance Connect连接,更改root密码 sudo passwd root 2)接着切换到切换到 root 身份,编辑 SSH 配置文件 $ sudo -i$ vi /etc/ssh/sshd_configPasswordAuthentication no,把 no 改成 yes #PermitRootLogin prohibit-passw…...
常见代码版本管理工具
目录 一、引言 二、Gitee (一)优点与特点 (二)缺点 (三)使用报告 三、GitHub 四、SVN 五、总结 一、引言 在软件开发过程中,代码版本控制工具是不可或缺的。Gitee、GitHub和SVN是三种常…...

最新版点微同城源码34.7+全套插件+小程序前后端
带全套插件 自己耐心点配置一下插件 可以H5可以小程序 一款专属的同城服务平台对于企业和个人而言,无疑是拓展业务、提升服务品质的重要一环。点微同城源码搭配全套插件,以及完善的小程序前后端,将为您的业务发展提供强大支持 源码免费下载…...

逻辑回归及python实现
概述 logistic回归是一种广义线性回归(generalized linear model),因此与多重线性回归分析有很多相同之处。它们的模型形式基本上相同,都具有 w‘xb,其中w和b是待求参数,其区别在于他们的因变量不同&#x…...
大模型押题高考语文作文,带着大模型参加语文高考会怎么样?
前沿 大语言模型通常是指那些经过大量数据训练,能够理解和生成自然语言文本的人工智能系统。这些模型通常具有数百万到数十亿个参数,能够执行多种语言任务,例如语言翻译、文本摘要、问答系统、文本生成等。大语言模型能够捕捉语言的复杂性和细微差别,提供更加准确和自然的…...

Linux Ext2/3/4文件系统
文章目录 前言一、Linux文件系统简介1.1 简介1.2 Linux File System Structure1.3 Directory Structure 二、Ext2/3/4文件系统2.1 Minix2.2 EXT2.3 EXT22.4 EXT32.5 EXT4 三、EXT Inode参考资料 前言 这篇文章介绍了Linux文件系统的一些基础知识:Linux 文件系统简介…...

SIMBA方法解读
目录 预处理scRNA-seqscATAC-seq 图构建(5种场景)scRNA-seq分析scATAC-seq分析多模态分析批次整合多模态整合 图学习SIMBA空间中查询实体识别TF-target genes 预处理 scRNA-seq 过滤掉在少于三个细胞中表达的基因。原始计数按文库大小标准化࿰…...
VueRoute url参数
版本 4.x 获取query参数 使用$router.query,可以获取参数对应的json对象。 获取url参数 需要在路由配置中定义。使用$router.param获取。...

WPS表格插件方方格子【凑数】功能:选出和等于固定数字的数
文章目录 后来发现可以下载方方格子插件,使用【凑数】功能https://ffcell.lanzouj.com/iwhfc1kjhayh【凑数】快速【凑数】 导师让沾发票,需要选出若干个数额的发票,使它们的和等于一个指定数。不知道怎么办了,查了一下,…...
通过SpringCloudGateway中的GlobalFilter实现鉴权过滤
1.pom.xml中加入gateway jar包 <dependency><groupId>org.springframework.cloud</groupId><artifactId>spring-cloud-starter-gateway</artifactId></dependency> 2.创建权限过滤器 SecurityFilter /*** 鉴权过滤***/ Slf4j Component …...

TCP/IP(网络编程)
一、网络每一层的作用 *网络接口层和物理层的作用:屏蔽硬件的差异,通过底层的驱动,会提供统一的接口,供网络层使用 *网络层的作用:实现端到端的传输 *传输层:数据应该交给哪一个任…...

网工内推 | 网络运维工程师,H3CIE认证优先,13薪,享股票期权
01 畅读 🔷招聘岗位:高级网络运维工程师 🔷职责描述: 1.负责线上业务网络技术运维工作,保障并优化线上网络质量; 2.规划并构建公司线上业务网络架构; 3.规划线上业务网络质量评估与监控体系&…...

QT C++ 基于word模板 在书签位置写入文字和图片
如果你有按模版批量自动化操作word文件的需求,那么本文能给你一定的帮助。 它能满足你程序自动化生成报表的需求。常常用于上位机、测试仪器的软件中。 需要你你自己做个word模版文档,添加2个书签。点按钮,会按照你的模板文档生成一个同样的…...

通过Wrangler CLI在worker中创建数据库和表
官方使用文档:Getting started Cloudflare D1 docs 创建数据库 在命令行中执行完成之后,会在本地和远程创建数据库: npx wranglerlatest d1 create prod-d1-tutorial 在cf中就可以看到数据库: 现在,您的Cloudfla…...

(二)原型模式
原型的功能是将一个已经存在的对象作为源目标,其余对象都是通过这个源目标创建。发挥复制的作用就是原型模式的核心思想。 一、源型模式的定义 原型模式是指第二次创建对象可以通过复制已经存在的原型对象来实现,忽略对象创建过程中的其它细节。 📌 核心特点: 避免重复初…...

SpringBoot+uniapp 的 Champion 俱乐部微信小程序设计与实现,论文初版实现
摘要 本论文旨在设计并实现基于 SpringBoot 和 uniapp 的 Champion 俱乐部微信小程序,以满足俱乐部线上活动推广、会员管理、社交互动等需求。通过 SpringBoot 搭建后端服务,提供稳定高效的数据处理与业务逻辑支持;利用 uniapp 实现跨平台前…...
【RockeMQ】第2节|RocketMQ快速实战以及核⼼概念详解(二)
升级Dledger高可用集群 一、主从架构的不足与Dledger的定位 主从架构缺陷 数据备份依赖Slave节点,但无自动故障转移能力,Master宕机后需人工切换,期间消息可能无法读取。Slave仅存储数据,无法主动升级为Master响应请求ÿ…...

第 86 场周赛:矩阵中的幻方、钥匙和房间、将数组拆分成斐波那契序列、猜猜这个单词
Q1、[中等] 矩阵中的幻方 1、题目描述 3 x 3 的幻方是一个填充有 从 1 到 9 的不同数字的 3 x 3 矩阵,其中每行,每列以及两条对角线上的各数之和都相等。 给定一个由整数组成的row x col 的 grid,其中有多少个 3 3 的 “幻方” 子矩阵&am…...

Netty从入门到进阶(二)
二、Netty入门 1. 概述 1.1 Netty是什么 Netty is an asynchronous event-driven network application framework for rapid development of maintainable high performance protocol servers & clients. Netty是一个异步的、基于事件驱动的网络应用框架,用于…...

无人机侦测与反制技术的进展与应用
国家电网无人机侦测与反制技术的进展与应用 引言 随着无人机(无人驾驶飞行器,UAV)技术的快速发展,其在商业、娱乐和军事领域的广泛应用带来了新的安全挑战。特别是对于关键基础设施如电力系统,无人机的“黑飞”&…...

[ACTF2020 新生赛]Include 1(php://filter伪协议)
题目 做法 启动靶机,点进去 点进去 查看URL,有 ?fileflag.php说明存在文件包含,原理是php://filter 协议 当它与包含函数结合时,php://filter流会被当作php文件执行。 用php://filter加编码,能让PHP把文件内容…...
比较数据迁移后MySQL数据库和OceanBase数据仓库中的表
设计一个MySQL数据库和OceanBase数据仓库的表数据比较的详细程序流程,两张表是相同的结构,都有整型主键id字段,需要每次从数据库分批取得2000条数据,用于比较,比较操作的同时可以再取2000条数据,等上一次比较完成之后,开始比较,直到比较完所有的数据。比较操作需要比较…...
Vue3中的computer和watch
computed的写法 在页面中 <div>{{ calcNumber }}</div>script中 写法1 常用 import { computed, ref } from vue; let price ref(100);const priceAdd () > { //函数方法 price 1price.value ; }//计算属性 let calcNumber computed(() > {return ${p…...