AI通用大模型不及垂直大模型?各有各的好
AI时代,通用大模型和垂直大模型,两者孰优孰劣,一直众说纷纭。
通用大模型,聚焦基础层,如ChatGPT、百度文心一言,科大讯飞星火大模型等,都归属通用大模型,它们可以解答各种问题、撰写文章、编程、翻译等等。
垂直大模型,聚焦解决垂直领域,如中国科学院香港创新院AI中心发布的垂直大模型CARES Copilot 1.0,只运用在医疗领域,可以在手术阶段自动识别病灶和解剖结构。写文章,它干不了。
对比下来看,通用大模型属于“万金油”型,垂直大模型属“专家”型。
中国有句话叫“博而不精,知而不专”,那么,涉猎广泛的通用大模型在商业上会取得怎样的成绩?
1.通用大模型:商业运用的革新力量

近日,据《科创板日报》消息,低调的国内通用大模型领军企业“阶跃星辰”,在上海举行的2024全球开发者先锋大会期间正式对外亮相。
之所以提到这家公司,因为这家公司不仅成功研发了Step千亿参数系列通用大模型,据说可比肩GPT-4。
同时还推出了两款面向C端用户的大模型产品——效率工具“跃问”和AI开放世界平台“冒泡鸭”。
全是通用大模型。
那么,阶跃星辰能否在竞争激烈的市场中脱颖而出,从阶跃星辰身上如何看待通用大模型的发展空间和前景。
据网友爆料,该公司发布大模型前并没有进行过融资,但公司背景却很牛,合作方有:中广天泽,云赛智联,大模型开发则是由前微软人员开发。
大模型发布以后,主要标的:上海电影,光线传媒、万达电影、华策影视、捷成股份、横店影视。
如此壮志雄心,想来资本将很快进入到阶跃星辰,助推其进一步发展。
从这个角度看,资本并不排斥通用大模型。
另外,从技术角度看,通用大模型的出现,可以改变传统数据处理和分析的方式。
以往,商业决策往往依赖于有限的数据和人工分析,这种方式不仅效率低下,而且容易受到人为因素的干扰。
相反,通用大模型则能够通过海量的数据学习和处理,实现对商业数据的精准挖掘和分析。
其实,通用大模型的革新力量,体现在广泛的应用场景上。
无论是智能客服、推荐系统、自动化办公还是其他领域,通用大模型都能发挥出其独特的作用。
以智能客服为例,传统的人工客服面临着人力成本高、响应速度慢等问题,而通用大模型则能够通过自然语言处理技术,实现与用户的智能交互,快速准确地解答用户的问题,提升用户体验。
在推荐系统方面,通用大模型能够根据用户的兴趣和行为数据,为用户推荐个性化的产品和服务,增加用户的黏性和转化率。
在自动化办公领域,通用大模型能够自动化处理和分析大量数据,减轻员工的工作压力,提高工作效率。
Step-2万亿参数MoE语言大模型预览版,不仅能够处理更加复杂和精细的任务,还能够通过深度学习和自然语言处理技术,实现对商业数据的深度挖掘和分析。
对于企业而言,这意味着能够获取更加精准和全面的市场洞察,为商业决策提供更加有力的支持。
由此可见,通用大模型未来的发展空间是非常大的,资本也愿意投入到这个方向上来,不仅为企业带来了经济效益的提升,更推动了整个商业领域的进步和发展,这体现了通用大模型作为商业运用的革新力量。
2.通用大模型的商业价值与社会影响

有人将通用大模型比喻成地基,垂直大模型是在地基上建立起来的各种建筑物。
也有人说,垂直大模型才是未来AI发展趋势。
不管好坏,可以肯定的是,通用大模型既然存在,必然有其商业价值和社会价值。
首先,通用大模型能够提升企业的运营效率和创新能力,从而推动整个行业的进步和发展。
通过利用通用大模型的数据处理和分析能力,企业可以更加精准地把握市场趋势和用户需求,优化产品和服务,提升竞争力,还能够激发企业的创新活力,推动新产品和新服务的不断涌现,为经济发展注入新的动力。
其次,通用大模型的应用也促进了社会的智能化和便利化。在医疗、教育、交通等各个领域,通用大模型都发挥着重要作用。
例如,在教育领域,通用大模型可以根据学生的学习情况和兴趣爱好,提供个性化的学习资源和辅导服务,不仅提升了社会的服务水平,也提高了人们的生活质量。
第三,由于技术门槛高,会筛选掉一部分企业,一定程度上会减少“内卷”问题,这对行业来说,可以将精力倾注在技术创新上。
随着技术的不断发展和商业运用的深入拓展,通用大模型将在更多领域发挥出更大的作用,为企业和社会带来更多的价值。
3.通用大模型现存的挑战

通用大模型虽有广阔的空间,但从实际运用情况来看,也存在诸多挑战。
首先是资源效率问题。
由于通用大模型什么都要会点,所以,训练和运行大型模型需要大量的资源,这会增加成本。反观垂直大模型,只专注于某个行业领域,所以资源需求量就会低些。
其次是专业性问题。
有句话叫“360行,行行出状元”,这指的是要做精,做专,做细。当AI和具体行业结合,那么其专业程度决定了AI作用的上限。通用大模型在某些特定领域,相比于垂直大模型,就显得逊色一筹。
第三是数据需求问题。
我们现在已经知道数据的重要性,这是一种宝贵的资源,对数据的保护意识也大大提升。对通用大模型而言,要发挥其强大能力,需要很多的数据进行训练和优化,当数据不足的时候,通用大模型可能就变得没有那么“聪明”了。
总的来说,通用大模型虽然有以上不足,但其灵活性和泛能力性,是垂直大模型无法达到的。至于通用大模型、垂直大模型谁好谁坏,还需要人们在选择时,根据具体任务要求进行选择。
4.结语
综上所述,应该说通用大模型未来的发展空间是可期的。在一些适用场景中,通用大模型“万金油”的特点或许能为客户带来更好的体验感受。
未来大模型市场将往什么方向发展还有待进一步观察,但AI时代必将成为一股不可阻挡的潮流,企业可以围绕该方向,开拓延伸出更多新兴行业,创造出更多商机。
相关文章:
AI通用大模型不及垂直大模型?各有各的好
AI时代,通用大模型和垂直大模型,两者孰优孰劣,一直众说纷纭。 通用大模型,聚焦基础层,如ChatGPT、百度文心一言,科大讯飞星火大模型等,都归属通用大模型,它们可以解答…...
农产品价格信息系统小程序
一键掌握市场脉动 🌾 引言:为何关注农产品价格? 在当今社会,农产品价格的波动直接关系到农民的收入和消费者的生活成本。因此,及时、准确地掌握农产品价格信息,对于农民合理安排生产、消费者做出购买决策都…...
【LLM-多模态】高效多模态大型语言模型综述
一、结论写在前面 模型规模的庞大及训练和推理成本的高昂,限制了MLLMs在学术界和工业界的广泛应用。因此,研究高效轻量级的MLLMs具有巨大潜力,特别是在边缘计算场景中。 论文深入探讨了高效MLLM文献的领域,提供了一个全面的视角…...
ASP .Net Core创建一个httppost请求并添加证书
ASP .Net Core创建一个httppost请求并添加证书 创建.net Core程序,使用自签名证书,可以处理https的get和post请求。 创建证书 创建自签名证书的流程可以在这里查看: https://blog.csdn.net/GoodCooking/article/details/139815278创建完毕…...
Redis入门篇
目录 传送门一、前言二、NoSQL1、ont only sql,特点:2、NoSQL的四大分类: 三、Redis概念四、五大数据类型: 传送门 SpringMVC的源码解析(精品) Spring6的源码解析(精品) SpringBoot3框架&#…...
变电站智能巡检机器人解决方案
我国拥有庞大的电网体系,变电站数量众多,且近年来快速增长。然而目前我国变电站巡检方式仍以人工为主,存在效率低下、监控不全面等问题。变电站通常是一个封闭的系统空间,设备种类繁多、占地面积广阔,这对巡检人员实时…...
Linux Kernel入门到精通系列讲解(QEMU-虚拟化篇) 2.5 Qemu实现RTC设备
1. 概述 上一章节起(5.4小节),我们已经把整个Naruto Pi都跑通了,从BL0到kernel再到Rootfs都通了,目前可以说已经具备学习Linux得基础条件,剩下得都只是添砖加瓦,本小节我们将添加RTC,如果你还没有添加RTC,你可以试试不添加RTC时,Linux的时间戳会很奇怪,加了RTC后,…...
【自动驾驶】通过下位机发送的加速度、角速度计算机器人在世界坐标系中的姿态
文章目录 原始代码全局变量定义逆平方根函数四元数解算函数理论解释四元数加速度计数据归一化计算方向余弦矩阵的第三行计算误差计算并应用积分反馈应用比例反馈积分陀螺仪数据,更新四元数归一化四元数更新姿态数据整体流程原始代码 #define SAMPLING_FREQ 20.0f // 采样频率…...
Python 设计模式(第2版) -- 第四部分(其他设计模式)
Python 设计模式(第2版) 最后介绍下其他设计模式。 模型—视图—控制器(MVC)-- 复合模式 根据 GoF 的定义,“复合模式将两个或更多模式组合成解决常见或普遍性问题的解决方案”。复合模式不是同时使用的一组模式,而是一个问题的…...
gitlab升级16.11.3-ee
背景 这是事后一段时间补充记录的博客。 升级目的:修补漏洞CVE-2024-4835 未经认证的威胁攻击者能够利用该漏洞在跨站脚本 (XSS) 攻击中,轻松接管受害者账户。 gitlab版本为14.6.2-ee升级至16.11.3-ee 思路 翻阅文档找升级方法及升级版本路径。使用…...
剑指offer 算法题(搜索二维矩阵)
剑指offer 第二题 去力扣里测试算法 思路一: 直接暴力遍历二维数组。 class Solution { public:bool searchMatrix(vector<vector<int>>& matrix, int target) {for (unsigned int i{ 0 }; i < matrix.size(); i){for (unsigned int j{ 0 };…...
SaaS平台数据对接为什么要选择API对接?
SaaS平台数据对接是指将一个或多个SaaS平台中的数据集成到其他应用或平台中的过程。在当前的数字化时代,企业越来越倾向于使用SaaS平台来管理他们的业务和数据。然而,这些数据通常散布在不同的SaaS平台中,这对于企业数据的整合和分析来说可能…...
力扣136. 只出现一次的数字
Problem: 136. 只出现一次的数字 文章目录 题目描述思路复杂度Code 题目描述 思路 由于题目要求使用线性时间复杂度和常量级的空间复杂度,再加上找重复元素这个特性,我们可以想到使用位运算来求解: 1.任何数与其本身异或得0,任何…...
重学java 74.Lombok的使用
少点心气,多点干劲 —— 24.6.18 一、lombok的安装使用 1.作用: 简化javabean开发 2.使用: a.下插件 ->如果是idea2022不用下载了,自带 b.导lombok的jar包 安装教程: http://t.csdnimg.cn/wq9MM c.修改设置 二、lombok的介绍 Lombok通过增加一…...
数据结构6---树
一、定义 树(Tree)是n(n>0)个结点的有限集。当n0时成为空树,在任意一棵非空树中: 1、有且仅有一个特定的称为根(Root)的结点; 2、当n>1时,其余结点可分为m(m>日)个互不相交的有限集T1、T2、...、 Tm,其中每一个集合本身又是一棵树,并且称为根的…...
一键制作,打造高质量的数字刊物
随着数字化时代的到来,数字刊物已经成为信息传播的重要载体。它以便捷、环保、互动性强等特点,受到了越来越多人的青睐。然而,如何快速、高效地制作出高质量的数字刊物,成为许多创作者面临的难题。今天,教大家一个制作…...
Java面试题:对比继承Thread类和实现Runnable接口两种创建线程的方法,以及它们的优缺点
Java 中创建线程有两种主要的方法:继承 Thread 类和实现 Runnable 接口。下面我将分别介绍这两种方法,并对比它们的优缺点。 继承 Thread 类 方法: 创建一个继承自 Thread 的子类。重写 Thread 类的 run 方法。创建子类的实例并调用 start…...
编译原理-各章典型题型+思路求解
第2章文法和语言习题 基础知识: 思路: 基础知识: 思路: 基础知识: 编译原理之 短语&直接短语&句柄 定义与区分_编译原理短语,直接短语,句柄-CSDN博客 思路: 题目: 基础解释:…...
【绝对有用】C++ vector排序
在 C 中,有多种方法可以对向量(即 std::vector)进行排序。最常用的方法是使用标准库中的 std::sort 函数。以下是一些例子: 使用 std::sort 函数 std::sort 函数是标准库 <algorithm> 中的一个函数,可以对向量…...
linux——VScode安装
方法一:使用snap一键安装 Snap Store 是 Ubuntu、Debian、Fedora 和其他几个 Linux 发行版中的一个应用商店,提供了数千个应用程序和工具的安装。Snap Store 使用 Snap 包格式,这是一种通用的 Linux 软件包格式,使得在不同的 Lin…...
[特殊字符] 智能合约中的数据是如何在区块链中保持一致的?
🧠 智能合约中的数据是如何在区块链中保持一致的? 为什么所有区块链节点都能得出相同结果?合约调用这么复杂,状态真能保持一致吗?本篇带你从底层视角理解“状态一致性”的真相。 一、智能合约的数据存储在哪里…...
MPNet:旋转机械轻量化故障诊断模型详解python代码复现
目录 一、问题背景与挑战 二、MPNet核心架构 2.1 多分支特征融合模块(MBFM) 2.2 残差注意力金字塔模块(RAPM) 2.2.1 空间金字塔注意力(SPA) 2.2.2 金字塔残差块(PRBlock) 2.3 分类器设计 三、关键技术突破 3.1 多尺度特征融合 3.2 轻量化设计策略 3.3 抗噪声…...
基于距离变化能量开销动态调整的WSN低功耗拓扑控制开销算法matlab仿真
目录 1.程序功能描述 2.测试软件版本以及运行结果展示 3.核心程序 4.算法仿真参数 5.算法理论概述 6.参考文献 7.完整程序 1.程序功能描述 通过动态调整节点通信的能量开销,平衡网络负载,延长WSN生命周期。具体通过建立基于距离的能量消耗模型&am…...
【WiFi帧结构】
文章目录 帧结构MAC头部管理帧 帧结构 Wi-Fi的帧分为三部分组成:MAC头部frame bodyFCS,其中MAC是固定格式的,frame body是可变长度。 MAC头部有frame control,duration,address1,address2,addre…...
解锁数据库简洁之道:FastAPI与SQLModel实战指南
在构建现代Web应用程序时,与数据库的交互无疑是核心环节。虽然传统的数据库操作方式(如直接编写SQL语句与psycopg2交互)赋予了我们精细的控制权,但在面对日益复杂的业务逻辑和快速迭代的需求时,这种方式的开发效率和可…...
什么是库存周转?如何用进销存系统提高库存周转率?
你可能听说过这样一句话: “利润不是赚出来的,是管出来的。” 尤其是在制造业、批发零售、电商这类“货堆成山”的行业,很多企业看着销售不错,账上却没钱、利润也不见了,一翻库存才发现: 一堆卖不动的旧货…...
Qwen3-Embedding-0.6B深度解析:多语言语义检索的轻量级利器
第一章 引言:语义表示的新时代挑战与Qwen3的破局之路 1.1 文本嵌入的核心价值与技术演进 在人工智能领域,文本嵌入技术如同连接自然语言与机器理解的“神经突触”——它将人类语言转化为计算机可计算的语义向量,支撑着搜索引擎、推荐系统、…...
多模态大语言模型arxiv论文略读(108)
CROME: Cross-Modal Adapters for Efficient Multimodal LLM ➡️ 论文标题:CROME: Cross-Modal Adapters for Efficient Multimodal LLM ➡️ 论文作者:Sayna Ebrahimi, Sercan O. Arik, Tejas Nama, Tomas Pfister ➡️ 研究机构: Google Cloud AI Re…...
【JavaWeb】Docker项目部署
引言 之前学习了Linux操作系统的常见命令,在Linux上安装软件,以及如何在Linux上部署一个单体项目,大多数同学都会有相同的感受,那就是麻烦。 核心体现在三点: 命令太多了,记不住 软件安装包名字复杂&…...
精益数据分析(97/126):邮件营销与用户参与度的关键指标优化指南
精益数据分析(97/126):邮件营销与用户参与度的关键指标优化指南 在数字化营销时代,邮件列表效度、用户参与度和网站性能等指标往往决定着创业公司的增长成败。今天,我们将深入解析邮件打开率、网站可用性、页面参与时…...

