AI通用大模型不及垂直大模型?各有各的好
AI时代,通用大模型和垂直大模型,两者孰优孰劣,一直众说纷纭。
通用大模型,聚焦基础层,如ChatGPT、百度文心一言,科大讯飞星火大模型等,都归属通用大模型,它们可以解答各种问题、撰写文章、编程、翻译等等。
垂直大模型,聚焦解决垂直领域,如中国科学院香港创新院AI中心发布的垂直大模型CARES Copilot 1.0,只运用在医疗领域,可以在手术阶段自动识别病灶和解剖结构。写文章,它干不了。
对比下来看,通用大模型属于“万金油”型,垂直大模型属“专家”型。
中国有句话叫“博而不精,知而不专”,那么,涉猎广泛的通用大模型在商业上会取得怎样的成绩?
1.通用大模型:商业运用的革新力量

近日,据《科创板日报》消息,低调的国内通用大模型领军企业“阶跃星辰”,在上海举行的2024全球开发者先锋大会期间正式对外亮相。
之所以提到这家公司,因为这家公司不仅成功研发了Step千亿参数系列通用大模型,据说可比肩GPT-4。
同时还推出了两款面向C端用户的大模型产品——效率工具“跃问”和AI开放世界平台“冒泡鸭”。
全是通用大模型。
那么,阶跃星辰能否在竞争激烈的市场中脱颖而出,从阶跃星辰身上如何看待通用大模型的发展空间和前景。
据网友爆料,该公司发布大模型前并没有进行过融资,但公司背景却很牛,合作方有:中广天泽,云赛智联,大模型开发则是由前微软人员开发。
大模型发布以后,主要标的:上海电影,光线传媒、万达电影、华策影视、捷成股份、横店影视。
如此壮志雄心,想来资本将很快进入到阶跃星辰,助推其进一步发展。
从这个角度看,资本并不排斥通用大模型。
另外,从技术角度看,通用大模型的出现,可以改变传统数据处理和分析的方式。
以往,商业决策往往依赖于有限的数据和人工分析,这种方式不仅效率低下,而且容易受到人为因素的干扰。
相反,通用大模型则能够通过海量的数据学习和处理,实现对商业数据的精准挖掘和分析。
其实,通用大模型的革新力量,体现在广泛的应用场景上。
无论是智能客服、推荐系统、自动化办公还是其他领域,通用大模型都能发挥出其独特的作用。
以智能客服为例,传统的人工客服面临着人力成本高、响应速度慢等问题,而通用大模型则能够通过自然语言处理技术,实现与用户的智能交互,快速准确地解答用户的问题,提升用户体验。
在推荐系统方面,通用大模型能够根据用户的兴趣和行为数据,为用户推荐个性化的产品和服务,增加用户的黏性和转化率。
在自动化办公领域,通用大模型能够自动化处理和分析大量数据,减轻员工的工作压力,提高工作效率。
Step-2万亿参数MoE语言大模型预览版,不仅能够处理更加复杂和精细的任务,还能够通过深度学习和自然语言处理技术,实现对商业数据的深度挖掘和分析。
对于企业而言,这意味着能够获取更加精准和全面的市场洞察,为商业决策提供更加有力的支持。
由此可见,通用大模型未来的发展空间是非常大的,资本也愿意投入到这个方向上来,不仅为企业带来了经济效益的提升,更推动了整个商业领域的进步和发展,这体现了通用大模型作为商业运用的革新力量。
2.通用大模型的商业价值与社会影响

有人将通用大模型比喻成地基,垂直大模型是在地基上建立起来的各种建筑物。
也有人说,垂直大模型才是未来AI发展趋势。
不管好坏,可以肯定的是,通用大模型既然存在,必然有其商业价值和社会价值。
首先,通用大模型能够提升企业的运营效率和创新能力,从而推动整个行业的进步和发展。
通过利用通用大模型的数据处理和分析能力,企业可以更加精准地把握市场趋势和用户需求,优化产品和服务,提升竞争力,还能够激发企业的创新活力,推动新产品和新服务的不断涌现,为经济发展注入新的动力。
其次,通用大模型的应用也促进了社会的智能化和便利化。在医疗、教育、交通等各个领域,通用大模型都发挥着重要作用。
例如,在教育领域,通用大模型可以根据学生的学习情况和兴趣爱好,提供个性化的学习资源和辅导服务,不仅提升了社会的服务水平,也提高了人们的生活质量。
第三,由于技术门槛高,会筛选掉一部分企业,一定程度上会减少“内卷”问题,这对行业来说,可以将精力倾注在技术创新上。
随着技术的不断发展和商业运用的深入拓展,通用大模型将在更多领域发挥出更大的作用,为企业和社会带来更多的价值。
3.通用大模型现存的挑战

通用大模型虽有广阔的空间,但从实际运用情况来看,也存在诸多挑战。
首先是资源效率问题。
由于通用大模型什么都要会点,所以,训练和运行大型模型需要大量的资源,这会增加成本。反观垂直大模型,只专注于某个行业领域,所以资源需求量就会低些。
其次是专业性问题。
有句话叫“360行,行行出状元”,这指的是要做精,做专,做细。当AI和具体行业结合,那么其专业程度决定了AI作用的上限。通用大模型在某些特定领域,相比于垂直大模型,就显得逊色一筹。
第三是数据需求问题。
我们现在已经知道数据的重要性,这是一种宝贵的资源,对数据的保护意识也大大提升。对通用大模型而言,要发挥其强大能力,需要很多的数据进行训练和优化,当数据不足的时候,通用大模型可能就变得没有那么“聪明”了。
总的来说,通用大模型虽然有以上不足,但其灵活性和泛能力性,是垂直大模型无法达到的。至于通用大模型、垂直大模型谁好谁坏,还需要人们在选择时,根据具体任务要求进行选择。
4.结语
综上所述,应该说通用大模型未来的发展空间是可期的。在一些适用场景中,通用大模型“万金油”的特点或许能为客户带来更好的体验感受。
未来大模型市场将往什么方向发展还有待进一步观察,但AI时代必将成为一股不可阻挡的潮流,企业可以围绕该方向,开拓延伸出更多新兴行业,创造出更多商机。
相关文章:
AI通用大模型不及垂直大模型?各有各的好
AI时代,通用大模型和垂直大模型,两者孰优孰劣,一直众说纷纭。 通用大模型,聚焦基础层,如ChatGPT、百度文心一言,科大讯飞星火大模型等,都归属通用大模型,它们可以解答…...
农产品价格信息系统小程序
一键掌握市场脉动 🌾 引言:为何关注农产品价格? 在当今社会,农产品价格的波动直接关系到农民的收入和消费者的生活成本。因此,及时、准确地掌握农产品价格信息,对于农民合理安排生产、消费者做出购买决策都…...
【LLM-多模态】高效多模态大型语言模型综述
一、结论写在前面 模型规模的庞大及训练和推理成本的高昂,限制了MLLMs在学术界和工业界的广泛应用。因此,研究高效轻量级的MLLMs具有巨大潜力,特别是在边缘计算场景中。 论文深入探讨了高效MLLM文献的领域,提供了一个全面的视角…...
ASP .Net Core创建一个httppost请求并添加证书
ASP .Net Core创建一个httppost请求并添加证书 创建.net Core程序,使用自签名证书,可以处理https的get和post请求。 创建证书 创建自签名证书的流程可以在这里查看: https://blog.csdn.net/GoodCooking/article/details/139815278创建完毕…...
Redis入门篇
目录 传送门一、前言二、NoSQL1、ont only sql,特点:2、NoSQL的四大分类: 三、Redis概念四、五大数据类型: 传送门 SpringMVC的源码解析(精品) Spring6的源码解析(精品) SpringBoot3框架&#…...
变电站智能巡检机器人解决方案
我国拥有庞大的电网体系,变电站数量众多,且近年来快速增长。然而目前我国变电站巡检方式仍以人工为主,存在效率低下、监控不全面等问题。变电站通常是一个封闭的系统空间,设备种类繁多、占地面积广阔,这对巡检人员实时…...
Linux Kernel入门到精通系列讲解(QEMU-虚拟化篇) 2.5 Qemu实现RTC设备
1. 概述 上一章节起(5.4小节),我们已经把整个Naruto Pi都跑通了,从BL0到kernel再到Rootfs都通了,目前可以说已经具备学习Linux得基础条件,剩下得都只是添砖加瓦,本小节我们将添加RTC,如果你还没有添加RTC,你可以试试不添加RTC时,Linux的时间戳会很奇怪,加了RTC后,…...
【自动驾驶】通过下位机发送的加速度、角速度计算机器人在世界坐标系中的姿态
文章目录 原始代码全局变量定义逆平方根函数四元数解算函数理论解释四元数加速度计数据归一化计算方向余弦矩阵的第三行计算误差计算并应用积分反馈应用比例反馈积分陀螺仪数据,更新四元数归一化四元数更新姿态数据整体流程原始代码 #define SAMPLING_FREQ 20.0f // 采样频率…...
Python 设计模式(第2版) -- 第四部分(其他设计模式)
Python 设计模式(第2版) 最后介绍下其他设计模式。 模型—视图—控制器(MVC)-- 复合模式 根据 GoF 的定义,“复合模式将两个或更多模式组合成解决常见或普遍性问题的解决方案”。复合模式不是同时使用的一组模式,而是一个问题的…...
gitlab升级16.11.3-ee
背景 这是事后一段时间补充记录的博客。 升级目的:修补漏洞CVE-2024-4835 未经认证的威胁攻击者能够利用该漏洞在跨站脚本 (XSS) 攻击中,轻松接管受害者账户。 gitlab版本为14.6.2-ee升级至16.11.3-ee 思路 翻阅文档找升级方法及升级版本路径。使用…...
剑指offer 算法题(搜索二维矩阵)
剑指offer 第二题 去力扣里测试算法 思路一: 直接暴力遍历二维数组。 class Solution { public:bool searchMatrix(vector<vector<int>>& matrix, int target) {for (unsigned int i{ 0 }; i < matrix.size(); i){for (unsigned int j{ 0 };…...
SaaS平台数据对接为什么要选择API对接?
SaaS平台数据对接是指将一个或多个SaaS平台中的数据集成到其他应用或平台中的过程。在当前的数字化时代,企业越来越倾向于使用SaaS平台来管理他们的业务和数据。然而,这些数据通常散布在不同的SaaS平台中,这对于企业数据的整合和分析来说可能…...
力扣136. 只出现一次的数字
Problem: 136. 只出现一次的数字 文章目录 题目描述思路复杂度Code 题目描述 思路 由于题目要求使用线性时间复杂度和常量级的空间复杂度,再加上找重复元素这个特性,我们可以想到使用位运算来求解: 1.任何数与其本身异或得0,任何…...
重学java 74.Lombok的使用
少点心气,多点干劲 —— 24.6.18 一、lombok的安装使用 1.作用: 简化javabean开发 2.使用: a.下插件 ->如果是idea2022不用下载了,自带 b.导lombok的jar包 安装教程: http://t.csdnimg.cn/wq9MM c.修改设置 二、lombok的介绍 Lombok通过增加一…...
数据结构6---树
一、定义 树(Tree)是n(n>0)个结点的有限集。当n0时成为空树,在任意一棵非空树中: 1、有且仅有一个特定的称为根(Root)的结点; 2、当n>1时,其余结点可分为m(m>日)个互不相交的有限集T1、T2、...、 Tm,其中每一个集合本身又是一棵树,并且称为根的…...
一键制作,打造高质量的数字刊物
随着数字化时代的到来,数字刊物已经成为信息传播的重要载体。它以便捷、环保、互动性强等特点,受到了越来越多人的青睐。然而,如何快速、高效地制作出高质量的数字刊物,成为许多创作者面临的难题。今天,教大家一个制作…...
Java面试题:对比继承Thread类和实现Runnable接口两种创建线程的方法,以及它们的优缺点
Java 中创建线程有两种主要的方法:继承 Thread 类和实现 Runnable 接口。下面我将分别介绍这两种方法,并对比它们的优缺点。 继承 Thread 类 方法: 创建一个继承自 Thread 的子类。重写 Thread 类的 run 方法。创建子类的实例并调用 start…...
编译原理-各章典型题型+思路求解
第2章文法和语言习题 基础知识: 思路: 基础知识: 思路: 基础知识: 编译原理之 短语&直接短语&句柄 定义与区分_编译原理短语,直接短语,句柄-CSDN博客 思路: 题目: 基础解释:…...
【绝对有用】C++ vector排序
在 C 中,有多种方法可以对向量(即 std::vector)进行排序。最常用的方法是使用标准库中的 std::sort 函数。以下是一些例子: 使用 std::sort 函数 std::sort 函数是标准库 <algorithm> 中的一个函数,可以对向量…...
linux——VScode安装
方法一:使用snap一键安装 Snap Store 是 Ubuntu、Debian、Fedora 和其他几个 Linux 发行版中的一个应用商店,提供了数千个应用程序和工具的安装。Snap Store 使用 Snap 包格式,这是一种通用的 Linux 软件包格式,使得在不同的 Lin…...
Prompt Tuning、P-Tuning、Prefix Tuning的区别
一、Prompt Tuning、P-Tuning、Prefix Tuning的区别 1. Prompt Tuning(提示调优) 核心思想:固定预训练模型参数,仅学习额外的连续提示向量(通常是嵌入层的一部分)。实现方式:在输入文本前添加可训练的连续向量(软提示),模型只更新这些提示参数。优势:参数量少(仅提…...
练习(含atoi的模拟实现,自定义类型等练习)
一、结构体大小的计算及位段 (结构体大小计算及位段 详解请看:自定义类型:结构体进阶-CSDN博客) 1.在32位系统环境,编译选项为4字节对齐,那么sizeof(A)和sizeof(B)是多少? #pragma pack(4)st…...
对WWDC 2025 Keynote 内容的预测
借助我们以往对苹果公司发展路径的深入研究经验,以及大语言模型的分析能力,我们系统梳理了多年来苹果 WWDC 主题演讲的规律。在 WWDC 2025 即将揭幕之际,我们让 ChatGPT 对今年的 Keynote 内容进行了一个初步预测,聊作存档。等到明…...
Spring Boot面试题精选汇总
🤟致敬读者 🟩感谢阅读🟦笑口常开🟪生日快乐⬛早点睡觉 📘博主相关 🟧博主信息🟨博客首页🟫专栏推荐🟥活动信息 文章目录 Spring Boot面试题精选汇总⚙️ **一、核心概…...
uniapp手机号一键登录保姆级教程(包含前端和后端)
目录 前置条件创建uniapp项目并关联uniClound云空间开启一键登录模块并开通一键登录服务编写云函数并上传部署获取手机号流程(第一种) 前端直接调用云函数获取手机号(第三种)后台调用云函数获取手机号 错误码常见问题 前置条件 手机安装有sim卡手机开启…...
【 java 虚拟机知识 第一篇 】
目录 1.内存模型 1.1.JVM内存模型的介绍 1.2.堆和栈的区别 1.3.栈的存储细节 1.4.堆的部分 1.5.程序计数器的作用 1.6.方法区的内容 1.7.字符串池 1.8.引用类型 1.9.内存泄漏与内存溢出 1.10.会出现内存溢出的结构 1.内存模型 1.1.JVM内存模型的介绍 内存模型主要分…...
淘宝扭蛋机小程序系统开发:打造互动性强的购物平台
淘宝扭蛋机小程序系统的开发,旨在打造一个互动性强的购物平台,让用户在购物的同时,能够享受到更多的乐趣和惊喜。 淘宝扭蛋机小程序系统拥有丰富的互动功能。用户可以通过虚拟摇杆操作扭蛋机,实现旋转、抽拉等动作,增…...
DeepSeek源码深度解析 × 华为仓颉语言编程精粹——从MoE架构到全场景开发生态
前言 在人工智能技术飞速发展的今天,深度学习与大模型技术已成为推动行业变革的核心驱动力,而高效、灵活的开发工具与编程语言则为技术创新提供了重要支撑。本书以两大前沿技术领域为核心,系统性地呈现了两部深度技术著作的精华:…...
【实施指南】Android客户端HTTPS双向认证实施指南
🔐 一、所需准备材料 证书文件(6类核心文件) 类型 格式 作用 Android端要求 CA根证书 .crt/.pem 验证服务器/客户端证书合法性 需预置到Android信任库 服务器证书 .crt 服务器身份证明 客户端需持有以验证服务器 客户端证书 .crt 客户端身份…...
Canal环境搭建并实现和ES数据同步
作者:田超凡 日期:2025年6月7日 Canal安装,启动端口11111、8082: 安装canal-deployer服务端: https://github.com/alibaba/canal/releases/1.1.7/canal.deployer-1.1.7.tar.gz cd /opt/homebrew/etc mkdir canal…...

