AI通用大模型不及垂直大模型?各有各的好
AI时代,通用大模型和垂直大模型,两者孰优孰劣,一直众说纷纭。
通用大模型,聚焦基础层,如ChatGPT、百度文心一言,科大讯飞星火大模型等,都归属通用大模型,它们可以解答各种问题、撰写文章、编程、翻译等等。
垂直大模型,聚焦解决垂直领域,如中国科学院香港创新院AI中心发布的垂直大模型CARES Copilot 1.0,只运用在医疗领域,可以在手术阶段自动识别病灶和解剖结构。写文章,它干不了。
对比下来看,通用大模型属于“万金油”型,垂直大模型属“专家”型。
中国有句话叫“博而不精,知而不专”,那么,涉猎广泛的通用大模型在商业上会取得怎样的成绩?
1.通用大模型:商业运用的革新力量

近日,据《科创板日报》消息,低调的国内通用大模型领军企业“阶跃星辰”,在上海举行的2024全球开发者先锋大会期间正式对外亮相。
之所以提到这家公司,因为这家公司不仅成功研发了Step千亿参数系列通用大模型,据说可比肩GPT-4。
同时还推出了两款面向C端用户的大模型产品——效率工具“跃问”和AI开放世界平台“冒泡鸭”。
全是通用大模型。
那么,阶跃星辰能否在竞争激烈的市场中脱颖而出,从阶跃星辰身上如何看待通用大模型的发展空间和前景。
据网友爆料,该公司发布大模型前并没有进行过融资,但公司背景却很牛,合作方有:中广天泽,云赛智联,大模型开发则是由前微软人员开发。
大模型发布以后,主要标的:上海电影,光线传媒、万达电影、华策影视、捷成股份、横店影视。
如此壮志雄心,想来资本将很快进入到阶跃星辰,助推其进一步发展。
从这个角度看,资本并不排斥通用大模型。
另外,从技术角度看,通用大模型的出现,可以改变传统数据处理和分析的方式。
以往,商业决策往往依赖于有限的数据和人工分析,这种方式不仅效率低下,而且容易受到人为因素的干扰。
相反,通用大模型则能够通过海量的数据学习和处理,实现对商业数据的精准挖掘和分析。
其实,通用大模型的革新力量,体现在广泛的应用场景上。
无论是智能客服、推荐系统、自动化办公还是其他领域,通用大模型都能发挥出其独特的作用。
以智能客服为例,传统的人工客服面临着人力成本高、响应速度慢等问题,而通用大模型则能够通过自然语言处理技术,实现与用户的智能交互,快速准确地解答用户的问题,提升用户体验。
在推荐系统方面,通用大模型能够根据用户的兴趣和行为数据,为用户推荐个性化的产品和服务,增加用户的黏性和转化率。
在自动化办公领域,通用大模型能够自动化处理和分析大量数据,减轻员工的工作压力,提高工作效率。
Step-2万亿参数MoE语言大模型预览版,不仅能够处理更加复杂和精细的任务,还能够通过深度学习和自然语言处理技术,实现对商业数据的深度挖掘和分析。
对于企业而言,这意味着能够获取更加精准和全面的市场洞察,为商业决策提供更加有力的支持。
由此可见,通用大模型未来的发展空间是非常大的,资本也愿意投入到这个方向上来,不仅为企业带来了经济效益的提升,更推动了整个商业领域的进步和发展,这体现了通用大模型作为商业运用的革新力量。
2.通用大模型的商业价值与社会影响

有人将通用大模型比喻成地基,垂直大模型是在地基上建立起来的各种建筑物。
也有人说,垂直大模型才是未来AI发展趋势。
不管好坏,可以肯定的是,通用大模型既然存在,必然有其商业价值和社会价值。
首先,通用大模型能够提升企业的运营效率和创新能力,从而推动整个行业的进步和发展。
通过利用通用大模型的数据处理和分析能力,企业可以更加精准地把握市场趋势和用户需求,优化产品和服务,提升竞争力,还能够激发企业的创新活力,推动新产品和新服务的不断涌现,为经济发展注入新的动力。
其次,通用大模型的应用也促进了社会的智能化和便利化。在医疗、教育、交通等各个领域,通用大模型都发挥着重要作用。
例如,在教育领域,通用大模型可以根据学生的学习情况和兴趣爱好,提供个性化的学习资源和辅导服务,不仅提升了社会的服务水平,也提高了人们的生活质量。
第三,由于技术门槛高,会筛选掉一部分企业,一定程度上会减少“内卷”问题,这对行业来说,可以将精力倾注在技术创新上。
随着技术的不断发展和商业运用的深入拓展,通用大模型将在更多领域发挥出更大的作用,为企业和社会带来更多的价值。
3.通用大模型现存的挑战

通用大模型虽有广阔的空间,但从实际运用情况来看,也存在诸多挑战。
首先是资源效率问题。
由于通用大模型什么都要会点,所以,训练和运行大型模型需要大量的资源,这会增加成本。反观垂直大模型,只专注于某个行业领域,所以资源需求量就会低些。
其次是专业性问题。
有句话叫“360行,行行出状元”,这指的是要做精,做专,做细。当AI和具体行业结合,那么其专业程度决定了AI作用的上限。通用大模型在某些特定领域,相比于垂直大模型,就显得逊色一筹。
第三是数据需求问题。
我们现在已经知道数据的重要性,这是一种宝贵的资源,对数据的保护意识也大大提升。对通用大模型而言,要发挥其强大能力,需要很多的数据进行训练和优化,当数据不足的时候,通用大模型可能就变得没有那么“聪明”了。
总的来说,通用大模型虽然有以上不足,但其灵活性和泛能力性,是垂直大模型无法达到的。至于通用大模型、垂直大模型谁好谁坏,还需要人们在选择时,根据具体任务要求进行选择。
4.结语
综上所述,应该说通用大模型未来的发展空间是可期的。在一些适用场景中,通用大模型“万金油”的特点或许能为客户带来更好的体验感受。
未来大模型市场将往什么方向发展还有待进一步观察,但AI时代必将成为一股不可阻挡的潮流,企业可以围绕该方向,开拓延伸出更多新兴行业,创造出更多商机。
相关文章:
AI通用大模型不及垂直大模型?各有各的好
AI时代,通用大模型和垂直大模型,两者孰优孰劣,一直众说纷纭。 通用大模型,聚焦基础层,如ChatGPT、百度文心一言,科大讯飞星火大模型等,都归属通用大模型,它们可以解答…...
农产品价格信息系统小程序
一键掌握市场脉动 🌾 引言:为何关注农产品价格? 在当今社会,农产品价格的波动直接关系到农民的收入和消费者的生活成本。因此,及时、准确地掌握农产品价格信息,对于农民合理安排生产、消费者做出购买决策都…...
【LLM-多模态】高效多模态大型语言模型综述
一、结论写在前面 模型规模的庞大及训练和推理成本的高昂,限制了MLLMs在学术界和工业界的广泛应用。因此,研究高效轻量级的MLLMs具有巨大潜力,特别是在边缘计算场景中。 论文深入探讨了高效MLLM文献的领域,提供了一个全面的视角…...
ASP .Net Core创建一个httppost请求并添加证书
ASP .Net Core创建一个httppost请求并添加证书 创建.net Core程序,使用自签名证书,可以处理https的get和post请求。 创建证书 创建自签名证书的流程可以在这里查看: https://blog.csdn.net/GoodCooking/article/details/139815278创建完毕…...
Redis入门篇
目录 传送门一、前言二、NoSQL1、ont only sql,特点:2、NoSQL的四大分类: 三、Redis概念四、五大数据类型: 传送门 SpringMVC的源码解析(精品) Spring6的源码解析(精品) SpringBoot3框架&#…...
变电站智能巡检机器人解决方案
我国拥有庞大的电网体系,变电站数量众多,且近年来快速增长。然而目前我国变电站巡检方式仍以人工为主,存在效率低下、监控不全面等问题。变电站通常是一个封闭的系统空间,设备种类繁多、占地面积广阔,这对巡检人员实时…...
Linux Kernel入门到精通系列讲解(QEMU-虚拟化篇) 2.5 Qemu实现RTC设备
1. 概述 上一章节起(5.4小节),我们已经把整个Naruto Pi都跑通了,从BL0到kernel再到Rootfs都通了,目前可以说已经具备学习Linux得基础条件,剩下得都只是添砖加瓦,本小节我们将添加RTC,如果你还没有添加RTC,你可以试试不添加RTC时,Linux的时间戳会很奇怪,加了RTC后,…...
【自动驾驶】通过下位机发送的加速度、角速度计算机器人在世界坐标系中的姿态
文章目录 原始代码全局变量定义逆平方根函数四元数解算函数理论解释四元数加速度计数据归一化计算方向余弦矩阵的第三行计算误差计算并应用积分反馈应用比例反馈积分陀螺仪数据,更新四元数归一化四元数更新姿态数据整体流程原始代码 #define SAMPLING_FREQ 20.0f // 采样频率…...
Python 设计模式(第2版) -- 第四部分(其他设计模式)
Python 设计模式(第2版) 最后介绍下其他设计模式。 模型—视图—控制器(MVC)-- 复合模式 根据 GoF 的定义,“复合模式将两个或更多模式组合成解决常见或普遍性问题的解决方案”。复合模式不是同时使用的一组模式,而是一个问题的…...
gitlab升级16.11.3-ee
背景 这是事后一段时间补充记录的博客。 升级目的:修补漏洞CVE-2024-4835 未经认证的威胁攻击者能够利用该漏洞在跨站脚本 (XSS) 攻击中,轻松接管受害者账户。 gitlab版本为14.6.2-ee升级至16.11.3-ee 思路 翻阅文档找升级方法及升级版本路径。使用…...
剑指offer 算法题(搜索二维矩阵)
剑指offer 第二题 去力扣里测试算法 思路一: 直接暴力遍历二维数组。 class Solution { public:bool searchMatrix(vector<vector<int>>& matrix, int target) {for (unsigned int i{ 0 }; i < matrix.size(); i){for (unsigned int j{ 0 };…...
SaaS平台数据对接为什么要选择API对接?
SaaS平台数据对接是指将一个或多个SaaS平台中的数据集成到其他应用或平台中的过程。在当前的数字化时代,企业越来越倾向于使用SaaS平台来管理他们的业务和数据。然而,这些数据通常散布在不同的SaaS平台中,这对于企业数据的整合和分析来说可能…...
力扣136. 只出现一次的数字
Problem: 136. 只出现一次的数字 文章目录 题目描述思路复杂度Code 题目描述 思路 由于题目要求使用线性时间复杂度和常量级的空间复杂度,再加上找重复元素这个特性,我们可以想到使用位运算来求解: 1.任何数与其本身异或得0,任何…...
重学java 74.Lombok的使用
少点心气,多点干劲 —— 24.6.18 一、lombok的安装使用 1.作用: 简化javabean开发 2.使用: a.下插件 ->如果是idea2022不用下载了,自带 b.导lombok的jar包 安装教程: http://t.csdnimg.cn/wq9MM c.修改设置 二、lombok的介绍 Lombok通过增加一…...
数据结构6---树
一、定义 树(Tree)是n(n>0)个结点的有限集。当n0时成为空树,在任意一棵非空树中: 1、有且仅有一个特定的称为根(Root)的结点; 2、当n>1时,其余结点可分为m(m>日)个互不相交的有限集T1、T2、...、 Tm,其中每一个集合本身又是一棵树,并且称为根的…...
一键制作,打造高质量的数字刊物
随着数字化时代的到来,数字刊物已经成为信息传播的重要载体。它以便捷、环保、互动性强等特点,受到了越来越多人的青睐。然而,如何快速、高效地制作出高质量的数字刊物,成为许多创作者面临的难题。今天,教大家一个制作…...
Java面试题:对比继承Thread类和实现Runnable接口两种创建线程的方法,以及它们的优缺点
Java 中创建线程有两种主要的方法:继承 Thread 类和实现 Runnable 接口。下面我将分别介绍这两种方法,并对比它们的优缺点。 继承 Thread 类 方法: 创建一个继承自 Thread 的子类。重写 Thread 类的 run 方法。创建子类的实例并调用 start…...
编译原理-各章典型题型+思路求解
第2章文法和语言习题 基础知识: 思路: 基础知识: 思路: 基础知识: 编译原理之 短语&直接短语&句柄 定义与区分_编译原理短语,直接短语,句柄-CSDN博客 思路: 题目: 基础解释:…...
【绝对有用】C++ vector排序
在 C 中,有多种方法可以对向量(即 std::vector)进行排序。最常用的方法是使用标准库中的 std::sort 函数。以下是一些例子: 使用 std::sort 函数 std::sort 函数是标准库 <algorithm> 中的一个函数,可以对向量…...
linux——VScode安装
方法一:使用snap一键安装 Snap Store 是 Ubuntu、Debian、Fedora 和其他几个 Linux 发行版中的一个应用商店,提供了数千个应用程序和工具的安装。Snap Store 使用 Snap 包格式,这是一种通用的 Linux 软件包格式,使得在不同的 Lin…...
多云管理“拦路虎”:深入解析网络互联、身份同步与成本可视化的技术复杂度
一、引言:多云环境的技术复杂性本质 企业采用多云策略已从技术选型升维至生存刚需。当业务系统分散部署在多个云平台时,基础设施的技术债呈现指数级积累。网络连接、身份认证、成本管理这三大核心挑战相互嵌套:跨云网络构建数据…...
深入剖析AI大模型:大模型时代的 Prompt 工程全解析
今天聊的内容,我认为是AI开发里面非常重要的内容。它在AI开发里无处不在,当你对 AI 助手说 "用李白的风格写一首关于人工智能的诗",或者让翻译模型 "将这段合同翻译成商务日语" 时,输入的这句话就是 Prompt。…...
利用ngx_stream_return_module构建简易 TCP/UDP 响应网关
一、模块概述 ngx_stream_return_module 提供了一个极简的指令: return <value>;在收到客户端连接后,立即将 <value> 写回并关闭连接。<value> 支持内嵌文本和内置变量(如 $time_iso8601、$remote_addr 等)&a…...
在四层代理中还原真实客户端ngx_stream_realip_module
一、模块原理与价值 PROXY Protocol 回溯 第三方负载均衡(如 HAProxy、AWS NLB、阿里 SLB)发起上游连接时,将真实客户端 IP/Port 写入 PROXY Protocol v1/v2 头。Stream 层接收到头部后,ngx_stream_realip_module 从中提取原始信息…...
相机从app启动流程
一、流程框架图 二、具体流程分析 1、得到cameralist和对应的静态信息 目录如下: 重点代码分析: 启动相机前,先要通过getCameraIdList获取camera的个数以及id,然后可以通过getCameraCharacteristics获取对应id camera的capabilities(静态信息)进行一些openCamera前的…...
网络编程(UDP编程)
思维导图 UDP基础编程(单播) 1.流程图 服务器:短信的接收方 创建套接字 (socket)-----------------------------------------》有手机指定网络信息-----------------------------------------------》有号码绑定套接字 (bind)--------------…...
AI书签管理工具开发全记录(十九):嵌入资源处理
1.前言 📝 在上一篇文章中,我们完成了书签的导入导出功能。本篇文章我们研究如何处理嵌入资源,方便后续将资源打包到一个可执行文件中。 2.embed介绍 🎯 Go 1.16 引入了革命性的 embed 包,彻底改变了静态资源管理的…...
【分享】推荐一些办公小工具
1、PDF 在线转换 https://smallpdf.com/cn/pdf-tools 推荐理由:大部分的转换软件需要收费,要么功能不齐全,而开会员又用不了几次浪费钱,借用别人的又不安全。 这个网站它不需要登录或下载安装。而且提供的免费功能就能满足日常…...
动态 Web 开发技术入门篇
一、HTTP 协议核心 1.1 HTTP 基础 协议全称 :HyperText Transfer Protocol(超文本传输协议) 默认端口 :HTTP 使用 80 端口,HTTPS 使用 443 端口。 请求方法 : GET :用于获取资源,…...
人工智能--安全大模型训练计划:基于Fine-tuning + LLM Agent
安全大模型训练计划:基于Fine-tuning LLM Agent 1. 构建高质量安全数据集 目标:为安全大模型创建高质量、去偏、符合伦理的训练数据集,涵盖安全相关任务(如有害内容检测、隐私保护、道德推理等)。 1.1 数据收集 描…...

