大模型落地竞逐,云计算大厂“百舸争流”
作者 | 辰纹
来源 | 洞见新研社
从ChatGPT到Sora,从图文到视频,从通用大模型到垂直大模型……经过了1年多时间的探索,大模型进入到以落地为先的第二阶段。
行业的躁动与资本的狂热相交汇,既造就了信仰派的脚踏实地,也产生了投机者的浑水摸鱼,如今回头,大模型落地到底进行的怎样了,大模型厂商们又是如何实践的?
我们今天选取阿里、百度、腾讯、华为这四个头部云计算厂商,从他们或明或暗的战略路线,来窥视出大模型落地的路径分野。
01 阿里云:闭源开源两线并举
不久前结束的阿里云AI智领者峰会·北京站上,阿里云CTO周靖人直接亮明了“底牌“,“阿里云是全球唯一一家既在持续做(大)模型开发,又做大量(大)模型开源的公司。”
之所以会两线并举,周靖人的解释是,为了满足用户和开发者生态对基础模型的不通需求,这也是“模型即服务“的内涵之一。
具体实践中,阿里云此次大会发布了闭源SOTA大模型通义千问2.5,根据权威基准OpenCompass的测评结果,通义千问2.5得分追平了GPT-4 Turbo,为国产大模型取得的最高排名。
开源路线上,自2023年8月以来,阿里云陆续开源了十数款模型,据官方公布数据显示,目前通义开源模型下载量已经超过了700万,最新开源的1100亿参数模型在多个基准测评收获最佳成绩,超越Meta的Llama-3-70。
虽然有了基础模型,但是各行各业的需求不同,即便是同一行业中的不同企业,他们之间的需求也很难被统一,因而标准化的基础模型很难被直接用起来,为此,阿里云贴着开发者生态的场景需求,升级了AI Infra平台——百炼,推出了百炼 2.0。
百炼 2.0依托阿里云AI基础设施,同时对模型开发、应用开发和算力底座等工具进行了升级,引入更多模型,还率先兼容LlamaIndex等开源框架,企业可自由替换能力组件来适配自身系统。
作为国内最大的云厂商,阿里云拥有最为庞大的业务规模和覆盖最全面的客户群体,在AI路线还远没有收敛的行业背景下,一面是客户需求的驱动,一面是对技术踏空的隐忧,阿里云在大模型上全面布局也就可以理解了。
如果再将阿里云3月份时的史上最大力度降价相关联,可以看出,阿里云的种种动作都指向一个目标,即实现云和人工智能业务的螺旋上升,暗含着对未来业绩增长的长远考量。
02 百度云:以AI原生应用为矛
在几家云计算大厂中,百度云的规模最小,但由于大模型与百度一直坚持的AI技术路线强关联,加之去年3月推出文心一言后,又陆续在大模型工具平台、大模型对自身应用重构、大模型生态建设等方面,进行了一系列体系化的出击,使得其成为大模型行业中极为重要的一支力量。
百度的打法并不复杂,一方面通过对文心一言的持续进化,保证文心一言的能力始终处于第一梯队,去年的百度世界大会上推出的文心大模型4.0版本的参数规模达到万亿级别,综合能力不逊色于GPT-4。
另一方面强调原生应用重要性,李彦宏分析大模型应用竞争的本质是表示:“企业竞争,不是大鱼吃小鱼,而是快鱼吃慢鱼,比竞争对手更快决策,很可能你就赢了。”这事实上也是百度在大模型落地上的竞争策略:加速冲刺,多方探索应用可能,尤其看重“AI原生应用”。
百度首先用大模型对自己的产品进行了全面改造和焕新,基于现有的用户基础,获得真实使用反馈后,反过来加速大模型的迭代;然后与云服务相结合,提供智能算力资源和训练工具,帮助其他企业开发自己的模型。
为此,百度智能云推出了一系列平台或工具产品,如帮助生成营销材料的“擎舵”、文心大模型插件开发平台“灵境”,企业级大模型生产平台“千帆”等。
百度云今年春季召开的首届生态大会中,宣布面向三类市场——头部市场、价值市场和高潜市场,厘清与伙伴之间的分工协作边界,实现协同作战,其目的也是为了将场景快速闭环,加速大模型落地。
03 腾讯云:以实用主义落地实体经济
腾讯入局大模型的时间比较晚,直到去年9月的腾讯全球数字生态大会上才正式发布自研的通用大语言模型混元大模型,在行业中一直是比较低调和另类的存在。
混元大模型发布之前,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生曾阐述过腾讯的大模型价值观,“通用大模型不一定是满足行业场景需求的最优解。企业需要有针对性的行业大模型,结合自己的数据做训练或精调,在合理的成本下,打造实用性更高的智能服务。”
实用主义由此被提炼出来。
一方面是关注大模型解决具体问题而不是参数大小,另一方面是用什么样的技术组合更有效率的解决问题。
腾讯云副总裁、腾讯云智能负责人吴运声曾表示:“几亿、几十亿、几百亿还是一千多亿,我们并不关心模型参数的那个数字,我们更关注的怎么解决客户的问题,希望用最有效,最低成本的手段去解决客户的问题。”
在具体实践上,腾讯云有着非常清晰的思考,第一步,铆钉标杆客户;第二部辐射整个上下游产业链的腰部企业,而破局的关键就是实体经济。
目前,腾讯云已经携手政务等行业的头部企业,在20余个行业探索了超50个行业大模型的应用解决方案。以腾讯云数智人工厂为例,腾讯云MaaS能力可以让数智人分身复刻缩短至24小时,大幅降低成本。在文旅领域推出的文旅大模型,金融领域打造的OCR大模型都是已经落地的案例。
04 华为云:以算力底座为基础深入千行百业
与很多大模型厂商在刚入局时死磕技术,专注于对标ChatGPT的能力有所不通,华为云的大模型战略一开始就是奔着落地去的,去年的世界人工智能大会上,华为轮值董事长胡厚崑演讲时表示,人工智能的发展关键在于“走深向实”,华为的定位是赋能产业升级,服务好千行百业,服务好科学研究。
围绕这个定位,华为的大模型战略出现了两条路径,一是大模型领域,从通用大模型到行业大模型,让人工智能使能行业,助力科研;二是算力领域,打造强有力的算力底座。
华为云盘古大模型3.0发布时,提出了“不作诗只做事”的口号,按照“5+N+X”三层架构,即基础模型、行业模型和场景模型,目前已经落地金融、制造、政务、煤矿、铁路等10多个行业,支撑400多个业务场景的AI应用落地。
一个最典型的场景,煤矿的智能化升级中,盘古矿山大模型只需导入海量无标注的矿山场景数据进行预训练,即可进行无监督自主学习,一个大模型可以覆盖煤矿的采、掘、机、运、通、洗选等业务流程下的1000多个细分场景的通用。目前,盘古矿山大模型已在全国8个矿井规模使用。
做强算力底座方面,华为的关键词是“自研”和“开放”。
在相对底层的计算效率研究方面,华为的打法是架构创新,基于自研的达芬奇架构,推出昇腾处理器,围绕昇腾芯片打造昇腾AI集群,国内建设的规模最大的AI计算集群深圳鹏城云脑II期不但实现了全栈软硬件的自主可控,还蝉联了多项全球AI性能榜单的冠军,算力达到1000P。
不难看出,华为不但直接卖“鱼”,还传授“捕鱼”技巧。
05 结语
综上所述,这四家云计算大厂对于大模型的落地虽然在打法上各有侧重,但目标还是非常一致,基本上都是在自身原有业务的基础上进行延展,或继续加长自己的长板,或开发出新的增量。
值得一提的是,除了在大模型的技术和业务层面进行竞争之外,这几家大厂还广泛参与到大模型创业公司的投资之中,目前中国估值前五的生成时AI独角兽(月之暗面、智谱AI、Minmax、零一万物和百川智能),阿里的参投率为100%,腾讯则投了百川智能、智谱 AI 、MiniMax 3家,此外深言科技、无问芯穹等大模型公司也曾进入到腾讯的投资名单。
这也是说,大模型的竞争不仅仅只停留在大模型上,资本层面的暗战同样激烈。
相关文章:

大模型落地竞逐,云计算大厂“百舸争流”
作者 | 辰纹 来源 | 洞见新研社 从ChatGPT到Sora,从图文到视频,从通用大模型到垂直大模型……经过了1年多时间的探索,大模型进入到以落地为先的第二阶段。 行业的躁动与资本的狂热相交汇,既造就了信仰派的脚踏实地,也…...

物体检测算法-R-CNN,SSD,YOLO
物体检测算法-R-CNN,SSD,YOLO 1 R-CNN2 SSD3 Yolo总结 1 R-CNN R-CNN(Region-based Convolutional Neural Network)是一种基于区域的卷积神经网络,是第一个成功将深度学习应用到目标检测上的算法。它主要由三个步骤组…...

区块链开发:区块链软件开发包装相关解析
区块链开发是指设计、构建和维护基于区块链技术的应用程序或系统的过程。区块链是一种分布式账本技术,它通过去中心化的方式记录和验证数据,确保数据的透明性、不可篡改性和安全性。区块链开发者使用各种编程语言和框架来创建这些应用程序。 在加密货币领…...
一个月速刷leetcodeHOT100 day07 轮转数组 除自身以外的乘积 找到字符串中所有字母异位词
轮转数组 给定一个整数数组 nums,将数组中的元素向右轮转 k 个位置,其中 k 是非负数。 示例 1: 输入: nums [1,2,3,4,5,6,7], k 3 输出: [5,6,7,1,2,3,4] 解释: 向右轮转 1 步: [7,1,2,3,4,5,6] 向右轮转 2 步: [6,7,1,2,3,4,5] 向右轮转 3 步: […...
Plotly数据可视化宝典
一、引言 在数据驱动的时代,数据可视化已成为不可或缺的一部分。通过图形化的方式展示数据,我们能更直观地理解数据的内在规律和趋势。Plotly,作为一款强大的数据可视化工具,以其丰富的图表类型、交互性和灵活性,赢得了广大数据科学家的青睐。本宝典将深入解析Plotly的各…...

由于找不到mfc140u.dll,无法继续执行代码如何解决
在计算机使用过程中,我们经常会遇到一些错误提示,其中之一就是电脑找不到mfc140u.dll文件。这个问题可能会导致程序无法正常运行或系统崩溃。为了解决这个问题,本文将介绍5种修复方法,帮助大家快速恢复电脑的正常运行。 一&#x…...

卷积神经网络(CNN)详细介绍及其原理详解
卷积神经网络(Convolutional Neural Networks,简称CNN)是深度学习中非常重要的一类神经网络,主要用于图像识别、图像分类、物体检测等计算机视觉任务。本文将详细介绍卷积神经网络的基本概念、结构组成及其工作原理,并…...
kotlin基础之空指针检查、字符串表达式、函数默认值
Kotlin 的空指针检查 Kotlin 是一种空安全的语言,这意味着它强制开发者明确地处理可能的空值。在 Kotlin 中,所有的变量默认都是非空的,除非显式地标记为可为空。 声明可为空的变量 你可以通过在类型后面添加 ? 来声明一个变量可以为空&a…...
【力扣一轮】字符串异位 数组并集
先验知识记录: 遇到哈希问题,想到三种数据结构: ①数组:适用于哈希值比较小,范围较小, ②set:适用于哈希值较大。 ③map:如果需要用到键值对,则用之。 242.有效的字母…...
完美解决flex布局换行后最后一行不能和保持和满行的间距一致,或者左对齐的尴尬情景
display: grid; 是 CSS3 引入的一个非常强大的布局系统,允许你以二维网格的形式布局内容。这种布局模型在设计和构建复杂的网页布局时非常有用,因为它提供了对行和列的完全控制。 以下是关于 display: grid; 的一些基本概念和特性的讲解: 1…...

面试准备-项目【面试准备】
面试准备-项目【面试准备】 前言面试准备自我介绍:项目介绍: 论坛项目功能总结简介数据库表设计注册功能登录功能显示登录信息功能发布帖子评论私信点赞功能关注功能通知搜索网站数据统计热帖排行缓存 论坛项目技术总结Http的无状态cookie和session的区别…...
迭代器 增强for循环
迭代器原理 简单来说,迭代器就是一种可以访问集合的方式,就像一个游标或者指针,可以逐一查看集合(映射、列表)中的元素。 想象一下你有一张清单,上面列着你需要做的事情,但是你只能一次看一项。迭代器就像…...
Ubuntu系统版本查看办法
Ubuntu系统版本查看办法 1. 使用 lsb_release 命令2. 查看 /etc/issue 文件3. 使用 hostnamectl 命令4. 查看 /etc/os-release 文件5. 查看内核版本6. 使用 neofetch 命令(如果已安装)总结 在 Ubuntu 操作系统中,查看当前系统版本的详细信息可…...
HTML5 SVG技术应用
HTML5 SVG技术应用 目录 SVG属性SVG图像绘制 SVG路径SVG直线SVG矩形SVG圆形SVG椭圆SVG多边形SVG曲线SVG属性 SVG(Scalable Vector Graphics)元素拥有众多属性,这些属性用于定义图形的外观、位置、变换、交互等特性。 基本图形属 width 和 height: 定义SVG元素或图形的宽度…...

hcia datacom学习(10):交换机基础
1.二层交换机工作原理 1.1交换机的5种行为 查看mac地址表的命令为 dis mac-address *一个MAC只能关联在一个接口上,一个接口上可以学习多个MAC *mac地址漂移:mac表中,mac地址的出接口从一个端口变为另一个端口的现象。 造成mac漂移的原因…...

参考文献交叉引用两个文献,逗号隔开
1.引用两个参考文献,定位到word正文中需要引用的位置,然后插入-交叉引用,引好文献 2.选中两个参考文献,切换域代码,然后进行修改: 改为 上面的两张图片中的点是空格的含义,word中按ctrlshift8就…...

Linux多线程系列三: 生产者消费者模型,信号量使用,基于阻塞队列和环形队列的这两种生产者消费者代码的实现
Linux多线程系列三: 生产者消费者模型,信号量,基于阻塞队列和环形队列的这两种生产者消费者代码的实现 一.生产者消费者模型的理论1.现实生活中的生产者消费者模型2.多线程当中的生产者消费者模型3.理论 二.基于阻塞队列的生产者消费者模型的基础代码1.阻塞队列的介绍2.大致框架…...

Mongodb介绍及springboot集成增删改查
文章目录 1. MongoDB相关概念1.1 业务应用场景1.2 MongoDB简介1.3 体系结构1.4 数据模型1.5 MongoDB的特点 2. docker安装mongodb3. springboot集成3.1 文件结构3.2 增删改查3.2.1 增加insert3.2.2 保存save3.2.3 更新update3.2.4 查询3.2.5 删除 1. MongoDB相关概念 1.1 业务…...

JAVA 中 HTTP 基本认证(Basic Authentication)
目录 服务端这么做服务端告知客户端使用 Basic Authentication 方式进行认证服务端接收并处理客户端按照 Basic Authentication 方式发送的数据 客户端这么做如果客户端是浏览器如果客户端是 RestTemplat如果客户端是 HttpClient 其它参考 服务端这么做 服务端告知客户端使用 …...
【Flutter】 webview请求权限问题
需求:webview可以通过录音后语音转文字。 使用插件: permission_handler: ^11.0.1 webview_flutter: ^4.7.0 代码如下: 1.添加权限 添加安卓的权限: android/app/src/main/AndroidManifest.xml <uses-permission android…...

XML Group端口详解
在XML数据映射过程中,经常需要对数据进行分组聚合操作。例如,当处理包含多个物料明细的XML文件时,可能需要将相同物料号的明细归为一组,或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码,增加了开…...

Flask RESTful 示例
目录 1. 环境准备2. 安装依赖3. 修改main.py4. 运行应用5. API使用示例获取所有任务获取单个任务创建新任务更新任务删除任务 中文乱码问题: 下面创建一个简单的Flask RESTful API示例。首先,我们需要创建环境,安装必要的依赖,然后…...

shell脚本--常见案例
1、自动备份文件或目录 2、批量重命名文件 3、查找并删除指定名称的文件: 4、批量删除文件 5、查找并替换文件内容 6、批量创建文件 7、创建文件夹并移动文件 8、在文件夹中查找文件...

【快手拥抱开源】通过快手团队开源的 KwaiCoder-AutoThink-preview 解锁大语言模型的潜力
引言: 在人工智能快速发展的浪潮中,快手Kwaipilot团队推出的 KwaiCoder-AutoThink-preview 具有里程碑意义——这是首个公开的AutoThink大语言模型(LLM)。该模型代表着该领域的重大突破,通过独特方式融合思考与非思考…...

Cloudflare 从 Nginx 到 Pingora:性能、效率与安全的全面升级
在互联网的快速发展中,高性能、高效率和高安全性的网络服务成为了各大互联网基础设施提供商的核心追求。Cloudflare 作为全球领先的互联网安全和基础设施公司,近期做出了一个重大技术决策:弃用长期使用的 Nginx,转而采用其内部开发…...

【Java_EE】Spring MVC
目录 Spring Web MVC 编辑注解 RestController RequestMapping RequestParam RequestParam RequestBody PathVariable RequestPart 参数传递 注意事项 编辑参数重命名 RequestParam 编辑编辑传递集合 RequestParam 传递JSON数据 编辑RequestBody …...
docker 部署发现spring.profiles.active 问题
报错: org.springframework.boot.context.config.InvalidConfigDataPropertyException: Property spring.profiles.active imported from location class path resource [application-test.yml] is invalid in a profile specific resource [origin: class path re…...

浪潮交换机配置track检测实现高速公路收费网络主备切换NQA
浪潮交换机track配置 项目背景高速网络拓扑网络情况分析通信线路收费网络路由 收费汇聚交换机相应配置收费汇聚track配置 项目背景 在实施省内一条高速公路时遇到的需求,本次涉及的主要是收费汇聚交换机的配置,浪潮网络设备在高速项目很少,通…...

人工智能(大型语言模型 LLMs)对不同学科的影响以及由此产生的新学习方式
今天是关于AI如何在教学中增强学生的学习体验,我把重要信息标红了。人文学科的价值被低估了 ⬇️ 转型与必要性 人工智能正在深刻地改变教育,这并非炒作,而是已经发生的巨大变革。教育机构和教育者不能忽视它,试图简单地禁止学生使…...

无人机侦测与反制技术的进展与应用
国家电网无人机侦测与反制技术的进展与应用 引言 随着无人机(无人驾驶飞行器,UAV)技术的快速发展,其在商业、娱乐和军事领域的广泛应用带来了新的安全挑战。特别是对于关键基础设施如电力系统,无人机的“黑飞”&…...