当前位置: 首页 > news >正文

大模型落地竞逐,云计算大厂“百舸争流”

作者 | 辰纹

来源 | 洞见新研社

从ChatGPT到Sora,从图文到视频,从通用大模型到垂直大模型……经过了1年多时间的探索,大模型进入到以落地为先的第二阶段。

行业的躁动与资本的狂热相交汇,既造就了信仰派的脚踏实地,也产生了投机者的浑水摸鱼,如今回头,大模型落地到底进行的怎样了,大模型厂商们又是如何实践的?

我们今天选取阿里、百度、腾讯、华为这四个头部云计算厂商,从他们或明或暗的战略路线,来窥视出大模型落地的路径分野。

01 阿里云:闭源开源两线并举 

不久前结束的阿里云AI智领者峰会·北京站上,阿里云CTO周靖人直接亮明了“底牌“,“阿里云是全球唯一一家既在持续做(大)模型开发,又做大量(大)模型开源的公司。”

之所以会两线并举,周靖人的解释是,为了满足用户和开发者生态对基础模型的不通需求,这也是“模型即服务“的内涵之一。

具体实践中,阿里云此次大会发布了闭源SOTA大模型通义千问2.5,根据权威基准OpenCompass的测评结果,通义千问2.5得分追平了GPT-4 Turbo,为国产大模型取得的最高排名。

开源路线上,自2023年8月以来,阿里云陆续开源了十数款模型,据官方公布数据显示,目前通义开源模型下载量已经超过了700万,最新开源的1100亿参数模型在多个基准测评收获最佳成绩,超越Meta的Llama-3-70。

虽然有了基础模型,但是各行各业的需求不同,即便是同一行业中的不同企业,他们之间的需求也很难被统一,因而标准化的基础模型很难被直接用起来,为此,阿里云贴着开发者生态的场景需求,升级了AI Infra平台——百炼,推出了百炼 2.0。

百炼 2.0依托阿里云AI基础设施,同时对模型开发、应用开发和算力底座等工具进行了升级,引入更多模型,还率先兼容LlamaIndex等开源框架,企业可自由替换能力组件来适配自身系统。

作为国内最大的云厂商,阿里云拥有最为庞大的业务规模和覆盖最全面的客户群体,在AI路线还远没有收敛的行业背景下,一面是客户需求的驱动,一面是对技术踏空的隐忧,阿里云在大模型上全面布局也就可以理解了。

如果再将阿里云3月份时的史上最大力度降价相关联,可以看出,阿里云的种种动作都指向一个目标,即实现云和人工智能业务的螺旋上升,暗含着对未来业绩增长的长远考量。

02 百度云:以AI原生应用为矛 

在几家云计算大厂中,百度云的规模最小,但由于大模型与百度一直坚持的AI技术路线强关联,加之去年3月推出文心一言后,又陆续在大模型工具平台、大模型对自身应用重构、大模型生态建设等方面,进行了一系列体系化的出击,使得其成为大模型行业中极为重要的一支力量。

百度的打法并不复杂,一方面通过对文心一言的持续进化,保证文心一言的能力始终处于第一梯队,去年的百度世界大会上推出的文心大模型4.0版本的参数规模达到万亿级别,综合能力不逊色于GPT-4。

另一方面强调原生应用重要性,李彦宏分析大模型应用竞争的本质是表示:“企业竞争,不是大鱼吃小鱼,而是快鱼吃慢鱼,比竞争对手更快决策,很可能你就赢了。”这事实上也是百度在大模型落地上的竞争策略:加速冲刺,多方探索应用可能,尤其看重“AI原生应用”。

百度首先用大模型对自己的产品进行了全面改造和焕新,基于现有的用户基础,获得真实使用反馈后,反过来加速大模型的迭代;然后与云服务相结合,提供智能算力资源和训练工具,帮助其他企业开发自己的模型。

为此,百度智能云推出了一系列平台或工具产品,如帮助生成营销材料的“擎舵”、文心大模型插件开发平台“灵境”,企业级大模型生产平台“千帆”等。

百度云今年春季召开的首届生态大会中,宣布面向三类市场——头部市场、价值市场和高潜市场,厘清与伙伴之间的分工协作边界,实现协同作战,其目的也是为了将场景快速闭环,加速大模型落地。

03 腾讯云:以实用主义落地实体经济 

腾讯入局大模型的时间比较晚,直到去年9月的腾讯全球数字生态大会上才正式发布自研的通用大语言模型混元大模型,在行业中一直是比较低调和另类的存在。

混元大模型发布之前,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生曾阐述过腾讯的大模型价值观,“通用大模型不一定是满足行业场景需求的最优解。企业需要有针对性的行业大模型,结合自己的数据做训练或精调,在合理的成本下,打造实用性更高的智能服务。”

实用主义由此被提炼出来。

一方面是关注大模型解决具体问题而不是参数大小,另一方面是用什么样的技术组合更有效率的解决问题。

腾讯云副总裁、腾讯云智能负责人吴运声曾表示:“几亿、几十亿、几百亿还是一千多亿,我们并不关心模型参数的那个数字,我们更关注的怎么解决客户的问题,希望用最有效,最低成本的手段去解决客户的问题。”

在具体实践上,腾讯云有着非常清晰的思考,第一步,铆钉标杆客户;第二部辐射整个上下游产业链的腰部企业,而破局的关键就是实体经济

目前,腾讯云已经携手政务等行业的头部企业,在20余个行业探索了超50个行业大模型的应用解决方案。以腾讯云数智人工厂为例,腾讯云MaaS能力可以让数智人分身复刻缩短至24小时,大幅降低成本。在文旅领域推出的文旅大模型,金融领域打造的OCR大模型都是已经落地的案例。

04 华为云:以算力底座为基础深入千行百业 

与很多大模型厂商在刚入局时死磕技术,专注于对标ChatGPT的能力有所不通,华为云的大模型战略一开始就是奔着落地去的,去年的世界人工智能大会上,华为轮值董事长胡厚崑演讲时表示,人工智能的发展关键在于“走深向实”,华为的定位是赋能产业升级,服务好千行百业,服务好科学研究。

围绕这个定位,华为的大模型战略出现了两条路径,一是大模型领域,从通用大模型到行业大模型,让人工智能使能行业,助力科研;二是算力领域,打造强有力的算力底座。

华为云盘古大模型3.0发布时,提出了“不作诗只做事”的口号,按照“5+N+X”三层架构,即基础模型、行业模型和场景模型,目前已经落地金融、制造、政务、煤矿、铁路等10多个行业,支撑400多个业务场景的AI应用落地。

一个最典型的场景,煤矿的智能化升级中,盘古矿山大模型只需导入海量无标注的矿山场景数据进行预训练,即可进行无监督自主学习,一个大模型可以覆盖煤矿的采、掘、机、运、通、洗选等业务流程下的1000多个细分场景的通用。目前,盘古矿山大模型已在全国8个矿井规模使用。

做强算力底座方面,华为的关键词是“自研”和“开放”

在相对底层的计算效率研究方面,华为的打法是架构创新,基于自研的达芬奇架构,推出昇腾处理器,围绕昇腾芯片打造昇腾AI集群,国内建设的规模最大的AI计算集群深圳鹏城云脑II期不但实现了全栈软硬件的自主可控,还蝉联了多项全球AI性能榜单的冠军,算力达到1000P。

不难看出,华为不但直接卖“鱼”,还传授“捕鱼”技巧。

05 结语 

综上所述,这四家云计算大厂对于大模型的落地虽然在打法上各有侧重,但目标还是非常一致,基本上都是在自身原有业务的基础上进行延展,或继续加长自己的长板,或开发出新的增量。

值得一提的是,除了在大模型的技术和业务层面进行竞争之外,这几家大厂还广泛参与到大模型创业公司的投资之中,目前中国估值前五的生成时AI独角兽(月之暗面、智谱AI、Minmax、零一万物和百川智能),阿里的参投率为100%,腾讯则投了百川智能、智谱 AI 、MiniMax 3家,此外深言科技、无问芯穹等大模型公司也曾进入到腾讯的投资名单。

这也是说,大模型的竞争不仅仅只停留在大模型上,资本层面的暗战同样激烈。

相关文章:

大模型落地竞逐,云计算大厂“百舸争流”

作者 | 辰纹 来源 | 洞见新研社 从ChatGPT到Sora,从图文到视频,从通用大模型到垂直大模型……经过了1年多时间的探索,大模型进入到以落地为先的第二阶段。 行业的躁动与资本的狂热相交汇,既造就了信仰派的脚踏实地,也…...

物体检测算法-R-CNN,SSD,YOLO

物体检测算法-R-CNN,SSD,YOLO 1 R-CNN2 SSD3 Yolo总结 1 R-CNN R-CNN(Region-based Convolutional Neural Network)是一种基于区域的卷积神经网络,是第一个成功将深度学习应用到目标检测上的算法。它主要由三个步骤组…...

区块链开发:区块链软件开发包装相关解析

区块链开发是指设计、构建和维护基于区块链技术的应用程序或系统的过程。区块链是一种分布式账本技术,它通过去中心化的方式记录和验证数据,确保数据的透明性、不可篡改性和安全性。区块链开发者使用各种编程语言和框架来创建这些应用程序。 在加密货币领…...

一个月速刷leetcodeHOT100 day07 轮转数组 除自身以外的乘积 找到字符串中所有字母异位词

轮转数组 给定一个整数数组 nums,将数组中的元素向右轮转 k 个位置,其中 k 是非负数。 示例 1: 输入: nums [1,2,3,4,5,6,7], k 3 输出: [5,6,7,1,2,3,4] 解释: 向右轮转 1 步: [7,1,2,3,4,5,6] 向右轮转 2 步: [6,7,1,2,3,4,5] 向右轮转 3 步: […...

Plotly数据可视化宝典

一、引言 在数据驱动的时代,数据可视化已成为不可或缺的一部分。通过图形化的方式展示数据,我们能更直观地理解数据的内在规律和趋势。Plotly,作为一款强大的数据可视化工具,以其丰富的图表类型、交互性和灵活性,赢得了广大数据科学家的青睐。本宝典将深入解析Plotly的各…...

由于找不到mfc140u.dll,无法继续执行代码如何解决

在计算机使用过程中,我们经常会遇到一些错误提示,其中之一就是电脑找不到mfc140u.dll文件。这个问题可能会导致程序无法正常运行或系统崩溃。为了解决这个问题,本文将介绍5种修复方法,帮助大家快速恢复电脑的正常运行。 一&#x…...

卷积神经网络(CNN)详细介绍及其原理详解

卷积神经网络(Convolutional Neural Networks,简称CNN)是深度学习中非常重要的一类神经网络,主要用于图像识别、图像分类、物体检测等计算机视觉任务。本文将详细介绍卷积神经网络的基本概念、结构组成及其工作原理,并…...

kotlin基础之空指针检查、字符串表达式、函数默认值

Kotlin 的空指针检查 Kotlin 是一种空安全的语言,这意味着它强制开发者明确地处理可能的空值。在 Kotlin 中,所有的变量默认都是非空的,除非显式地标记为可为空。 声明可为空的变量 你可以通过在类型后面添加 ? 来声明一个变量可以为空&a…...

【力扣一轮】字符串异位 数组并集

先验知识记录: 遇到哈希问题,想到三种数据结构: ①数组:适用于哈希值比较小,范围较小, ②set:适用于哈希值较大。 ③map:如果需要用到键值对,则用之。 242.有效的字母…...

完美解决flex布局换行后最后一行不能和保持和满行的间距一致,或者左对齐的尴尬情景

display: grid; 是 CSS3 引入的一个非常强大的布局系统,允许你以二维网格的形式布局内容。这种布局模型在设计和构建复杂的网页布局时非常有用,因为它提供了对行和列的完全控制。 以下是关于 display: grid; 的一些基本概念和特性的讲解: 1…...

面试准备-项目【面试准备】

面试准备-项目【面试准备】 前言面试准备自我介绍:项目介绍: 论坛项目功能总结简介数据库表设计注册功能登录功能显示登录信息功能发布帖子评论私信点赞功能关注功能通知搜索网站数据统计热帖排行缓存 论坛项目技术总结Http的无状态cookie和session的区别…...

迭代器 增强for循环

迭代器原理 简单来说,迭代器就是一种可以访问集合的方式,就像一个游标或者指针,可以逐一查看集合(映射、列表)中的元素。 想象一下你有一张清单,上面列着你需要做的事情,但是你只能一次看一项。迭代器就像…...

Ubuntu系统版本查看办法

Ubuntu系统版本查看办法 1. 使用 lsb_release 命令2. 查看 /etc/issue 文件3. 使用 hostnamectl 命令4. 查看 /etc/os-release 文件5. 查看内核版本6. 使用 neofetch 命令(如果已安装)总结 在 Ubuntu 操作系统中,查看当前系统版本的详细信息可…...

HTML5 SVG技术应用

HTML5 SVG技术应用 目录 SVG属性SVG图像绘制 SVG路径SVG直线SVG矩形SVG圆形SVG椭圆SVG多边形SVG曲线SVG属性 SVG(Scalable Vector Graphics)元素拥有众多属性,这些属性用于定义图形的外观、位置、变换、交互等特性。 基本图形属 width 和 height: 定义SVG元素或图形的宽度…...

hcia datacom学习(10):交换机基础

1.二层交换机工作原理 1.1交换机的5种行为 查看mac地址表的命令为 dis mac-address *一个MAC只能关联在一个接口上,一个接口上可以学习多个MAC *mac地址漂移:mac表中,mac地址的出接口从一个端口变为另一个端口的现象。 造成mac漂移的原因…...

参考文献交叉引用两个文献,逗号隔开

1.引用两个参考文献,定位到word正文中需要引用的位置,然后插入-交叉引用,引好文献 2.选中两个参考文献,切换域代码,然后进行修改: 改为 上面的两张图片中的点是空格的含义,word中按ctrlshift8就…...

Linux多线程系列三: 生产者消费者模型,信号量使用,基于阻塞队列和环形队列的这两种生产者消费者代码的实现

Linux多线程系列三: 生产者消费者模型,信号量,基于阻塞队列和环形队列的这两种生产者消费者代码的实现 一.生产者消费者模型的理论1.现实生活中的生产者消费者模型2.多线程当中的生产者消费者模型3.理论 二.基于阻塞队列的生产者消费者模型的基础代码1.阻塞队列的介绍2.大致框架…...

Mongodb介绍及springboot集成增删改查

文章目录 1. MongoDB相关概念1.1 业务应用场景1.2 MongoDB简介1.3 体系结构1.4 数据模型1.5 MongoDB的特点 2. docker安装mongodb3. springboot集成3.1 文件结构3.2 增删改查3.2.1 增加insert3.2.2 保存save3.2.3 更新update3.2.4 查询3.2.5 删除 1. MongoDB相关概念 1.1 业务…...

JAVA 中 HTTP 基本认证(Basic Authentication)

目录 服务端这么做服务端告知客户端使用 Basic Authentication 方式进行认证服务端接收并处理客户端按照 Basic Authentication 方式发送的数据 客户端这么做如果客户端是浏览器如果客户端是 RestTemplat如果客户端是 HttpClient 其它参考 服务端这么做 服务端告知客户端使用 …...

【Flutter】 webview请求权限问题

需求&#xff1a;webview可以通过录音后语音转文字。 使用插件&#xff1a; permission_handler: ^11.0.1 webview_flutter: ^4.7.0 代码如下&#xff1a; 1.添加权限 添加安卓的权限&#xff1a; android/app/src/main/AndroidManifest.xml <uses-permission android…...

.Net框架,除了EF还有很多很多......

文章目录 1. 引言2. Dapper2.1 概述与设计原理2.2 核心功能与代码示例基本查询多映射查询存储过程调用 2.3 性能优化原理2.4 适用场景 3. NHibernate3.1 概述与架构设计3.2 映射配置示例Fluent映射XML映射 3.3 查询示例HQL查询Criteria APILINQ提供程序 3.4 高级特性3.5 适用场…...

Mybatis逆向工程,动态创建实体类、条件扩展类、Mapper接口、Mapper.xml映射文件

今天呢&#xff0c;博主的学习进度也是步入了Java Mybatis 框架&#xff0c;目前正在逐步杨帆旗航。 那么接下来就给大家出一期有关 Mybatis 逆向工程的教学&#xff0c;希望能对大家有所帮助&#xff0c;也特别欢迎大家指点不足之处&#xff0c;小生很乐意接受正确的建议&…...

STM32+rt-thread判断是否联网

一、根据NETDEV_FLAG_INTERNET_UP位判断 static bool is_conncected(void) {struct netdev *dev RT_NULL;dev netdev_get_first_by_flags(NETDEV_FLAG_INTERNET_UP);if (dev RT_NULL){printf("wait netdev internet up...");return false;}else{printf("loc…...

java调用dll出现unsatisfiedLinkError以及JNA和JNI的区别

UnsatisfiedLinkError 在对接硬件设备中&#xff0c;我们会遇到使用 java 调用 dll文件 的情况&#xff0c;此时大概率出现UnsatisfiedLinkError链接错误&#xff0c;原因可能有如下几种 类名错误包名错误方法名参数错误使用 JNI 协议调用&#xff0c;结果 dll 未实现 JNI 协…...

解决本地部署 SmolVLM2 大语言模型运行 flash-attn 报错

出现的问题 安装 flash-attn 会一直卡在 build 那一步或者运行报错 解决办法 是因为你安装的 flash-attn 版本没有对应上&#xff0c;所以报错&#xff0c;到 https://github.com/Dao-AILab/flash-attention/releases 下载对应版本&#xff0c;cu、torch、cp 的版本一定要对…...

关于easyexcel动态下拉选问题处理

前些日子突然碰到一个问题&#xff0c;说是客户的导入文件模版想支持部分导入内容的下拉选&#xff0c;于是我就找了easyexcel官网寻找解决方案&#xff0c;并没有找到合适的方案&#xff0c;没办法只能自己动手并分享出来&#xff0c;针对Java生成Excel下拉菜单时因选项过多导…...

在 Spring Boot 中使用 JSP

jsp&#xff1f; 好多年没用了。重新整一下 还费了点时间&#xff0c;记录一下。 项目结构&#xff1a; pom: <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://ww…...

Neko虚拟浏览器远程协作方案:Docker+内网穿透技术部署实践

前言&#xff1a;本文将向开发者介绍一款创新性协作工具——Neko虚拟浏览器。在数字化协作场景中&#xff0c;跨地域的团队常需面对实时共享屏幕、协同编辑文档等需求。通过本指南&#xff0c;你将掌握在Ubuntu系统中使用容器化技术部署该工具的具体方案&#xff0c;并结合内网…...

boost::filesystem::path文件路径使用详解和示例

boost::filesystem::path 是 Boost 库中用于跨平台操作文件路径的类&#xff0c;封装了路径的拼接、分割、提取、判断等常用功能。下面是对它的使用详解&#xff0c;包括常用接口与完整示例。 1. 引入头文件与命名空间 #include <boost/filesystem.hpp> namespace fs b…...

高端性能封装正在突破性能壁垒,其芯片集成技术助力人工智能革命。

2024 年&#xff0c;高端封装市场规模为 80 亿美元&#xff0c;预计到 2030 年将超过 280 亿美元&#xff0c;2024-2030 年复合年增长率为 23%。 细分到各个终端市场&#xff0c;最大的高端性能封装市场是“电信和基础设施”&#xff0c;2024 年该市场创造了超过 67% 的收入。…...