火山引擎“奇袭”阿里云
图片|电影《美国队长3》剧照
©自象限原创
作者丨程心
编辑丨罗辑
大模型价格战,已经不是什么新闻。
从OpenAI发布GPT-4o,将API价格下调50%,并宣布面向普通用户免费开始,就标志着大模型的竞争从性能进入到了成本时代。
国内的价格战从创业公司开始,先是DeepSeek宣布降价,智普AI,面壁智能等创业公司跟进开始。直到火山引擎,将战火从创业公司烧到大厂跟前,然后就是一系列的连锁反应。
▲图源:火山引擎官方
5月21日,阿里云最先应战,百度智能云直接掀了桌子,宣布两款轻量级主力模型免费,科大讯飞跟进,就连一向在行业里保持低调的腾讯,也给出了相当有诚意的优惠。
短短一周之内,一场围绕着价格的角逐就从局部冲突演变为全面战争,大模型杀疯了。
但在这场混战中,最典型也最有代表性的,恐怕要属阿里云和火山引擎,因为这两者的价格战,代表了目前大模型企业和云计算平台最典型的两种竞争方式。
一、火山引擎“奇袭”阿里云
某种程度上,大模型的价格战是无可避免的。但国内这场价格战却有一个非常戏剧性的特点。
即大厂之间,率先降价的并不是之前一直高举“低价”大旗的阿里云,而是字节跳动旗下的火山引擎。
▲图源:阿里云、火山引擎官方
火山引擎和阿里云的竞争,就像一个成名多年的高手,在自己最得意的招式上,被一个年轻小伙子出其不意的抢了先机,这无法不让人感到意外。
但这件事情其实是早有预兆,我们可以从字节和阿里过往的竞争中找到一些端倪。
如果从阿里和字节的层面,这一次其实是字节跳动第二次“奇袭”阿里,因为第一次是去年抖音电商异军突起猛攻淘宝。
2023年,抖音电商全年GMV快速超过2万亿,抖音向整个电商行业证明了它不仅仅是一个内容创造者,更是一个流量黑洞。只要抖音能抓住消费者的注意力,就能撬动B端让利。
通过这种方式,抖音电商在淘宝的“眼皮子”底下长大了,以一种几乎戏谑的方式,挑战着淘宝的传统电商老大的地位。
如今,抖音又将这个“绝招”用在了云市场上。
当我们把时间线拉长,捋清字节跳动这一年AI的轨迹,就会发现它“没有一个动作是多余的”。
比如「自象限」在《解密Kimi:大模型应用当红顶流是如何练成的?》提到,字节旗下的豆包与Kimi等应用在C端市场打响了营销战。如今,火山引擎又率先挑起面向B端和开发者的价格战。
看起来营销战和价格战分别对2C和2B发起的进攻,但本质上这是字节跳动一盘棋中的两步。
据「自象限」了解到,在字节跳动内部「豆包」及其他大模型应用产品的产品战略负责人是曾经操刀过Musical.ly和TikTok早期产品规划的副总裁朱骏,而火山引擎主要负责豆包大模型的2B服务,与千行百业的结合,由谭待负责。
也就是说,本质上,豆包2C的营销和投放和火山引擎的2B战略是两条业务线。
但有一个问题在于,2B市场尤其是传统行业在做创新性决策时,往往需要一个参照物或者是一个样本,对于完全陌生的领域,他们更追求“可预判性”而不是完全未知。
一位火山引擎的头部客户告诉「自象限」:“领导不懂技术,但他们可能用豆包,我们提案,就说内部做一个豆包,领导一下就能懂了。”
对于2B客户而言,创不创新是小事,但不能行差踏错。
由于豆包在C端市场已经通过营销打下了一定的用户心智,以及由于豆包的助力模型是云雀语音大模型,在一众大模型产品中,豆包具有一定的差异化,用户几乎不需要打字,通过语音就能和豆包进行对话,还有Agent通话功能。
这个功能,满足了很多老年人的需求。从去年开始我们发现身边有很多老人开始陆续使用豆包,有的父亲带着豆包去买菜,碰到不认识的菜就拍下来问问豆包;有的博士生导师和豆包一起改学生的论文;有的姥爷用豆包带娃哄孩子...
一位接近豆包的行业人士向「自象限」透露到:“从Grace改名叫豆包的时,产品团队几乎就选中了老年人群体和接地气的路线,也对这部分群体做了针对性的营销和渗透,尤其是通过抖音的定向推送。”
有流量平台果然能“一鱼多吃”,更何况目前大部分的公司的话语权,都掌握在这部分人手里。
这看起来是一个迂回策略,但事实上,或许从字节将大模型产品从Grace改名为豆包,外人都笑他“土”的时候,这盘棋的第一步就已经落子。
通过技术见长而打造产品差异化是第一步;而根据产品的差异化精准定位人群,是第二步。
通过抖音的大流量平台,进行精准的投放培养用户心智、和产品认知,顺带着参与了一轮营销战,是第三步。
有了标杆产品之后,2C和2B就开始有了连接点,以「豆包」为模版,打造企业自己的豆包,一度是火山引擎的核心销售话术。
这个销售策略和字节跳动2B的风格一致,即:将自己擅长的能力外化。飞书是字节内部管理流程的外化、火山引擎的诞生是源于字节推荐算法能力的外化。
降价,是全面引爆2B市场认知度的一把火,但却不是唯一的目的。谭待不断强调,降价的前提是因为“我们大模型的能力准备好了”,或许火山引擎想要对外的传达的,不只是价格低,而是模型能力早已ready。
但我们推测,降价、掀起价格战只是大模型的某一阶段,它并不是字节甚至火山引擎的直接目的。至于他的目的是什么,谭待也说的很清楚:“大模型尚未真正大规模落地,只要把价格降下来就还有机会。火山引擎最重要的,就是如何把最佳实践做好、市场做大。”
从而实现第四朵云的弯道超车。大模型是云厂商的新机会,很明显,火山引擎正在牢牢抓住这个新的机会不放,目前,已经获得了和阿里云同一牌桌的机会。
不过,想要做好整个市场,火山引擎还太“嫩”了,在阿里云的优势战区,火山引擎光“讨巧”已经不灵了,后面还需要拿出点硬实力。
二、技术降本VS规模化降本
套用马斯克的一句话:没有人不想用大模型,只要它足够便宜。
大模型的降价是一种必然,只是谁也没想过,它会来的那么快。
也更没人会没想到,到了大模型时代,阿里竟是第一个被字节跳动冲击的公司。
除了电商的核心业务之外,阿里云是名副其实的“二当家”,过去几年,阿里云在云市场拥有着绝对的先发优势,无论是IaaS层的规模化、2B的服务经验还是生态体系的健全程度,都让火山引擎这个“年轻小子”无法望其项背。
去年4月,阿里云主导了云市场的大规模降价潮,一年过去了当我们回头再看便会发现,彼时的降价并不是一个基于市场化竞争的决定,而是规模化带来的降本,降本之后的良性降价。
云计算发展了近20年,大部分IDC基建已经铺设的基本完善,也来到了摊薄成本的转折点,从2009年成立开始至2024年,随着基础设施的完善,平台整体性能的提高,降价成为了一种必然趋势,也是云厂商走过成长期,进入成熟期的标志。
在这一次通义千问的全面降价中,阿里也不断提到公有云规模化带来的算力普惠,阿里云公共云事业部刘伟光特意点出了:“公共云技术公里和规模效应,将带来巨大的成本和性能优势。”
归根结底,阿里云的降价仍然是规模化降本导致的降价,是足够老、足够久、足够庞大的人,才有的特权。
相比之下,火山引擎太年轻了,它第一次对外提供服务是2019年,和阿里云比谁更“厚”,几乎是一条死路。
但不代表,火山引擎就不能把成本“打下来”。
让我们回顾一下移动互联网时代的抖音,当时面临最大的困难是用户习惯?市场渗透?还是推荐算法难题?
其实都不是,当时抖音大规模普及面临最大的问题,是“流量太贵了”。
在那个3G到4G转变的节点,在人均每个月只有20M、30M流量的年代,没有人愿意一个月花几百块钱刷抖音。
所以从那时候开始,抖音的算法团队就在探索如何用更少的流量资源来刷视频这件事,这种算法的逻辑本质上和今天用有限的算力推理出更多结果是一个道理。
所以阿里通义降价的核心是规模化,而火山引擎则是技术带来的降本。
谭待曾公开讲道:“我们今天之所以降价,是因为我们能做到。我们在技术上有非常多的优化手段,能把它的成本降低,同时把效果做好。比如我们在模型结构上做优化和调整,在工程上用分布式推理替代单机推理,通过混合调度体系,日均处理1200亿Tokens文本,生成3000万张图片,加强使用算力的程度,大大降低成本。”
除了豆包大模型之外,被称为“大模型界的拼多多”的DeepSeek,也通过技术手段将算力成本降到最低,在行业地板的价格,仍然能获得50%的利润。同时如潞晨科技一样的创业公司,也正在锚定算力优化的路线,通过算法侧的改变,将单卡的开发程度达到最高,将多卡的耗损降到最低。
▲图源:DeepSeek论文中的优化架构
在当下这个阶段,规模化降本和技术降本是两条互相缠绕着的路线,阿里云和火山引擎都选择了适合自己的路。
这场“奇袭”,始于字节在大模型时代的猛攻。但也如同上文所说,奇袭可以杀个措手不及,但不代表能够获得胜利。
当火山引擎要在阿里的腹地与其贴脸开打,还有一场场硬仗等待着他。
相关文章:

火山引擎“奇袭”阿里云
图片|电影《美国队长3》剧照 ©自象限原创 作者丨程心 编辑丨罗辑 大模型价格战,已经不是什么新闻。 从OpenAI发布GPT-4o,将API价格下调50%,并宣布面向普通用户免费开始,就标志着大模型的竞争从性能进入到了成本…...

牛客网刷题 | BC94 反向输出一个四位数
目前主要分为三个专栏,后续还会添加: 专栏如下: C语言刷题解析 C语言系列文章 我的成长经历 感谢阅读! 初来乍到,如有错误请指出,感谢! 描述 将一个四位数&…...

记一次MySQL执行修改语句超时问题
异常问题 原因分析 这个问题发生在开发环境,怀疑是提交事务时终止项目运行,没有提交该事务,造成死锁 调试该事务时时间太长,为什么说有这个原因呢,因为通过查找日志显示 The client was disconnected by the server …...
linux fork()函数调用原理
在Linux中,fork函数用于创建一个新的进程,该进程是调用进程的子进程。fork函数的实现涉及用户态和内核态之间的交互。下面我将详细说明fork函数在代码流程中的原理和用户态与内核态的交互过程。 用户态调用fork函数: 用户程序调用fork函数,该函数是libc库提供的一个封装函数…...
【电控笔记5.9】编码器脉冲计算速度MT法
总结 编码器的脉冲计算速度可以使用多种方法,其中一种常用的方法是“MT法” (Measuring Time Method),即测量时间法。该方法通过测量编码器脉冲间的时间来计算速度。这种方法在高精度速度测量中非常有效,特别是在速度较低时。 MT法计算速度的基本原理 MT法的基本原理是通过…...

go-zero 实战(4)
中间件 在 userapi 项目中引入中间件。go项目中的中间可以处理请求之前和之后的逻辑。 1. 在 userapi/internal目录先创建 middlewares目录,并创建 user.go文件 package middlewaresimport ("github.com/zeromicro/go-zero/core/logx""net/http&q…...
go语言泛型Generic最佳实践 --- slices包
在go的内置包slices中, 所有的函数函数都使用了泛型, 各种各样的泛型, 可以说这个包绝对是go语言泛型学习的最佳实践之一! 来,先来瞄一眼,看看这个slices包里面的函数原型定义: func BinarySe…...

【神经网络结构可视化】使用 Visualkeras 可视化 Keras / TensorFlow 神经网络结构
文章目录 Visualkeras介绍下载安装代码示例1、导入必要的库2、创建VGG16神经网络模型3、可视化神经网络结构4、完整代码5、使用教程 可视化自己创建的神经网络结构1、导入要的库2、创建自己的神经网络模型3、可视化神经网络结构图4、完整代码 Visualkeras介绍 Visualkeras是一…...
nvm安装nodejs/npm/nvm笔记
1 安装nvm, 指定路径nvm路径: D:\Program_Files\nvm\nvm指定路径nodejs 路径: D:\Program_Files\nvm\nodejs 2 进入nvm安装路径找到settings.xml文件,追加2行,设置镜像 node_mirror: https://npmmirror.com/mirrors/node/ npm_mirror: ht…...

微信小程序源码-基于Java后端的小区租拼车管理信息系统毕业设计(附源码+演示录像+LW)
大家好!我是程序员一帆,感谢您阅读本文,欢迎一键三连哦。 💞当前专栏:微信小程序毕业设计 精彩专栏推荐👇🏻👇🏻👇🏻 🎀 Python毕业设…...

嵌入式进阶——LED呼吸灯(PWM)
🎬 秋野酱:《个人主页》 🔥 个人专栏:《Java专栏》《Python专栏》 ⛺️心若有所向往,何惧道阻且长 文章目录 PWM基础概念STC8H芯片PWMA应用PWM配置详解占空比 PWM基础概念 PWM全称是脉宽调制(Pulse Width Modulation)…...

一文读懂:http免费升级https
背景: 随着现在全民网络安全意识的日益提升,各个网站需要实现的https数量也随之提升,那么如何将原本网站的http访问方式升级为https呢? 该内容为如何免费将网站的http访问升级为https访问 论https的加密逻辑: 步骤 …...
算法刷题笔记 高精度除法(C++实现)
文章目录 题目描述求解思路实现代码 题目描述 给定两个非负整数(不含前导0)A,B,请你计算 A/B 的商和余数。 输入格式 共两行,第一行包含整数A,第二行包含整数B。 输出格式 共两行,第一行输…...

按月爬取天气数据可视化展示
从天气网分析,可以查询每个月的天气情况,这里按照url规则,传入年月,获取数据,最后进行可视化展示,最终效果: 下面是获取过程: 第一步: import requestsdef get_weather(month):url = f"https://lishi.tianqi.com/nanning/{month}.html"response = reques…...

VMware安装Ubuntu系统(超详细)
一.Ubuntu官网下载镜像 Ubuntu官网:Enterprise Open Source and Linux | Ubuntu 二.安装Ubuntu系统 选择文件->创建虚拟机新建虚拟机(ControlN),这里直接选择典型即可 选择稍后安装系统 选择linux Ubuntu 64位 填写虚拟机名称…...

数据清洗操作及众所周知【数据分析】
各位大佬好 ,这里是阿川的博客 , 祝您变得更强 个人主页:在线OJ的阿川 大佬的支持和鼓励,将是我成长路上最大的动力 阿川水平有限,如有错误,欢迎大佬指正 前面的博客 数据分析—技术栈和开发环境搭建 …...

炫酷gdb
在VS里面调试很方便对吧?(F5直接调试,F10逐过程调试--不进函数,F11逐语句调试--进函数,F9创建断点),那在Linux中怎么调试呢? 我们需要用到一个工具:gdb 我们知道VS中程…...

windows 7 10 11快捷键到启动页面
1.快速打开用户启动文件夹 shell:startup 方式2:快速打开系统启动文件夹 shell:Common Startup shell:Common Startup...
[处理器芯片]-6 超标量CPU实现之浮点运算
1 浮点运算单元FPU 超标量CPU中的浮点运算单元是专门处理浮点数运算的关键组件。浮点运算单元的设计涉及多个复杂的子模块和技术,以保证高效、准确地执行浮点数的加减法、乘法、除法、平方根等操作。 1)浮点数术语 浮点数通常采用IEEE 754标准表示&…...

又有人叫嚣:AI取代前端,来给你几张图,看能不能憋死AI。
总有自媒体人,为了些许流量,在大放厥词,说截个图给AI,AI就能输出前端代码,这是啥都敢说,吹牛不上税。 我来给你几张贝格前端工场日常接的大数据项目相关的图,你让AI生成代码,取代前…...

大数据学习栈记——Neo4j的安装与使用
本文介绍图数据库Neofj的安装与使用,操作系统:Ubuntu24.04,Neofj版本:2025.04.0。 Apt安装 Neofj可以进行官网安装:Neo4j Deployment Center - Graph Database & Analytics 我这里安装是添加软件源的方法 最新版…...
云原生核心技术 (7/12): K8s 核心概念白话解读(上):Pod 和 Deployment 究竟是什么?
大家好,欢迎来到《云原生核心技术》系列的第七篇! 在上一篇,我们成功地使用 Minikube 或 kind 在自己的电脑上搭建起了一个迷你但功能完备的 Kubernetes 集群。现在,我们就像一个拥有了一块崭新数字土地的农场主,是时…...
Spring Boot 实现流式响应(兼容 2.7.x)
在实际开发中,我们可能会遇到一些流式数据处理的场景,比如接收来自上游接口的 Server-Sent Events(SSE) 或 流式 JSON 内容,并将其原样中转给前端页面或客户端。这种情况下,传统的 RestTemplate 缓存机制会…...

CMake基础:构建流程详解
目录 1.CMake构建过程的基本流程 2.CMake构建的具体步骤 2.1.创建构建目录 2.2.使用 CMake 生成构建文件 2.3.编译和构建 2.4.清理构建文件 2.5.重新配置和构建 3.跨平台构建示例 4.工具链与交叉编译 5.CMake构建后的项目结构解析 5.1.CMake构建后的目录结构 5.2.构…...

visual studio 2022更改主题为深色
visual studio 2022更改主题为深色 点击visual studio 上方的 工具-> 选项 在选项窗口中,选择 环境 -> 常规 ,将其中的颜色主题改成深色 点击确定,更改完成...
数据库分批入库
今天在工作中,遇到一个问题,就是分批查询的时候,由于批次过大导致出现了一些问题,一下是问题描述和解决方案: 示例: // 假设已有数据列表 dataList 和 PreparedStatement pstmt int batchSize 1000; // …...

第 86 场周赛:矩阵中的幻方、钥匙和房间、将数组拆分成斐波那契序列、猜猜这个单词
Q1、[中等] 矩阵中的幻方 1、题目描述 3 x 3 的幻方是一个填充有 从 1 到 9 的不同数字的 3 x 3 矩阵,其中每行,每列以及两条对角线上的各数之和都相等。 给定一个由整数组成的row x col 的 grid,其中有多少个 3 3 的 “幻方” 子矩阵&am…...

tree 树组件大数据卡顿问题优化
问题背景 项目中有用到树组件用来做文件目录,但是由于这个树组件的节点越来越多,导致页面在滚动这个树组件的时候浏览器就很容易卡死。这种问题基本上都是因为dom节点太多,导致的浏览器卡顿,这里很明显就需要用到虚拟列表的技术&…...

C# 求圆面积的程序(Program to find area of a circle)
给定半径r,求圆的面积。圆的面积应精确到小数点后5位。 例子: 输入:r 5 输出:78.53982 解释:由于面积 PI * r * r 3.14159265358979323846 * 5 * 5 78.53982,因为我们只保留小数点后 5 位数字。 输…...
力扣-35.搜索插入位置
题目描述 给定一个排序数组和一个目标值,在数组中找到目标值,并返回其索引。如果目标值不存在于数组中,返回它将会被按顺序插入的位置。 请必须使用时间复杂度为 O(log n) 的算法。 class Solution {public int searchInsert(int[] nums, …...