当前位置: 首页 > article >正文

黄仁勋可能开始焦虑了

只做卖铲人已经不能让 Nvidia 高枕无虞了。2026年4月15日黄仁勋在Dwarkesh Patel 的播客里经历了一场他很久没经历过的尖锐追问。一个多小时的对话他反复用来定义英伟达的那句话是“必须有东西把电子变成token。”他把自家公司形容成“全球每瓦生产token 最多的架构”——不是每瓦算力最多是每瓦 token 最多。这是一家卖GPU的公司在重新定义自己。为什么要重新定义因为他比任何人都更早地看见一件事——AI 时代的权力正在被分成两种不同的东西。一种是算力在美国手里另一种是 token在中国手里。这两种权力不在同一个平面上谁都吃不掉谁。而英伟达夹在中间它原来以为自己是最大的赢家现在发现自己是这两个结构里都没有舒服位置的那个。这才是他焦虑的真正原因。算力的地主token 的租客先看美国那半边。4月14 日EpochAI 发布最新数据——Amazon、Google、Meta、Microsoft、Oracle 五家美国 hyperscaler 合计持有全球 67% 的 AI 算力按H100 等价口径折算。2024 年 Q1 这个数字是 60%。十八个月里全球 AI 算力的集中度又提高了七个百分点而且上行趋势看不到减速。这五家公司有一个共同点它们都不做前沿模型。Google 算是一个例外TPU 自研加 Gemini 自己做但剩下四家的基本身位是“收租的”——Microsoft 靠 Azure 给 OpenAI 租算力Amazon 靠 AWS 和自家 Trainium 芯片把 Anthropic 绑在身边Oracle 靠 Stargate 项目切进 OpenAI的基础设施版图Meta 自己造芯片但主要内用4 月 13 日刚与 Broadcom 签了 1GW 自研芯片订单。那谁在用这些算力前沿 AI lab 都是它们的租客。Anthropic 刚宣布扩大与Google 的TPU 合作未来几年要接入多GW 级算力。OpenAI 的骨干算力是Microsoft Azure 加 Oracle Stargate——OpenAI 在 2 月刚完成 1100 亿美元融资Amazon 投了 500 亿SoftBank 投了 300 亿Nvidia 追加了300 亿从原本承诺的1000 亿缩水而来。xAI 自建集群但芯片仍然从英伟达买。美国 AI 产业真实的权力结构是这样的5 家算力地主 3 家前沿模型租客 一个 Nvidia。外界以为 OpenAI、Anthropic、xAI 是主角实际上它们是交租的一方。它们每融一轮钱都要把大头交给那五家地主——这五家地主同时也是它们的投资人、它们的供应商、它们的谈判对手。Nvidia 在这个结构里看上去是最大的赢家。它拿了 2026 财年大约 1150 亿美元的数据中心收入市值 3 万亿美元以上。但这个身位的脆弱性黄仁勋自己看得最清楚。他在3月的Morgan Stanley大会上宣布Nvidia 投资 OpenAI 的 300亿美元和投资Anthropic 的100亿美元大概率都是最后一笔。两个月前他刚把那100亿美元押给AnthropicAnthropic转身就加大了 TPU合作——Nvidia投资的钱流回去帮对手做非英伟达的算力。这是商业层面的选择Anthropic 不能只依赖一家芯片供应商它必须分散。Nvidia 的客户结构本来就高度集中——全球算力版图上真正的大户就是那五家美国公司。加上中国市场那就是它过去两年数据中心业务的全部核心收入池。2025 年 4 月之后H20 禁令让中国这一池水基本蒸发。剩下的五家客户每一家都比 Nvidia 更想往上游吃——Meta自研芯片、Amazon 有Trainium、Google有 TPU、Microsoft 和 Oracle在押 OpenAI 的自研 Titan。一个卖铲子的人面对的客户是五家正在自己造铲子的人。这就是美国结构里英伟达的真实处境。token 的工厂没有业主也没有租客再看中国那半边。中国前四大云厂商——阿里云、字节火山引擎、腾讯云、百度智能云——全部都同时在做两件事一边卖算力一边做自己的大模型。阿里云的底下是千问Qwen火山引擎的底下是豆包和 Seedance腾讯云的底下是混元百度智能云的底下是文心。再加上对于对于 AI “新势力”们错综复杂的投资产业布局都很完备。中国的云厂商只能同时做业主和租客——自己造算力、自己造模型、自己消化 token最后把 token 作为商品卖给下游企业。算力、模型、应用三层被同一家公司吃掉整条价值链上只剩下一种东西可以作为商品出货——token。阿里是这个链条的代表性企业 ATH大家都很熟悉了CEO 吴泳铭在内部备忘录里给它定下了核心使命“创造 Token、输送 Token、应用 Token。”ATH 成立后的一个月阿里的动作密度是过去两年之最。3 月 30 日发布Qwen3.5-Omni——Qwen 系列近年来第一次从开源走向闭源。紧接着Qwen 3.6 Plus 在OpenRouter上以 4.6 万亿/周的调用量登顶全球大模型周调用量冠军同系列的Preview 版本拿下第三。今天ATH 又掏出了最新的开放式世界模型产品Happy Oyster研发效率堪称恐怖。吴泳铭在 3 月 19 日的财报电话会上说了一句话分量比 ATH 成立本身更大。他说企业在消耗 Token 时不再把它当作 IT 预算而是当作生产资料。IT 预算是成本项是被优化的对象生产资料是投入项是被扩张的对象。一家万亿美金市值的中国公司的 CEO 在财报电话会上告诉华尔街——token 已经从“支出”变成了“投入”从“IT 科目”变成了“经济活动本身”。他给出的具体数字是未来五年阿里云和 AI 商业化年收入要冲到1000 亿美元。按新的 Token 消耗算法这1000 亿美元甚至可以包含电商业务产生的 AI 收入。在企业的动作之前监管则是更早给这场科技的盛宴定下了基调。3 月 23 日国家数据局局长刘烈宏在中国发展高层论坛年会上正式把 token 的中文译名定为“词元”并称其为“智能时代的价值锚点”和“连接技术供给与商业需求的结算单位”。第二天国新办发布会上他公布了一组官方数字——中国日均词元调用量突破140 万亿对比2024 年初的1000 亿两年增长超过一千倍。这是把 token 从技术概念抬升为经济统计指标的动作。“流量”之于互联网时代“词元”之于 AI 时代。OpenRouter 平台给了这套叙事最硬的数据支点——2 月 9 日至 15 日那一周中国大模型的 Token 调用量首次超过美国4.12 万亿对 2.94 万亿。到 4 月初中国模型周调用量达到 12.96 万亿美国模型 3.03 万亿中国已经连续五周领先全球调用量前六全部是中国模型。MiniMax M2.5 发布后七天调用量突破 3.07 万亿。Kimi K2.5 发布不到一个月近 20 天累计收入超过了月之暗面 2025 全年总收入。智谱 GLM-5 在春节期间因为流量爆单公开“寻找算力合伙人”——不是营销噱头是真实订单把产能撑爆了。算一下结构差异。美国那半边算力是核心资产token 是算力的副产品。中国这半边反过来——token 是核心商品算力是生产 token 的原料。定价逻辑、商业模型、公司估值、监管指标全部围绕两种不同的东西展开。大洋那边充满了算力但 token 却源源不断从大洋这边产生。老黄为什么焦虑回到 Dwarkesh 的播客。黄仁勋在访谈里给出一个他反复使用的框架——“five-layer cake”AI产业有五层能源、芯片、系统、模型、应用。他说美国必须在五层里每一层都领先否则就是败局。他说中国是全世界开源软件最大的贡献者说这话时连说两次“Fact”——事实、事实。他说中国占全球 AI 研究员的一半制造全球 60% 以上的主流芯片有大量满电空置的“幽灵数据中心”。他说 AI 的大部分进步来自算法进步不是硬件本身。然后他抛出一句话——如果 DeepSeek 的下一个版本首发在华为芯片上对美国来说是灾难。这些话串在一起读意思已经很清楚了。他的焦虑不是来自“中国追上来”这种宏观叙事而是来自一个明确的尴尬窘境——在美国那半边他正在失去议价权在中国那半边他正在失去入场券。在美国那半边5家hyperscaler 拿走了 67% 的全球算力它们是他最大的客户也是他最强的对手。它们每一家都在做自研芯片——Meta 刚签了 1GW的Broadcom 订单Amazon 的Trainium 拿下了 AnthropicGoogle 的TPU 在吞噬Nvidia的份额。当你的客户同时是你的对手当你的市场集中到只剩 5 家买主你的定价权就是一个慢慢被蚕食的过程。Anthropic 拿了 Nvidia100 亿美元投资两个月后反手加大 TPU 合作——这件事是趋势不是偶然。在中国那半边token生态正在绕过英伟达。DeepSeek V4 的蓄势待发在华为 Ascend 950PR上跑训练和推理不走 Nvidia。阿里、字节、腾讯为此批量下单了几十万片华为芯片。Qwen、Kimi 、 MiniMax 们每周产出几万亿 token 的模型每多跑一天华为芯片的装机量就涨一天。更严重的是这些模型的用户正在全球扩张——OpenRouter 上中国模型连续五周超过美国MiniMax 主打“1 美元跑一小时 AI 数字员工”Kimi 的海外付费用户正在反超国内。当世界开发者的默认技术栈开始从英伟达切换到华为Nvidia 在这条链路上一个字都插不进去。面对这两个困境英伟达过去半年做了两件事都可以在这个命题下被重新解读。第一件事亲自下场做自己本不该做的产品。3 月的 GTC 上Nvidia 连发 Cosmos 3世界基础模型、Isaac GR00T N1.7机器人、Alpamayo1.5自动驾驶、Nemotron开源大模型家族——一整套覆盖物理 AI 和前沿模型的栈。4 月 14 日世界量子日它发布 Ising——开源的量子 AI 模型家族黄仁勋亲自给它定性“AI 成为控制面成为量子机器的操作系统。”这些发布加在一起传递的信号非常明确英伟达不再满足于做芯片它要做模型、做操作系统、做物理世界的模拟器、做量子计算的控制层。卖铲子的人开始自己挖矿不是因为贪心是因为两个结构都在挤压他的原有位置。第二件事他把公司的核心指标从“算力”迁移到“产出”。“electrons to tokens” 这个比喻他在 Dwarkesh 访谈里用了不下五次。他把 Nvidia 形容成“全球每瓦生产 token 最多的架构”——不是每瓦算力最多是每瓦 token 最多。一家把核心指标从“算力”改成“token”的公司已经承认了这个时代的硬通货在哪里。但承认不等于解决。他手里的 GPU 本质上还是生产算力的机器不是直接生产 token 的机器。他在两个结构里都在做对的事——在美国扩张上游、在技术栈上锁住开发者——但这些动作都没法改变基本面算力和 token 不在同一个平面上。一家只生产算力的公司无论怎么重新定义自己都没法同时占据两种权力。只做卖铲人已经不能让 Nvidia 高枕无虞了。结语AI 时代的权力结构现在已经分成了两半。美国那半边是地产——5 家 hyperscaler 坐在 67% 的全球算力上前沿 lab 是它们的租客。这个结构里算力是硬资产估值逻辑是“地皮面积 × 租金”。中国这半边是工厂——4 家云厂把算力、模型、应用压成一条流水线token 是唯一的出货物。这个结构里token 是硬通货估值逻辑是“产出量 × 单价”。两种结构互相不可吃掉。美国的算力地主没法直接进入中国的 token 工厂——监管、生态、开发者习惯都拦着。中国的 token 工厂也没法直接替代美国的算力地主——前沿训练还是要最先进的硬件华为 Ascend 追得再快短期内补不上与顶级Nvidia 芯片的代际差距。两种权力各自运转各自扩张各自找各自的出口。黄仁勋夹在中间。他本来以为自己是这个时代最大的赢家——算力是上游模型是下游他给上游和下游都供货他是唯一的瓶颈。但瓶颈的位置正在双向松动。上游那半边5 家地主自己造芯片下游那半边中国用国产芯片跑出了自己的 token 生态。向左扩张投资OpenAI、Anthropic没守住下游往右扩张还没证明能守住技术栈。他一个人两条战线都面临着增长的困境。他在播客里说“必须有东西把电子变成 token”。他是在替英伟达的未来辩护但这句话本身已经承认了——这个时代的硬通货不是电子是 token。而生产token最密集的地方目前不在美国。他在两种结构之间Nvidia正在失去最舒服的位置。原文链接:老黄可能开始焦虑了-36氪

相关文章:

黄仁勋可能开始焦虑了

只做卖铲人,已经不能让 Nvidia 高枕无虞了。 2026年4月15日,黄仁勋在Dwarkesh Patel 的播客里经历了一场他很久没经历过的尖锐追问。一个多小时的对话,他反复用来定义英伟达的那句话是:“必须有东西把电子变成token。”他把自家公…...

Xbox Game Pass存档提取终极指南:3分钟实现游戏进度无损迁移

Xbox Game Pass存档提取终极指南:3分钟实现游戏进度无损迁移 【免费下载链接】XGP-save-extractor Python script to extract savefiles out of Xbox Game Pass for PC games 项目地址: https://gitcode.com/gh_mirrors/xg/XGP-save-extractor 还在为Xbox Ga…...

Unity 资源管理与加载

Unity资源管理与加载:构建高效游戏的关键 在游戏开发中,资源管理与加载是影响性能与体验的核心环节。Unity作为主流引擎,提供了丰富的资源管理机制,但如何高效利用这些功能,避免内存浪费与卡顿,是开发者必…...

WorkshopDL终极指南:三步解决非Steam平台模组下载难题的完整方案

WorkshopDL终极指南:三步解决非Steam平台模组下载难题的完整方案 【免费下载链接】WorkshopDL WorkshopDL - The Best Steam Workshop Downloader 项目地址: https://gitcode.com/gh_mirrors/wo/WorkshopDL 还在为Epic Games或GOG平台无法访问Steam创意工坊而…...

避坑指南:K230部署YOLOv8时,nncase版本、Python环境与系统匹配的那些坑

K230部署YOLOv8避坑实战:从版本冲突到环境变量的深度排错手册 当你在K230开发板上部署YOLOv8目标检测模型时,是否遇到过这些令人抓狂的报错?"nncase版本不匹配"、"Python环境冲突"、"找不到.NET运行时"... 这些…...

Win11Debloat:终极Windows系统清理工具,3分钟告别臃肿与广告

Win11Debloat:终极Windows系统清理工具,3分钟告别臃肿与广告 【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other changes to…...

Python的__init_subclass__中的流动元信息

Python作为一门灵活的动态语言,其元编程能力一直是开发者探索的热点。在类创建过程中,__init_subclass__钩子方法的引入为元信息流动提供了全新可能。这个在Python 3.6版本加入的特殊方法,允许父类在子类定义时介入处理,成为类继承…...

巧用 Cloudflare Workers,在子目录而非子域名上托管博客,提升 SEO 效果!

引言在本指南中,将学习如何在子目录(例如 example.com/blog)而非子域名(例如 blog.example.com)上托管博客,且每个步骤都经过测试和验证。为何在子目录上托管?在子目录上托管博客可提高 SEO 效果…...

GPS定位器平台指令配置实战:从协议解析到IP端口设置

1. GPS定位器平台指令配置的核心逻辑 第一次接触GPS定位器平台迁移时,我也被各种协议和指令搞得头晕眼花。后来才发现,整个过程就像给手机换运营商——本质都是重新配置通信参数。GPS设备通过IP和端口与平台服务器建立连接,就像快递员需要知道…...

从时序到实战:基于STM32 HAL库的W25Q64 SPI驱动开发全解析

1. SPI协议基础与硬件连接 SPI协议作为嵌入式开发中最常用的通信协议之一,其全称是Serial Peripheral Interface(串行外设接口)。我第一次接触SPI是在做一个传感器项目时,当时需要高速读取加速度计数据,I2C的速率已经无…...

【maaath】Flutter for OpenHarmony 跨平台实战:集成图片加载与缓存优化方案

Flutter for OpenHarmony 跨平台实战:集成图片加载与缓存优化方案作者:maaath欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.csdn.net前言 在移动应用开发领域,图片资源的加载与缓存一直是性能优化的关键环节。尤…...

如何快速掌握跨平台资源下载:res-downloader终极完整指南

如何快速掌握跨平台资源下载:res-downloader终极完整指南 【免费下载链接】res-downloader 视频号、小程序、抖音、快手、小红书、直播流、m3u8、酷狗、QQ音乐等常见网络资源下载! 项目地址: https://gitcode.com/GitHub_Trending/re/res-downloader 你是否曾…...

Zotero-OCR实战指南:让扫描PDF秒变可搜索文献

Zotero-OCR实战指南:让扫描PDF秒变可搜索文献 【免费下载链接】zotero-ocr Zotero Plugin for OCR 项目地址: https://gitcode.com/gh_mirrors/zo/zotero-ocr 还在为那些古老的扫描版PDF文献无法搜索而烦恼吗?Zotero-OCR插件就是你的救星&#xf…...

全网独家自带Uniapp的CRM源码:一套代码编译微信小程序+H5,移动办公零门槛

温馨提示:文末有资源获取方式为什么你的销售团队需要这样一套CRM系统?在移动办公成为常态的今天,企业销售管理面临三个痛点:客户跟进记录分散,团队协作效率低电脑端系统无法满足外勤办公需求小程序和H5需要分别开发&am…...

从零到一:OpenClaw 数字员工全流程实战指南

从零到一:OpenClaw 数字员工全流程实战指南 OpenClaw(昵称“小龙虾”)是2026年最火的开源AI智能体框架,GitHub星标超28万。它之所以被称为“数字员工”而非“聊天机器人”,核心区别在于:它能真正“动手干活…...

HJ180 游游的最长稳定子数组

题目题解(30)讨论(15)排行 中等 通过率:51.28% 时间限制:1秒 空间限制:256M 知识点双指针 校招时部分企业笔试将禁止编程题跳出页面,为提前适应,练习时请使用在线自测,而非本地IDE。 描述 定义一个数…...

文字转语音工具:每个功能都指向明确的语音产出

🎯 文字转语音工具:每个功能都指向明确的语音产出🤔 一、为何选择专注的工具而非“大而全”平台?在数字化工具泛滥的今天,许多平台追求功能集成,试图用一个产品解决所有问题。然而,对于只需要将…...

终极指南:用Chinese-ERJ LaTeX模板轻松搞定经济研究期刊论文排版

终极指南:用Chinese-ERJ LaTeX模板轻松搞定经济研究期刊论文排版 【免费下载链接】Chinese-ERJ 《经济研究》杂志 LaTeX 论文模板 - LaTeX Template for Economic Research Journal 项目地址: https://gitcode.com/gh_mirrors/ch/Chinese-ERJ 还在为《经济研…...

Minecraft启动报错OpenGL版本过低?别急着换显卡,试试这个驱动升级保姆级教程

Minecraft启动报错OpenGL版本过低?别急着换显卡,试试这个驱动升级保姆级教程 当你在某个周末下午兴致勃勃地双击Minecraft启动器,准备重温方块世界的乐趣时,屏幕上突然弹出的"OpenGL版本过低"报错信息就像一盆冷水浇下…...

AirPodsDesktop终极指南:如何在Windows上完整体验苹果耳机的原生功能

AirPodsDesktop终极指南:如何在Windows上完整体验苹果耳机的原生功能 【免费下载链接】AirPodsDesktop ☄️ AirPods desktop user experience enhancement program, for Windows and Linux (WIP) 项目地址: https://gitcode.com/gh_mirrors/ai/AirPodsDesktop …...

别再只用BERT了!用sentence-transformers库的SBERT,5分钟搞定文本相似度匹配

别再只用BERT了!5分钟用SBERT实现工业级文本相似度匹配 当你在电商平台搜索"轻薄笔记本电脑"时,系统如何从百万商品中精准找到MacBook Air和XPS 13?当你在知识库提问"如何重置路由器密码",客服机器人怎样快速…...

解锁B站宝藏:用BiliBiliCCSubtitle轻松获取CC字幕的完整指南

解锁B站宝藏:用BiliBiliCCSubtitle轻松获取CC字幕的完整指南 【免费下载链接】BiliBiliCCSubtitle 一个用于下载B站(哔哩哔哩)CC字幕及转换的工具; 项目地址: https://gitcode.com/gh_mirrors/bi/BiliBiliCCSubtitle 你是否曾经在B站看到精彩的视频&#xff…...

如何用OBS StreamFX插件打造电影级直播画面:从基础到进阶的完整指南

如何用OBS StreamFX插件打造电影级直播画面:从基础到进阶的完整指南 【免费下载链接】obs-StreamFX StreamFX is a plugin for OBS Studio which adds many new effects, filters, sources, transitions and encoders! Be it 3D Transform, Blur, complex Masking, …...

用Python的pywifi库写个WiFi密码测试工具,顺便聊聊网络安全那些事儿

Python实战:用pywifi构建WiFi安全测试工具的技术解析 在数字化生活高度普及的今天,WiFi网络已成为我们日常工作和生活的基础设施。作为开发者,理解WiFi连接原理并掌握相关安全知识,不仅能提升技术能力,也能更好地保护自…...

别再死记硬背了!用5分钟动画图解SpringMVC的Model数据流转(附源码)

5分钟动画拆解:SpringMVC数据流转的幕后剧场 想象一下你正在导演一场话剧——前台演员(用户界面)需要与后台道具组(服务器数据)无缝配合。SpringMVC的Model系统就像这场演出的幕后调度员,今天我们就用动画…...

CardEditor:桌游设计师的批处理卡牌生成神器,让创意批量落地

CardEditor:桌游设计师的批处理卡牌生成神器,让创意批量落地 【免费下载链接】CardEditor 一款专为桌游设计师开发的批处理数值填入卡牌生成器/A card batch generator specially developed for board game designers 项目地址: https://gitcode.com/g…...

Windows软件彻底卸载终极指南:Bulk Crap Uninstaller专业级批量清理方案

Windows软件彻底卸载终极指南:Bulk Crap Uninstaller专业级批量清理方案 【免费下载链接】Bulk-Crap-Uninstaller Remove large amounts of unwanted applications quickly. 项目地址: https://gitcode.com/gh_mirrors/bu/Bulk-Crap-Uninstaller 在Windows系…...

5分钟学会音频解锁:如何快速解密任何加密音乐文件

5分钟学会音频解锁:如何快速解密任何加密音乐文件 【免费下载链接】unlock-music 在浏览器中解锁加密的音乐文件。原仓库: 1. https://github.com/unlock-music/unlock-music ;2. https://git.unlock-music.dev/um/web 项目地址: https://g…...

B站字幕下载终极指南:3分钟掌握高效字幕处理技巧

B站字幕下载终极指南:3分钟掌握高效字幕处理技巧 【免费下载链接】BiliBiliCCSubtitle 一个用于下载B站(哔哩哔哩)CC字幕及转换的工具; 项目地址: https://gitcode.com/gh_mirrors/bi/BiliBiliCCSubtitle 还在为B站视频的字幕下载而烦恼吗?&#…...

别再只盯着原理了!用TensorRT INT8量化你的YOLOv5模型,实测推理速度翻倍(附完整C++代码)

实战指南:用TensorRT INT8量化加速YOLOv5模型推理(附完整C实现) 当你在深夜调试模型时,是否经历过这样的场景——模型精度达标了,但推理速度却像蜗牛爬行?部署到边缘设备时,显存占用直接爆表&am…...