当前位置: 首页 > article >正文

黄仁勋:龙虾就是新操作系统!英伟达7种芯片拼出算力怪兽,放话2027营收万亿美元

梦晨 henry 发自 凹非寺量子位 | 公众号 QbitAI英伟达GTC 2026很不寻常黄仁勋迟到了15分钟。今年有450家企业赞助、1000场技术分会、2000位演讲者、110台机器人这样的规模已经不像一场技术会议更像AI行业的年度朝圣。皮衣老黄站在舞台中央接受了新称号“Token之王”。这次他没有直奔芯片发布而是花了整整一个小时从25年前的GeForce游戏显卡讲起讲到20年前的CUDA讲到10年前的RTX渲染技术讲到云计算合作伙伴再讲到今天的爆火OpenClaw和token经济。AI从感知到生成到推理再到执行每一步都需要生成更多token消耗更多算力。所有这一切铺垫只为引出一个数字英伟达到2027年营收预计至少达到1万亿美元。去年GTC上我看到了5000亿美元的高确信需求。今年站在同一个舞台上这个数字变成了1万亿美元覆盖Blackwell和Rubin到2027年的订单。而且我确定实际需求会比这更高。就在这个瞬间与现场观众的掌声和欢呼声一同高涨的是英伟达股价。Token工厂经济学老黄教全球CEO看一张图只有英伟达的Keynote你才会看到去年的slide再出现一次。而老黄称这是全球CEO都要仔仔细细研究的一张图。纵轴是Token吞吐量每瓦产出多少Token横轴是Token速率每秒生成多少Token。吞吐量代表你的工厂产能速率代表AI的“聪明程度”模型越大、上下文越长、思考越深速率就越低但每个Token越值钱。老黄把这张图变成了一套完整的商业模型。免费层高吞吐、低速率用来获客。中间层$3-$6/百万Token服务普通用户。高级层$45/百万Token大模型深度推理。顶级层$150/百万Token超长研究任务、关键路径实时响应。去年Semi Analysis做了一次有史以来最大规模的AI推理基准测试。结果显示Grace Blackwell NVLink 72的每瓦token吞吐量比上一代Hopper H200高出50倍。而黄仁勋自己说说的35倍。对此Semi Analysis创始人公开表示“黄仁勋在sand bagging故意保留余地”。老黄说没错我就说故意的实际是50倍每瓦性能决定了一切。因为每座数据中心的功率都是物理约束一座1GW的AI工厂永远不会变成2GW。在固定功率下谁的每瓦token产出更高谁的token成本就更低。这就是Vera Rubin存在的理由作为下一代计算平台再次将每瓦token吞吐量提高2-10倍。Vera Rubin十年千万倍加速Hopper时代老黄还会举起一块芯片秀给观众看但那个时代已经结束了。去年我说Hopper的时候会举起一块芯片那很可爱。但这是Vera Rubin当人们想到Vera Rubin人们想到的是整个系统。Vera Rubin是英伟达有史以来最复杂的AI计算系统。7种芯片5种机架垂直集成、端到端优化成一台巨型计算机Rubin GPU全新架构支持NVLink 72全互联3.6 exaflops算力260TB/s全对全带宽。Vera CPU全新数据中心CPU全球唯一采用LPDDR5的服务器处理器单线程性能和能效比出色。老黄原本没打算单独卖CPU但Vera卖得太好这已经确定是一个数十亿美元的业务了。Groq LP30世界上从未见过的第三代芯片500MB片上SRAM确定性数据流处理器静态编译、软件调度专为推理而生。BlueField 4 DPU CX9网卡全新存储平台共同构成了面向AI原生的全新存储基础设施。NVLink Switch第六代NVLink交换芯片提供大规模MoE模型所需的快速、无缝的GPU到GPU通信Spectrum X CPO交换机全球首款量产的共封装光学Co-Packaged Optics交换机电子直接转光子。在同一座1GW数据中心里从Grace Blackwell到Vera Rubin Groqtoken生成速率从200万跳到7亿。‘两年时间350倍。摩尔定律在同样的时间里能给多少大约1.5倍。350倍不是靠芯片上多塞几个晶体管实现的。当算力密度卷到这个程度瓶颈早就转移到了芯片之外散热和互联。Vera Rubin的答案是两大变化一个关于水一个关于光。关于水Vera Rubin采用100%液冷方案连NVLink交换机都泡在液冷系统里。互联不再靠外部线缆而是在液冷模块内部做板级/背板式集成互联。线缆全部消失了过去安装一个机架要两天现在两小时。关于光黄仁勋举起了世界首款量产的CPO共封装光学交换机。传统交换机里电信号从芯片出来经过PCB走线到达光模块在光模块里完成电-光转换再通过光纤传出去。每一次转换都有延迟每一段铜线都有损耗。CPO把这条链路压缩到极致光学器件直接封装到芯片上电子在硅片表面就转换成光子。 没有光模块没有铜线中转。英伟达和TSMC联合发明了一种叫CoUP的封装工艺目前全球只有英伟达在量产。要让72块GPU实现260TB/s的全对全带宽如果还用传统铜缆信号跑不了太远机架尺寸就是物理极限。CPO打破了这个限制光子跑得更远、损耗更低、能效更高。但铜缆和光学不是二选一。黄仁勋被问了太多次这个问题干脆一次说清我们都要我们需要更多的铜缆产能更多的光芯片产能更多的CPO产能。十年前的DGX-18块Pascal GPU170 TFLOPS。十年后的Vera Rubin NVLink 723.6 ExaFLOPS。十年算力增长四千万倍。高吞吐的归Rubin低延迟的归Groq但还有一个问题没解决。NVLink 72在高吞吐区间几乎无敌72块GPU全对全互联带宽拉满。可一旦要求的不是400 token/秒而是1000 token/秒的极速推理NVLink 72的带宽就不够用了。这就是Groq的故事。英伟达在2025年底收购了推理芯片公司Groq后者以“LPU”Language Processing Unit著称。Groq的架构和英伟达GPU截然相反它是一颗确定性数据流处理器静态编译、编译器调度没有动态调度片上堆了500MB的巨量SRAM只干一件事推理。此前业界一直猜测英伟达会如何整合这项资产。答案来了不是替代GPU而是与GPU协同。一颗Groq芯片4GB SRAM一颗Rubin芯片288GB HBM。前者极致快后者极致大。单独用Groq装不下万亿参数模型和海量KV cache单独用Rubin推不到极速token生成。英伟达的解法是分离式推理用Dynamo推理框架把流水线拆开。Pre-fill和attention的计算量大交给Vera Rubindecode阶段的token生成对带宽敏感、对延迟敏感卸载给Groq。两颗极端不同的处理器通过以太网紧密耦合延迟减半。结果在最高价值的推理层级上再提升35倍吞吐量。同时解锁了此前根本不存在的新推理层级千token/秒级别的极速生成。黄仁勋给出了配比建议如果你的工作负载主要是高吞吐100%上Vera Rubin就够了。如果你有大量编程、工程级token生成需求拿出25%的数据中心功率给Groq。Groq 3芯片由三星代工已经量产预计Q3出货。而Vera Rubin的首个机架已经在微软Azure云上跑起来了。OpenClawAI时代的Linux时刻发布会的最后一部分老黄画风一转开始聊人类历史上最受欢迎的开源项目OpenClaw。OpenClaw能做什么老黄举例有人帮60岁的父亲自动化了整个精酿啤酒生意蓝牙连接酿造设备自动生成销售网站顾客可以直接下单“龙虾拉格啤酒”。但老黄更在意的是它的本质。他用操作系统的语言重新定义了OpenClaw资源管理可以调用大语言模型、访问文件系统、使用工具。调度系统能做cron jobs、分步执行、生成子Agent。I/O系统多模态输入输出你可以冲它挥手它给你发邮件。OpenClaw开源了Agent计算机的操作系统。就像Windows让我们创造了个人电脑OpenClaw让我们创造了个人Agent。Windows→PC时代Linux→服务器时代HTML→互联网时代Kubernetes→云时代OpenClaw→Agent时代。每一次平台转移都催生了一批改变世界的公司。企业IT的全部逻辑即将改写。老黄直接断言每家SaaS公司都将变成Agent-as-a-Service公司。ButAgent在企业网络中能访问敏感信息、执行代码、对外通信“你把这三件事连起来大声说出来再想一想……”所以英伟达与OpenClaw合作推出了企业版NeMo Claw加上了策略引擎、网络护栏、隐私路由器。老黄给出了他对未来企业的终极想象未来每个工程师都会有一个年度Token预算。他们年薪几十万美元我会在此基础上再给他们一半的金额作为Token额度。这已经是硅谷的新招聘筹码了你的offer里带多少TokenTwo More Thing在发布会上对于外界备受关注的下一代计算架构Feynman费曼老黄也做了预告并表示计算架构每年都会有新东西。Feynman将带来全新的GPU、LPULP 40和CPU Rosa。新一代的BlueField 5将连接下一代CPU与SuperNIC CX10并配合新的Kyber技术实现铜线与光学双扩展——这意味着Feynman将首次同时支持铜线与光学封装的水平扩展。老黄强调无论是铜线、光学还是CPO未来都需要更高的容量与带宽这正是Feynman的核心突破。此外他还透露NVIDIA 正与合作伙伴联合开发英伟达Space One一台将部署在太空的数据中心计算机开启“太空算力”的新篇章。太空中没有对流没有传导只有辐射散热。我们得想办法在太空里给GPU散热。不过我们有很多优秀的工程师在搞这件事。把GPU送上近地轨道这大概是“AI无处不在”最字面意义上的诠释了。直播回放https://www.youtube.com/watch?vjw_o0xr8MWU一键三连「点赞」「转发」「小心心」欢迎在评论区留下你的想法—完—今天你养虾了吗欢迎加入【龙虾养成讨论组】一起交流养虾经验扫码添加小助手加入社群记得备注【OPENCLAW】哦一键关注 点亮星标科技前沿进展每日见

相关文章:

黄仁勋:龙虾就是新操作系统!英伟达7种芯片拼出算力怪兽,放话2027营收万亿美元

梦晨 henry 发自 凹非寺量子位 | 公众号 QbitAI英伟达GTC 2026很不寻常,黄仁勋迟到了15分钟。今年有450家企业赞助、1000场技术分会、2000位演讲者、110台机器人,这样的规模已经不像一场技术会议,更像AI行业的年度朝圣。皮衣老黄站在舞台中央…...

MusePublic生成质量实测:面部结构准确率与光影一致性分析

MusePublic生成质量实测:面部结构准确率与光影一致性分析 1. 项目概述 MusePublic是一款专为艺术感时尚人像创作设计的轻量化文本生成图像系统。该系统基于专属大模型构建,采用安全高效的safetensors格式封装,针对艺术人像的优雅姿态、细腻…...

DeepSeek-OCR-2实用指南:如何优化识别效果,提升准确率

DeepSeek-OCR-2实用指南:如何优化识别效果,提升准确率 1. 认识DeepSeek-OCR-2的核心能力 DeepSeek-OCR-2是2026年发布的新一代OCR识别模型,采用了创新的DeepEncoder V2技术。与传统的从左到右扫描式OCR不同,它能够智能理解图像内…...

NEURAL MASK幻镜开发者案例:集成至自有CMS系统的API对接实践

NEURAL MASK幻镜开发者案例:集成至自有CMS系统的API对接实践 1. 项目背景与需求 在当今内容为王的时代,视觉素材处理已成为内容管理系统(CMS)的核心需求之一。传统的图片处理工具往往在处理复杂场景时力不从心,特别是…...

Vue 3 + TypeScript 开发必备:vue-tsc 类型检查实战指南(附常见错误解决)

Vue 3 TypeScript 开发实战:vue-tsc 类型检查深度解析与高频错误处理 当我们在Vue 3项目中引入TypeScript时,类型系统就像一位严格的代码审查员,而vue-tsc则是这位审查员的得力助手。作为专为Vue单文件组件设计的类型检查工具,vu…...

JetBrains激活失效终极指南:从Connection timed out到成功激活的全流程

JetBrains激活失效终极指南:从Connection timed out到成功激活的全流程 当你正沉浸在代码的世界里,突然IDE弹出一个冰冷的提示框:"Cannot obtain ticket from license server due to connectivity problem: Connection timed out"…...

【MCP 2026农业物联网对接终极指南】:3大协议兼容性陷阱、5类传感器接入失败根因与72小时上线实操手册

第一章:MCP 2026农业物联网对接全景概览MCP 2026 是面向现代农业场景设计的轻量级设备协同协议,专为低功耗传感器、边缘网关与云平台间高可靠数据交换而优化。其核心目标是在异构农业设备(如土壤墒情仪、气象站、智能灌溉控制器)与…...

嘉立创EDA vs Altium Designer:新手入门该选哪个?从安装到第一个PCB的完整对比

嘉立创EDA vs Altium Designer:新手入门该选哪个?从安装到第一个PCB的完整对比 当第一次踏入PCB设计领域时,选择合适的工具往往令人困惑。作为电子设计自动化(EDA)软件的两大代表,嘉立创EDA和Altium Design…...

Kubernetes上部署VASTBASE G100全攻略:从StatefulSet到CronJob备份

Kubernetes上部署VASTBASE G100全攻略:从StatefulSet到CronJob备份 在云原生技术席卷企业IT基础设施的今天,数据库容器化部署已成为提升业务敏捷性的关键一环。VASTBASE G100作为国产高性能数据库的代表,其与Kubernetes的深度整合能够为企业级…...

Ps2022版DR5插件安装全攻略:从扩展窗口消失到未签署报错的终极修复

1. DR5插件安装常见问题一览 刚拿到DR5插件时,我和大多数设计师朋友一样兴奋不已。这个号称能提升修图效率300%的神器,安装过程却给我上了生动的一课。记得那天深夜,我连续遭遇了扩展菜单消失和未签署报错两大难题,差点把鼠标摔了…...

单细胞测序质控分析(QC)实战指南:从数据加载到低质量细胞识别

1. 单细胞测序质控分析的重要性 第一次接触单细胞测序数据时,我被那些密密麻麻的数字表格搞得头晕眼花。直到导师指着某个样本说"这个细胞已经死了",我才恍然大悟——原来原始数据里藏着这么多"坑"。单细胞测序就像给每个细胞拍X光片…...

逆变器核心技术解析:从SPWM到IGBT的深度探索

1. 逆变器基础与SPWM调制原理 第一次拆解光伏逆变器时,我盯着电路板上密密麻麻的功率管发愣——这些黑色方块如何把电池的直流电变成家里插座用的交流电?后来在实验室用示波器捕捉到SPWM波形那刻,才真正理解这种"电子裁缝"般的调制…...

数字IC验证实战:从SystemVerilog到SVA断言的深度解析

1. SystemVerilog基础:从数据类型到线程通信 SystemVerilog作为数字IC验证的黄金语言,其数据类型系统比传统Verilog丰富得多。我刚开始接触动态数组时,经常混淆它和队列的用法,直到在项目中踩了几个坑才真正理解它们的差异。 1.1 …...

android mtk camera如何自定义默认拍照与录像分辨率

1. MTK Camera分辨率适配原理揭秘 MTK平台的Camera应用在启动时会自动选择与屏幕比例匹配的最佳分辨率。这个设计初衷是为了保证预览画面能够全屏显示,避免出现黑边影响用户体验。但实际开发中,我们经常遇到需要自定义默认分辨率的需求,比如追…...

Windows驱动垃圾清理完整教程:Driver Store Explorer帮你彻底释放系统空间

Windows驱动垃圾清理完整教程:Driver Store Explorer帮你彻底释放系统空间 【免费下载链接】DriverStoreExplorer Driver Store Explorer [RAPR] 项目地址: https://gitcode.com/gh_mirrors/dr/DriverStoreExplorer 你是否发现Windows系统盘空间越来越小&…...

打破物理束缚:ParsecVDisplay虚拟显示技术全方位实践指南

打破物理束缚:ParsecVDisplay虚拟显示技术全方位实践指南 【免费下载链接】parsec-vdd ✨ Virtual super display, upto 4K 2160p240hz 😎 项目地址: https://gitcode.com/gh_mirrors/pa/parsec-vdd 诊断显示困境:现代工作流中的物理限…...

达摩院春联生成模型实战:输入“吉祥”“平安”等祝福词,快速生成工整对联

达摩院春联生成模型实战:输入"吉祥""平安"等祝福词,快速生成工整对联 春节将至,家家户户都开始为贴春联做准备。传统春联虽然寓意美好,但往往千篇一律,缺乏个性。现在,借助达摩院Alic…...

MCP 2026新规落地倒计时:医疗机构数据加密、审计日志、跨境传输这3道关卡,你过了几道?

第一章:MCP 2026新规核心要义与合规演进全景 MCP 2026(Multi-Cloud Policy Framework 2026)是云原生治理领域里程碑式的合规框架升级,旨在统一跨公有云、私有云及边缘环境的策略执行语义,强化零信任架构下的动态策略编…...

Web安全入门:5分钟搞懂XSS漏洞与重定向漏洞的区别及防御方法

Web安全入门:XSS漏洞与重定向漏洞的本质区别及实战防御指南 刚接触Web安全的新手常被各种漏洞类型搞得晕头转向,尤其是XSS和重定向漏洞,表面看起来都与"跳转"相关,实则存在根本性差异。去年某电商平台就曾因混淆这两种漏…...

计算机视觉库对比:OpenCV vs MMRotate在旋转判断中的应用

计算机视觉库对比:OpenCV vs MMRotate在旋转判断中的应用 1. 引言 在图像处理的实际应用中,经常会遇到需要判断图片旋转角度的场景。比如用户上传的证件照可能是横着的,扫描的文档可能是倒置的,或者拍摄的照片因为手机方向不同而…...

软萌拆拆屋效果展示:国潮风(水墨+书法+印章)文化元素拆解

软萌拆拆屋效果展示:国潮风(水墨书法印章)文化元素拆解 1. 什么是软萌拆拆屋?——一件衣服的“解构美学”革命 你有没有想过,一件旗袍、一套汉服、甚至是一条扎染长裙,其实可以像打开一本立体书那样&…...

SEER‘S EYE预言家之眼模拟商业谈判场景:AI在博弈论中的策略分析应用

SEERS EYE预言家之眼模拟商业谈判场景:AI在博弈论中的策略分析应用 想象一下,你即将走进一场至关重要的商业谈判,对手是老谋深算的行业巨头。会议室里空气凝重,每一个提议、每一次让步都牵动着数百万的合同金额。你心里没底&…...

Nomic-Embed-Text-V2-MoE 在操作系统日志分析中的应用:异常行为模式挖掘

Nomic-Embed-Text-V2-MoE 在操作系统日志分析中的应用:异常行为模式挖掘 1. 引言 想象一下,你负责维护一个大型在线服务,每天服务器会产生上千万条日志。这些日志就像系统的“心电图”,记录着每一次心跳、每一次异常。某天凌晨&…...

OBS多平台同步推流插件:终极指南与完整配置方案

OBS多平台同步推流插件:终极指南与完整配置方案 【免费下载链接】obs-multi-rtmp OBS複数サイト同時配信プラグイン 项目地址: https://gitcode.com/gh_mirrors/ob/obs-multi-rtmp 在当今多平台直播成为主流趋势的背景下,内容创作者面临着同时向多…...

OBS多平台直播终极指南:obs-multi-rtmp插件完整使用教程

OBS多平台直播终极指南:obs-multi-rtmp插件完整使用教程 【免费下载链接】obs-multi-rtmp OBS複数サイト同時配信プラグイン 项目地址: https://gitcode.com/gh_mirrors/ob/obs-multi-rtmp 还在为每次直播都要手动切换平台而烦恼吗?想同时推流到B…...

cv_resnet101_face-detection_cvpr22papermogface 效果深度评测:高精度人脸定位案例展示

cv_resnet101_face-detection_cvpr22papermogface 效果深度评测:高精度人脸定位案例展示 1. 引言 人脸检测,听起来是个挺酷的技术,但你可能不知道,它在咱们日常生活中的应用已经无处不在。从手机解锁、美颜相机,到商…...

零编码损耗视频剪辑神器:5个理由让你立即爱上LosslessCut

零编码损耗视频剪辑神器:5个理由让你立即爱上LosslessCut 【免费下载链接】lossless-cut The swiss army knife of lossless video/audio editing 项目地址: https://gitcode.com/gh_mirrors/lo/lossless-cut 你是否曾为视频剪辑时的画质损失而烦恼&#xff…...

OBS多平台直播终极指南:obs-multi-rtmp插件一键实现同步推流

OBS多平台直播终极指南:obs-multi-rtmp插件一键实现同步推流 【免费下载链接】obs-multi-rtmp OBS複数サイト同時配信プラグイン 项目地址: https://gitcode.com/gh_mirrors/ob/obs-multi-rtmp 想要同时向多个平台直播却苦于复杂的设置?obs-multi…...

番茄小说下载器终极指南:三步打造你的离线小说图书馆

番茄小说下载器终极指南:三步打造你的离线小说图书馆 【免费下载链接】Tomato-Novel-Downloader 番茄小说下载器不精简版 项目地址: https://gitcode.com/gh_mirrors/to/Tomato-Novel-Downloader 你是否经常遇到网络信号不好,想看的番茄小说加载缓…...

Qwen3-ForcedAligner-0.6B优化技巧:提升对齐精度与处理速度

Qwen3-ForcedAligner-0.6B优化技巧:提升对齐精度与处理速度 1. 理解强制对齐模型的核心挑战 强制对齐技术看似简单——把已知文本与对应音频的时间轴匹配起来,但实际应用中会遇到几个关键瓶颈。我在处理超过500小时的语音数据后发现,90%的精…...