当前位置: 首页 > article >正文

谷歌推出两款全新TPU芯片,驱动AI训练与推理新浪潮

谷歌有限责任公司在2026年谷歌云Next大会上发布了两款专为人工智能设计的定制芯片推出了分别面向训练与推理任务的两种张量处理器TPU架构第八代TPU 8t与TPU 8i。谷歌表示这两款芯片的设计初衷是应对下一代AI工作负载并针对市场上不同的需求进行了明确分工。AI计算主要涉及两大核心任务构建模型与运行模型。随着AI智能体的快速兴起市场对于能够承担推理任务大脑角色的强大AI模型以及支撑其在云端运行的高性能硬件需求持续攀升。前一代芯片Ironwood TPU被定位为推理时代的单一旗舰平台而谷歌此次将最新一代芯片拆分为两种独立架构分别专注于大规模训练与高并发推理以支撑智能体时代的到来。TPU 8t重塑AI训练体验谷歌表示TPU 8t专为大规模预训练和嵌入密集型工作负载而优化采用3D环形网络拓扑结构谷歌称这一技术已在更大规模的芯片网络中验证了良好的扩展性。与上一代相比TPU 8t可在单个集群中连接9600块芯片而Ironwood仅支持9216块。TPU 8t配备了SparseCore专用加速器能够处理大语言模型查找过程中常见的不规则内存访问问题同时支持原生四位浮点运算以突破内存带宽优化瓶颈。这使得训练速度更快模型压缩效果更佳在保持精度的同时吞吐量提升一倍内存占用显著降低。通过一种称为量化的技术降低每个参数所需的比特数可以在性能较低的系统上运行更大的模型从而降低能耗、缩小本地硬件占用空间并实现更高的利用率峰值。谷歌表示此次目标是以更低成本抢占训练市场。谷歌声称在大规模训练场景下TPU 8t相较于Ironwood TPU的每美元性能提升幅度高达2.7倍。TPU 8i加速模型部署落地模型训练完成并准备就绪后便需要投入实际使用这正是推理发挥作用的场景也是谷歌认为TPU 8i大放异彩之处。TPU 8i通过高带宽内存与专用网络拓扑专注于训练后优化与高并发推理助力大型模型高效服务。TPU 8i搭载的静态随机存取内存容量是Ironwood的三倍可在大语言模型推理时缓存更大的键值对从而显著加速文本生成。此外谷歌还构建了一套名为Collectives Acceleration Engine的推理系统专门处理自回归解码与思维链过程中所需的规约与同步步骤。为了将更多芯片互联并构建一个所有芯片均可互见的系统谷歌开发了名为Boardfly ICI的定制网络拓扑结构最多可互联1152块芯片。通过缩短网络直径和数据包穿越系统所需的跳转次数有效降低网络延迟。谷歌表示这一设计将全对全通信所需的跳转次数整体降低了多达50%而全对全通信对于混合专家架构大语言模型及推理模型的推理任务至关重要。在成本方面谷歌表示TPU 8i在低延迟目标下尤其是在服务超大规模混合专家前沿模型时相较于Ironwood的每美元性能提升幅度约为80%。谷歌补充称两款芯片相较于上一代产品每瓦性能均提升了一倍。QAQ1TPU 8t和TPU 8i有什么区别分别适用于哪些场景ATPU 8t专为大规模AI模型训练设计采用3D环形网络拓扑支持9600块芯片互联并内置SparseCore加速器和四位浮点运算适合预训练和嵌入密集型任务。TPU 8i则专注于模型推理场景配备三倍于Ironwood的静态随机存取内存并搭载Collectives Acceleration Engine推理系统适合高并发、低延迟的大语言模型服务。Q2TPU 8i的Boardfly ICI网络拓扑有什么作用ABoardfly ICI是谷歌为TPU 8i专门开发的定制网络拓扑结构最多可将1152块芯片互联成一个整体系统。其核心优势在于通过缩短网络直径和减少数据传输的跳转次数来降低延迟并将全对全通信所需跳转次数整体降低多达50%这对于混合专家架构大语言模型的推理任务尤为关键。Q3TPU 8t相比上一代Ironwood TPU在性能和成本上有哪些提升A在性能方面TPU 8t支持的单集群芯片互联数量从9216块提升至9600块吞吐量翻倍同时内存占用更小。在成本效益方面谷歌声称TPU 8t在大规模训练场景下每美元性能提升高达2.7倍。此外TPU 8t的每瓦性能也比Ironwood提升了一倍有助于降低整体能耗成本。

相关文章:

谷歌推出两款全新TPU芯片,驱动AI训练与推理新浪潮

谷歌有限责任公司在2026年谷歌云Next大会上发布了两款专为人工智能设计的定制芯片,推出了分别面向训练与推理任务的两种张量处理器(TPU)架构:第八代TPU 8t与TPU 8i。谷歌表示,这两款芯片的设计初衷是应对下一代AI工作负…...

告别盲人摸象:用Python脚本模拟Tester,手把手带你玩转UDS诊断(ISO 14229)

告别盲人摸象:用Python脚本模拟Tester,手把手带你玩转UDS诊断(ISO 14229) 在汽车电子开发与测试领域,UDS(Unified Diagnostic Services)协议作为ISO 14229标准的核心,已成为ECU诊断的…...

WinForm 中轻松绘制实时曲线,彻底告别图表控件焦虑

前言工业监控、科学实验或金融分析等场景中,数据可视化是不可或缺的一环。尤其当面对动态变化的实时数据时,如何高效、清晰地呈现趋势与异常,成为上位机软件开发的关键挑战。传统的图表控件往往功能有限、扩展性差,而完全自绘又耗…...

告别Errno 5!保姆级教程:用Rufus制作NTFS格式Ubuntu启动盘,完美解决双系统安装报错

彻底解决Ubuntu双系统安装中的Errno 5错误:NTFS启动盘制作全指南 当你在Windows电脑上尝试安装Ubuntu双系统时,是否遇到过这样的场景:安装过程看似顺利,却在最后阶段突然弹出"[Errno 5] Input/output error"的错误提示&…...

语言模型记忆架构:KV与FFN记忆技术解析

1. 语言模型记忆架构:从理论到实践的深度解析在当今大规模语言模型(LLM)快速发展的背景下,如何高效地存储和检索海量知识成为关键挑战。传统Transformer架构将所有知识编码在稠密参数中,导致模型体积庞大且推理效率低下…...

Edge浏览器油猴插件Tampermonkey保姆级配置指南:从安装到脚本管理全流程

Edge浏览器Tampermonkey终极配置指南:从新手到脚本管理大师 在浏览器扩展生态中,Tampermonkey(俗称"油猴")无疑是提升效率的神器。它像是一个万能遥控器,通过安装各种脚本,可以解锁网页的隐藏功能…...

Kaggle老手都在用的随机森林调参避坑指南:从特征重要性到OOB误差的实战技巧

Kaggle老手都在用的随机森林调参避坑指南:从特征重要性到OOB误差的实战技巧 在数据科学竞赛和工业级模型优化中,随机森林因其出色的表现和相对简单的调参流程,成为众多从业者的首选算法。然而,真正掌握随机森林的调参技巧&#xf…...

别再乱叠层了!四层、六层、八层PCB板分层实战指南(附Altium Designer设置要点)

多层PCB设计实战:从四层到八层的叠层策略与Altium Designer实现 在高速数字电路和射频系统设计中,PCB叠层结构的选择直接影响信号完整性、电源分配和电磁兼容性。许多工程师在面对四层、六层和八层板设计时,常常陷入"层数越多越好"…...

保姆级教程:用Wireshark抓包+rsyslogd -dn调试,5分钟定位你的日志转发故障

运维侦探实战:三大利器精准定位日志转发故障 日志系统是运维工程师的"眼睛",但当这双眼睛突然失明时,如何快速恢复视力?想象一下凌晨三点,你被警报吵醒,发现关键业务日志全部失踪,而明…...

终极B站视频下载指南:3分钟掌握跨平台批量下载技巧

终极B站视频下载指南:3分钟掌握跨平台批量下载技巧 【免费下载链接】BilibiliDown (GUI-多平台支持) B站 哔哩哔哩 视频下载器。支持稍后再看、收藏夹、UP主视频批量下载|Bilibili Video Downloader 😳 项目地址: https://gitcode.com/gh_mirrors/bi/B…...

别等出事再翻手册!给华为云Stack做个“体检”:手把手搭建你的应急预案知识库与演练沙盒

华为云Stack主动防御体系:构建高可用应急预案与实战演练系统 当云平台突发故障时,翻阅厚达数百页的应急预案手册绝非理想选择。本文将揭示如何将华为云Stack的应急预案转化为可即时调用的"数字肌肉记忆",通过系统化知识库与沙盒演练…...

如何快速掌握IDR:终极Delphi反编译器完整指南 [特殊字符]

如何快速掌握IDR:终极Delphi反编译器完整指南 🚀 【免费下载链接】IDR Interactive Delphi Reconstructor 项目地址: https://gitcode.com/gh_mirrors/id/IDR IDR(Interactive Delphi Reconstructor)是一款专为Windows环境…...

DistroAV NDI插件终极配置指南:从零构建专业音视频网络

DistroAV NDI插件终极配置指南:从零构建专业音视频网络 【免费下载链接】obs-ndi DistroAV (formerly OBS-NDI): NDI integration for OBS Studio 项目地址: https://gitcode.com/gh_mirrors/ob/obs-ndi DistroAV(原OBS-NDI)是专为OBS…...

避坑指南:在VisionMaster二次开发中调用OpenCV等第三方DLL的完整流程与常见问题

VisionMaster二次开发中集成OpenCV的九大避坑实战指南 当你在VisionMaster平台上尝试扩展视觉算法能力时,OpenCV往往是首选工具库。但许多工程师在集成过程中都遭遇过这样的困境:明明在VS中编译通过,一部署到VisionMaster环境就频繁报错。本文…...

告别Keil!用STM32CubeIDE+GCC+J-Link从零点亮STM32G030的LED(保姆级图文)

从零构建STM32G030开发环境:基于开源工具链的实战指南 在嵌入式开发领域,商业IDE长期占据主导地位,但开源工具链的成熟让开发者有了更多选择。本文将手把手带您使用STM32CubeIDEGCCJ-Link这套完全免费的工具组合,在STM32G030C8T6开…...

VideoDownloadHelper:智能网页视频解析与下载的Chrome扩展解决方案

VideoDownloadHelper:智能网页视频解析与下载的Chrome扩展解决方案 【免费下载链接】VideoDownloadHelper Chrome Extension to Help Download Video for Some Video Sites. 项目地址: https://gitcode.com/gh_mirrors/vi/VideoDownloadHelper 在当今数字化学…...

Better BibTeX架构深度解析:为LaTeX用户提供高效文献管理解决方案

Better BibTeX架构深度解析:为LaTeX用户提供高效文献管理解决方案 【免费下载链接】zotero-better-bibtex Make Zotero effective for us LaTeX holdouts 项目地址: https://gitcode.com/gh_mirrors/zo/zotero-better-bibtex Better BibTeX (BBT) 作为Zotero…...

基于Gemini AI的视频会议智能分析与结构化提取

1. 项目概述:从视频会议中提取结构化洞察的智能工作流作为一名长期从事AI和MLOps实践的工程师,我经常需要处理大量视频会议记录。每次会议结束后,那些关键决策、待办事项和技术细节就像沙滩上的字迹,随着时间流逝逐渐模糊。传统的…...

打造企业级网络监控:自定义插件开发终极指南

打造企业级网络监控:自定义插件开发终极指南 【免费下载链接】SmokePing The Active Monitoring System 项目地址: https://gitcode.com/gh_mirrors/smo/SmokePing 在当今复杂的网络环境中,构建可靠的自定义网络监控插件已成为技术团队的核心竞争…...

别再死记硬背Fama-French模型了!用Python实战带你搞懂因子投资的核心逻辑

用Python实战拆解Fama-French三因子模型:从数据获取到策略回测全流程 在量化投资的工具箱里,Fama-French三因子模型就像瑞士军刀般经典。但大多数教程要么停留在理论推导,要么给出黑箱代码。本文将用Jupyter Notebook逐行演示如何用Python实现…...

无名杀:在浏览器中体验三国杀策略对决的现代开源方案

无名杀:在浏览器中体验三国杀策略对决的现代开源方案 【免费下载链接】noname 项目地址: https://gitcode.com/GitHub_Trending/no/noname 想象一下,一款经典的三国杀卡牌游戏,无需安装任何客户端,直接在浏览器中就能畅玩…...

从PCB Layout到负载电容计算:手把手教你搞定25MHz以太网PHY晶振电路设计

25MHz以太网PHY晶振电路设计实战:从理论计算到PCB布局的完整指南 在工业通信和车载以太网系统中,25MHz晶振电路的稳定性直接决定了整个网络的传输质量。我曾在一个智能工厂项目中遇到过这样的案例:由于晶振负载电容计算偏差导致PHY芯片时钟漂…...

如何快速永久保存Jable视频?5步终极下载指南

如何快速永久保存Jable视频?5步终极下载指南 【免费下载链接】jable-download 方便下载jable的小工具 项目地址: https://gitcode.com/gh_mirrors/ja/jable-download 你是否曾经遇到过这样的困扰:在Jable.tv上发现了一个精彩的视频,想…...

从PCI到PCIe:一个老工程师的硬件调试笔记,聊聊那些年我们踩过的总线坑

从PCI到PCIe:一个老工程师的硬件调试笔记,聊聊那些年我们踩过的总线坑 记得2003年第一次调试PCI采集卡时,我在实验室熬了三个通宵。那块工控主板上的PCI插槽就像个脾气古怪的老头——明明硬件连接没问题,设备管理器里却死活找不到…...

键盘控制鼠标终极指南:如何用Mouseable彻底解放你的双手

键盘控制鼠标终极指南:如何用Mouseable彻底解放你的双手 【免费下载链接】mouseable Mouseable is intended to replace a mouse or trackpad. 项目地址: https://gitcode.com/gh_mirrors/mo/mouseable 你是否曾经在长时间使用鼠标后感到手腕酸痛&#xff1f…...

PyTorch深度学习框架核心技术与实战应用

1. PyTorch与深度学习全景图PyTorch作为当前最活跃的深度学习框架之一,其设计哲学与实现方式完美诠释了现代深度学习的核心要义。我第一次接触PyTorch是在2017年处理一个图像分割项目时,当时被其动态计算图的灵活性所震撼——这种设计让研究者能够像写Py…...

Midjourney创意玩法:用‘A out of B’提示词,把iPhone变成钻石、把山变成黄金的脑洞生成术

Midjourney创意炼金术:用"A out of B"重构视觉想象的21种高阶玩法 当数字画布遇上跨界材质重组,AI艺术创作便进入了全新的化学反应阶段。在Midjourney的魔法工具箱里,"A out of B"这个看似简单的语法结构,实则…...

MapTR模型训练与预测全流程解析:从NuScenes-mini数据准备到可视化结果生成

MapTR模型训练与预测全流程解析:从NuScenes-mini数据准备到可视化结果生成 在自动驾驶领域,高精地图构建一直是核心技术挑战之一。传统方法依赖昂贵的激光雷达设备和复杂的后处理流程,而基于视觉的BEV(鸟瞰图)感知技术…...

不止是调色盘:用LVGL Color Picker为你的IoT设备打造个性化主题

从调色盘到用户体验革命:LVGL颜色选择器在智能设备中的高阶应用 当智能手表在手腕上轻轻震动,屏幕从深邃的午夜蓝渐变为充满活力的珊瑚橙时,这种微妙却个性化的交互瞬间,往往成为用户与设备建立情感连接的关键触点。在嵌入式设备G…...

一键下载网页视频:Video Download Helper 高效实用指南

一键下载网页视频:Video Download Helper 高效实用指南 【免费下载链接】VideoDownloadHelper Chrome Extension to Help Download Video for Some Video Sites. 项目地址: https://gitcode.com/gh_mirrors/vi/VideoDownloadHelper 还在为无法保存网页视频而…...