当前位置: 首页 > news >正文

深度解读英伟达新一轮对华特供芯片H20、L20、L2的定位



大家好,我是极智视界,欢迎关注我的公众号,获取我的更多前沿科技分享

邀您加入我的知识星球「极智视界」,星球内有超多好玩的项目实战源码和资源下载,链接:https://t.zsxq.com/0aiNxERDq

因为一直从事 AI 工作,所以对于英伟达的卡会关注的比较多,从刚入行时候的 TITAN 到 20、30、40、A100、H100,从 T4 到 A10、L4,大多都接触过 (当然除了 H100)。这次英伟达要给咱们特供芯片,不是首次,上一次是特供版的 A800、H800,那时候的禁令里边还没有算力密度的限制,所以 A800、H800 也是满算力的,只是带宽给降低了。后来,美国升级了尖端芯片禁令,加入了算力密度 PD 的限制,一方面直接限制了 A800、H800 的出售,另一方面还间接抑制了咱们的 Chiplet 芯粒堆叠技术突破的可能性。这样一来,限制可谓是全方位的。关于这方面,我之前写过一篇解读 <极智AI | 老美升级芯片禁令限制中的性能指标到底指什么>,有兴趣的同学可以去看看。

对于英伟达,一家以利益为先的商业企业,虽然只能 "服从安排",但是肯定不甘,也只能见招拆招了。所以这又一次特供的三款芯片,肯定会照着最新的芯片法案,好好读透它然后绕开它。说实话其实很难绕,因为限制的很死,估计只能阉割降算力。这里需要注意的一点是,对于禁令中的算力限制,主要是针对浮点算力,浮点算力是干嘛的大家应该清楚,说白了就是限制 AI 训练。

从三块型号 H20、L20、L2 来看,H20 应该是训练卡,而 L20、L2 应该是推理卡,H20 基于最新的 Hopper 架构,而 L20、L2 则基于 Ada 架构。来看这几款芯片的性能参数,

据我所知,同为 Ada 架构 L 推理系列的 L4 并没有被禁 (禁的只是 L40S),所以上面的表格中我也特意加入了 NVIDIA L4 的性能数据,以方便直接对比,这样看其实 L20 和 L2 的定位就会比较尴尬一些。先来看 L20、L2 的定位,从性能参数来看,L20 基本会是 2x 的 L2,而 L2 一定会是张半高半长的计算卡,这么看 L20 应该是张全高全长的加速卡。L20 应该会是阉割版的 L40,产品形态应该和 L40 长得一致,如下,

而 L2 会是阉割版的 L4,产品形体应该和 L4 的一致,如下,

我翻了下上一代全高全长卡 A10 的参数,基本上这次的 L20 和上一代 A10 会持平 (L20 的显存带宽会高一点),这样的水平定位应该会比较清楚了。因为 A10 现在还是比较容易可以买到的,所以这对于你是否会入 L20 是个参考。而对于 L2,它的定位应该是介于 T4 和 L4 之间的一款计算卡,它的 INT8 Tensor Core 算力 193 TOPS,也是会介于 L4 485 TOPS 和 T4 130 TOPS 之间的。L2 的功耗虽然网上没有数据,但是很好猜测,估计在 70 ~ 75W 之间,这是这个级别推理卡的标配。这样,对于 L2 的选购也有了一定的参考。

咱们再来分析 H20 的定位,H20 是明显这几款加速卡中最先进的那个,因为它是 Hopper 架构,而其他是 Ada 架构。而从目前的市面上来看,Hopper 架构的卡除了 RTX 40 消费级显卡外,专业的计算卡你是买不到的,所以 H20 必定是个稀罕货。从算力、功耗、互联来看,H20 主要用于训练,而其他主要用于推理;而从显存、显存带宽、浮点算力、MIG、编解码能力、是否支持 NVLink 互联等综合来看,明显 H20 和其他卡不在一个层次 (当然直接用训练卡和推理卡这么对比是不公平的)。由于 A100、H100、A800、H800 被禁了,高端的训练卡是咱们最缺的,是紧俏货,所以 H20 会很香。对于英伟达来说,H20 应该会比 L20、L2 好卖太多;但对老美来说,他们知道我们缺的是什么,他们知道我们想要的是什么。我们想要什么,他们就越不想给。

L20、L2 不是咱们的急需,也不是咱们的痛点。对于这类推理卡,咱们有很多选择的余地,比如 NVIDIA L4、比如咱们一众的国产推理卡。甚至从这个角度,英伟达特供的 L20、L2,对咱们来说并算不上什么 "好事"。怎么说呢,目前 NVIDIA T4 卡已经停产挺久,各厂家都在推 "更新换代",若要用英伟达的卡就基本是要往前推上 L4,而 L4 的性能基本是 T4 的三倍左右,这个跨度还是挺大的。而咱们国产的推理卡,基本就是对标 T4,对于用户来说由于很多场景可能已经适应 T4 的算力,再加上性价比、国产化替代的考虑,使用国产卡平替 T4 可能会是个不错的选择。而 L20、L2 的推出,又给 T4 的 "国产化替代" 带来了一些不确定性。对于更多会考虑生态、考虑可用性、而非国产化替代的产商来说,本来可能是会考虑选择国产卡,但现在来说,L2、L20 似乎是个更加不错的选择,因为这样你的软件生态就能直接延续下来,而不用大规模重新开发。

而 H20 的情况则完全完全不同,国产卡做的比较好的、比较能够拿得出手的主要在推理卡,对于训练卡,大规模商业化的并不算多,大家可能熟知一些是昇腾 910、昇腾910b 这些。对于训练卡,在禁令下各种高端 NVIDIA 训练卡禁售的情况下,加上国产卡平替的一言难尽,国内高端训练卡的供需情况可想而知,若用 "饥渴" 来形容也不为过。所以,对于咱们来说,L20、L2 是个锦上添花的东西,而 H20 是真正雪中送炭的东西。

但从目前的消息来看,英伟达会推迟面向咱们销售 H20,此番深意,你可细品,便略知一二。


【极智视界】

《深度解读英伟达新一轮对华特供芯片H20、L20、L2的定位》

畅享人工智能的科技魅力,让好玩的AI项目不难玩。邀请您加入我的知识星球,星球内我精心整备了大量好玩的AI项目,皆以工程源码形式开放使用,涵盖人脸、检测、分割、多模态、AIGC、自动驾驶、工业等。一定会对你学习有所帮助,也一定非常好玩,并持续更新更加有趣的项目。https://t.zsxq.com/0aiNxERDq

​​​​

相关文章:

深度解读英伟达新一轮对华特供芯片H20、L20、L2的定位

大家好&#xff0c;我是极智视界&#xff0c;欢迎关注我的公众号&#xff0c;获取我的更多前沿科技分享 邀您加入我的知识星球「极智视界」&#xff0c;星球内有超多好玩的项目实战源码和资源下载&#xff0c;链接&#xff1a;https://t.zsxq.com/0aiNxERDq 因为一直从事 AI 工…...

一起学docker系列之九docker运行mysql 碰到的各种坑及解决方法

目录 前言1 Docker 运行mysql命令2 坑一&#xff1a;无法读取/etc/mysql/conf.d目录的问题3 坑二&#xff1a;/tmp/ibnr0mis 文件无法创建/写入的问题4 坑三&#xff1a;Navicat 连接错误&#xff08;1045-access denied&#xff09;5 坑四&#xff1a;MySQL 登录失败问题结语 …...

利用Nginx与php处理方式不同绕过Nginx_host实现SQL注入

目录 首先需要搭建环境 nginxphpmysql环境&#xff1a; 搭建网站 FILTER_VALIDATE_EMAIL 绕过 方法1&#xff1a;冒号号分割host字段 方法2&#xff1a;冒号号分割host字段 方法3&#xff1a;SNI扩展绕过 首先需要搭建环境 nginxphpmysql环境&#xff1a; php安装包&a…...

分割list 批量插入数据指定条数数据

一、代码层面切割好list&#xff0c;然后插入 // package org.apache.commons.collections4; 先将list切成1000条一份 List<List<DeptDO>> p1 ListUtils.partition(deptList, 1000); for (List<DeptDO> deptDOS : p1) { // 1000条一次批量插入systemDeptMa…...

Arduino库之 LedControl 库说明文档

LedControl 库最初是为基于 8 位 AVR 处理器的 Arduino 板编写的。用于通过MAX7219芯片控制LED矩阵和7段数码管。但由于该代码不使用处理器的任何复杂的内部功能&#xff0c;因此具有高度可移植性&#xff0c;并且应该在任何支持 和 功能的 Arduino&#xff08;类似&#xff09…...

Hadoop学习总结(MapReduce的数据去重)

现在假设有两个数据文件 file1.txtfile2.txt2018-3-1 a 2018-3-2 b 2018-3-3 c 2018-3-4 d 2018-3-5 a 2018-3-6 b 2018-3-7 c 2018-3-3 c2018-3-1 b 2018-3-2 a 2018-3-3 b 2018-3-4 d 2018-3-5 a 2018-3-6 c 2018-3-7 d 2018-3-3 c 上述文件 file1.txt 本身包含重复数据&…...

ctfshow sql

180 过滤%23 %23被过滤&#xff0c;没办法注释了&#xff0c;还可以用’1’1来闭合后边。 或者使用--%0c-- 1%0corder%0cby%0c3--%0c--1%0cunion%0cselect%0c1,2,database()--%0c--1%0cunion%0cselect%0c1,2,table_name%0cfrom%0cinformation_schema.tables%0cwhere%0ctable_…...

Java实现求最大值

1 问题 接收用户输入的3个整数&#xff0c;如何将最大值作为结果输出。 2 方法 采用“截图文字代码”的方式描述。 引入输入包调用main()函数&#xff0c;提示并接收用户输入的3个整数&#xff0c;并交由变量a b c来保存。对接收的3个数据进行比较&#xff0c;先比较a和b&#…...

NX二次开发UF_CURVE_ask_curve_inflections 函数介绍

文章作者&#xff1a;里海 来源网站&#xff1a;https://blog.csdn.net/WangPaiFeiXingYuan UF_CURVE_ask_curve_inflections Defined in: uf_curve.h int UF_CURVE_ask_curve_inflections(tag_t curve_eid, double proj_matrx [ 9 ] , double range [ 2 ] , int * num_infpt…...

一个基于RedisTemplate静态工具类

每次是用RedisTemplate的时候都需要进行自动注入实在是太麻烦了&#xff0c;于是找到一个讨巧的办法。 import org.springframework.beans.factory.annotation.Autowired; import org.springframework.data.redis.core.RedisTemplate; import org.springframework.stereotype.…...

【计算机网络笔记】数据链路层——差错编码

系列文章目录 什么是计算机网络&#xff1f; 什么是网络协议&#xff1f; 计算机网络的结构 数据交换之电路交换 数据交换之报文交换和分组交换 分组交换 vs 电路交换 计算机网络性能&#xff08;1&#xff09;——速率、带宽、延迟 计算机网络性能&#xff08;2&#xff09;…...

js生成pdf并自动上传

1.生成pdf前要让js选中生成pdf部分的dom <div id"printPageFirst"> pdf内容区 </div> 2.使用两个插件&#xff0c;import到项目里&#xff0c;然后是获取dom进行生成pdf操作 import html2canvas from html2canvas import JsPDF from jspdf function cr…...

高品质MP3音频解码语音芯片WT2003Hx的特征优势与应用场景

在现代化科技快速发展的时代&#xff0c;高品质音频语音芯片在各个领域的应用越来越广泛。唯创知音推出的高品质MP3音频语音芯片WT2003Hx&#xff0c;凭借其出色的特性与优势&#xff0c;赢得了市场的广泛认可。本文将详细介绍WT2003Hx的特征优势以及其在各个领域的应用场景。 …...

浅析linux中的信号

人们往往将信号称为“软件中断”&#xff0c;它提供了异步事件的处理机制&#xff0c;这些事件可以来自系统外部&#xff08;如用户按下ctrlc产生中断符&#xff09;&#xff0c;也可能来自程序或者内核内部的执行动作&#xff08;如进程除零操作&#xff09;。进程收到信号&am…...

从0开始学习JavaScript--JavaScript数据类型与数据结构

JavaScript作为一门动态、弱类型的脚本语言&#xff0c;拥有丰富的数据类型和数据结构&#xff0c;这些构建了语言的基础&#xff0c;为开发者提供了灵活性和表达力。本文将深入探讨JavaScript中的各种数据类型&#xff0c;包括基本数据类型和复杂数据类型&#xff0c;并介绍常…...

数据结构与算法编程题20

统计二叉树的叶结点个数。 #define _CRT_SECURE_NO_WARNINGS#include <iostream> using namespace std;typedef char ElemType; #define ERROR 0 #define OK 1 typedef struct BiNode {ElemType data;BiNode* lchild, * rchild; }BiNode,*BiTree;bool Create_tree(BiTre…...

FreeRTOS源码阅读笔记5--mutex

互斥量是一种特殊的二值信号量&#xff0c;拥有优先级继承的机制&#xff0c;所以适合用在临界资源互斥访问。 5.1创建互斥量xSemaphoreCreateMutex() 5.1.1函数原型 5.1.2函数框架 5.2创建递归互斥量xSemaphoreCreateRecursiveMutex() 5.2.1函数原型 5.2.2函数框架 xSemaph…...

STM32_7(ADC)

一、ADC ADC&#xff08;Analog-Digital Converter&#xff09;模拟-数字转换器ADC可以将引脚上连续变化的模拟电压转换为内存中存储的数字变量&#xff0c;建立模拟电路到数字电路的桥梁12位逐次逼近型ADC&#xff0c;1us转换时间输入电压范围&#xff1a;0~3.3V&#xff0c;…...

Flink实战(11)-Exactly-Once语义之两阶段提交

0 大纲 [Apache Flink]2017年12月发布的1.4.0版本开始&#xff0c;为流计算引入里程碑特性&#xff1a;TwoPhaseCommitSinkFunction。它提取了两阶段提交协议的通用逻辑&#xff0c;使得通过Flink来构建端到端的Exactly-Once程序成为可能。同时支持&#xff1a; 数据源&#…...

日志技术logback

一&#xff0c;日志概括 二&#xff0c;日志技术的特点 三&#xff0c;日志技术的体系 三&#xff0c;入门 四&#xff0c;案例 package XinZheng;import org.slf4j.Logger; import org.slf4j.LoggerFactory;public class Main58 {//1,创建一个Logger日志对象public static fi…...

MATLAB/Simulink仿真研究:基于下垂控制的蓄电池SOC均衡策略

MATLAB/Simulink仿真&#xff0c;蓄电池SOC均衡 采用下垂控制&#xff0c;根据自身容量选择出力&#xff0c;直流母线电压、功率保持稳定无波动 MATLAB/Simulink仿真&#xff0c;蓄电池SOC均衡&#xff08;锂电池&#xff09; 根据微网内功率盈余&#xff0c;两组SOC不同的蓄电…...

PyTorch张量并行技术解析与实战指南

1. 理解张量并行技术在训练超大规模Transformer模型时&#xff0c;单张GPU的内存容量往往成为瓶颈。张量并行&#xff08;Tensor Parallelism&#xff09;是一种模型并行技术&#xff0c;它通过将单个张量沿特定维度切分&#xff0c;将计算任务分配到多个设备上执行。这种技术最…...

ZYNQ实战:手把手教你用LWIP实现UDP文件传输到DDR(附完整代码)

ZYNQ LWIP UDP文件传输实战&#xff1a;从协议栈配置到DDR存储的完整实现 在嵌入式系统开发中&#xff0c;网络通信功能已成为现代SoC设计的标配能力。Xilinx ZYNQ系列凭借其ARM处理器与可编程逻辑的完美结合&#xff0c;为开发者提供了灵活高效的网络通信解决方案。本文将深入…...

避坑指南:S32K1xx系列Flash操作的那些“对齐”陷阱与中断安全

S32K1xx系列Flash操作实战&#xff1a;规避对齐陷阱与中断安全的最佳实践 在嵌入式开发中&#xff0c;Flash操作一直是系统可靠性的关键环节。S32K1xx系列微控制器凭借其出色的性能和丰富的外设资源&#xff0c;在汽车电子和工业控制领域广受欢迎。然而&#xff0c;许多开发者在…...

XUnity.AutoTranslator完整指南:为Unity游戏开启实时翻译新时代

XUnity.AutoTranslator完整指南&#xff1a;为Unity游戏开启实时翻译新时代 【免费下载链接】XUnity.AutoTranslator 项目地址: https://gitcode.com/gh_mirrors/xu/XUnity.AutoTranslator 想要畅玩日系游戏却苦于语言障碍&#xff1f;XUnity.AutoTranslator就是你的终…...

避坑指南:VASP+Phonopy做QHA计算时,如何解决虚频和体积计算为0的问题?

VASPPhonopy QHA计算实战&#xff1a;虚频诊断与体积异常解决方案 当你在深夜的实验室里盯着屏幕上刺眼的"Warning: has imaginary modes"提示&#xff0c;或是发现v-e.dat文件中那一串诡异的零值时&#xff0c;那种挫败感我深有体会。QHA&#xff08;准谐近似&#…...

告别玄学调参:用Python+EXIT图可视化分析你的LDPC码性能

告别玄学调参&#xff1a;用PythonEXIT图可视化分析你的LDPC码性能 在通信系统设计中&#xff0c;LDPC码因其接近香农限的性能而备受青睐。然而&#xff0c;许多工程师在实际调参过程中常常陷入"试错-仿真-再试错"的循环&#xff0c;不仅效率低下&#xff0c;也难以系…...

告别黑框!手把手教你用UEFI HII给固件写个图形化配置界面(附完整代码)

从命令行到图形化&#xff1a;UEFI HII实战开发指南 在固件开发领域&#xff0c;命令行界面&#xff08;CLI&#xff09;长期以来是配置系统参数的主要方式。但随着用户对友好交互体验的需求增长&#xff0c;图形化配置界面已成为现代固件的标配。UEFI Human Interface Infrast…...

ACPI _DSM方法全解析:从UUID到Function Index的实战指南

ACPI _DSM方法深度实战&#xff1a;从UUID解析到功能索引的完整指南 在系统级编程和固件开发领域&#xff0c;ACPI规范中的_DSM&#xff08;Device Specific Method&#xff09;方法是一个强大但常被低估的工具。想象一下&#xff0c;当你需要为特定硬件设备实现自定义控制功能…...

向量搜索不是加个Vector列就完事!EF Core 10六大易错点曝光,87%开发者在生产环境踩过坑

第一章&#xff1a;Entity Framework Core 10 向量搜索扩展 面试题汇总核心能力与适用场景 Entity Framework Core 10 原生不支持向量搜索&#xff0c;但通过官方预览包 Microsoft.EntityFrameworkCore.Vector&#xff08;随 EF Core 10.0.0-preview7 引入&#xff09;可集成 P…...