NVIDIA 显卡硬件支持的精度模式
很多炼丹师不知道自己英伟达显卡支持哪些精度模式,本文整理了NVIDIA官网的数据,为你解开疑惑。
1. 首先了解CUDA计算能力及其支持的精度模式;
2. 查看自己显卡(或其它NVIDIA硬件)的计算能力值为多少。
表1 CUDA计算能力及其支持的精度模式
| CUDA Compute Capability | TF32 | FP32 | FP16 | INT8 | FP16 Tensor Cores | INT8 Tensor Cores | DLA |
| 9 | Yes | Yes | Yes | Yes | Yes | Yes | No |
| 8.9 | Yes | Yes | Yes | Yes | Yes | Yes | No |
| 8.7 | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
| 8.6 | Yes | Yes | Yes | Yes | Yes | Yes | No |
| 8 | Yes | Yes | Yes | Yes | Yes | Yes | No |
| 7.5 | No | Yes | Yes | Yes | Yes | Yes | No |
| 7.2 | No | Yes | Yes | Yes | Yes | Yes | Yes |
| 7 | No | Yes | Yes | Yes | Yes | No | No |
| 6.1 | No | Yes | Yes | Yes | No | No | No |
| 6 | No | Yes | Yes | No | No | No | No |
表2 NVIDIA 硬件(包含显卡、嵌入式板卡等)对应的计算能力
| GPU | Compute Capability |
| NVIDIA H100 | 9 |
| NVIDIA L4 | 8.9 |
| NVIDIA L40 | 8.9 |
| RTX 6000 | 8.9 |
| GeForce RTX 4090 | 8.9 |
| GeForce RTX 4080 | 8.9 |
| GeForce RTX 4070 Ti | 8.9 |
| GeForce RTX 4070 | 8.9 |
| GeForce RTX 4060 | 8.9 |
| GeForce RTX 4050 | 8.9 |
| Jetson AGX Orin | 8.7 |
| Jetson Orin NX | 8.7 |
| Jetson Orin Nano | 8.7 |
| NVIDIA A40 | 8.6 |
| NVIDIA A10 | 8.6 |
| NVIDIA A16 | 8.6 |
| NVIDIA A2 | 8.6 |
| RTX A6000 | 8.6 |
| RTX A5000 | 8.6 |
| RTX A4000 | 8.6 |
| RTX A3000 | 8.6 |
| RTX A2000 | 8.6 |
| GeForce RTX 3090 Ti | 8.6 |
| GeForce RTX 3090 | 8.6 |
| GeForce RTX 3080 Ti | 8.6 |
| GeForce RTX 3080 | 8.6 |
| GeForce RTX 3070 Ti | 8.6 |
| GeForce RTX 3070 | 8.6 |
| Geforce RTX 3060 Ti | 8.6 |
| Geforce RTX 3060 | 8.6 |
| GeForce RTX 3050 Ti | 8.6 |
| GeForce RTX 3050 | 8.6 |
| NVIDIA A100 | 8 |
| NVIDIA A30 | 8 |
| NVIDIA T4 | 7.5 |
| Quadro RTX 8000 | 7.5 |
| Quadro RTX 6000 | 7.5 |
| Quadro RTX 5000 | 7.5 |
| Quadro RTX 4000 | 7.5 |
| RTX 5000 | 7.5 |
| RTX 4000 | 7.5 |
| RTX 3000 | 7.5 |
| T2000 | 7.5 |
| T1200 | 7.5 |
| T1000 | 7.5 |
| T600 | 7.5 |
| T500 | 7.5 |
| T400 | 7.5 |
| GeForce GTX 1650 Ti | 7.5 |
| NVIDIA TITAN RTX | 7.5 |
| Geforce RTX 2080 Ti | 7.5 |
| Geforce RTX 2080 | 7.5 |
| Geforce RTX 2070 | 7.5 |
| Geforce RTX 2060 | 7.5 |
| Jetson AGX Xavier | 7.2 |
| Jetson Xavier NX | 7.2 |
| NVIDIA V100 | 7 |
| Quadro GV100 | 7 |
| NVIDIA TITAN V | 7 |
| Jetson TX2 | 6.2 |
| Tesla P40 | 6.1 |
| Tesla P4 | 6.1 |
| Quadro P6000 | 6.1 |
| Quadro P5200 | 6.1 |
| Quadro P5000 | 6.1 |
| Quadro P4200 | 6.1 |
| Quadro P4000 | 6.1 |
| Quadro P3200 | 6.1 |
| Quadro P3000 | 6.1 |
| Quadro P2200 | 6.1 |
| Quadro P2000 | 6.1 |
| Quadro P1000 | 6.1 |
| Quadro P620 | 6.1 |
| Quadro P600 | 6.1 |
| Quadro P500 | 6.1 |
| Quadro P400 | 6.1 |
| P620 | 6.1 |
| P520 | 6.1 |
| NVIDIA TITAN Xp | 6.1 |
| NVIDIA TITAN X | 6.1 |
| GeForce GTX 1080 Ti | 6.1 |
| GeForce GTX 1080 | 6.1 |
| GeForce GTX 1070 Ti | 6.1 |
| GeForce GTX 1070 | 6.1 |
| GeForce GTX 1060 | 6.1 |
| GeForce GTX 1050 | 6.1 |
| Tesla P100 | 6 |
| Quadro GP100 | 6 |
| Jetson Nano | 5.3 |
通过以上两表,可了解每个硬件支持的精度模式。
参考:
Support Matrix :: NVIDIA Deep Learning TensorRT Documentation
CUDA GPUs - Compute Capability | NVIDIA Developer
相关文章:
NVIDIA 显卡硬件支持的精度模式
很多炼丹师不知道自己英伟达显卡支持哪些精度模式,本文整理了NVIDIA官网的数据,为你解开疑惑。 1. 首先了解CUDA计算能力及其支持的精度模式; 2. 查看自己显卡(或其它NVIDIA硬件)的计算能力值为多少。 表1 CUDA计算…...
【Java|golang】210. 课程表 II---拓扑排序
一、拓扑排序的定义: 先引用一段百度百科上对于拓扑排序的定义: 对一个有向无环图 ( Directed Acyclic Graph 简称 DAG ) G 进行拓扑排序,是将 G 中所有顶点排成一个线性序列,使得图中任意一对顶点 u 和 v ,若边 <…...
STM32CubeMX systick bug?
发觉用新版(V6.9.1)的它生成代码,会有问题。可能是 BUG。具体如下: 一个简单的点灯程序,用 Keil MDK 5.38a(compiler version 6)编译。 如果在变量前,不加上关键字“volatile”&am…...
徐亦达机器学习:Kalman Filter 卡尔曼滤波笔记 (一)
P ( x t P(x_t P(xt| x t − 1 ) x_{t-1}) xt−1) P ( y t P(y_t P(yt| x t ) x_t) xt) P ( x 1 ) P(x_1) P(x1)Discrete State DM A X t − 1 , X t A_{X_{t-1},X_t} AXt−1,XtAny π \pi πLinear Gassian Kalman DM N ( A X t − 1 B , Q ) N(AX_{t-1}B,Q)…...
Java和vue的包含数组组件contains、includes
List<String> tempList Arrays.asList("10018","1007","10017","1012"); if(tempList.contains(initMap.get("asset_type_id").toString())){// todo 计算运营终点桩号-起点桩号BigDecimal diffSum collectNum(col…...
OpenCV_CUDA_VS编译安装
一、OpenCV 我这里是下载的OpenCV4.5.4,但是不知道到在vs里面build时一直报错,后面换了4.7.0的版本测试,安装成功。 Release OpenCV 4.5.4 opencv/opencv GitHub 这个里面有官方预编译好的OpenCV库,可以直接食用。 扩展包&am…...
基于减法优化SABO优化ELM(SABO-ELM)负荷预测(Matlab代码实现)
💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…...
记录第一个启动代码的诞生
核使用R52,参考汇编模板,一步一步来实现。 首先是ld文件,这个没啥好说的,主要是关注给vector_table划一块地址、stack地址,如下: .text.intvec :{_vectors_start .;KEEP(*(.text.intvec))_vectors_end .;…...
基于STM32的简化版智能手表
一、前言 本文的OLED多级菜单UI为一个综合性的STM32小项目,使用多传感器与OLED显示屏实现智能终端的效果。项目中的多级菜单UI使用了较为常见的结构体索引法去实现功能与功能之间的来回切换,搭配DHT11,RTC,LED,KEY等器…...
揭秘弹幕游戏制作
最近好多人问弹幕游戏,甚至是招人的也要DOTS做弹幕游戏... 实际上目前的弹幕游戏绝大多数应该和DOTS没有半点关系,别忘了DOTS这项技术渲染问题还没能够被合理解决呢 所以目前用的全都是GPU Instance这项技术,于是乎我决定下场写这篇帖子&am…...
2327. 知道秘密的人数;1722. 执行交换操作后的最小汉明距离;2537. 统计好子数组的数目
2327. 知道秘密的人数 核心思想:动态规划,每天的人可以分为三种,可分享秘密的人,不可分享秘密的人,忘记秘密的人。定义f[i]为第i天可分享秘密的人,那么第(idelay ,iforget)天,会增加f[i]个可分…...
【TCPDF】使用TCPDF导出PDF文件
目录 一、安装TCPDF类库 二、安装字体 三、使用TCPDF导出PDF文件 目的:PHP通过TCPDF类库导出文件为PDF。 开发语言及类库:ThinkPHP、TCPDF 效果图如下 一、安装TCPDF类库 在项目根目录使用composer安装TCPDF,安装完成后会在vendor目录下…...
MacBook苹果电脑重装、降级系统
1、下载balenaEtcher镜像启动盘制作工具 https://tails.net/etcher/balenaEtcher-portable.exe 2、选择从文件烧录选择下载好的Mac 镜像文件 百度网盘 请输入提取码(Mac OS 10.10-12版本镜像文件) 第二步选择目标磁盘,这里需要准备一块1…...
Java 解决long类型数据在前后端传递失真问题
问题:雪花算法的id长度为19位,前端能够接收的数字最多只能是16位的,因此就会造成精度丢失,得到的ID不是真正的ID。 解决: 在拦截器中加入Long类型转换,返回给前端string package io.global.iot.common.c…...
IDEA的快捷键大全
快捷键 说明 IntelliJ IDEA 的便捷操作性,快捷键的功劳占了一大半,对于各个快捷键组合请认真对待。IntelliJ IDEA 本身的设计思维是提倡键盘优先于鼠标的,所以各种快捷键组合层出不穷,对于快捷键设置也有各种支持,对…...
简单记一下Vue router 路由中使用 vue-i18n 进行标题国际化
引入状态管理和国际化文件 import store from ../store import i18n from /configs/i18n使用状态管理设置路由当前国际化选项 // 使用状态管理 i18n.locale store.state.setStore.i18n??zh路由中使用i18n { path: /login, name: login, component: LoginPage, meta: { ti…...
【Gitea】 Post “http://localhost:3000/api/internal/hook/pre-receive/aa/bbb“ 异常
引 使用 JGit 做了一个发布代码到 Gitea 的接口,使用该接口发布代码到 http://xxx-local/{name}/{project} ,报了 Post "http://localhost:3000/api/internal/hook/pre-receive/{name}/{project} 相关的异常。具体内容如下: Gitea: In…...
如何使用element-ui相关组件如:el-select,el-table,el-switch,el-pagination,el-dialog
element-ui 官方链接: 组件 | Elementhttps://element.eleme.cn/#/zh-CN/component/installation el-select <!-- 用户类型选择框<template> 看情况使用value选择框绑定的值 命名必须是value不能改v-for"item in Options" options数据源来自于…...
微信小程序+echart实现点亮旅游地图
背景 最近看抖音有个很火的特效就是点亮地图,去过哪些地方,于是乎自己也想做一个,结合自己之前做的以家庭为单位的小程序,可以考虑做一个家庭一起点亮地图的功能。 效果图 过程 1,首先就是得去下微信小程序适配的ec…...
Git(8)——Git命令总结
一、简介 本篇文章将基于Git(4)——Git命令小总结,补充后续的Git使用命令 二、总结 # 添加远程连接 git remote add origin 远端地址# 推送本地代码 git push origin 分支名称# 拉取远端代码(第一次) git clone 远端克隆地址# 更新远端代码…...
DAC高速线缆市场洞察:预计到2032年将增长至180.8亿元
据恒州诚思调研统计,2025年全球DAC高速线缆市场规模达66.60亿元,预计到2032年将增长至180.8亿元,2026-2032年复合增长率(CAGR)为14.7%。作为数据中心短距离互连的核心组件,DAC高速线缆凭借其低延迟、高可靠…...
HUNYUAN-MT企业级Java集成指南:构建高并发翻译微服务
HUNYUAN-MT企业级Java集成指南:构建高并发翻译微服务 1. 引言 想象一下,你负责的电商平台刚刚接到一个来自海外的百万级订单,但商品详情、用户手册全是中文。市场团队急等着把上万页的产品资料翻译成十几种语言,时间窗口只有短短…...
如何用PortProxyGUI简化Windows端口转发配置
如何用PortProxyGUI简化Windows端口转发配置 【免费下载链接】PortProxyGUI A manager of netsh interface portproxy which is to evaluate TCP/IP port redirect on windows. 项目地址: https://gitcode.com/gh_mirrors/po/PortProxyGUI PortProxyGUI是一款专为Window…...
从移位相加到硬件实现:FPGA二进制乘法器的设计精髓
1. 从纸笔计算到硬件逻辑:二进制乘法的本质 记得第一次学二进制乘法时,我拿着铅笔在纸上画了半天移位相加的步骤。比如计算11011011,就像小学生列竖式一样,先写下110111101,然后11011左移一位变成11010,接着…...
新手零基础入门:借助快马AI生成你的第一个班级宠物园网页应用
作为一个刚接触编程的新手,想要快速上手开发一个班级宠物园网页应用,确实会遇到不少挑战。不过现在有了InsCode(快马)平台这样的工具,整个过程变得简单多了。下面我就分享一下自己从零开始构建这个项目的经验,希望能帮助到同样想入…...
OpenMemories-Tweak完整指南:如何安全解锁索尼相机的隐藏功能
OpenMemories-Tweak完整指南:如何安全解锁索尼相机的隐藏功能 【免费下载链接】OpenMemories-Tweak Unlock your Sony cameras settings 项目地址: https://gitcode.com/gh_mirrors/op/OpenMemories-Tweak OpenMemories-Tweak是一款专为索尼相机设计的开源解…...
Selenium爬虫被检测?3种隐藏WebDriver属性的实战技巧(附最新ChromeDriver配置)
Selenium爬虫被检测?3种隐藏WebDriver属性的实战技巧(附最新ChromeDriver配置) 在数据采集领域,Selenium一直是处理动态渲染页面的利器。但近年来,越来越多的网站开始部署针对自动化工具的检测机制,使得传统…...
Java 面试八股文(全网最全20w字)
一、Java 基础知识 1、Object 类相关方法 getClass 获取当前运行时对象的 Class 对象。hashCode 返回对象的 hash 码。clone 拷贝当前对象, 必须实现 Cloneable 接口。浅拷贝对基本类型进行值拷贝,对引用类型拷贝引用;深拷贝对基本类型进行…...
深入解析WIFI中EAP-TLS认证流程与安全机制
1. EAP-TLS认证:WIFI安全连接的基石 每次我们用手机连接公司或学校的WIFI时,系统总会弹出一个证书确认的窗口,这就是EAP-TLS在发挥作用。作为目前最安全的WIFI认证协议之一,它就像网络世界的"护照查验系统",…...
这次终于选对了!高效论文写作全流程AI论文写作软件推荐(2026 最新)
2026年AI论文写作软件已全面升级,论文写作全流程可拆解为文献调研→选题/开题→大纲/初稿→文献综述→降重/去AI味→润色/格式→查重/投稿七大环节,以下工具按环节精准匹配,兼顾中文适配、降重能力、去AI痕迹、学术合规四大核心需求ÿ…...
