# 显卡算力参数对比
显卡算力参数对比
文章目录
- 显卡算力参数对比
- A 显卡参数查询
- B 显卡性能对比:
综合看:T4最具性价比
A 显卡参数查询
查询网址:https://www.techpowerup.com/gpu-specs/ ,以下列出部分:
Product Name | GPU Chip | Released | Bus | Memory | GPU clock | Memory clock | Shaders / TMUs / ROPs |
---|---|---|---|---|---|---|---|
GeForce RTX 5090 | GB102 | 2025 | PCIe 5.0 x16 | 32 GB, GDDR7, 512 bit | 2235 MHz | 2500 MHz | 21760 / 680 / 192 |
L40 | AD102 | Oct 13th, 2022 | PCIe 4.0 x16 | 48 GB, GDDR6, 384 bit | 735 MHz | 2250 MHz | 18176 / 568 / 192 |
L20 | AD102 | Nov 16th, 2023 | PCIe 4.0 x16 | 48 GB, GDDR6, 384 bit | 1440 MHz | 2250 MHz | 11776 / 368 / 128 |
GeForce RTX 4090 | AD102 | Sep 20th, 2022 | PCIe 4.0 x16 | 24 GB, GDDR6X, 384 bit | 2235 MHz | 1313 MHz | 16384 / 512 / 176 |
GeForce RTX 4090 D | AD102 | Dec 28th, 2023 | PCIe 4.0 x16 | 24 GB, GDDR6X, 384 bit | 2280 MHz | 1313 MHz | 14592 / 456 / 176 |
GeForce RTX 4090 Ti | AD102 | Never Released | PCIe 4.0 x16 | 24 GB, GDDR6X, 384 bit | 2325 MHz | 1500 MHz | 18176 / 568 / 192 |
GeForce RTX 4070 | AD104 | Apr 12th, 2023 | PCIe 4.0 x16 | 12 GB, GDDR6X, 192 bit | 1920 MHz | 1313 MHz | 5888 / 184 / 64 |
GeForce RTX 4070 SUPER | AD104 | Jan 8th, 2024 | PCIe 4.0 x16 | 12 GB, GDDR6X, 192 bit | 1980 MHz | 1313 MHz | 7168 / 224 / 80 |
GeForce RTX 4070 Ti | AD104 | Jan 3rd, 2023 | PCIe 4.0 x16 | 12 GB, GDDR6X, 192 bit | 2310 MHz | 1313 MHz | 7680 / 240 / 80 |
GeForce RTX 4070 Ti SUPER | AD103 | Jan 8th, 2024 | PCIe 4.0 x16 | 16 GB, GDDR6X, 256 bit | 2340 MHz | 1313 MHz | 8448 / 264 / 96 |
GeForce RTX 4060 | AD107 | May 18th, 2023 | PCIe 4.0 x8 | 8 GB, GDDR6, 128 bit | 1830 MHz | 2125 MHz | 3072 / 96 / 48 |
GeForce RTX 4060 Ti 8 GB | AD106 | May 18th, 2023 | PCIe 4.0 x8 | 8 GB, GDDR6, 128 bit | 2310 MHz | 2250 MHz | 4352 / 136 / 48 |
GeForce RTX 3090 | GA102 | Sep 1st, 2020 | PCIe 4.0 x16 | 24 GB, GDDR6X, 384 bit | 1395 MHz | 1219 MHz | 10496 / 328 / 112 |
GeForce RTX 2080 Ti | TU102 | Sep 20th, 2018 | PCIe 3.0 x16 | 11 GB, GDDR6, 352 bit | 1350 MHz | 1750 MHz | 4352 / 272 / 88 |
GeForce GTX 1080 Ti | GP102 | Mar 10th, 2017 | PCIe 3.0 x16 | 11 GB, GDDR5X, 352 bit | 1481 MHz | 1376 MHz | 3584 / 224 / 88 |
GeForce GTX 1070 | GP104 | Jun 10th, 2016 | PCIe 3.0 x16 | 8 GB, GDDR5, 256 bit | 1506 MHz | 2002 MHz | 1920 / 120 / 64 |
GeForce GTX 1060 6 GB | GP106 | Jul 19th, 2016 | PCIe 3.0 x16 | 6 GB, GDDR5, 192 bit | 1506 MHz | 2002 MHz | 1280 / 80 / 48 |
GeForce GTX 1050 Ti | GP107 | Oct 25th, 2016 | PCIe 3.0 x16 | 4 GB, GDDR5, 128 bit | 1291 MHz | 1752 MHz | 768 / 48 / 32 |
GeForce GTX 1660 Ti | TU116 | Feb 22nd, 2019 | PCIe 3.0 x16 | 6 GB, GDDR6, 192 bit | 1500 MHz | 1500 MHz | 1536 / 96 / 48 |
— | |||||||
Tesla T4 | TU104 | Sep 13th, 2018 | PCIe 3.0 x16 | 16 GB, GDDR6, 256 bit | 585 MHz | 1250 MHz | 2560 / 160 / 64 |
Tesla V100 PCIe 32 GB | GV100 | Mar 27th, 2018 | PCIe 3.0 x16 | 32 GB, HBM2, 4096 bit | 1230 MHz | 876 MHz | 5120 / 320 / 128 |
A100 PCIe 80 GB | GA100 | Jun 28th, 2021 | PCIe 4.0 x16 | 80 GB, HBM2e, 5120 bit | 1065 MHz | 1512 MHz | 6912 / 432 / 160 |
A800 PCIe 80 GB | GA100 | Nov 8th, 2022 | PCIe 4.0 x16 | 80 GB, HBM2e, 5120 bit | 1065 MHz | 1512 MHz | 6912 / 432 / 160 |
H800 PCIe 80 GB | GH100 | Mar 21st, 2023 | PCIe 5.0 x16 | 80 GB, HBM2e, 5120 bit | 1095 MHz | 1593 MHz | 14592 / 456 / 24 |
H100 PCIe 96 GB | GH100 | Mar 21st, 2023 | PCIe 5.0 x16 | 96 GB, HBM3, 5120 bit | 1665 MHz | 1313 MHz | 16896 / 528 / 24 |
B 显卡性能对比:
标志 | 显卡 | Graphics Processor | Cores | Memory Size (GB) | Bus Width (bit) | FP16 (half) | FP32 (float) | FP64 (double) | 备注 |
---|---|---|---|---|---|---|---|---|---|
1 | NVIDIA H100 PCIe 96 GB | GH100 | 16896 | 96 | 5120 | 248.3 TFLOPS (4:1) | 62.08 TFLOPS | 31.04 TFLOPS (1:2) | |
NVIDIA H100 SXM5 96 GB | GH100 | 16896 | 96 | 5120 | 248.3 TFLOPS (4:1) | 62.08 TFLOPS | 31.04 TFLOPS (1:2) | ||
1 | NVIDIA H800 PCIe 80 GB | GH100 | 14592 | 80 | 5120 | 204.9 TFLOPS (4:1) | 51.22 TFLOPS | 25.61 TFLOPS (1:2) | |
NVIDIA H800 SXM5 | GH100 | 16896 | 80 | 5120 | 237.2 TFLOPS (4:1) | 59.30 TFLOPS | 29.65 TFLOPS (1:2) | ||
1 | NVIDIA A100 PCIe 80 GB | GA100 | 6912 | 80 | 5120 | 77.97 TFLOPS (4:1) | 19.49 TFLOPS | 9.746 TFLOPS (1:2) | |
1 | NVIDIA A800 PCIe 80 GB | GA100 | 6912 | 80 | 5120 | 77.97 TFLOPS (4:1) | 19.49 TFLOPS | 9.746 TFLOPS (1:2) | |
1 | NVIDIA Tesla V100 PCIe 32 GB | GV100 | 5120 | 32 | 4096 | 28.26 TFLOPS (2:1) | 14.13 TFLOPS | 7.066 TFLOPS (1:2) | |
1 | NVIDIA Tesla T4 | TU104 | 2560 | 16 | 256 | 65.13 TFLOPS (8:1) | 8.141 TFLOPS | 254.4 GFLOPS (1:32) | |
1 | NVIDIA L40 | AD102 | 18176 | 48 | 384 | 90.52 TFLOPS (1:1) | 90.52 TFLOPS | 1,414 GFLOPS (1:64) | |
1 | NVIDIA L20 | AD102 | 11776 | 48 | 384 | 59.35 TFLOPS (1:1) | 59.35 TFLOPS | 927.4 GFLOPS (1:64) | |
1 | NVIDIA GeForce RTX 4090 | AD102 | 16384 | 24 | 384 | 82.58 TFLOPS (1:1) | 82.58 TFLOPS | 1,290 GFLOPS (1:64) | |
NVIDIA GeForce RTX 4090 D | AD102 | 14592 | 24 | 384 | 73.54 TFLOPS (1:1) | 73.54 TFLOPS | 1,149 GFLOPS (1:64) | ||
1 | NVIDIA GeForce RTX 4090 Ti | AD102 | 18176 | 24 | 384 | 93.24 TFLOPS (1:1) | 93.24 TFLOPS | 1,457 GFLOPS (1:64) | |
NVIDIA GeForce RTX 4090 Mobile | AD103 | 9728 | 16 | 256 | 32.98 TFLOPS (1:1) | 32.98 TFLOPS | 515.3 GFLOPS (1:64) | ||
NVIDIA GeForce RTX 4090 Max-Q | AD103 | 9728 | 16 | 256 | 28.31 TFLOPS (1:1) | 28.31 TFLOPS | 442.3 GFLOPS (1:64) | ||
NVIDIA GeForce RTX 4070 | AD104 | 5888 | 12 | 192 | 29.15 TFLOPS (1:1) | 29.15 TFLOPS | 455.4 GFLOPS (1:64) | ||
NVIDIA GeForce RTX 4070 SUPER | AD104 | 7168 | 12 | 192 | 35.48 TFLOPS (1:1) | 35.48 TFLOPS | 554.4 GFLOPS (1:64) | ||
NVIDIA GeForce RTX 4070 Ti | AD104 | 7680 | 12 | 192 | 40.09 TFLOPS (1:1) | 40.09 TFLOPS | 626.4 GFLOPS (1:64) | ||
1 | NVIDIA GeForce RTX 4070 Ti SUPER | AD103 | 8448 | 16 | 256 | 44.10 TFLOPS (1:1) | 44.10 TFLOPS | 689.0 GFLOPS (1:64) | |
NVIDIA GeForce RTX 4060 | AD107 | 3072 | 8 | 128 | 15.11 TFLOPS (1:1) | 15.11 TFLOPS | 236.2 GFLOPS (1:64) | ||
NVIDIA GeForce RTX 4060 Ti 8 GB | AD106 | 4352 | 8 | 128 | 22.06 TFLOPS (1:1) | 22.06 TFLOPS | 344.8 GFLOPS (1:64) | ||
NVIDIA GeForce RTX 4060 Ti 16 GB | AD106 | 4352 | 16 | 128 | 22.06 TFLOPS (1:1) | 22.06 TFLOPS | 344.8 GFLOPS (1:64) | ||
NVIDIA GeForce RTX 3090 | GA102 | 10496 | 24 | 384 | 35.58 TFLOPS (1:1) | 35.58 TFLOPS | 556.0 GFLOPS (1:64) | ||
1 | NVIDIA GeForce RTX 3090 Ti | GA102 | 10752 | 24 | 384 | 40.00 TFLOPS (1:1) | 40.00 TFLOPS | 625.0 GFLOPS (1:64) | |
NVIDIA GeForce RTX 3080 | GA102 | 8704 | 10 | 320 | 29.77 TFLOPS (1:1) | 29.77 TFLOPS | 465.1 GFLOPS (1:64) | ||
1 | NVIDIA GeForce RTX 3080 Ti | GA102 | 10240 | 12 | 384 | 34.10 TFLOPS (1:1) | 34.10 TFLOPS | 532.8 GFLOPS (1:64) | |
NVIDIA GeForce RTX 2080 | TU104 | 2944 | 8 | 256 | 20.14 TFLOPS (2:1) | 10.07 TFLOPS | 314.6 GFLOPS (1:32) | ||
1 | NVIDIA GeForce RTX 2080 Ti | TU102 | 4352 | 11 | 352 | 26.90 TFLOPS (2:1) | 13.45 TFLOPS | 420.2 GFLOPS (1:32) | |
1 | NVIDIA GeForce GTX 1080 Ti | GP102 | 3584 | 11 | 352 | 177.2 GFLOPS (1:64) | 11.34 TFLOPS | 354.4 GFLOPS (1:32) | |
NVIDIA GeForce GTX 1070 Ti | GP104 | 2432 | 8 | 256 | 127.9 GFLOPS (1:64) | 8.186 TFLOPS | 255.8 GFLOPS (1:32) | ||
NVIDIA GeForce GTX 1060 6 GB | GP106 | 1280 | 6 | 192 | 68.36 GFLOPS (1:64) | 4.375 TFLOPS | 136.7 GFLOPS (1:32) | ||
NVIDIA GeForce GTX 1050 Ti | GP107 | 768 | 4 | 128 | 33.41 GFLOPS (1:64) | 2.138 TFLOPS | 66.82 GFLOPS (1:32) | ||
相关文章:
# 显卡算力参数对比
显卡算力参数对比 文章目录 显卡算力参数对比A 显卡参数查询B 显卡性能对比: 综合看:T4最具性价比 A 显卡参数查询 查询网址:https://www.techpowerup.com/gpu-specs/ ,以下列出部分: Product NameGPU ChipReleasedB…...

掌握RocketMQ4.X消息中间件(一)-RocketMQ基本概念与系统架构
1 MQ介绍 MQ(Message Quene) : 翻译为 消息队列,别名为 消息中间件,通过典型的 生产者和消费者模型,生产者不断向消息队列中生产消息,消费者不断的从队列中获取消息。因为消息的生产和消费都是异步的,而且只关心消息的发送和接收,…...

实际开发中,java开发的准备工作
实际开发中,java开发的准备工作 一、IDEA工具环境设置 1、编码设置...

SQL进阶技巧:Order by 中 NULLS LAST特性使用?
目录 1 需求描述 2 数据准备 3 问题分析 4 小结 如果觉得本文对你有帮助,想进一步学习SQL语言这门艺术的,那么不妨也可以选择去看看我的博客专栏 ,部分内容如下: 数字化建设通关指南 专栏 原价99,现在活动价59…...
Redis:cpp.redis++类型操作
Redis:cpp.redis类型操作 stringsetmsetmgetgetrangesetrangeincrbydecrby listlpushrpushlrangellenlpoprpopblpopbrpop setsaddsmemeberssismemberscardspopsintersinterstore hashhsethgethexistshdelhkeyshvalshmsethmget zsetzaddzrangezcardzremzscorezrank 总…...
感冒用药记录
问题描述:国庆感冒了,头昏喉咙不舒服 用药过程: – 前3天:未用药,不好也不坏 – 中间2天:开始喉痛,使用复方氨酚烷胺胶囊【含对乙酰氨基酚】,基本没有效果 – 后面1天:开…...

JMeter性能测试时,如何做CSV参数化
在现代软件开发中,性能测试是保证应用程序在高负载条件下稳定运行的重要环节。为了实现真实场景的测试,参数化技术应运而生。其中,CSV参数化是一种高效且灵活的方法,可以让测试人员通过外部数据文件驱动测试脚本,从而模…...
爬虫获取不同数据类型(如JSON,HTML)的处理方法以及图片相对URL地址的转换
当我们爬取图片的URL地址时,我们要确保它们都是有效的绝对URL,这样就可以直接用这些URL来下载图片了。但是很多时候,它们都不是绝对URL地址,因此我们需要它进行URL转换。 if img_url.startswith(//): 这个条件检查URL是否以//开头…...

Elasticsearch 实战应用
Elasticsearch 实战应用 引言 Elasticsearch 是一个分布式、RESTful 风格的搜索和分析引擎,能够快速、实时地处理大规模数据,广泛应用于全文搜索、日志分析、推荐系统等领域。在这篇博客中,我们将从 Elasticsearch 的基本概念入手ÿ…...
前端数据加载慢的解决方法
都是和前端性能优化非常类似的做法。 1. 懒加载 (Lazy Loading) 对于图片、视频等资源,或者某些组件,在用户滚动到相关区域时再加载,而不是页面一开始就加载所有内容。使用 IntersectionObserver 实现懒加载,或者一些 UI 框架&am…...
探索MultiApp:一款强大的多应用管理工具
探索MultiApp:一款强大的多应用管理工具 在这个数字化时代,多任务并行已经成为我们日常生活的一部分。无论是工作还是娱乐,我们都需要频繁地在多个应用之间切换。今天,我要向大家介绍一款能够帮助你在同一设备上无缝切换和管理多…...

qt QGraphicsItem详解
一、概述 QGraphicsItem是Qt框架中图形视图框架(Graphics View Framework)的一个核心组件,它是用于表示2D图形元素的基类。 它支持的功能包括: 设置和获取图形项的位置和尺寸。控制图形项的外观,如颜色、笔刷、边框…...
LVS搭建负载均衡
LVS搭建负载均衡 引言 在现代互联网应用中,用户对服务的可用性和响应速度要求越来越高。为了应对高并发请求,保证系统的稳定性和容错能力,负载均衡技术应运而生。LVS(Linux Virtual Server)是一种高性能、高可用性的…...

Unity MVC框架演示 1-1 理论分析
本文仅作学习笔记分享与交流,不做任何商业用途,该课程资源来源于唐老狮 1.一般的图解MVC 什么是MVC我就不说了,老生常谈,网上有大量的介绍,想看看这三层都起到什么职责?那就直接上图吧 2.我举一个栗子 我有…...

基于springboot+vue人脸识别的考勤管理系统(源码+定制+开发)
博主介绍: ✌我是阿龙,一名专注于Java技术领域的程序员,全网拥有10W粉丝。作为CSDN特邀作者、博客专家、新星计划导师,我在计算机毕业设计开发方面积累了丰富的经验。同时,我也是掘金、华为云、阿里云、InfoQ等平台…...

【api连接ChatGPT的最简单方式】
通过api连接ChatGPT的最简单方式 建立client 其中base_url为代理,若连接官网可省略;配置环境变量 from openai import OpenAI client OpenAI(base_url"https://api.chatanywhere.tech/v1" )或给出api和base_url client OpenAI(api_key&…...

技术成神之路:设计模式(二十)装饰模式
介绍 装饰模式(Decorator Pattern)是一种结构型设计模式,它允许在不改变对象自身的情况下,动态地为对象添加额外的职责。这个模式通常用于增强或改变对象的功能。 1.定义 装饰模式通过创建一个装饰类,将功能动态地添加…...

利用特征点采样一致性改进icp算法点云配准方法
1、index、vector 2、kdtree和kdtreeflann 3、if kdtree.radiusSearch(。。。) > 0)...

LabVIEW惯性导航系统仿真平台
LabVIEW开发捷联惯性导航系统仿真平台,采用模块化设计,利用LabVIEW的图形化编程特性,提高了系统仿真的效率和精度,同时具备良好的可扩展性和用户交互性。 项目背景 当前,惯性导航系统(INS)的研…...
es简单实现文章检索功能
使用的api是:Elasticsearch Java API client 8.0 官网:Package structure and namespace clients | Elasticsearch Java API Client [8.15] | Elastic 1.建立索引库 实现搜索功能字段: title:文章标题content:文章内…...

【机器视觉】单目测距——运动结构恢复
ps:图是随便找的,为了凑个封面 前言 在前面对光流法进行进一步改进,希望将2D光流推广至3D场景流时,发现2D转3D过程中存在尺度歧义问题,需要补全摄像头拍摄图像中缺失的深度信息,否则解空间不收敛…...
Linux云原生安全:零信任架构与机密计算
Linux云原生安全:零信任架构与机密计算 构建坚不可摧的云原生防御体系 引言:云原生安全的范式革命 随着云原生技术的普及,安全边界正在从传统的网络边界向工作负载内部转移。Gartner预测,到2025年,零信任架构将成为超…...
相机Camera日志分析之三十一:高通Camx HAL十种流程基础分析关键字汇总(后续持续更新中)
【关注我,后续持续新增专题博文,谢谢!!!】 上一篇我们讲了:有对最普通的场景进行各个日志注释讲解,但相机场景太多,日志差异也巨大。后面将展示各种场景下的日志。 通过notepad++打开场景下的日志,通过下列分类关键字搜索,即可清晰的分析不同场景的相机运行流程差异…...
聊一聊接口测试的意义有哪些?
目录 一、隔离性 & 早期测试 二、保障系统集成质量 三、验证业务逻辑的核心层 四、提升测试效率与覆盖度 五、系统稳定性的守护者 六、驱动团队协作与契约管理 七、性能与扩展性的前置评估 八、持续交付的核心支撑 接口测试的意义可以从四个维度展开,首…...

Maven 概述、安装、配置、仓库、私服详解
目录 1、Maven 概述 1.1 Maven 的定义 1.2 Maven 解决的问题 1.3 Maven 的核心特性与优势 2、Maven 安装 2.1 下载 Maven 2.2 安装配置 Maven 2.3 测试安装 2.4 修改 Maven 本地仓库的默认路径 3、Maven 配置 3.1 配置本地仓库 3.2 配置 JDK 3.3 IDEA 配置本地 Ma…...
Redis:现代应用开发的高效内存数据存储利器
一、Redis的起源与发展 Redis最初由意大利程序员Salvatore Sanfilippo在2009年开发,其初衷是为了满足他自己的一个项目需求,即需要一个高性能的键值存储系统来解决传统数据库在高并发场景下的性能瓶颈。随着项目的开源,Redis凭借其简单易用、…...
Modbus RTU与Modbus TCP详解指南
目录 1. Modbus协议基础 1.1 什么是Modbus? 1.2 Modbus协议历史 1.3 Modbus协议族 1.4 Modbus通信模型 🎭 主从架构 🔄 请求响应模式 2. Modbus RTU详解 2.1 RTU是什么? 2.2 RTU物理层 🔌 连接方式 ⚡ 通信参数 2.3 RTU数据帧格式 📦 帧结构详解 🔍…...
数据库——redis
一、Redis 介绍 1. 概述 Redis(Remote Dictionary Server)是一个开源的、高性能的内存键值数据库系统,具有以下核心特点: 内存存储架构:数据主要存储在内存中,提供微秒级的读写响应 多数据结构支持&…...
WEB3全栈开发——面试专业技能点P4数据库
一、mysql2 原生驱动及其连接机制 概念介绍 mysql2 是 Node.js 环境中广泛使用的 MySQL 客户端库,基于 mysql 库改进而来,具有更好的性能、Promise 支持、流式查询、二进制数据处理能力等。 主要特点: 支持 Promise / async-await…...
从实验室到产业:IndexTTS 在六大核心场景的落地实践
一、内容创作:重构数字内容生产范式 在短视频创作领域,IndexTTS 的语音克隆技术彻底改变了配音流程。B 站 UP 主通过 5 秒参考音频即可克隆出郭老师音色,生成的 “各位吴彦祖们大家好” 语音相似度达 97%,单条视频播放量突破百万…...