[针对于个人用户] 显卡与计算卡性能对比表
笔者使用 Quadro M4000 显卡用于 LLM 相关任务,但奈何该卡发布的年代过于久远,以至于 LLM 相关任务只能使用例如:Phi3 mini、Qwen 2 2B、GLM 4 8B 以及 Gemini v2 2B等小参数模型,且速度不堪理想,也经常因为显卡过热降频导致对话效率低下。
对于家用而言,不会去考虑那些特别新的 Tesla 计算卡,而会考虑一些旧的大显存平台,最好是大于10 GB 的显存,这样可以跑一些经过量化的、参数量高一些的模型。对于计算相关,推理相关的更应注重FP16的计算能力,如果有微调需求,同时也应注重FP32的计算能力。
最近总想着置办一张计算卡用于 Homelab 的 LLM 应用,但是市面上的计算卡/显卡种类太多了,有的时候不晓得要看哪一张显卡,故从TechPowerUp 网站摘录下表,以供参考。
| 显卡型号 | Chip | Released | VRAM | Bandwidth | BF16 | FP16 | FP32 | FP64 | TDP (W) |
|---|---|---|---|---|---|---|---|---|---|
| Quadro M4000 (现役) | GM204 | Jun 29th, 2015 | 8 GB GDDR5 | 192.3 GB/s | Nan | Nan | 2.573 TFlops | 80.39 GFlops | 120 |
| Tesla P4 | GP104 | Sep 13th, 2016 | 8GB GDDR5 | 192.3GB/s | Nan | 89.12 GFlops | 5.704 TFlops | 178.2 GFlops | 75 |
| Tesla P40 | GP102 | Sep 13th, 2016 | 24GB GDDR5 | 347.1 GB/s | Nan | 183.7 GFlops | 11.76 TFlops | 367.4 GFlops | 250 |
| Tesla P100 PCIE | GP100 | Jun 20th, 2016 | 16GB HBM2 | 732.2 GB/s | Nan | 19.05 TFlops | 9.526 TFlops | 4.763 TFlops | 250 |
| Tesla P100 SXM2 | GP100 | Apr 5th, 2016 | 16GB HBM2 | 732.2 GB/s | Nan | 21.22 TFlops | 10.61 TFlops | 5.304 TFlops | 300 |
| GTX 1080 | GP104 | May 27th, 2016 | 8GB GDDR5X | 320.3 GB/s | Nan | 138.6 GFlops | 8.873 TFlops | 277.3 GFlops | 180 |
| RTX 2080 Ti | TU102 | Sep 20th, 2018 | 11GB GDDR6 | 616.0 GB/s | Nan | 26.9 TFlops | 13.45 TFlops | 420.2 GFlops | 250 |
| Tesla V100 PCIe | GV100 | Jun 21st, 2017 | 16 GB HBM2 | 897.0 GB/s | Nan | 28.26 TFlops | 14.13 TFlops | 7.066 TFlops | 300 |
| Tesla V100 PCIe | GV100 | Mar 27th, 2018 | 32 GB HBM2 | 897.0 GB/s | Nan | 28.26 TFlops | 14.13 TFlops | 7.066 TFlops | 250 |
| Tesla T4 | TU104 | Sep 13th, 2018 | 16 GB GDDR6 | 320.0 GB/s | Nan | 65.13 TFlops | 8.141 TFlops | 254.4 GFlops | 70 |
| RTX3060 | GA104 | Sep 1st, 2021 | 12GB GDDR6 | 360.0 GB/s | Unknow | 12.74 TFlops | 12.74 TFlops | 199.0 GFlops | 170 |
| RTX3060 | GA106 | Jan 12th, 2021 | 12GB GDDR6 | 360.0 GB/s | Unknow | 12.74 TFlops | 12.74 TFlops | 199.0 GFlops | 170 |
| RTX3060 Ti | GA104 | Dec 1st, 2020 | 8GB GDDR6 | 448.0 GB/s | Unknow | 16.2 TFlops | 16.2 TFlops | 253.1 GFlops | 200 |
| RTX 3080 Ti | GA102 | Jan 2022 | 20GB GDDR6X | 760.3 GB/s | Unknow | 34.1 TFlops | 34.1 TFlops | 532.8 GFlops | 350 |
| RTX 3090 | GA102 | Sep 1st, 2020 | 24 GB GDDR6X | 936.2 GB/s | Unknow | 35.58 TFlops | 35.58 TFlops | 556.0 GFlops | 350 |
| RTX 3090 Ti | GA102 | Jan 27th, 2022 | 24GB GDDR6X | 1.01 TB/s | Unknow | 40 TFlops | 40 TFlops | 625.0 GFlops | 450 |
| A100 PCIe | GA100 | Jun 22nd, 2020 | 40 GB HBM2e | 1.56 TB/s | 311.84 TFlops | 77.97 TFlops | 19.49 TFlops | 9.746 TFlops | 250 |
| RTX 4060 | AD107 | May 18th, 2023 | 8 GB GDDR6 | 272.0 GB/s | Unknow | 15.11 TFlops | 15.11 TFlops | 236.2 GFlops | 115 |
| RTX 4060 Ti | AD106 | May 18th, 2023 | 16 GB GDDR6 | 288.0 GB/s | Unknow | 22.06 TFlops | 22.06 TFlops | 344.8 GFlops | 165 |
| RTX 4070 SUPER | AD104 | Jan 8th, 2024 | 12 GB GDDR6X | 504.2 GB/s | Unknow | 35.48 TFlops | 35.48 TFlops | 554.4 GFlops | 220 |
| RTX 4070 Ti SUPER | AD103 | Jan 8th, 2024 | 16 GB GDDR6X | 672.3 GB/s | Unknow | 44.10 TFlops | 44.10 TFlops | 689.0 GFlops | 285 |
| RTX 4080 | AD103 | Sep 20th, 2022 | 16 GB GDDR6X | 716.8 GB/s | Unknow | 48.74 TFlops | 48.74 TFlops | 761.5 GFlops | 320 |
| RTX 4080 SUPER | AD103 | Jan 8th, 2024 | 16 GB GDDR6X | 736.3 GB/s | Unknow | 52.22 TFlops | 52.22 TFlops | 816.0 GFlops | 320 |
| RTX 4090 | AD102 | Sep 20th, 2022 | 24 GB GDDR6X | 1.01 TB/s | Unknow | 82.58 TFlops | 82.58 TFlops | 1,290 GFlops | 450 |
| RTX 4090 D | AD102 | Sep 20th, 2022 | 24 GB GDDR6X | 1.01 TB/s | Unknow | 73.54 TFlops | 73.54 TFlops | 1,149 GFlops | 450 |
相关文章:
[针对于个人用户] 显卡与计算卡性能对比表
笔者使用 Quadro M4000 显卡用于 LLM 相关任务,但奈何该卡发布的年代过于久远,以至于 LLM 相关任务只能使用例如:Phi3 mini、Qwen 2 2B、GLM 4 8B 以及 Gemini v2 2B等小参数模型,且速度不堪理想,也经常因为显卡过热降…...
2024年智能录屏解决方案全攻略,从桌面到云端
如果你有过录屏经验那你一定遇到过被限制录制时长或者录制的画面比较模糊之类的情况。这次我我推荐几款免费录屏软件,让我们可以更自由的录制屏幕画面。 1.福晰REC大师 链接:www.foxitsoftware.cn/REC/ 这款软件便捷好操作,而且符合我这次…...
CentOS7.9下snmp v3 inform搭建监控端
1.基础环境配置 为了防止防火墙及selinux等的影响,需关闭防火墙及selinux等,具体参考: Linux常规基础配置_linux基础配置-CSDN博客 2.安装snmp yum源配置,具体参考: Linux常规基础配置_linux基础配置-CSDN博客 snmp安装命令: yum install -y net-snmp net-snmp-ut…...
水库大坝安全监测方案,双重守护,安全无忧
水库作为重要的水利设施,在防洪、灌溉及供水等方面发挥着重要作用。然而随着时间的推移,大坝面临着自然老化、设计标准不足及极端天气等多重挑战,其安全性与稳定性日益受到关注。水库堤坝险情导致的洪涝灾害给人民生命财产和经济社会发展带来…...
yolov8实现图片验证码识别
1、环境准备 1.1、安装miniconda 地址:Index of /anaconda/miniconda/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror 注意:为避免不兼容的问题,推荐下载py38版本,我下载的是Miniconda3-py38_23.1.0-1-Windows-x86_…...
代码随想录训练营 Day56打卡 图论part06 108. 冗余连接 109. 冗余连接II
代码随想录训练营 Day56打卡 图论part06 一、卡码108. 冗余连接 题目描述 有一个图,它是一棵树,他是拥有 n 个节点(节点编号1到n)和 n - 1 条边的连通无环无向图(其实就是一个线形图),如图&…...
QT天气预报
json 理论 什么是JSON? 规则 被大括号包括的是JSON对象,被中括号包括的是JSON数组. JSON数组JSON对象 实验 构建JSON 用代码实现如下json内容: //构建JSON void WirteJson() {QJsonObject rootObject;//1.插入name字段rootObject.insert("name","china&quo…...
JavaWeb中处理 Web 请求的方式总结
文章目录 JavaWeb中处理 Web 请求的方式总结1. 原始的 Servlet 方式1.1. 环境搭建**创建 Maven 或 Gradle 项目**:**添加 Servlet 依赖**:**创建 Servlet 类**:**配置项目**:**配置 Tomcat**: 1.2. 路由机制1.3. 示例代…...
React的事件与原生事件的执行顺序?
react自身实现了一套自己的事件机制,包括事件注册、事件的合成、事件冒泡、事件派发等,虽然和原生的是两码事,但也是基于浏览器的事件机制下完成的。 react 的所有事件并没有绑定到具体的dom节点上而是绑定在了document 上,然后由…...
【Java】Runtime与Properties获取系统信息
Java系列文章目录 补充内容 Windows通过SSH连接Linux 第一章 Linux基本命令的学习与Linux历史 文章目录 Java系列文章目录一、前言二、学习内容:三、问题描述四、解决方案:4.1 代码4.2 运行结果 五、总结: 一、前言 这些都被淘汰比较少用了…...
基于SpringBoot的社团管理系统
作者:计算机学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI等,“文末源码”。 专栏推荐:前后端分离项目源码、SpringBoot项目源码、SSM项目源码 系统展示 基于JavaSpringBootVueMySQL的社团管理系统【附源码文档】、…...
UE5.3_跟一个插件—Socket.IO Client
网上看到这个插件,挺好! 项目目前也没有忙到不可开交,索性跟着测一下吧: 商城可见,售价72.61人民币! 但是,git上有仓库哦,免费!! 跟着链接先准备起来: Documentation: GitHub - getnamo/SocketIOClient-Unreal: Socket.IO client plugin for the Unreal Engin…...
鸿蒙轻内核A核源码分析系列七 进程管理 (1)
往期知识点记录: 鸿蒙(HarmonyOS)应用层开发(北向)知识点汇总 轻内核A核源码分析系列一 数据结构-双向循环链表 轻内核A核源码分析系列二 数据结构-位图操作 轻内核A核源码分析系列三 物理内存(1࿰…...
qt QGraphicsScene场景坐标和场景内GraphicsItem局部坐标的相互转换
为了更清晰地解释场景坐标与局部坐标之间的转换过程,我们可以通过一个简单的实例来演示如何赋值场景坐标,并将其转换为图形项的局部坐标。 实例步骤 假设我们有一个场景 QGraphicsScene 和一个矩形图形项 QGraphicsRectItem,矩形的大小为 1…...
Windows与linux中docker的安装与使用
windos中安装使用docker 下载Docker_Desktop 安装包进入docker官网下载Docker_Desktop: https://www.docker.com/启用wsl 我们搜索“启用或关闭Windows功能”,打开后勾选适用于Linux的Windows 子系统 Docker_Desktop设置 出现Docker Engine stopp…...
some electronic products
纽扣电池 button cell 运动手环 sports wristband 智能手环 smart bracelet 皮卡丘夜灯 pikachu night lamp 数字显示充电器 Charger with a digital display 磁吸无线充 magnetic wireless charger 直流电机调速器 DC motor speed controller 继电器模块 relay module 锂离子电…...
刘润《关键跃升》读书笔记7
沟通: 想明⽩,说清楚,能接受 团队沟通的正确⽅式可以⽤9个字来概括:想明⽩,说清楚,能接受 (⻅图4-1)想明⽩ 有时经理跟⼈沟通,讲完之后却⽆奈地对员⼯说,你怎…...
带参宏定义
#define WM_EVENT_DECLARE_GROUP(group) extern wm_event_group_t const group 宏定义的结构: #define:这是C语言中的预处理指令,用来定义宏。宏的作用是替换代码中的特定部分,类似于全局的文本替换。这里定义的宏名称是 WM_EVE…...
java流
99. ByteArrayOutputStream转化为ByteArrayInputStream ByteArrayOutputStream baos xxx;i new ByteArrayInputStream(baos.toByteArray())100.将inputstream转换为byte[] https://blog.csdn.net/yogima/article/details/128500056 100.1 方式一 直接使用IOUtils byte[] …...
Java ArrayList扩容机制 (源码解读)
结论:初始长度为10,若所需长度小于1.5倍原长度,则按照1.5倍扩容。若不够用则按照所需长度扩容。 一. 明确类内部重要变量含义 1:数组默认长度 2:这是一个共享的空数组实例,用于明确创建长度为0时的ArrayList ÿ…...
突破不可导策略的训练难题:零阶优化与强化学习的深度嵌合
强化学习(Reinforcement Learning, RL)是工业领域智能控制的重要方法。它的基本原理是将最优控制问题建模为马尔可夫决策过程,然后使用强化学习的Actor-Critic机制(中文译作“知行互动”机制),逐步迭代求解…...
DeepSeek 赋能智慧能源:微电网优化调度的智能革新路径
目录 一、智慧能源微电网优化调度概述1.1 智慧能源微电网概念1.2 优化调度的重要性1.3 目前面临的挑战 二、DeepSeek 技术探秘2.1 DeepSeek 技术原理2.2 DeepSeek 独特优势2.3 DeepSeek 在 AI 领域地位 三、DeepSeek 在微电网优化调度中的应用剖析3.1 数据处理与分析3.2 预测与…...
Java如何权衡是使用无序的数组还是有序的数组
在 Java 中,选择有序数组还是无序数组取决于具体场景的性能需求与操作特点。以下是关键权衡因素及决策指南: ⚖️ 核心权衡维度 维度有序数组无序数组查询性能二分查找 O(log n) ✅线性扫描 O(n) ❌插入/删除需移位维护顺序 O(n) ❌直接操作尾部 O(1) ✅内存开销与无序数组相…...
React Native在HarmonyOS 5.0阅读类应用开发中的实践
一、技术选型背景 随着HarmonyOS 5.0对Web兼容层的增强,React Native作为跨平台框架可通过重新编译ArkTS组件实现85%以上的代码复用率。阅读类应用具有UI复杂度低、数据流清晰的特点。 二、核心实现方案 1. 环境配置 (1)使用React Native…...
江苏艾立泰跨国资源接力:废料变黄金的绿色供应链革命
在华东塑料包装行业面临限塑令深度调整的背景下,江苏艾立泰以一场跨国资源接力的创新实践,重新定义了绿色供应链的边界。 跨国回收网络:废料变黄金的全球棋局 艾立泰在欧洲、东南亚建立再生塑料回收点,将海外废弃包装箱通过标准…...
leetcodeSQL解题:3564. 季节性销售分析
leetcodeSQL解题:3564. 季节性销售分析 题目: 表:sales ---------------------- | Column Name | Type | ---------------------- | sale_id | int | | product_id | int | | sale_date | date | | quantity | int | | price | decimal | -…...
Java入门学习详细版(一)
大家好,Java 学习是一个系统学习的过程,核心原则就是“理论 实践 坚持”,并且需循序渐进,不可过于着急,本篇文章推出的这份详细入门学习资料将带大家从零基础开始,逐步掌握 Java 的核心概念和编程技能。 …...
在Ubuntu24上采用Wine打开SourceInsight
1. 安装wine sudo apt install wine 2. 安装32位库支持,SourceInsight是32位程序 sudo dpkg --add-architecture i386 sudo apt update sudo apt install wine32:i386 3. 验证安装 wine --version 4. 安装必要的字体和库(解决显示问题) sudo apt install fonts-wqy…...
Python Ovito统计金刚石结构数量
大家好,我是小马老师。 本文介绍python ovito方法统计金刚石结构的方法。 Ovito Identify diamond structure命令可以识别和统计金刚石结构,但是无法直接输出结构的变化情况。 本文使用python调用ovito包的方法,可以持续统计各步的金刚石结构,具体代码如下: from ovito…...
莫兰迪高级灰总结计划简约商务通用PPT模版
莫兰迪高级灰总结计划简约商务通用PPT模版,莫兰迪调色板清新简约工作汇报PPT模版,莫兰迪时尚风极简设计PPT模版,大学生毕业论文答辩PPT模版,莫兰迪配色总结计划简约商务通用PPT模版,莫兰迪商务汇报PPT模版,…...
