显卡基础知识及元器件原理分析
显卡应该算是是目前最为火热的研发方向了,其中的明星公司当属英伟达。
当地时间8月23日,英伟达发布截至7月30日的2024财年第二财季财报,营收和利润成倍增长,均超市场预期。
财报显示,第二财季英伟达营收为135.07 亿美元,同比增长101%,环比增长88%。美国通用会计准则(GAAP)下,净利润为61.88 亿美元,同比增长843%,环比增长203%,non-GAAP下净利润为67.40亿美元,同比增长422%毛利率大幅提升至70.1%。
英伟达预计,2024财年第三财季该公司的营收将达160亿美元,上下浮动2%。GAAP下的毛利润率预计在71.5%,non-GAAP下预计为72.5%,均高于第二财季。
具体业务层面,在AI业务推动下,数据中心业务创下新高。英伟达数据中心业务第二财季营收为103.2亿美元,同比增长171%;游戏业务营收为24.9亿美元,同比增长 22%;专业可视化业务第二财季营收为3.79亿美元,同比下降 24%;车业务营收为2.53亿美元,同比增长 15%。
英伟达CEO黄仁勋表示,主要的云计算服务提供商纷纷宣布了大规模的英伟达H100 AI基础设施计划,领先的企业IT系统和软件提供商宣布建立合作伙伴关系,将英伟达AI引入各行各业,采用生成式人工智能的竞赛已经开始。
笔者闲暇时间也比较喜欢对不同的显卡做一些拆解分析。本文是对AMD 中低端显卡Radeon 520显卡最一些拆解和核心器件的原理分析。
在本文拆解前,先简要介绍两个概念:
1.显卡是什么?
显卡,又称显示卡、显示器适配器、图形加速器、图形处理器、显卡芯片等。显卡是计算机中的一种重要的硬件组件,主要用于处理图形和视频数据,将数字信号转换成模拟信号输出到显示器上显示。显卡通常包含一个或多个图形处理器(GPU),以及一定量的显存,可以提供更流畅、更高质量的图像和视频输出。
2. 显卡的功能?显卡和chatGPT的关系?
据报道,微软给 ChatGPT 准备了一万多张 A100,但面对井喷式的流量需求,OpenAI 还是坚持不住了,出现了宕机。
有人做过预估,想要满足当下的用户流量,微软还得买几万张 A100、H100 显卡,目前的算力远远不够。
功耗与性能计算:一般来说,8张 A100 组成的 DGX A100 服务器大概售价 19.9 万美元,最高功率为 6.5kW。
按照一万张来算的话,光在硬件上微软就要花去 2.5 亿美元,运行一个月就要用掉 585 万度电。
从基本逻辑来说,chatGPT和矿机的实现是有一定相似性的。对于矿机,更高效的挖矿就需要堆算力;而对于chatGPT而言,要更智能跟准确的回来问题,就需要更多的机器作训练。
3. AMD Radeon 520的拆解和介绍
AMD Radeon 520 显卡(也称为 GPU)的性能等级为 626。 这是一个很好的结果。 显卡 AMD Radeon 520 以 1030 MHz 的最低时钟速度运行。 它具有加速选项的特点,并且能够运行到 . 制造商为 AMD 配备了 2 GB 内存,时钟速度 2250 MHz 和带宽 16 GB/s。
这张显卡的功耗为50瓦,制造过程仅为28 nm。
• 实物图
拆掉风扇后的照片,非常简洁,主要就是显示接口,GPU芯片,显存,电源这四个模块,后面再一一详细看。
整板正面
整板背面
首先,最左边的就是显示接口,分别是HDMI接口和VGA接口。
然后,是GPU处理器芯片。如下图
正面——GPU部分
命名规则如下图
其次,是显存芯片,支持DDR3以及GDDR5
正面——memory芯片(Micron ICB77-D9VVR)部分GDDR5 SDRAM
• Memory Detail:Micron:GDDR5,8Gb*2pcs=2GB,Vmem=1.1V
再次是电源。
一般GPU的核心电源是多相电源,用来满足大功率输出要求。
但这颗芯片定位低端市场,因此使用了单相BUCK控制芯片,然后搭配外置的MOS管,提供足够的输出电流。
GS7210A——单相BUCK控制芯片
GStek-GS9238 0NXB——单相BUCK控制芯片
PK618BA、PK698SA --NMOS管
然后,一些DC-DC以及LDO用来满足板卡其他电源的电流需求,比较简单就不再赘述。
LD1117AG ——低压差线性稳压器
PB4350 ——NPN晶体管
GStek-GS7166——线性稳压器(LDO)
MXIC-25L1006E——flash
IADPN——
这一颗芯片只有MARK,还没有仔细查型号,知道的朋友,告诉一下。。。。
N21-7GN107——
总结:
AMD Radeon 520是一款入门级独立显卡,适用于轻度游戏和日常办公使用,国内常作为亮机卡使用。
性能:AMD Radeon 520采用GCN架构,拥有320个流处理器和2GB GDDR5显存。它的性能适中,适合处理一些轻度游戏和多媒体应用。
游戏性能:AMD Radeon 520适合玩一些较老的游戏或者对画质要求不高的较新游戏。对于一些图形要求较高的AAA级游戏,它的性能可能不够。
功耗和散热:AMD Radeon 520的功耗相对较低,散热相对较好,适合在笔记本电脑等小型设备中使用。
支持功能:AMD Radeon 520支持DirectX 12、Vulkan和OpenGL等主流图形API,以及AMD的FreeSync技术,提供更流畅的游戏体验。
驱动支持:AMD Radeon 520有稳定的驱动支持,可以通过AMD官方网站获取最新的驱动程序。
显卡的主要组件包括:
GPU(图形处理器):控制图像的计算和处理,是显卡的核心组件。GPU 负责的工作大多是重复性的 3D 建模或者 3D 渲染,其上主要包括运算单元(SP)和控制单元。运算单元负责顶点运算和像素运算,在不同场景下动态分配进行顶点运算和像素运算的流处理器数量,达到资源的高效利用。控制单元则负责管理整个 GPU 的运行。
显存(视频内存):显存是显卡中用于存储图像数据、纹理和其他图形资源的内存。它具有高带宽和低延迟,可以快速地提供图像数据给GPU进行处理。显存的容量和类型对于处理高分辨率图像和复杂场景非常重要。
PCB(印刷电路板):连接所有的元件和接口,使它们可以协同工作。上面安装有GPU芯片、显存、电源连接器等。PCB的设计可以影响显卡的散热、信号传输和电源分配等方面。
散热系统: 由于GPU在高负载下会产生大量热量,显卡通常配备散热系统来冷却GPU芯片。这可能包括散热风扇、散热器、热管等,以确保显卡保持适当的工作温度。
电源供应: 显卡需要电源供应以驱动GPU和其他组件。高性能显卡通常需要额外的电源连接,如6针或8针PCIe电源接口,以满足其高功耗需求。
视频输出端口: 显卡通常配备多个视频输出端口,如HDMI、DisplayPort、DVI等,用于连接显示器、投影仪等设备以显示图像和视频。
电容和电感: 这些元件在显卡的电路中起到稳定电源供应、滤波和噪音抑制等作用,有助于保持电路的稳定性和性能。
监控芯片: 一些显卡可能搭载监控芯片,用于监测显卡的温度、风扇速度等参数,并且可以通过驱动程序进行设置和调整。
相关文章:

显卡基础知识及元器件原理分析
显卡应该算是是目前最为火热的研发方向了,其中的明星公司当属英伟达。 当地时间8月23日,英伟达发布截至7月30日的2024财年第二财季财报,营收和利润成倍增长,均超市场预期。 财报显示,第二财季英伟达营收为135.07 亿美…...

Spark Rebalance hint的倾斜的处理(OptimizeSkewInRebalancePartitions)
背景 本文基于Spark 3.5.0 目前公司在做小文件合并的时候用到了 Spark Rebalance 这个算子,这个算子的主要作用是在AQE阶段的最后写文件的阶段进行小文件的合并,使得最后落盘的文件不会太大也不会太小,从而达到小文件合并的作用,…...

Vue 3中实现基于角色的权限认证实现思路
一、基于角色的权限认证主要步骤 在Vue 3中实现基于角色的权限认证通常涉及以下几个主要步骤: 定义角色和权限:首先需要在后端服务定义不同的角色和它们对应的权限。权限可以是对特定资源的访问权限,比如读取、写入、修改等。用户认证&#…...

Visual Studio 2022进行文件差异比较
前言 Visual Studio 2022在版本17.7.4中发布在解决方案资源管理器中比较文件的功能,通过使用此功能,可以轻松地查看两个文件之间的差异,包括添加、删除和修改的代码行。可以逐行查看差异,并根据需要手动调整和编辑文件内容以进行…...

1.2 编译型语言和解释型语言的区别
编译型语言和解释型语言的区别 通过高级语言编写的源码,我们能够轻松理解,但对于计算机来说,它只认识二进制指令,源码就是天书,根本无法识别。源码要想执行,必须先转换成二进制指令。 所谓二进制指令&…...
C语言-常量
什么是常量? 答:常量是在程序执行过程中,其值不发生改变的量,常量分为直接常量和符号常量两种。 其中直接常量又可以分为整型常量、实型常量、字符型常量、字符串常量。 直接常量 1.整型常量 整型常量即整数,包括正整数,负整数和0。c语言中常量可以用八进制,十进制和十六…...

开源的OCR工具基本使用:PaddleOCR/Tesseract/CnOCR
前言 因项目需要,调研了一下目前市面上一些开源的OCR工具,支持本地部署,非调用API,主要有PaddleOCR/CnOCR/chinese_lite OCR/EasyOCR/Tesseract/chineseocr/mmocr这几款产品。 本文主要尝试了EasyOCR/CnOCR/Tesseract/PaddleOCR这…...

vue3实现输入框短信验证码功能---全网始祖
组件功能分析 1.按键删除,清空当前input,并跳转prevInput & 获取焦点,按键delete,清空当前input,并跳转nextInput & 获取焦点。按键Home/End键,焦点跳转first/最后一个input输入框。ArrowLeft/ArrowRight键点击…...

[C#]winformYOLO区域检测任意形状区域绘制射线算法实现
【简单介绍】 Winform OpenCVSharp YOLO区域检测与任意形状区域射线绘制算法实现 在现代安全监控系统中,区域检测是一项至关重要的功能。通过使用Winform结合OpenCVSharp库,并结合YOLO(You Only Look Once)算法,我们…...

个人网站制作 Part 14 添加网站分析工具 | Web开发项目
文章目录 👩💻 基础Web开发练手项目系列:个人网站制作🚀 添加网站分析工具🔨使用Google Analytics🔧步骤 1: 注册Google Analytics账户🔧步骤 2: 获取跟踪代码 🔨使用Vue.js&#…...
数据按设定单位(分辨率)划分的方法
1. 问题描述 需要将使用公式计算后的float数值换算到固定间隔数轴的对应位置上的数据,比如2.186这个数据,将该数据换算到以0.25为间隔的数轴上,换算后是2.0,还是2.25呢?该方法就是解决这个问题。 2. 方法 输入&…...

Ubuntu 搭建gitlab服务器,及使用repo管理
一、GitLab安装与配置 GitLab 是一个用于仓库管理系统的开源项目,使用Git作为代码管理工具,并在此基础上搭建起来的Web服务。 1、安装Ubuntu系统(这个教程很多,就不展开了)。 2、安装gitlab社区版本,有需…...
QT(19)-QNetworkRequest
attribute(QNetworkRequest::Attribute code, const QVariant &defaultValue QVariant()) const 获取指定的请求属性。如果该属性未设置,则返回默认值。 hasRawHeader(const QByteArray &headerName) const 检查是否存在指定名称的原始请求头。 header(Q…...

基于Vue的社区旧衣回收利用系统的设计与实现
经济的高速发展使得每一个家庭的收入都获得了大幅增长,随之而来的就是各种梦想的逐步实现,首当其冲的就是各类衣服的更新换代而导致了大量旧衣物在家中的积存。为了帮助人们解决旧衣物处理的问题而以当前主流的互联网技术构建一个可于社区中实现旧衣回收…...

【网站项目】291校园疫情防控系统
🙊作者简介:拥有多年开发工作经验,分享技术代码帮助学生学习,独立完成自己的项目或者毕业设计。 代码可以私聊博主获取。🌹赠送计算机毕业设计600个选题excel文件,帮助大学选题。赠送开题报告模板ÿ…...
win git filter-repo教程
git filter-repo 是一个用于过滤和清理 Git 仓库历史的工具,它可以高效地批量修改提交历史中的文件内容、删除文件、重命名文件以及进行其他历史重构操作。相较于 git filter-branch,它通常更快且更易于使用。 以下是一个基本示例,说明如何使…...

Redis相关操作高阶篇--集群搭建
Redis相关操作大全一篇全搞定-CSDN博客 Redis集群 是一个由多个主从节点群组成的分布式服务器群,它具有复制、高可用和分片特性。Redis集群不需要seninel哨兵也能完成节点移除和故障转移的功能。需要将每个节点 设置成集群模式,这种集群模式没有中心节…...

JNDI注入原理及利用IDEA漏洞复现
🍬 博主介绍👨🎓 博主介绍:大家好,我是 hacker-routing ,很高兴认识大家~ ✨主攻领域:【渗透领域】【应急响应】 【Java、PHP】 【VulnHub靶场复现】【面试分析】 🎉点赞➕评论➕收…...
大数据,或称巨量资料
大数据,或称巨量资料,指的是在传统数据处理应用软件不足以处理的大或复杂的数据集。大数据也可以定义为来自各种来源的大量非结构化或结构化数据。从学术角度而言,大数据的出现促成广泛主题的新颖研究,这也导致各种大数据统计方法…...

windows上打开redis服务闪退问题处理
方法1:在windows上面打开redis服务时,弹窗闪退可能是6379端口占用,可以用以下命令查看: netstat -aon | findstr 6379 如果端口被占用可以用这个命令解决: taskkill /f /pid 进程号 方法2: 可以使用…...

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?
编辑:陈萍萍的公主一点人工一点智能 未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战,在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…...

idea大量爆红问题解决
问题描述 在学习和工作中,idea是程序员不可缺少的一个工具,但是突然在有些时候就会出现大量爆红的问题,发现无法跳转,无论是关机重启或者是替换root都无法解决 就是如上所展示的问题,但是程序依然可以启动。 问题解决…...

如何在看板中体现优先级变化
在看板中有效体现优先级变化的关键措施包括:采用颜色或标签标识优先级、设置任务排序规则、使用独立的优先级列或泳道、结合自动化规则同步优先级变化、建立定期的优先级审查流程。其中,设置任务排序规则尤其重要,因为它让看板视觉上直观地体…...

Linux相关概念和易错知识点(42)(TCP的连接管理、可靠性、面临复杂网络的处理)
目录 1.TCP的连接管理机制(1)三次握手①握手过程②对握手过程的理解 (2)四次挥手(3)握手和挥手的触发(4)状态切换①挥手过程中状态的切换②握手过程中状态的切换 2.TCP的可靠性&…...
Axios请求超时重发机制
Axios 超时重新请求实现方案 在 Axios 中实现超时重新请求可以通过以下几种方式: 1. 使用拦截器实现自动重试 import axios from axios;// 创建axios实例 const instance axios.create();// 设置超时时间 instance.defaults.timeout 5000;// 最大重试次数 cons…...
Git常用命令完全指南:从入门到精通
Git常用命令完全指南:从入门到精通 一、基础配置命令 1. 用户信息配置 # 设置全局用户名 git config --global user.name "你的名字"# 设置全局邮箱 git config --global user.email "你的邮箱example.com"# 查看所有配置 git config --list…...
Kafka主题运维全指南:从基础配置到故障处理
#作者:张桐瑞 文章目录 主题日常管理1. 修改主题分区。2. 修改主题级别参数。3. 变更副本数。4. 修改主题限速。5.主题分区迁移。6. 常见主题错误处理常见错误1:主题删除失败。常见错误2:__consumer_offsets占用太多的磁盘。 主题日常管理 …...

MyBatis中关于缓存的理解
MyBatis缓存 MyBatis系统当中默认定义两级缓存:一级缓存、二级缓存 默认情况下,只有一级缓存开启(sqlSession级别的缓存)二级缓存需要手动开启配置,需要局域namespace级别的缓存 一级缓存(本地缓存&#…...

Qwen系列之Qwen3解读:最强开源模型的细节拆解
文章目录 1.1分钟快览2.模型架构2.1.Dense模型2.2.MoE模型 3.预训练阶段3.1.数据3.2.训练3.3.评估 4.后训练阶段S1: 长链思维冷启动S2: 推理强化学习S3: 思考模式融合S4: 通用强化学习 5.全家桶中的小模型训练评估评估数据集评估细节评估效果弱智评估和民间Arena 分析展望 如果…...
Git 命令全流程总结
以下是从初始化到版本控制、查看记录、撤回操作的 Git 命令全流程总结,按操作场景分类整理: 一、初始化与基础操作 操作命令初始化仓库git init添加所有文件到暂存区git add .提交到本地仓库git commit -m "提交描述"首次提交需配置身份git c…...