当前位置: 首页 > news >正文

显卡基础知识及元器件原理分析

显卡应该算是是目前最为火热的研发方向了,其中的明星公司当属英伟达。
当地时间8月23日,英伟达发布截至7月30日的2024财年第二财季财报,营收和利润成倍增长,均超市场预期。

财报显示,第二财季英伟达营收为135.07 亿美元,同比增长101%,环比增长88%。美国通用会计准则(GAAP)下,净利润为61.88 亿美元,同比增长843%,环比增长203%,non-GAAP下净利润为67.40亿美元,同比增长422%毛利率大幅提升至70.1%。
英伟达预计,2024财年第三财季该公司的营收将达160亿美元,上下浮动2%。GAAP下的毛利润率预计在71.5%,non-GAAP下预计为72.5%,均高于第二财季。
具体业务层面,在AI业务推动下,数据中心业务创下新高。英伟达数据中心业务第二财季营收为103.2亿美元,同比增长171%;游戏业务营收为24.9亿美元,同比增长 22%;专业可视化业务第二财季营收为3.79亿美元,同比下降 24%;车业务营收为2.53亿美元,同比增长 15%。
英伟达CEO黄仁勋表示,主要的云计算服务提供商纷纷宣布了大规模的英伟达H100 AI基础设施计划,领先的企业IT系统和软件提供商宣布建立合作伙伴关系,将英伟达AI引入各行各业,采用生成式人工智能的竞赛已经开始。
在这里插入图片描述
在这里插入图片描述

笔者闲暇时间也比较喜欢对不同的显卡做一些拆解分析。本文是对AMD 中低端显卡Radeon 520显卡最一些拆解和核心器件的原理分析。

在本文拆解前,先简要介绍两个概念:

1.显卡是什么?

显卡,又称显示卡、显示器适配器、图形加速器、图形处理器、显卡芯片等。显卡是计算机中的一种重要的硬件组件,主要用于处理图形和视频数据,将数字信号转换成模拟信号输出到显示器上显示。显卡通常包含一个或多个图形处理器(GPU),以及一定量的显存,可以提供更流畅、更高质量的图像和视频输出。

2. 显卡的功能?显卡和chatGPT的关系?

据报道,微软给 ChatGPT 准备了一万多张 A100,但面对井喷式的流量需求,OpenAI 还是坚持不住了,出现了宕机。
有人做过预估,想要满足当下的用户流量,微软还得买几万张 A100、H100 显卡,目前的算力远远不够。
功耗与性能计算:一般来说,8张 A100 组成的 DGX A100 服务器大概售价 19.9 万美元,最高功率为 6.5kW。
按照一万张来算的话,光在硬件上微软就要花去 2.5 亿美元,运行一个月就要用掉 585 万度电。
从基本逻辑来说,chatGPT和矿机的实现是有一定相似性的。对于矿机,更高效的挖矿就需要堆算力;而对于chatGPT而言,要更智能跟准确的回来问题,就需要更多的机器作训练。

3. AMD Radeon 520的拆解和介绍

AMD Radeon 520 显卡(也称为 GPU)的性能等级为 626。 这是一个很好的结果。 显卡 AMD Radeon 520 以 1030 MHz 的最低时钟速度运行。 它具有加速选项的特点,并且能够运行到 . 制造商为 AMD 配备了 2 GB 内存,时钟速度 2250 MHz 和带宽 16 GB/s。
在这里插入图片描述

这张显卡的功耗为50瓦,制造过程仅为28 nm。
• 实物图
在这里插入图片描述
在这里插入图片描述

拆掉风扇后的照片,非常简洁,主要就是显示接口,GPU芯片,显存,电源这四个模块,后面再一一详细看。

整板正面
在这里插入图片描述

整板背面
在这里插入图片描述

首先,最左边的就是显示接口,分别是HDMI接口和VGA接口。
在这里插入图片描述

然后,是GPU处理器芯片。如下图
在这里插入图片描述

正面——GPU部分
命名规则如下图
在这里插入图片描述
在这里插入图片描述

其次,是显存芯片,支持DDR3以及GDDR5
在这里插入图片描述

正面——memory芯片(Micron ICB77-D9VVR)部分GDDR5 SDRAM
• Memory Detail:Micron:GDDR5,8Gb*2pcs=2GB,Vmem=1.1V
在这里插入图片描述
在这里插入图片描述

再次是电源。

一般GPU的核心电源是多相电源,用来满足大功率输出要求。
但这颗芯片定位低端市场,因此使用了单相BUCK控制芯片,然后搭配外置的MOS管,提供足够的输出电流。
在这里插入图片描述

GS7210A——单相BUCK控制芯片

在这里插入图片描述

GStek-GS9238 0NXB——单相BUCK控制芯片

在这里插入图片描述

PK618BA、PK698SA --NMOS管

然后,一些DC-DC以及LDO用来满足板卡其他电源的电流需求,比较简单就不再赘述。
在这里插入图片描述

LD1117AG ——低压差线性稳压器

在这里插入图片描述

PB4350 ——NPN晶体管

在这里插入图片描述

GStek-GS7166——线性稳压器(LDO)

在这里插入图片描述

MXIC-25L1006E——flash

在这里插入图片描述

IADPN——
这一颗芯片只有MARK,还没有仔细查型号,知道的朋友,告诉一下。。。。
在这里插入图片描述

N21-7GN107——

总结:

AMD Radeon 520是一款入门级独立显卡,适用于轻度游戏和日常办公使用,国内常作为亮机卡使用。

性能:AMD Radeon 520采用GCN架构,拥有320个流处理器和2GB GDDR5显存。它的性能适中,适合处理一些轻度游戏和多媒体应用。

游戏性能:AMD Radeon 520适合玩一些较老的游戏或者对画质要求不高的较新游戏。对于一些图形要求较高的AAA级游戏,它的性能可能不够。

功耗和散热:AMD Radeon 520的功耗相对较低,散热相对较好,适合在笔记本电脑等小型设备中使用。

支持功能:AMD Radeon 520支持DirectX 12、Vulkan和OpenGL等主流图形API,以及AMD的FreeSync技术,提供更流畅的游戏体验。

驱动支持:AMD Radeon 520有稳定的驱动支持,可以通过AMD官方网站获取最新的驱动程序。

显卡的主要组件包括:

GPU(图形处理器):控制图像的计算和处理,是显卡的核心组件。GPU 负责的工作大多是重复性的 3D 建模或者 3D 渲染,其上主要包括运算单元(SP)和控制单元。运算单元负责顶点运算和像素运算,在不同场景下动态分配进行顶点运算和像素运算的流处理器数量,达到资源的高效利用。控制单元则负责管理整个 GPU 的运行。
显存(视频内存):显存是显卡中用于存储图像数据、纹理和其他图形资源的内存。它具有高带宽和低延迟,可以快速地提供图像数据给GPU进行处理。显存的容量和类型对于处理高分辨率图像和复杂场景非常重要。
PCB(印刷电路板):连接所有的元件和接口,使它们可以协同工作。上面安装有GPU芯片、显存、电源连接器等。PCB的设计可以影响显卡的散热、信号传输和电源分配等方面。
散热系统: 由于GPU在高负载下会产生大量热量,显卡通常配备散热系统来冷却GPU芯片。这可能包括散热风扇、散热器、热管等,以确保显卡保持适当的工作温度。
电源供应: 显卡需要电源供应以驱动GPU和其他组件。高性能显卡通常需要额外的电源连接,如6针或8针PCIe电源接口,以满足其高功耗需求。
视频输出端口: 显卡通常配备多个视频输出端口,如HDMI、DisplayPort、DVI等,用于连接显示器、投影仪等设备以显示图像和视频。
电容和电感: 这些元件在显卡的电路中起到稳定电源供应、滤波和噪音抑制等作用,有助于保持电路的稳定性和性能。
监控芯片: 一些显卡可能搭载监控芯片,用于监测显卡的温度、风扇速度等参数,并且可以通过驱动程序进行设置和调整。

相关文章:

显卡基础知识及元器件原理分析

显卡应该算是是目前最为火热的研发方向了,其中的明星公司当属英伟达。 当地时间8月23日,英伟达发布截至7月30日的2024财年第二财季财报,营收和利润成倍增长,均超市场预期。 财报显示,第二财季英伟达营收为135.07 亿美…...

Spark Rebalance hint的倾斜的处理(OptimizeSkewInRebalancePartitions)

背景 本文基于Spark 3.5.0 目前公司在做小文件合并的时候用到了 Spark Rebalance 这个算子,这个算子的主要作用是在AQE阶段的最后写文件的阶段进行小文件的合并,使得最后落盘的文件不会太大也不会太小,从而达到小文件合并的作用,…...

Vue 3中实现基于角色的权限认证实现思路

一、基于角色的权限认证主要步骤 在Vue 3中实现基于角色的权限认证通常涉及以下几个主要步骤: 定义角色和权限:首先需要在后端服务定义不同的角色和它们对应的权限。权限可以是对特定资源的访问权限,比如读取、写入、修改等。用户认证&#…...

Visual Studio 2022进行文件差异比较

前言 Visual Studio 2022在版本17.7.4中发布在解决方案资源管理器中比较文件的功能,通过使用此功能,可以轻松地查看两个文件之间的差异,包括添加、删除和修改的代码行。可以逐行查看差异,并根据需要手动调整和编辑文件内容以进行…...

1.2 编译型语言和解释型语言的区别

编译型语言和解释型语言的区别 通过高级语言编写的源码,我们能够轻松理解,但对于计算机来说,它只认识二进制指令,源码就是天书,根本无法识别。源码要想执行,必须先转换成二进制指令。 所谓二进制指令&…...

C语言-常量

什么是常量? 答:常量是在程序执行过程中,其值不发生改变的量,常量分为直接常量和符号常量两种。 其中直接常量又可以分为整型常量、实型常量、字符型常量、字符串常量。 直接常量 1.整型常量 整型常量即整数,包括正整数,负整数和0。c语言中常量可以用八进制,十进制和十六…...

开源的OCR工具基本使用:PaddleOCR/Tesseract/CnOCR

前言 因项目需要,调研了一下目前市面上一些开源的OCR工具,支持本地部署,非调用API,主要有PaddleOCR/CnOCR/chinese_lite OCR/EasyOCR/Tesseract/chineseocr/mmocr这几款产品。 本文主要尝试了EasyOCR/CnOCR/Tesseract/PaddleOCR这…...

vue3实现输入框短信验证码功能---全网始祖

组件功能分析 1.按键删除,清空当前input,并跳转prevInput & 获取焦点,按键delete,清空当前input,并跳转nextInput & 获取焦点。按键Home/End键,焦点跳转first/最后一个input输入框。ArrowLeft/ArrowRight键点击…...

[C#]winformYOLO区域检测任意形状区域绘制射线算法实现

【简单介绍】 Winform OpenCVSharp YOLO区域检测与任意形状区域射线绘制算法实现 在现代安全监控系统中,区域检测是一项至关重要的功能。通过使用Winform结合OpenCVSharp库,并结合YOLO(You Only Look Once)算法,我们…...

个人网站制作 Part 14 添加网站分析工具 | Web开发项目

文章目录 👩‍💻 基础Web开发练手项目系列:个人网站制作🚀 添加网站分析工具🔨使用Google Analytics🔧步骤 1: 注册Google Analytics账户🔧步骤 2: 获取跟踪代码 🔨使用Vue.js&#…...

数据按设定单位(分辨率)划分的方法

1. 问题描述 需要将使用公式计算后的float数值换算到固定间隔数轴的对应位置上的数据,比如2.186这个数据,将该数据换算到以0.25为间隔的数轴上,换算后是2.0,还是2.25呢?该方法就是解决这个问题。 2. 方法 输入&…...

Ubuntu 搭建gitlab服务器,及使用repo管理

一、GitLab安装与配置 GitLab 是一个用于仓库管理系统的开源项目,使用Git作为代码管理工具,并在此基础上搭建起来的Web服务。 1、安装Ubuntu系统(这个教程很多,就不展开了)。 2、安装gitlab社区版本,有需…...

QT(19)-QNetworkRequest

attribute(QNetworkRequest::Attribute code, const QVariant &defaultValue QVariant()) const 获取指定的请求属性。如果该属性未设置,则返回默认值。 hasRawHeader(const QByteArray &headerName) const 检查是否存在指定名称的原始请求头。 header(Q…...

基于Vue的社区旧衣回收利用系统的设计与实现

经济的高速发展使得每一个家庭的收入都获得了大幅增长,随之而来的就是各种梦想的逐步实现,首当其冲的就是各类衣服的更新换代而导致了大量旧衣物在家中的积存。为了帮助人们解决旧衣物处理的问题而以当前主流的互联网技术构建一个可于社区中实现旧衣回收…...

【网站项目】291校园疫情防控系统

🙊作者简介:拥有多年开发工作经验,分享技术代码帮助学生学习,独立完成自己的项目或者毕业设计。 代码可以私聊博主获取。🌹赠送计算机毕业设计600个选题excel文件,帮助大学选题。赠送开题报告模板&#xff…...

win git filter-repo教程

git filter-repo 是一个用于过滤和清理 Git 仓库历史的工具,它可以高效地批量修改提交历史中的文件内容、删除文件、重命名文件以及进行其他历史重构操作。相较于 git filter-branch,它通常更快且更易于使用。 以下是一个基本示例,说明如何使…...

Redis相关操作高阶篇--集群搭建

Redis相关操作大全一篇全搞定-CSDN博客 Redis集群 是一个由多个主从节点群组成的分布式服务器群,它具有复制、高可用和分片特性。Redis集群不需要seninel哨兵也能完成节点移除和故障转移的功能。需要将每个节点 设置成集群模式,这种集群模式没有中心节…...

JNDI注入原理及利用IDEA漏洞复现

🍬 博主介绍👨‍🎓 博主介绍:大家好,我是 hacker-routing ,很高兴认识大家~ ✨主攻领域:【渗透领域】【应急响应】 【Java、PHP】 【VulnHub靶场复现】【面试分析】 🎉点赞➕评论➕收…...

大数据,或称巨量资料

大数据,或称巨量资料,指的是在传统数据处理应用软件不足以处理的大或复杂的数据集。大数据也可以定义为来自各种来源的大量非结构化或结构化数据。从学术角度而言,大数据的出现促成广泛主题的新颖研究,这也导致各种大数据统计方法…...

windows上打开redis服务闪退问题处理

方法1:在windows上面打开redis服务时,弹窗闪退可能是6379端口占用,可以用以下命令查看: netstat -aon | findstr 6379 如果端口被占用可以用这个命令解决: taskkill /f /pid 进程号 方法2: 可以使用…...

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造,完美适配AGV和无人叉车。同时,集成以太网与语音合成技术,为各类高级系统(如MES、调度系统、库位管理、立库等)提供高效便捷的语音交互体验。 L…...

树莓派超全系列教程文档--(61)树莓派摄像头高级使用方法

树莓派摄像头高级使用方法 配置通过调谐文件来调整相机行为 使用多个摄像头安装 libcam 和 rpicam-apps依赖关系开发包 文章来源: http://raspberry.dns8844.cn/documentation 原文网址 配置 大多数用例自动工作,无需更改相机配置。但是,一…...

Spring Boot 实现流式响应(兼容 2.7.x)

在实际开发中,我们可能会遇到一些流式数据处理的场景,比如接收来自上游接口的 Server-Sent Events(SSE) 或 流式 JSON 内容,并将其原样中转给前端页面或客户端。这种情况下,传统的 RestTemplate 缓存机制会…...

DAY 47

三、通道注意力 3.1 通道注意力的定义 # 新增:通道注意力模块(SE模块) class ChannelAttention(nn.Module):"""通道注意力模块(Squeeze-and-Excitation)"""def __init__(self, in_channels, reduction_rat…...

抖音增长新引擎:品融电商,一站式全案代运营领跑者

抖音增长新引擎:品融电商,一站式全案代运营领跑者 在抖音这个日活超7亿的流量汪洋中,品牌如何破浪前行?自建团队成本高、效果难控;碎片化运营又难成合力——这正是许多企业面临的增长困局。品融电商以「抖音全案代运营…...

Golang dig框架与GraphQL的完美结合

将 Go 的 Dig 依赖注入框架与 GraphQL 结合使用,可以显著提升应用程序的可维护性、可测试性以及灵活性。 Dig 是一个强大的依赖注入容器,能够帮助开发者更好地管理复杂的依赖关系,而 GraphQL 则是一种用于 API 的查询语言,能够提…...

【项目实战】通过多模态+LangGraph实现PPT生成助手

PPT自动生成系统 基于LangGraph的PPT自动生成系统,可以将Markdown文档自动转换为PPT演示文稿。 功能特点 Markdown解析:自动解析Markdown文档结构PPT模板分析:分析PPT模板的布局和风格智能布局决策:匹配内容与合适的PPT布局自动…...

Nuxt.js 中的路由配置详解

Nuxt.js 通过其内置的路由系统简化了应用的路由配置,使得开发者可以轻松地管理页面导航和 URL 结构。路由配置主要涉及页面组件的组织、动态路由的设置以及路由元信息的配置。 自动路由生成 Nuxt.js 会根据 pages 目录下的文件结构自动生成路由配置。每个文件都会对…...

2025盘古石杯决赛【手机取证】

前言 第三届盘古石杯国际电子数据取证大赛决赛 最后一题没有解出来,实在找不到,希望有大佬教一下我。 还有就会议时间,我感觉不是图片时间,因为在电脑看到是其他时间用老会议系统开的会。 手机取证 1、分析鸿蒙手机检材&#x…...

拉力测试cuda pytorch 把 4070显卡拉满

import torch import timedef stress_test_gpu(matrix_size16384, duration300):"""对GPU进行压力测试,通过持续的矩阵乘法来最大化GPU利用率参数:matrix_size: 矩阵维度大小,增大可提高计算复杂度duration: 测试持续时间(秒&…...