当前位置: 首页 > news >正文

AI算力报告:算力大时代,AI算力产业链全景梳理

今天分享的是AI算力专题系列深度研究报告:《算力大时代,AI算力产业链全景梳理》。

(报告出品方:中信建投证券)

报告共计:98页

核心观点

生成式 AI取得突破,我们对生成式 A 带来的算力需求做了上下游梳理,并做了交叉验证,可以看到以chatGPT 为代表的大模型训练和推理端均需要强大的算力支撑,产业链共振明显,产业链放量顺序为:先进制程制造->以chiplet 为代表的2.5D/3D 封装、HBM->AI 芯片->板卡组装->交换机->光模块-液冷->AI 服务器->IDC 出租运维。综合来看,大模型仍处于混战阶段,应用处于渗透率早期,AI板块中算力需求增长的确定性较高,在未来两年时间内,算力板块都将处于高景气度阶段,重点推荐 AI算力产业链各环节相关公司。

摘要

生成式 AI取得突破,实现了从0到1的跨越,以ChatGPT为代表的人工智能大模型训练和推理需要强大的算力支撑。自2022 年底 OpenAl正式推出ChatGPT后,用户量大幅增长,围绕ChatGPT 相关的应用层出不穷,其通用性能力帮助人类在文字等工作上节省了大量时间。同时在Transformer 新架构下,多模态大模型也取得新的突破,文生图、文生视频等功能不断完善,并在广告、游戏等领域取得不错的进展。生成式A将是未来几年最重要的生产力工具,并深刻改变各个产业环节,围绕生成式A,无论是训练还是推理端,算力需求都将有望爆发式增长。

训练和推理端 AI算力需求或几何倍数增长。首先是训练侧参考 OpenAl论文,大模型训练侧算力需求=训练所需要的token数量*6*大模型参数量。可以看到从GPT3.5到GPT4,模型效果越来越好,模型也越来越大,训练所需要的token 数量和参数量均大幅增长,相应的训练算力需求也大幅增长。并且,与GPT4相关的公开论文也比较少,各家巨头向GPT4迈进的时候,需要更多方向上的探索,也将带来更多的训练侧算力需求。根据我们的推算,2023年-2027年,全球大模型训练端峰值算力需求量的年复合增长率有望达到78.0%,2023年全球大模型训练端所需全部算力换算成的 A100 芯片总量可能超过200万张。其次是推理侧,单个 token 的推理过程整体运算量为2*大模型参数量,因此大模型推理侧每日算力需求=每日调用大模型次数*每人平均查询 Token 数量*2*大模型参数量,仅以 Google 搜索引擎为例,每年调用次数至少超过2万亿,一旦和大模型结合,其A1算力需求将十分可观。随着越来越多的应用和大模型结合,推理侧算力需求也有望呈现爆发增长势头。根据我们的推算,2023年-2027年,全球大模型云端推理的峰值算力需求量的年复合增长率有望高达113%。

算力产业链价值放量顺序如下:先进制程制造->以chiplet为代表的 2.5D/3D封装、HBM->AI芯片->板卡组装->交换机->光模块->液冷->AI服务器->IDC 出租运维。

先进封装、HBM:为了解决先进制程成本快速提升和“内存墙”等问题,Chiplet 设计+异构先进封装成为性能与成本平衡的最佳方案,台积电开发的CoWos封装技术可以实现计算核心与HBM 通过 2.5D封装互连,因此英伟达 A100、H100等A1芯片纷纷采用台积电CoWos封装,并分别配备40GBHBM2E、80GB的HBM3内存。全球晶圆代工龙头台积电打造全球 2.5D/3D 先进封装工艺标杆,未来几年封装市场增长主要受益于先进封装的扩产。先进封装市场的快速增长,有望成为国内品圆代工厂商(中芯国际)与封测厂商(长电科技、通富微电、甬矽电子和深科技)的新一轮成长驱动力。

AI芯片/板卡封装:以英伟达为代表,今年二季度开始释放业绩。模型训练需要规模化的算力芯片部署于智能服务器,CPU不可或缺,但性能提升遭遇瓶颈,CPU+xPU异构方案成为大算力场景标配。其中GPU并行计算优势明显,CPU+GPU成为目前最流行的异构计算系统,而NPU在特定场景下的性能、效率优势明显,推理端应用潜力巨大,随着大模型多模态发展,硬件需求有望从GPU扩展至周边编解码硬件。A1加速芯片市场上,英伟达凭借其硬件产品性能的先进性和生态构建的完善性处于市场领导地位,在训练、推理端均占据领先地位。根据 Liftr nsights 数据,2022年数据中心 A1 加速市场中,英伟达份额达 82%。因此 A1 芯片需求爆发,英伟达最为受益,其 Q2收入指引 110亿美金,预计其数据中心芯片业务收入接近翻倍。国内厂商虽然在硬件产品性能和*业链生态架构方面与前者有所差距,但正在逐步完善产品布局和生态构建,不断缩小与行业龙头厂商的差距,并且英伟达、AMD对华供应高端 GPU芯片受限,国产算力芯片迎来国产替代窗口期。当前已经涌现出一大批国产算力芯片厂商:1)寒武纪:国内人工智能芯片领军者,持续强化核心竞争力:2)海光信息:深算系列GPGPU提供高性能算力,升级迭代稳步推进:3)龙芯中科:自主架构CPU行业先行者,新品频发加速驱动成长;4)芯原股份:国内半导体IP龙头,技术储备丰富驱动成长:5)工业富联:提供GPU芯片板块组装服务。

交换机:与传统数据中心的网络架构相比,A1数据网络架构会带来更多的交换机端口的需求。交换机具备技术壁垒,中国市场格局稳定,华为与新华三(紫光股份)两强争,锐捷网络展现追赶势头,建议重点关注。

光模块:AI 算力带动数据中心内部数据流量较大,光模块速率及数量均有显著提升。训练侧光模块需求与GPU 出货量强相关,推理侧光模块需求与数据流量强相关,伴随应用加速渗透,未来推理所需的算力和流量实际上可能远大于训练。目前,训练侧英伟达的 A100 GPU 主要对应 200G光模块和 400G光模块,H100 GPU 可以对应 400G或 800G光模块。根据我们的测算,训练端 A100和 200G光模块的比例是1:7,H100和800G光模块的比例是 1:3.5。800G 光模块 2022年底开始小批量出货,2023 年需求主要来自于英伟达和谷歌。在 2023 年这个时间点,市场下一代高速率光模块均指向 800G光模块,叠加 AIGC 带来的算力和模型竞赛,我们预计北美名大云厂商和相关科技巨头均有望在 2024年大量采购800G光模块,同时2023年也可能提前采购。

光模块上游--光芯片:以 AWG、PLC等为代表的无源光芯片,国内厂商市占率全球领先。以 EEL、VCSELDFB 等激光器芯片、探测器芯片和调制器芯片为代表的有源光芯片是现代光学技术的重要基石,是有源光器件的重要组成部分。以源杰科技、光库科技为代表的国内光芯片厂商不断攻城拔寨,在多个细分产品领域取得了较大进展,国产替代化加速推进,市场空间广阔。

液冷:AI大模型训练和推理所用的 GPU服务器功率密度将大幅提升,以英伟达DGXA100服务器为例,其单机最大功率约可达到6.5kw,大幅超过单台普通CPU服务器500w 左右的功率水平。根据《冷板式液冷服务器可靠性白皮书》数据显示,自然风冷的数据中心单柜密度一般只支持8kW-10kW,通常液冷数据中心单机柜可支持 30kw 以上的散热能力,并能较好演进到 100kW 以上,相较而言液冷的散热能力和经济性均有明显优势。司时“东数西算” 明确 PUE(数据中心总能耗/T 设备能耗)要求,枢纽节点 PUE要求更高,同时考虑到整体规划布局,未来新增机柜更多将在枢纽节点内,风冷方案在某些地区可能无法严格满足要求,液冷方案渗透率有望加速提升。目前在 A 算力需求的推动下,如浪潮信息、中兴通讯等服务器厂商已经开始大力布局液冷服务器产品。

AI服务器:预计今年 Q2-03开始逐步释放业绩。具体来看,训练型AI服务器成本中,约7成以上中 GPU构成,其余 CPU、存储、内存等占比相对较小,均价常达到百万元以上。对于推理型服务器,其 GPU 成本约为2-3成,整体成本构成与高性能型相近,价格常在 20-30万。根据IDC数据,2022年全球 A1服务器市场规模 202亿美元,同比增长 29.8%,占服务器市场规模的比例为16.4%,同比提升 1.2pct。我们认为全球 AI 服务器市场规模未来3年内将保持高速增长,市场规模分别为395/890/1601亿美元,对应增速96%/125%/80%。根据IDC数据,2022年中国A1服务器市场规模67亿美元,同比增长24%。我们预计,2023-2025年,结合对于全球 A1 服务器市场规模的预判,以及对于我国份额占比持续提升的假设,我国A服务器市场规模有望达到 134/307/561亿美元,同比增长101%/128%/83%。竞争格局方面,考虑到AI服务器研发和投入上需要更充足的资金及技术支持,国内市场的竞争格局预计将继续向头部集中,保持一超多强的竞争格局。重点推荐:1)浪潮信息:全球服务器行业龙头厂商,其 AI服务器多次位列全球市占率第一:2)工业富联:为英伟达提供 H100 等芯片组装,以及 A服务器生产:3)紫光股份:子公司新华三A服务器在手订单饱满,同时可以提供交换机、路由器等:4)中科曙光:高性能计算及国产化服务器龙头;5)中兴通讯:服务器业务快速增长;6)拓维信息:华为昇腾+鲲鹏核心合作伙伴:7)联想集团:全球领先的ICT设备企业。

报告共计:98页

精选报告来源/公众号:海选智库
本文仅供参考,不代表我们的任何投资建议。海选智库整理分享的资料仅推荐阅读,如需使用请参阅报告原文。

相关文章:

AI算力报告:算力大时代,AI算力产业链全景梳理

今天分享的是AI算力专题系列深度研究报告:《算力大时代,AI算力产业链全景梳理》。 (报告出品方:中信建投证券) 报告共计:98页 核心观点 生成式 AI取得突破,我们对生成式 A 带来的算力需求做…...

点击上传文件

一、页面样式: (1)点击前: (2)点击后: 设计:①自定义elementPlus图标;②使用Tooltip实现鼠标悬浮按钮上出现文字提示;③上传与更换的切换样式;…...

文件上传【2】--靶场通关

1.前端禁用js绕过 上传文件,进行抓包,没有抓到,说明这里的验证是前端js验证跳出的弹窗 禁用js后,php文件上传成功。 2.文件上传.htaccess 上传png木马后连接不上 代码中存在.htaccess,判断此时应该就是需要用到.htac…...

uniapp请求后端接口

新建文件夹utils const request (config) > {// 拼接完整的接口路径config.url http://mm.test.cn config.url;//这里拼接的是访问后端接口的地址,http://mm.test.cn/prod-api/testconsole.log(config.url)//判断是都携带参数if(!config.data){config.data …...

第十三章 OpenGL ES-RGB、HSV、HSL模型介绍

第十三章 OpenGL ES-RGB、HSV、HSL模型详细介绍 第一章 OpenGL ES 基础-屏幕、纹理、顶点坐标 第二章 OpenGL ES 基础-GLSL语法简单总结 第三章 OpenGL ES 基础-GLSL渲染纹理 第四章 OpenGL ES 基础-位移、缩放、旋转原理 第五章 OpenGL ES 基础-透视投影矩阵与正交投影矩阵…...

微软卡内基梅隆大学:无外部干预,GPT4等大语言模型难以自主探索

目录 引言:LLMs在强化学习中的探索能力探究 研究背景:LLMs的在情境中学习能力及其重要性 实验设计:多臂老虎机环境中的LLMs探索行为 实验结果概览:LLMs在探索任务中的普遍失败 成功案例分析:Gpt-4在特定配置下的探…...

探索设计模式的魅力:简单工厂模式

个人主页: danci_ 🔥系列专栏:《设计模式》《MYSQL应用》 💪🏻 制定明确可量化的目标,坚持默默的做事。 🚀 转载自热榜文章:探索设计模式的魅力:简单工厂模式 简单工厂模式&#x…...

【数据结构】-----双链表(小白必看!!!)

c语言中的小小白-CSDN博客c语言中的小小白关注算法,c,c语言,贪心算法,链表,mysql,动态规划,后端,线性回归,数据结构,排序算法领域.https://blog.csdn.net/bhbcdxb123?spm1001.2014.3001.5343 给大家分享一句我很喜欢我话: 知不足而奋进,望远山而前行&am…...

【数据结构】考研真题攻克与重点知识点剖析 - 第 8 篇:排序

前言 本文基础知识部分来自于b站:分享笔记的好人儿的思维导图与王道考研课程,感谢大佬的开源精神,习题来自老师划的重点以及考研真题。此前我尝试了完全使用Python或是结合大语言模型对考研真题进行数据清洗与可视化分析,本人技术…...

数字乡村可视化大数据-DIY拖拽式设计

DIY拖拽式大数据自由设计万村乐可视化大数据V1.0 随着万村乐数字乡村系统的广泛使用,我们也接收到了客户的真实反馈,最终在公司的决定下,我们推出了全新的可视化大数据平台V1.0版本,全新的可视化平台是一个通过拖拽配置生成可视化…...

数据集学习

1,CIFAR-10数据集 CIFAR-10数据集由10个类的60000个32x32彩色图像组成,每个类有6000个图像。有50000个训练图像和10000个测试图像。 数据集分为五个训练批次和一个测试批次,每个批次有10000个图像。测试批次包含来自每个类别的恰好1000个随机…...

【解决】npm run dev Syntax Error: TypeError: eslint.CLIEngine is not a constructor

问题: 由于代码语法不符合eslint而照成此错误,可以参照eslint规则修改语法,或者将eslint停掉 以下为停掉eslint的方法。 You may use special comments to disable some warnings. Use // eslint-disable-next-line to ignore the ne…...

Android 如何通过屏幕大小来适配不同大小的图片

可以使用Android中的dp(密度无关像素)单位来设置不同屏幕密度下的图片大小。dp是Android中的一种尺寸单位,它与屏幕密度无关,只与字体大小有关。在开发过程中,可以使用dp来设置布局和控件的大小,以便在不同的屏幕密度下保持一致的…...

【面试题】细说mysql中的各种锁

前言 作为一名IT从业人员,无论你是开发,测试还是运维,在面试的过程中,我们经常会被数据库,数据库中最经常被问到就是MySql。当面试官问MySql的时候经常会问道一个问题,”MySQL中有哪些锁?“当我…...

TMS320F280049 EPWM模块--TZ子模块(6)

下图是TZ子模块在epwm中的位置,可以看到TZ子模块接收内外部多种信号,经过处理后生成最终epwm波形,然后通过gpio向外发出。 TZ的动作有4个:拉高/拉低/高阻/不变。 TZ的内部框图见下图,可以看出: 1&#xf…...

数字乡村创新实践探索农业现代化路径:科技赋能农业产业升级、提升乡村治理效能与农民幸福感

随着信息技术的快速发展和数字化时代的到来,数字乡村建设正成为推动农业现代化、提升农业产业竞争力、优化乡村治理以及提高农民幸福感的重要途径。本文将围绕数字乡村创新实践,探讨其在农业现代化路径中的积极作用,以及如何通过科技赋能实现…...

linux中rpm包与deb包的区别及使用

文章目录 1. rpm与deb的区别2. deb软件包的格式和使用2.1 deb软件包命令遵行如下约定2.2 dpkg命令2.3 apt-命令 3. Unix和Linux的区别Reference 1. rpm与deb的区别 有的系统只支持使用rpm包安装,有的只支持deb包安装,混乱安装会导致系统问题。 关于rpm和…...

Linux中安装seata

Linux中安装seata 一、准备1、环境2、下载3、上传到服务器4、解压 二、配置1、备份配置文件2、导入sql3、修改配置前4、修改配置后5、在nacos中配置 三、使用1、启动2、关闭 一、准备 1、环境 因为要在 nacos 中配置,要求安装并启动 nacos 。可以参考这篇博客。 …...

预印本仓库ArXiv——防止论文录用前被别人剽窃

文章目录 一、什么是预印本二、什么是ArXiv2.1 ArXiv的领域2.2 如何使用 一、什么是预印本 预印本(Preprint)是指科研工作者的研究成果还未在正式出版物上发表,而出于和同行交流目的自愿先在学术会议上或通过互联网发布的科研论文、科技报告…...

LNMP 架构

1. 环境准备 环境准备 lnmp 需要 安装 nginx mysql php 软件 1.1 关闭防火墙 systemctl disable --now firewalld setenforce 0 1.2 安装依赖包 yum -y install pcre-devel zlib-devel gcc gcc-c make 1.3 创建运行用户、组 (Nginx 服务程序默认以 nobody 身份…...

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …...

业务系统对接大模型的基础方案:架构设计与关键步骤

业务系统对接大模型&#xff1a;架构设计与关键步骤 在当今数字化转型的浪潮中&#xff0c;大语言模型&#xff08;LLM&#xff09;已成为企业提升业务效率和创新能力的关键技术之一。将大模型集成到业务系统中&#xff0c;不仅可以优化用户体验&#xff0c;还能为业务决策提供…...

Prompt Tuning、P-Tuning、Prefix Tuning的区别

一、Prompt Tuning、P-Tuning、Prefix Tuning的区别 1. Prompt Tuning(提示调优) 核心思想:固定预训练模型参数,仅学习额外的连续提示向量(通常是嵌入层的一部分)。实现方式:在输入文本前添加可训练的连续向量(软提示),模型只更新这些提示参数。优势:参数量少(仅提…...

蓝桥杯 2024 15届国赛 A组 儿童节快乐

P10576 [蓝桥杯 2024 国 A] 儿童节快乐 题目描述 五彩斑斓的气球在蓝天下悠然飘荡&#xff0c;轻快的音乐在耳边持续回荡&#xff0c;小朋友们手牵着手一同畅快欢笑。在这样一片安乐祥和的氛围下&#xff0c;六一来了。 今天是六一儿童节&#xff0c;小蓝老师为了让大家在节…...

dify打造数据可视化图表

一、概述 在日常工作和学习中&#xff0c;我们经常需要和数据打交道。无论是分析报告、项目展示&#xff0c;还是简单的数据洞察&#xff0c;一个清晰直观的图表&#xff0c;往往能胜过千言万语。 一款能让数据可视化变得超级简单的 MCP Server&#xff0c;由蚂蚁集团 AntV 团队…...

接口自动化测试:HttpRunner基础

相关文档 HttpRunner V3.x中文文档 HttpRunner 用户指南 使用HttpRunner 3.x实现接口自动化测试 HttpRunner介绍 HttpRunner 是一个开源的 API 测试工具&#xff0c;支持 HTTP(S)/HTTP2/WebSocket/RPC 等网络协议&#xff0c;涵盖接口测试、性能测试、数字体验监测等测试类型…...

GitHub 趋势日报 (2025年06月06日)

&#x1f4ca; 由 TrendForge 系统生成 | &#x1f310; https://trendforge.devlive.org/ &#x1f310; 本日报中的项目描述已自动翻译为中文 &#x1f4c8; 今日获星趋势图 今日获星趋势图 590 cognee 551 onlook 399 project-based-learning 348 build-your-own-x 320 ne…...

【前端异常】JavaScript错误处理:分析 Uncaught (in promise) error

在前端开发中&#xff0c;JavaScript 异常是不可避免的。随着现代前端应用越来越多地使用异步操作&#xff08;如 Promise、async/await 等&#xff09;&#xff0c;开发者常常会遇到 Uncaught (in promise) error 错误。这个错误是由于未正确处理 Promise 的拒绝&#xff08;r…...

Chrome 浏览器前端与客户端双向通信实战

Chrome 前端&#xff08;即页面 JS / Web UI&#xff09;与客户端&#xff08;C 后端&#xff09;的交互机制&#xff0c;是 Chromium 架构中非常核心的一环。下面我将按常见场景&#xff0c;从通道、流程、技术栈几个角度做一套完整的分析&#xff0c;特别适合你这种在分析和改…...

stm32wle5 lpuart DMA数据不接收

配置波特率9600时&#xff0c;需要使用外部低速晶振...