当前位置: 首页 > article >正文

专家观点:图形管线的变革

多年来图形管线一直依赖于成熟且固定的功能工作负载如几何处理、光栅化、纹理贴图和着色。这种传统方法为渲染提供了可预测的结构每个阶段都提供特定且易于理解的功能。然而这种模式已经悄然发生了深刻转变。现代渲染的特点如今是计算驱动流程、神经推理以及对AI辅助图像形成的日益依赖。AI在图形学中的作用已超越了辅助功能的范畴它正逐渐成为图像渲染、增强、重建和合成方式中不可或缺的一部分。因此GPU的未来方向是明确的它们必须在桌面平台、云平台和边缘设备中融入高效的AI加速能力。如今的芯片负责处理从几何处理到图像增强和重建的各种工作负载。这一转变使AI加速成为现代渲染的核心支柱推动着当代系统图形质量与能力的提升。在整个行业中现代图形引擎正从以片段处理为主的管线转向以计算为主导的模式这一点在高端PC引擎和主机级工作负载中尤为明显。对比早期引擎与当代管线可以清晰看到这一变化传统管线由片段着色主导而现代引擎将越来越多的帧时间分配给计算工作负载。光照、材质评估、可见性处理以及后处理正不断迁移到计算驱动阶段。当代渲染管线越来越依赖计算着色器来驱动光照、材质、可见性和后期处理。传统片段着色的比例正在稳步下降计算着色器以及超分辨率、降噪和增强技术已经占据了GPU帧处理时间的很大一部分。像DLSS和FSR这样的技术曾经被视为高端特性现在已成为现代引擎中的标准配置。它们利用神经网络从较低分辨率的输入重建高分辨率帧应用高质量降噪并在严格的延迟限制下保持时间稳定性。我们内部分析清晰地反映了这一转变。在现代渲染管线中越来越多的帧延迟不再直接花费在“绘制”像素上而是花费在通过神经方法从一个稀疏的基础较低分辨率输入、较少的着色样本和激进的时间复用来推断出一个感知上完整的图像。商业硬件决策也体现了这一模式。例如索尼从PlayStation 5向PlayStation 5 Pro的升级中GPU子系统的硅面积大约增加了4倍其中绝大部分用于神经计算而非传统着色或固定功能光线追踪。这反映了行业的明确判断未来图像质量的提升将主要来自重建与推理而非单纯提高片段吞吐量。从架构角度看实时3D图形始终是一门“近似科学”而非数学上的完全精确。其核心约束从来不是正确性而是受限的延迟和能耗这迫使引擎必须激进地剔除那些对感知画质提升不明显的计算。可见性裁剪、细节层次LOD、时间复用和重建技术本质上都遵循同一原则去除不必要的计算将硅面积和功耗预算集中用于真正能带来差异化体验的部分。这一理念对GPU设计产生了直接影响。随着工作负载越来越由重建、推理和近似计算主导架构重点从最大化原始片段吞吐量转向在渲染流水线内部高效执行中小规模神经网络。神经着色器正是这一趋势的自然演进将紧凑的神经网络嵌入着色阶段使近似过程以数据驱动的方式被“学习”并与现有着色执行和内存访问模式紧密耦合。要高效支持这一点就需要GPU将神经执行视为头等架构关注点而非辅助性的计算任务。需要针对低延迟、高利用率以及与传统着色进行细粒度集成进行优化而不是将其视为孤立的、面向批处理的推理任务。虽然神经超分辨率已经成为主流但神经着色器直接嵌入在着色管线内部的小型网络正涌现为实时图形学的下一个重大变革。行业技术成熟度分析表明神经着色正从早期创新阶段迈向本十年后期的更广泛应用。我们已经发布了神经近似技术的相关研究预计未来GPU需要将高效神经执行作为常规着色工作负载的一部分而非独立的计算路径。研发趋势也支持这一判断。预测图形工作负载未来方向的最快方式之一就是关注SIGGRAPH。过去两年中神经驱动图形研究的数量显著激增例如神经材质和神经隐式表面为复杂资产提供实时、可学习的表示。基于扩散的资产提取和内容合成使用生成模型来生成和优化3D内容。神经降噪、重建和混合生成工作流在最近的SIGGRAPH出版物中随处可见。神经驱动的艺术和设计工具将AI直接嵌入内容创作管线。规划多年架构的硬件团队必须认识到这一时间线因为今天设计的GPU模块必须支持2028年及以后的工作负载。涵盖材质、动画、渲染和工具的神经图形研究其数量和广度都确凿无疑地表明AI已成为计算机图形学中的基础学科。综上所述行业信号是一致的渲染不再是关于最大化FP32片段吞吐量而是关于灵活的、通用的计算。而当未来的图形工作负载严重依赖神经处理时GPU架构师就不能依赖标量或传统的着色器核心来高效运行它们。神经工作负载需要更高的计算密度、更低的单次推理能耗并支持与着色器紧密集成且具有互补内存访问模式的中小型网络。正因如此Imagination正将AI加速直接集成到GPU架构中使客户能够支持计算机图形的前沿发展。我们的E-Series GPU IP同时支持图形处理和通用推理应用通过AI加速单元与传统着色集群的紧密融合在低功耗下提供高吞吐性能。在未来实时图形将由重建、近似和神经执行来定义将AI视为渲染管线中的头等部分不是可有可无的——而是必不可少的。欲深入了解Imagination高效能GPU IP如何应对先进制程挑战请立即预约与团队会面。作者Ed Plowman英文链接https://blog.imaginationtech.com/the-transformation-of-graphics-pipelines声明本文为原创文章转载需注明作者、出处及原文链接。END欢迎加入Imagination GPU与人工智能交流2群入群请加小编微信eetrend89添加请备注公司名和职称推荐阅读专家洞察 | 功率而非面积边缘GPU设计为何迎来新纪元专家洞察 I 融合之势为何边缘GPU无法承受“专精化”之重Imagination Technologies 是一家总部位于英国的公司致力于研发芯片和软件知识产权IP基于Imagination IP的产品已在全球数十亿人的电话、汽车、家庭和工作场所中使用。获取更多物联网、智能穿戴、通信、汽车电子、图形图像开发等前沿技术信息欢迎关注 Imagination Tech

相关文章:

专家观点:图形管线的变革

多年来,图形管线一直依赖于成熟且固定的功能工作负载,如几何处理、光栅化、纹理贴图和着色。这种传统方法为渲染提供了可预测的结构,每个阶段都提供特定且易于理解的功能。然而,这种模式已经悄然发生了深刻转变。现代渲染的特点如…...

Boomi连续第12次获评“领导者”,并在2026年Gartner®集成平台即服务(iPaaS)魔力象限™中于“执行能力”维度位列最高

Boomi™(数据激活领域企业)今日宣布,其在2026年Gartner集成平台即服务(iPaaS)魔力象限™中获评“领导者”,并在“执行能力”维度位居最高。这是Boomi连续第12次获评该报告“领导者”,亦是该魔力…...

FUTURE POLICE真实案例:前端语音解析系统完整搭建过程

FUTURE POLICE真实案例:前端语音解析系统完整搭建过程 你是不是也遇到过这样的问题?手头有一段重要的会议录音,或者一个需要添加字幕的视频素材,但手动对齐字幕时间轴简直是一场噩梦。一句一句听,一帧一帧调&#xff…...

Keenfolks正式推出KEENFOLKS X_

面向企业增长打造的全球AI原生营销基础设施网络 作为一家为Coca-Cola、Diageo、Mars、Reckitt、Nestl及Merck-MSD等品牌提供营销项目支持的AI转型合作伙伴,Keenfolks今日宣布推出全新全球营销网络KEENFOLKS X_。该网络基于共享的AI基础设施构建,旨在为企…...

南北阁Nanbeige 4.1-3B Python源码分析工具开发实战

南北阁Nanbeige 4.1-3B Python源码分析工具开发实战 大型Python项目的维护痛点:代码越写越乱、性能瓶颈难定位、团队协作效率低。本文将展示如何用南北阁Nanbeige 4.1-3B模型构建智能源码分析工具,让代码维护变得简单高效。 1. 项目背景与需求场景 每个…...

Credo 推出面向新一代 AI 应用的 Robin 800G 光 DSP 系列

高度集成、高性能、高能效 —— 灵活部署方案加速 AI 基础设施建设Credo Technology Group Holding Ltd (Credo)(纳斯达克代码:CRDO),一家通过提供快速、可靠且高能效的系统解决方案,引领规模互…...

Z-Image-Turbo_Sugar脸部Lora模型版本管理与回滚:基于Git的工作流实践

Z-Image-Turbo_Sugar脸部Lora模型版本管理与回滚:基于Git的工作流实践 你是不是也遇到过这种情况?花了好几天时间,用Z-Image-Turbo模型微调了一个专门生成Sugar风格脸部的Lora模型,效果特别满意。结果手一抖,在原来的…...

Dify 代码执行安装自定义 Python 依赖及权限问题解决

一直都在比较深度的使用 Dify AI开发平台,今天做某个 agent 需求需要用到执行 python 脚本,并且要导入一些默认沙盒没有安装的依赖,比如 jaydebeapi、pandas等等。因为 dify 默认为了安全运行沙盒都是白名单模式,没有配置在内的权…...

Nanbeige 4.1-3B惊艳案例分享:30亿参数在复古UI中生成神谕级回答

Nanbeige 4.1-3B惊艳案例分享:30亿参数在复古UI中生成神谕级回答 1. 像素冒险中的AI对话革命 在当今AI交互界面普遍追求极简风格的大环境下,Nanbeige 4.1-3B带来了一场视觉与功能的双重革新。这套专为30亿参数大模型设计的"像素游戏风"对话前…...

【稀缺首发】中国某星座在轨卫星真实OBC源码片段(脱敏版):仅限本文公开的3段高可靠C代码——看懂如何用volatile+memory barrier应对单粒子翻转

第一章:低轨卫星C语言代码示例低轨卫星(LEO)嵌入式系统对实时性、内存占用和抗辐射鲁棒性有严苛要求,C语言因其零开销抽象、确定性执行与硬件级控制能力,成为星载软件开发的主流选择。以下示例模拟星务计算机中常见的遥…...

Nanbeige 4.1-3B惊艳效果:夜间模式切换与像素风格暗色适配

Nanbeige 4.1-3B惊艳效果:夜间模式切换与像素风格暗色适配 1. 复古像素风AI对话体验革新 在AI交互界面设计趋同化的今天,Nanbeige 4.1-3B的像素冒险聊天终端带来了一股清新之风。这套专为4.1-3B模型设计的前端界面,彻底颠覆了传统聊天机器人…...

ChromePass:3分钟找回Chrome浏览器所有密码的完整指南

ChromePass:3分钟找回Chrome浏览器所有密码的完整指南 【免费下载链接】chromepass Get all passwords stored by Chrome on WINDOWS. 项目地址: https://gitcode.com/gh_mirrors/chr/chromepass 你是否曾经在登录重要网站时,明明记得Chrome保存过…...

OpenCV手势识别实战:用convexityDefects函数实现数字手势检测(附完整代码)

OpenCV手势识别实战:用convexityDefects函数实现数字手势检测 手势识别作为人机交互的重要方式,在智能家居、虚拟现实、医疗康复等领域有着广泛应用。本文将带你从零开始,使用OpenCV的convexityDefects函数实现一个完整的数字手势识别系统。不…...

Qwen3-TTS-1.7B-Base实操手册:批量文本转语音+多音色并行生成

Qwen3-TTS-1.7B-Base实操手册:批量文本转语音多音色并行生成 想不想让电脑帮你把大段文字自动念出来,还能用不同人的声音、不同的语言来读?今天要聊的Qwen3-TTS-1.7B-Base,就是这样一个“声音魔法师”。它不仅能听懂你的文字&…...

从零到一:用Gen6D和COLMAP为自己的小物件做6D位姿估计(鼠标/充电器实测)

从零到一:用Gen6D和COLMAP实现自定义物体的6D位姿估计实战指南 当你拿起桌上的无线鼠标时,大脑能瞬间判断它的位置和朝向——这种空间感知能力对机器人而言却是巨大的挑战。6D位姿估计技术正试图赋予机器这种三维空间理解能力,而Gen6D作为202…...

# 智能交通系统中的多源数据融合:基于Python的实时车辆轨迹预测实战在智能交

智能交通系统中的多源数据融合:基于Python的实时车辆轨迹预测实战 在智能交通系统(ITS)中,精准的车辆轨迹预测能力是实现动态路径规划、拥堵预警和自动驾驶协同的核心支撑技术之一。本文将围绕如何利用Python构建一个轻量级但高效…...

智慧工地设备选型与落地实践:从技术参数到项目实效的全维度解析

作为建筑行业数字化转型的核心载体,智慧工地设备的选型与落地直接决定了项目管理的智能化水平。不少施工企业在设备采购时容易陷入 “参数堆砌” 的误区,忽略了场景适配性与系统协同性。本文结合建安物联在数百个项目中的实践经验,从设备技术…...

图层导出效率提升指南:Photoshop自动化工具的工作流优化方案

图层导出效率提升指南:Photoshop自动化工具的工作流优化方案 【免费下载链接】Photoshop-Export-Layers-to-Files-Fast This script allows you to export your layers as individual files at a speed much faster than the built-in script from Adobe. 项目地址…...

如何快速配置轻量级图像查看器:JPEGView的完整使用指南

如何快速配置轻量级图像查看器:JPEGView的完整使用指南 【免费下载链接】jpegview Fork of JPEGView by David Kleiner - fast and highly configurable viewer/editor for JPEG, BMP, PNG, WEBP, TGA, GIF and TIFF images with a minimal GUI. Basic on-the-fly i…...

西门子PLC与组态王联手打造水泥混凝土自动配料系统:动态视频组态界面+脚本应用

西门子PLC和组态王组态自动配料系统的设计水泥混凝土,以实际视频组态界面为准,带脚本车间里的搅拌机轰隆隆转着,水泥灰在传送带上扬起细密的粉尘。老王叼着烟头蹲在控制柜旁边,突然扭头冲我喊:"这破系统又卡在骨料…...

用丹青幻境做汉服设计:轻松生成唐代齐胸襦裙、宋代褙子等各朝代服饰

用丹青幻境做汉服设计:轻松生成唐代齐胸襦裙、宋代褙子等各朝代服饰 1. 丹青幻境与汉服设计的完美结合 丹青幻境Z-Image Atelier是一款专为数字艺术创作设计的AI工具,它将现代AI技术与传统东方美学完美融合。这款工具基于先进的Z-Image架构&#xff0c…...

4步打造企业级高效协作平台:DzzOffice私有化部署完整指南

4步打造企业级高效协作平台:DzzOffice私有化部署完整指南 【免费下载链接】dzzoffice dzzoffice 项目地址: https://gitcode.com/gh_mirrors/dz/dzzoffice 在数字化转型浪潮中,企业面临着信息孤岛、协作效率低下、数据安全风险等多重挑战。DzzOff…...

Phi-3-mini-128k-instruct效果对比:vs Qwen2.5-7B/Qwen3-4B在长文本理解任务中胜出

Phi-3-mini-128k-instruct效果对比:vs Qwen2.5-7B/Qwen3-4B在长文本理解任务中胜出 1. 模型简介 Phi-3-Mini-128K-Instruct是一个38亿参数的轻量级开放模型,采用Phi-3数据集训练而成。这个数据集包含合成数据和经过筛选的公开网站数据,特别…...

LumiPixel Canvas Quest赋能社交媒体运营:自动化生成品牌代言人形象

LumiPixel Canvas Quest赋能社交媒体运营:自动化生成品牌代言人形象 1. 社交媒体内容创作的痛点与机遇 在当今快节奏的社交媒体环境中,品牌运营团队面临着一个共同挑战:如何持续产出高质量、风格一致的视觉内容。传统的内容创作流程往往需要…...

叉车防撞系统如何实现预警

在工厂车间或隧道施工现场,你是否见过工人因设备盲区遭遇碰撞的惊险瞬间?UWB AOA防撞技术正用厘米级精度重构安全防护标准,让危险预警从“被动响应”升级为“主动防御”。 工人佩戴的胸卡标签不再是简单ID卡——当进入危险区域时,…...

Qwen3-32B模型成本对比:OpenClaw本地调用vs第三方API实战测评

Qwen3-32B模型成本对比:OpenClaw本地调用vs第三方API实战测评 1. 为什么需要关注模型调用成本 去年夏天,当我第一次用OpenClaw搭建个人自动化工作流时,被月底的API账单吓了一跳。一个简单的"每日行业资讯收集摘要生成"任务&#…...

PHP函数、面向对象、内置函数库与Web交互(第二篇)

前言 在掌握了PHP基础语法、流程控制与数组之后,我们进入实战篇。本篇将系统讲解PHP开发的四大核心技能:函数、面向对象编程、常用内置函数库和Web交互。这些是构建动态网站的关键,学完你就能独立开发功能完整的Web应用。 目录 前言 一、 函…...

嵌入式系统主流接口技术原理与工程实践

1. 嵌入式系统接口技术深度解析嵌入式系统作为连接物理世界与数字世界的桥梁,其核心能力不仅体现在计算性能上,更关键地依赖于丰富多样的外设接口技术。这些接口构成了系统与传感器、执行器、人机交互设备及网络环境之间信息交换的物理通道和协议基础。在…...

游戏世界的中央收银台:腾讯米大师

想象你开了一家餐厅。 餐厅正式营业之前,你需要做很多准备工作。 厨师要练习新菜品,可能会做失败,可能会浪# 米大师:游戏世界里的收银台 你走进一家大型商场。 商场里有几百家店铺,卖各种各样的东西。 但你注意到一件奇怪的事情: 每一家店铺,都没有自己的收银台。 …...

Nomic-Embed-Text-V2-MoE模型Windows部署全流程:从系统重装到服务上线

Nomic-Embed-Text-V2-MoE模型Windows部署全流程:从系统重装到服务上线 如果你是一名Windows开发者,想在自己的电脑上跑起最新的Nomic-Embed-Text-V2-MoE模型,但被各种环境问题搞得头大,那这篇文章就是为你准备的。 我见过太多朋…...