对话芯动科技 | 助力云游戏 4K级服务器显卡的探索与创新
2021年芯动科技推出了基于IMG BXT GPU IP的风华1号显卡。单块风华1号显卡可在台式机和云游戏中实现4K级别的性能,渲染能力达到5 TFLOPS,如果在服务器中同时运行两块显卡,性能还可翻倍。该显卡是为不断扩大的安卓云游戏市场量身定制的,通过云端提供卓越的成本优势与杰出的能效比,以获得完美的移动娱乐体验。
现在,芯动科技团队分享了他们在风华1号显卡上取得的最新成就:在一块显卡上同时支持44个实例,每款游戏的运行速度约为30帧/秒。
这是他们发展历程中的一个重要里程碑,彰显了他们产品的能力,以及数据中心企业探索更新的显卡解决方案对其服务的益处。在下面的访谈中,与芯动科技的SoC首席架构师何颖探讨了他们的愿景、如何取得这些成果以及下一步的发展方向。
1、芯动科技认为云游戏的最新趋势是什么?
游戏内容的多样化和质量的提高。游戏画面、交互方式、声音体验、延迟改进等等,都在不断升级,以满足用户对游戏体验越来越高的要求。
第二个趋势是多终端协同,即无论使用什么设备,都能实现无处不在的游戏体验:智能电视、平板电脑、个人电脑和智能手机都是云游戏的有效选择。
云游戏正在逐步融合其他技术领域,推动技术创新。目前,许多城市已经实现了 5G 覆盖,使游戏玩家能够以更快的速度、更低的延迟串流畅玩更多更精细的内容。令人信服的人工智能生成内容的出现,为游戏开发商提供了差异化游戏的新方法。新推出的元宇宙应用要求同类型的处理与交互基础设施,而这些需求在云端业已得到或者得到证明。
游戏开发商正在探索创建云原生内容的方法,而不仅仅只是向用户从云端提供传统游戏的服务能力,以提高每用户平均营收。这些内容可以利用云计算更强的处理能力,为高分辨率显示器提供更复杂、帧率更高的大型游戏渲染,或在游戏中渗透人工智能生成内容等高级功能,以改变游戏玩法。
2、数据中心企业在为其服务选择合适的显卡时需要考虑哪些因素?
在挑选显卡时,数据中心运营商会考虑显卡供应商的生态系统及其在特定领域(如云游戏)的接受程度。他们会关注显卡的渲染运算、可实现的准确性、人工智能的训练和推断运算,以及显卡的目标应用和云基础功能。此外,绿色数据中心的趋势也在不断发展,它鼓励以安全、低能耗、环保的方式来满足企业的需求--从而反向通过降低功耗成本以获取更好的成本优势。
3、使用 IP 解决方案是如何帮助你们为客户打造最佳显卡的?
我们决定基于 Imagination 的 GPU IP开发我们的图形卡,以加快产品上市时间,并确保我们采用的基本图形架构是经过验证的领先技术。这一决定使我们的工程团队有时间专注为显卡添加新功能,帮助我们的产品在云游戏市场脱颖而出。
在我们的 GPU 研发过程中,GPU 设计部门和 IP 设计部门紧密合作,为 GPU 产品打造了一套高性能、高可靠性、低功耗和兼容性强的 IP 解决方案。
例如,风华二号采用的 LPDDR IP 不仅兼容 LPDDR4/4x/5/5x,我们还针对 GPU 的数据访问特性,设计并优化了 DDR 的内部请求调度机制。这为 GPU 核提供了更大的内存访问带宽,并降低了处理关键任务的时延。DDR 控制器的内部请求调度机制同样为 GPU Core更大的内存访问带宽和更低的关键任务时延而提供了专用设计。
由于 CoreActive 拥有适用于不同代工厂不同工艺节点的成熟强鲁棒性的 IP 库,因此我们在设计 GPU 芯片时可以更灵活地选择工艺节点,而不受 IP 选型的限制。
4、您选择在哪些方面集中工程力量来创建适用于安卓云游戏的芯片?
为安卓云游戏调整芯片的重点包括支持虚拟化、支持新版本的 OpenGL® ES 或 Vulkan® API、优化多客户端场景的线性度和可靠性。
在硬件开发方面,我们集中了更多的架构、算法和设计资源,用于研究和实施虚拟化和 API 升级所需的硬件修改。其次,我们加大了对软件驱动程序开发部门的资源投入,为更高版本的安卓系统创建驱动程序,并优化其稳定性和性能。最后,我们将部分测试工作集中在新功能上,以确保在主流游戏场景中的可靠性和性能,从而保证硬件能够与安卓设备进行良好的通信和运行。
5、在扩大风华1号可容纳的游戏玩家数量方面有哪些挑战?你们是如何克服的?
对于我们的商业客户来说,扩大显卡可容纳的游戏玩家数量是一个重要目标,但也存在一些困难。主要挑战之一是软件调度的线性。随着客户数量的增加,发送到 GPU 的请求数量以及随之而来的数据也会呈指数级增长。我们的驱动程序工程师在优化数据处理调度方面投入了大量精力:最大限度地利用片上数据处理引擎,同时优化图形控制器的数据吞吐效量,缩小任务调度中的间隙和浪费,这也减少了系统 CPU 负载和等待时间。
客户端数据的隔离和保护是另一个需要解决的问题。为了保证多个客户端的数据互不干扰,我们设计了一种高效/灵活配置的内存映射机制来管理不同客户端的内存空间,从而在不降低访问效率的前提下实现客户端数据的物理隔离。我们的解决方案是 Imagination HyperLane 虚拟化技术的演进,它为每个核创建了多达八个独立的控制通道,每个通道都在内存中安全隔离,并采用灵活的性能管理技术。
6、IMG BXT 的哪些功能为风华1号带来了最大价值?
Imagination基于分块的延迟渲染架构以及硬件虚拟化技术为风华系列GPU带来了显著的能效优势,使我们能够在相同功耗水平下比竞争对手拥有更多方式支持云游戏。
风华1号和风华2号只是开端,产品推出后效果非常好。我们下一步将继续开发两条产品线:一条面向低功耗市场,一条面向服务器市场。
在低功耗市场,除了继续提升性能外,我们还将积极探索不同行业的应用场景,推出更加注重节能、低成本、高性价比的产品。
在服务器市场,我们将继续推出技术更先进、性能更强大的产品。例如,我们将采用Chiplet (芯粒)技术,突破工艺瓶颈的限制,更好地提高性能。
7、客户和市场对 "风华 1号 "的反响如何?
风华1号一经推出,就迅速获得了市场的好评。经过测试和评估,我们的客户发现,在典型的云游戏场景中,与竞争对手的解决方案相比,"风华1号 "在能效比、单卡支持客户数量和性价比方面都具有突出优势。
8、芯动创新的下一步计划是什么?
风华1号和风华2号只是开端,产品推出后效果非常好。我们下一步将继续开发两条产品线:一条面向低功耗市场,一条面向服务器市场。
在低功耗市场,除了继续提升性能外,我们还将积极探索不同行业的应用场景,推出更加注重节能、低成本、高性价比的产品。
在服务器市场,我们将继续推出技术更先进、性能更强大的产品。例如,我们将采用Chiplet (芯粒)技术,突破工艺瓶颈的限制,更好地提高性能。
END
欢迎加入Imagination GPU与人工智能交流2群

入群请加小编微信:eetrend89
(添加请备注公司名和职称)
推荐阅读
对话Imagination中国区董事长:以GPU为支点加强软硬件协同,助力数
在线课程 | Imagination中国区技术总监全面解读IMG DXD GPU

Imagination Technologies 是一家总部位于英国的公司,致力于研发芯片和软件知识产权(IP),基于Imagination IP的产品已在全球数十亿人的电话、汽车、家庭和工作 场所中使用。获取更多物联网、智能穿戴、通信、汽车电子、图形图像开发等前沿技术信息,欢迎关注 Imagination Tech!
相关文章:
对话芯动科技 | 助力云游戏 4K级服务器显卡的探索与创新
2021年芯动科技推出了基于IMG BXT GPU IP的风华1号显卡。单块风华1号显卡可在台式机和云游戏中实现4K级别的性能,渲染能力达到5 TFLOPS,如果在服务器中同时运行两块显卡,性能还可翻倍。该显卡是为不断扩大的安卓云游戏市场量身定制的…...
[HTML]Web前端开发技术1,meta,HBuilder等——喵喵画网页
希望你开心,希望你健康,希望你幸福,希望你点赞! 最后的最后,关注喵,关注喵,关注喵,大大会看到更多有趣的博客哦!!! 喵喵喵,你对我真的…...
网上申请的电信卡能用多长时间?可以长期使用吗?
我们在网上总能看到一些关于流量卡的广告,都是19元,29元100多g的套餐,乍一看这些套餐非常便宜,但是小编提醒大家一定要注意优惠期。 网上的流量卡套餐,都是由基础套餐额外赠送充值送话费等内容组成,…...
交换机的工作原理
局域网交换技术是数据链路层上的技术,就是转发数据帧。在数据通信中,所有交换设备都执行两个基本操作: 交换数据帧生成并维护交换地址表 交换数据帧 交换机根据数据帧的MAC地址(物理地址)进行数据帧的转发操作。交换…...
如何使用ArcGIS Pro制作粉饰效果
在地图上,如果某个部分比较重要,直接的制图不能将其凸显出来,如果想要突出显示重要部分,可以通过粉饰效果来实现,这里为大家介绍一下方法,希望能对你有所帮助。 数据来源 本教程所使用的数据是从水经微图…...
CSS滚动捕获 scroll-snap-align
CSS滚动捕获 scroll-snap-align 看到 align, 就条件反射想到对齐方式, 嗯猜对了. 不过要先看一下若干名词介绍 scroll-snap-align 指定了盒子的 snap position, 即盒子 snap area 和滚动容器的 snapport 的对齐方式. 这个属性是定义在滚动元素上, 而不是滚动容器上 语法 这个…...
基础课8——中文分词
中文分词指的是将一个汉字序列切分成一个一个单独的词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。在英文的行文中,单词之间是以空格作为自然分界符的,而中文只是字、句和段能通过明显的分界符来简单划界,唯独词没有一个…...
OpenHarmony应用开发入门教程(一、开篇)
前言 华为正式宣布2024年发布的华为鸿蒙OS Next版将不再兼容安卓系统。这一重大改变,预示着华为鸿蒙OS即将进入一个全新的阶段。 都说科技无国界,这是骗人的鬼话。谷歌的安卓12.0系统早已发布,但是自从受到美影响,谷歌就拒绝再向…...
vue侦听器详解及代码
在 Vue 中,我们可以使用侦听器(watcher)来监听数据的变化,并在数据发生变化时执行相应的操作。Vue 提供了 watch 选项来定义侦听器,并可以使用 vm.$watch 方法来创建侦听器。 下面是一个简单的示例,我们监…...
Python爬虫的七个常用技巧总结,这些你一定得知道!
文章目录 前言1、基本抓取网页2、使用代理IP3、Cookies处理4、伪装成浏览器5、验证码的处理6、gzip压缩7、多线程并发抓取关于Python技术储备一、Python所有方向的学习路线二、Python基础学习视频三、精品Python学习书籍四、Python工具包项目源码合集①Python工具包②Python实战…...
【Linux】U盘安装的cfg引导文件配置
isolinux.cfg文件 default vesamenu.c32 timeout 600display boot.msg# Clear the screen when exiting the menu, instead of leaving the menu displayed. # For vesamenu, this means the graphical background is still displayed without # the menu itself for as long …...
Theory behind GAN
假如要生成一些人脸图,实际上就是想要找到一个分布,从这个分布内sample出来的图片像是人脸,分布之外生成的就不像人脸。而GAN要做的就是找到这个distribution。 在GAN之前用的是Maximum Likelihood Estimation。 Maximum Likelihood Estimat…...
《Deep learning for fine-grained image analysis: A survey》阅读笔记
论文标题 《Deep learning for fine-grained image analysis: A survey》 作者 魏秀参,旷世研究院 初读 摘要 细粒度图像分析(FGIA)的任务是分析从属类别的视觉对象。 细粒度性质引起的类间小变化和类内大变化使其成为一个具有挑战性的…...
节点导纳矩阵
节点导纳矩阵(Node Admittance Matrix)是电力系统分析中的关键工具,它用于描述电力系统中不同节点之间的电导和电纳参数。这个矩阵为电力工程师提供了深入了解电力系统运行和分析所需的数学工具。 节点导纳矩阵是一个复数矩阵,通常…...
小米真无线耳机 Air 2s产品蓝牙配对ubuntu20.04 笔记本电脑
小米真无线耳机 Air 2s产品蓝牙配对ubuntu20.04 笔记本电脑 1.我的笔记本是 22款联想拯救者y9000k,安装了双系统,ubuntu20.04。 2.打开耳机,按压侧面按钮2秒,指示灯显示白色闪烁。 3.打开ubunru20.04 系统右上角wifi的位置&…...
Python爬虫批量下载图片
一、思路: 1. 分析URL,图片的URL内嵌于base_url的返回当中 2. 下载图片 二、代码 import time import requests import os from lxml import etreeclass DownloadImg():爬虫进行美女图片下载def __init__(self):self.url http://xxxxxx/4kmeinv/self…...
java入门,从CK导一部分数据到mysql
一、需求 需要从生产环境ck数据库导数据到mysql,数据量大约100w条记录。 二、处理步骤 1、这里的关键词是生产库,第二就是100w条记录。所以处理数据的时候就要遵守一定的规范。首先将原数据库表进行备份,或者将需要导出的数据建一张新的表了…...
表白墙/留言墙 —— 中级SpringBoot项目,MyBatis技术栈MySQL数据库开发,练手项目前后端开发(带完整源码) 全方位全步骤手把手教学
🧸欢迎来到dream_ready的博客,📜相信你对这篇博客也感兴趣o (ˉ▽ˉ;) 📜表白墙/留言墙初级Spring Boot项目(此篇博客的简略版,不带MyBatis数据库开发) 目录 1、项目前端页面及项目…...
Stable Diffusion - StableDiffusion WebUI 软件升级与扩展兼容
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/134463035 目前,StableDiffusion WebUI 的版本是 1.6.0,同步更新 controlnet、tagcomplete、roop、easy-prompt-selector等…...
git创建新分支将项目挂载到新分支操作
1.如果是本地项目,没有关联过git // 在git创建仓库(默认master分支) // 复制克隆链接(默认下载下来的是master仓库,克隆指定分支如下所示) git clone -b 分支名 克隆地址 // 将某分支克隆下来后,直接将项目放到新文件夹内(执行以下命令提交即可) git add . git commit -m 备注…...
Python爬虫实战:研究MechanicalSoup库相关技术
一、MechanicalSoup 库概述 1.1 库简介 MechanicalSoup 是一个 Python 库,专为自动化交互网站而设计。它结合了 requests 的 HTTP 请求能力和 BeautifulSoup 的 HTML 解析能力,提供了直观的 API,让我们可以像人类用户一样浏览网页、填写表单和提交请求。 1.2 主要功能特点…...
Spring Boot 实现流式响应(兼容 2.7.x)
在实际开发中,我们可能会遇到一些流式数据处理的场景,比如接收来自上游接口的 Server-Sent Events(SSE) 或 流式 JSON 内容,并将其原样中转给前端页面或客户端。这种情况下,传统的 RestTemplate 缓存机制会…...
在 Nginx Stream 层“改写”MQTT ngx_stream_mqtt_filter_module
1、为什么要修改 CONNECT 报文? 多租户隔离:自动为接入设备追加租户前缀,后端按 ClientID 拆分队列。零代码鉴权:将入站用户名替换为 OAuth Access-Token,后端 Broker 统一校验。灰度发布:根据 IP/地理位写…...
spring:实例工厂方法获取bean
spring处理使用静态工厂方法获取bean实例,也可以通过实例工厂方法获取bean实例。 实例工厂方法步骤如下: 定义实例工厂类(Java代码),定义实例工厂(xml),定义调用实例工厂ÿ…...
让AI看见世界:MCP协议与服务器的工作原理
让AI看见世界:MCP协议与服务器的工作原理 MCP(Model Context Protocol)是一种创新的通信协议,旨在让大型语言模型能够安全、高效地与外部资源进行交互。在AI技术快速发展的今天,MCP正成为连接AI与现实世界的重要桥梁。…...
智能仓储的未来:自动化、AI与数据分析如何重塑物流中心
当仓库学会“思考”,物流的终极形态正在诞生 想象这样的场景: 凌晨3点,某物流中心灯火通明却空无一人。AGV机器人集群根据实时订单动态规划路径;AI视觉系统在0.1秒内扫描包裹信息;数字孪生平台正模拟次日峰值流量压力…...
【C++特殊工具与技术】优化内存分配(一):C++中的内存分配
目录 一、C 内存的基本概念 1.1 内存的物理与逻辑结构 1.2 C 程序的内存区域划分 二、栈内存分配 2.1 栈内存的特点 2.2 栈内存分配示例 三、堆内存分配 3.1 new和delete操作符 4.2 内存泄漏与悬空指针问题 4.3 new和delete的重载 四、智能指针…...
[免费]微信小程序问卷调查系统(SpringBoot后端+Vue管理端)【论文+源码+SQL脚本】
大家好,我是java1234_小锋老师,看到一个不错的微信小程序问卷调查系统(SpringBoot后端Vue管理端)【论文源码SQL脚本】,分享下哈。 项目视频演示 【免费】微信小程序问卷调查系统(SpringBoot后端Vue管理端) Java毕业设计_哔哩哔哩_bilibili 项…...
mac 安装homebrew (nvm 及git)
mac 安装nvm 及git 万恶之源 mac 安装这些东西离不开Xcode。及homebrew 一、先说安装git步骤 通用: 方法一:使用 Homebrew 安装 Git(推荐) 步骤如下:打开终端(Terminal.app) 1.安装 Homebrew…...
【JavaSE】多线程基础学习笔记
多线程基础 -线程相关概念 程序(Program) 是为完成特定任务、用某种语言编写的一组指令的集合简单的说:就是我们写的代码 进程 进程是指运行中的程序,比如我们使用QQ,就启动了一个进程,操作系统就会为该进程分配内存…...
