对话芯动科技 | 助力云游戏 4K级服务器显卡的探索与创新
2021年芯动科技推出了基于IMG BXT GPU IP的风华1号显卡。单块风华1号显卡可在台式机和云游戏中实现4K级别的性能,渲染能力达到5 TFLOPS,如果在服务器中同时运行两块显卡,性能还可翻倍。该显卡是为不断扩大的安卓云游戏市场量身定制的,通过云端提供卓越的成本优势与杰出的能效比,以获得完美的移动娱乐体验。
现在,芯动科技团队分享了他们在风华1号显卡上取得的最新成就:在一块显卡上同时支持44个实例,每款游戏的运行速度约为30帧/秒。
这是他们发展历程中的一个重要里程碑,彰显了他们产品的能力,以及数据中心企业探索更新的显卡解决方案对其服务的益处。在下面的访谈中,与芯动科技的SoC首席架构师何颖探讨了他们的愿景、如何取得这些成果以及下一步的发展方向。
1、芯动科技认为云游戏的最新趋势是什么?
游戏内容的多样化和质量的提高。游戏画面、交互方式、声音体验、延迟改进等等,都在不断升级,以满足用户对游戏体验越来越高的要求。
第二个趋势是多终端协同,即无论使用什么设备,都能实现无处不在的游戏体验:智能电视、平板电脑、个人电脑和智能手机都是云游戏的有效选择。
云游戏正在逐步融合其他技术领域,推动技术创新。目前,许多城市已经实现了 5G 覆盖,使游戏玩家能够以更快的速度、更低的延迟串流畅玩更多更精细的内容。令人信服的人工智能生成内容的出现,为游戏开发商提供了差异化游戏的新方法。新推出的元宇宙应用要求同类型的处理与交互基础设施,而这些需求在云端业已得到或者得到证明。
游戏开发商正在探索创建云原生内容的方法,而不仅仅只是向用户从云端提供传统游戏的服务能力,以提高每用户平均营收。这些内容可以利用云计算更强的处理能力,为高分辨率显示器提供更复杂、帧率更高的大型游戏渲染,或在游戏中渗透人工智能生成内容等高级功能,以改变游戏玩法。
2、数据中心企业在为其服务选择合适的显卡时需要考虑哪些因素?
在挑选显卡时,数据中心运营商会考虑显卡供应商的生态系统及其在特定领域(如云游戏)的接受程度。他们会关注显卡的渲染运算、可实现的准确性、人工智能的训练和推断运算,以及显卡的目标应用和云基础功能。此外,绿色数据中心的趋势也在不断发展,它鼓励以安全、低能耗、环保的方式来满足企业的需求--从而反向通过降低功耗成本以获取更好的成本优势。
3、使用 IP 解决方案是如何帮助你们为客户打造最佳显卡的?
我们决定基于 Imagination 的 GPU IP开发我们的图形卡,以加快产品上市时间,并确保我们采用的基本图形架构是经过验证的领先技术。这一决定使我们的工程团队有时间专注为显卡添加新功能,帮助我们的产品在云游戏市场脱颖而出。
在我们的 GPU 研发过程中,GPU 设计部门和 IP 设计部门紧密合作,为 GPU 产品打造了一套高性能、高可靠性、低功耗和兼容性强的 IP 解决方案。
例如,风华二号采用的 LPDDR IP 不仅兼容 LPDDR4/4x/5/5x,我们还针对 GPU 的数据访问特性,设计并优化了 DDR 的内部请求调度机制。这为 GPU 核提供了更大的内存访问带宽,并降低了处理关键任务的时延。DDR 控制器的内部请求调度机制同样为 GPU Core更大的内存访问带宽和更低的关键任务时延而提供了专用设计。
由于 CoreActive 拥有适用于不同代工厂不同工艺节点的成熟强鲁棒性的 IP 库,因此我们在设计 GPU 芯片时可以更灵活地选择工艺节点,而不受 IP 选型的限制。
4、您选择在哪些方面集中工程力量来创建适用于安卓云游戏的芯片?
为安卓云游戏调整芯片的重点包括支持虚拟化、支持新版本的 OpenGL® ES 或 Vulkan® API、优化多客户端场景的线性度和可靠性。
在硬件开发方面,我们集中了更多的架构、算法和设计资源,用于研究和实施虚拟化和 API 升级所需的硬件修改。其次,我们加大了对软件驱动程序开发部门的资源投入,为更高版本的安卓系统创建驱动程序,并优化其稳定性和性能。最后,我们将部分测试工作集中在新功能上,以确保在主流游戏场景中的可靠性和性能,从而保证硬件能够与安卓设备进行良好的通信和运行。
5、在扩大风华1号可容纳的游戏玩家数量方面有哪些挑战?你们是如何克服的?
对于我们的商业客户来说,扩大显卡可容纳的游戏玩家数量是一个重要目标,但也存在一些困难。主要挑战之一是软件调度的线性。随着客户数量的增加,发送到 GPU 的请求数量以及随之而来的数据也会呈指数级增长。我们的驱动程序工程师在优化数据处理调度方面投入了大量精力:最大限度地利用片上数据处理引擎,同时优化图形控制器的数据吞吐效量,缩小任务调度中的间隙和浪费,这也减少了系统 CPU 负载和等待时间。
客户端数据的隔离和保护是另一个需要解决的问题。为了保证多个客户端的数据互不干扰,我们设计了一种高效/灵活配置的内存映射机制来管理不同客户端的内存空间,从而在不降低访问效率的前提下实现客户端数据的物理隔离。我们的解决方案是 Imagination HyperLane 虚拟化技术的演进,它为每个核创建了多达八个独立的控制通道,每个通道都在内存中安全隔离,并采用灵活的性能管理技术。
6、IMG BXT 的哪些功能为风华1号带来了最大价值?
Imagination基于分块的延迟渲染架构以及硬件虚拟化技术为风华系列GPU带来了显著的能效优势,使我们能够在相同功耗水平下比竞争对手拥有更多方式支持云游戏。
风华1号和风华2号只是开端,产品推出后效果非常好。我们下一步将继续开发两条产品线:一条面向低功耗市场,一条面向服务器市场。
在低功耗市场,除了继续提升性能外,我们还将积极探索不同行业的应用场景,推出更加注重节能、低成本、高性价比的产品。
在服务器市场,我们将继续推出技术更先进、性能更强大的产品。例如,我们将采用Chiplet (芯粒)技术,突破工艺瓶颈的限制,更好地提高性能。
7、客户和市场对 "风华 1号 "的反响如何?
风华1号一经推出,就迅速获得了市场的好评。经过测试和评估,我们的客户发现,在典型的云游戏场景中,与竞争对手的解决方案相比,"风华1号 "在能效比、单卡支持客户数量和性价比方面都具有突出优势。
8、芯动创新的下一步计划是什么?
风华1号和风华2号只是开端,产品推出后效果非常好。我们下一步将继续开发两条产品线:一条面向低功耗市场,一条面向服务器市场。
在低功耗市场,除了继续提升性能外,我们还将积极探索不同行业的应用场景,推出更加注重节能、低成本、高性价比的产品。
在服务器市场,我们将继续推出技术更先进、性能更强大的产品。例如,我们将采用Chiplet (芯粒)技术,突破工艺瓶颈的限制,更好地提高性能。
END
欢迎加入Imagination GPU与人工智能交流2群
入群请加小编微信:eetrend89
(添加请备注公司名和职称)
推荐阅读
对话Imagination中国区董事长:以GPU为支点加强软硬件协同,助力数
在线课程 | Imagination中国区技术总监全面解读IMG DXD GPU
Imagination Technologies 是一家总部位于英国的公司,致力于研发芯片和软件知识产权(IP),基于Imagination IP的产品已在全球数十亿人的电话、汽车、家庭和工作 场所中使用。获取更多物联网、智能穿戴、通信、汽车电子、图形图像开发等前沿技术信息,欢迎关注 Imagination Tech!
相关文章:

对话芯动科技 | 助力云游戏 4K级服务器显卡的探索与创新
2021年芯动科技推出了基于IMG BXT GPU IP的风华1号显卡。单块风华1号显卡可在台式机和云游戏中实现4K级别的性能,渲染能力达到5 TFLOPS,如果在服务器中同时运行两块显卡,性能还可翻倍。该显卡是为不断扩大的安卓云游戏市场量身定制的…...

[HTML]Web前端开发技术1,meta,HBuilder等——喵喵画网页
希望你开心,希望你健康,希望你幸福,希望你点赞! 最后的最后,关注喵,关注喵,关注喵,大大会看到更多有趣的博客哦!!! 喵喵喵,你对我真的…...
网上申请的电信卡能用多长时间?可以长期使用吗?
我们在网上总能看到一些关于流量卡的广告,都是19元,29元100多g的套餐,乍一看这些套餐非常便宜,但是小编提醒大家一定要注意优惠期。 网上的流量卡套餐,都是由基础套餐额外赠送充值送话费等内容组成,…...
交换机的工作原理
局域网交换技术是数据链路层上的技术,就是转发数据帧。在数据通信中,所有交换设备都执行两个基本操作: 交换数据帧生成并维护交换地址表 交换数据帧 交换机根据数据帧的MAC地址(物理地址)进行数据帧的转发操作。交换…...

如何使用ArcGIS Pro制作粉饰效果
在地图上,如果某个部分比较重要,直接的制图不能将其凸显出来,如果想要突出显示重要部分,可以通过粉饰效果来实现,这里为大家介绍一下方法,希望能对你有所帮助。 数据来源 本教程所使用的数据是从水经微图…...

CSS滚动捕获 scroll-snap-align
CSS滚动捕获 scroll-snap-align 看到 align, 就条件反射想到对齐方式, 嗯猜对了. 不过要先看一下若干名词介绍 scroll-snap-align 指定了盒子的 snap position, 即盒子 snap area 和滚动容器的 snapport 的对齐方式. 这个属性是定义在滚动元素上, 而不是滚动容器上 语法 这个…...

基础课8——中文分词
中文分词指的是将一个汉字序列切分成一个一个单独的词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。在英文的行文中,单词之间是以空格作为自然分界符的,而中文只是字、句和段能通过明显的分界符来简单划界,唯独词没有一个…...

OpenHarmony应用开发入门教程(一、开篇)
前言 华为正式宣布2024年发布的华为鸿蒙OS Next版将不再兼容安卓系统。这一重大改变,预示着华为鸿蒙OS即将进入一个全新的阶段。 都说科技无国界,这是骗人的鬼话。谷歌的安卓12.0系统早已发布,但是自从受到美影响,谷歌就拒绝再向…...
vue侦听器详解及代码
在 Vue 中,我们可以使用侦听器(watcher)来监听数据的变化,并在数据发生变化时执行相应的操作。Vue 提供了 watch 选项来定义侦听器,并可以使用 vm.$watch 方法来创建侦听器。 下面是一个简单的示例,我们监…...

Python爬虫的七个常用技巧总结,这些你一定得知道!
文章目录 前言1、基本抓取网页2、使用代理IP3、Cookies处理4、伪装成浏览器5、验证码的处理6、gzip压缩7、多线程并发抓取关于Python技术储备一、Python所有方向的学习路线二、Python基础学习视频三、精品Python学习书籍四、Python工具包项目源码合集①Python工具包②Python实战…...

【Linux】U盘安装的cfg引导文件配置
isolinux.cfg文件 default vesamenu.c32 timeout 600display boot.msg# Clear the screen when exiting the menu, instead of leaving the menu displayed. # For vesamenu, this means the graphical background is still displayed without # the menu itself for as long …...

Theory behind GAN
假如要生成一些人脸图,实际上就是想要找到一个分布,从这个分布内sample出来的图片像是人脸,分布之外生成的就不像人脸。而GAN要做的就是找到这个distribution。 在GAN之前用的是Maximum Likelihood Estimation。 Maximum Likelihood Estimat…...

《Deep learning for fine-grained image analysis: A survey》阅读笔记
论文标题 《Deep learning for fine-grained image analysis: A survey》 作者 魏秀参,旷世研究院 初读 摘要 细粒度图像分析(FGIA)的任务是分析从属类别的视觉对象。 细粒度性质引起的类间小变化和类内大变化使其成为一个具有挑战性的…...
节点导纳矩阵
节点导纳矩阵(Node Admittance Matrix)是电力系统分析中的关键工具,它用于描述电力系统中不同节点之间的电导和电纳参数。这个矩阵为电力工程师提供了深入了解电力系统运行和分析所需的数学工具。 节点导纳矩阵是一个复数矩阵,通常…...

小米真无线耳机 Air 2s产品蓝牙配对ubuntu20.04 笔记本电脑
小米真无线耳机 Air 2s产品蓝牙配对ubuntu20.04 笔记本电脑 1.我的笔记本是 22款联想拯救者y9000k,安装了双系统,ubuntu20.04。 2.打开耳机,按压侧面按钮2秒,指示灯显示白色闪烁。 3.打开ubunru20.04 系统右上角wifi的位置&…...
Python爬虫批量下载图片
一、思路: 1. 分析URL,图片的URL内嵌于base_url的返回当中 2. 下载图片 二、代码 import time import requests import os from lxml import etreeclass DownloadImg():爬虫进行美女图片下载def __init__(self):self.url http://xxxxxx/4kmeinv/self…...

java入门,从CK导一部分数据到mysql
一、需求 需要从生产环境ck数据库导数据到mysql,数据量大约100w条记录。 二、处理步骤 1、这里的关键词是生产库,第二就是100w条记录。所以处理数据的时候就要遵守一定的规范。首先将原数据库表进行备份,或者将需要导出的数据建一张新的表了…...

表白墙/留言墙 —— 中级SpringBoot项目,MyBatis技术栈MySQL数据库开发,练手项目前后端开发(带完整源码) 全方位全步骤手把手教学
🧸欢迎来到dream_ready的博客,📜相信你对这篇博客也感兴趣o (ˉ▽ˉ;) 📜表白墙/留言墙初级Spring Boot项目(此篇博客的简略版,不带MyBatis数据库开发) 目录 1、项目前端页面及项目…...

Stable Diffusion - StableDiffusion WebUI 软件升级与扩展兼容
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/134463035 目前,StableDiffusion WebUI 的版本是 1.6.0,同步更新 controlnet、tagcomplete、roop、easy-prompt-selector等…...
git创建新分支将项目挂载到新分支操作
1.如果是本地项目,没有关联过git // 在git创建仓库(默认master分支) // 复制克隆链接(默认下载下来的是master仓库,克隆指定分支如下所示) git clone -b 分支名 克隆地址 // 将某分支克隆下来后,直接将项目放到新文件夹内(执行以下命令提交即可) git add . git commit -m 备注…...

测试微信模版消息推送
进入“开发接口管理”--“公众平台测试账号”,无需申请公众账号、可在测试账号中体验并测试微信公众平台所有高级接口。 获取access_token: 自定义模版消息: 关注测试号:扫二维码关注测试号。 发送模版消息: import requests da…...

python打卡day49
知识点回顾: 通道注意力模块复习空间注意力模块CBAM的定义 作业:尝试对今天的模型检查参数数目,并用tensorboard查看训练过程 import torch import torch.nn as nn# 定义通道注意力 class ChannelAttention(nn.Module):def __init__(self,…...
进程地址空间(比特课总结)
一、进程地址空间 1. 环境变量 1 )⽤户级环境变量与系统级环境变量 全局属性:环境变量具有全局属性,会被⼦进程继承。例如当bash启动⼦进程时,环 境变量会⾃动传递给⼦进程。 本地变量限制:本地变量只在当前进程(ba…...
前端倒计时误差!
提示:记录工作中遇到的需求及解决办法 文章目录 前言一、误差从何而来?二、五大解决方案1. 动态校准法(基础版)2. Web Worker 计时3. 服务器时间同步4. Performance API 高精度计时5. 页面可见性API优化三、生产环境最佳实践四、终极解决方案架构前言 前几天听说公司某个项…...

UDP(Echoserver)
网络命令 Ping 命令 检测网络是否连通 使用方法: ping -c 次数 网址ping -c 3 www.baidu.comnetstat 命令 netstat 是一个用来查看网络状态的重要工具. 语法:netstat [选项] 功能:查看网络状态 常用选项: n 拒绝显示别名&#…...

家政维修平台实战20:权限设计
目录 1 获取工人信息2 搭建工人入口3 权限判断总结 目前我们已经搭建好了基础的用户体系,主要是分成几个表,用户表我们是记录用户的基础信息,包括手机、昵称、头像。而工人和员工各有各的表。那么就有一个问题,不同的角色…...

Module Federation 和 Native Federation 的比较
前言 Module Federation 是 Webpack 5 引入的微前端架构方案,允许不同独立构建的应用在运行时动态共享模块。 Native Federation 是 Angular 官方基于 Module Federation 理念实现的专为 Angular 优化的微前端方案。 概念解析 Module Federation (模块联邦) Modul…...

JUC笔记(上)-复习 涉及死锁 volatile synchronized CAS 原子操作
一、上下文切换 即使单核CPU也可以进行多线程执行代码,CPU会给每个线程分配CPU时间片来实现这个机制。时间片非常短,所以CPU会不断地切换线程执行,从而让我们感觉多个线程是同时执行的。时间片一般是十几毫秒(ms)。通过时间片分配算法执行。…...
在鸿蒙HarmonyOS 5中使用DevEco Studio实现录音机应用
1. 项目配置与权限设置 1.1 配置module.json5 {"module": {"requestPermissions": [{"name": "ohos.permission.MICROPHONE","reason": "录音需要麦克风权限"},{"name": "ohos.permission.WRITE…...

多模态大语言模型arxiv论文略读(108)
CROME: Cross-Modal Adapters for Efficient Multimodal LLM ➡️ 论文标题:CROME: Cross-Modal Adapters for Efficient Multimodal LLM ➡️ 论文作者:Sayna Ebrahimi, Sercan O. Arik, Tejas Nama, Tomas Pfister ➡️ 研究机构: Google Cloud AI Re…...