当前位置: 首页 > article >正文

AI in Game,大模型能力与实时音视频技术融合,交出AI应用新答卷

随着AI的技术进步和工具普及,尤其是在这两年的跃进之后,AI在游戏行业内的应用已经逐步由理念设想推向落地实践。从蔡浩宇披露的AI新游《Whispers From The Star》到GDC上各大厂家呈现的游戏+AI新亮点,我们看到了更多AI与游戏的结合方式,不仅是制作端AIGC能力的融入,连游戏内互动体验也正因AI的崛起而卷入这场革命。

AI交互进化,打破传统边界

从“工具”到“伙伴”,重塑互动体验

游戏行业很早便已经开始使用“AI”一词,然而,这类所谓的AI从本质上来说还是“提线木偶”——它们的行为被预设脚本牢牢束缚,在庞大的行为库中排列组合,构建出与玩家的互动。而大语言模型和AI实时语音对话技术在游戏中的应用,彻底打破了传统互动模式的边界。角色能够从话语中思考理解玩家的意图并实时给出个性化反馈,不再只能根据明确的指令导向固定的行为,这为游戏中的虚拟角色赋予了高度拟人化的交互能力。

无论是游戏内的NPC、你的队友亦或是你的游戏小助手,都将成为有温度、有智慧、有个性的 “数字生命”,为玩家以及社区带来全新的情感化、智能化交互体验,提供独有的情绪价值。

|AI NPC:从“工具人”到“游戏原住民”,打破传统叙事边界

传统NPC的“机械感”始终是打破沉浸体验的顽疾——玩家早已厌倦了预设脚本和复读机般重复台词的角色,这同时也大大降低了游戏的重玩价值。而AI技术的介入,尤其是AI实时对话能力的加持正在颠覆这种单向交互模式,让NPC真正成为游戏世界的“原住民”,能够与玩家一同构建出丰富且个性化的剧情体验。

通过AI技术加持,《Whispers from the Star》支持玩家实时使用自然语言发送指令,而游戏的主角Stella也会随着玩家的指令作出或愤怒或欣喜的个性化反馈。这款以AI语音交互为核心玩法的太空生存游戏展现出了与传统游戏截然不同的创新性,尤其是AI实时对话对剧情走向的深度影响,为游戏互动性带来了新的维度。跳脱传统游戏的叙事边界,玩家不必拘泥于游戏提供的选项,而是可以真正与Stella自由交流,通过对话帮助她完成逃离。每一次对话,都可能将游戏引入未知的方向,并激发全新的故事。

在社交推理游戏《太空杀》中,AI NPC的融入也为游戏带来了全新玩法和更多变数。独特的“内鬼挑战”玩法由两位真人玩家共同对抗8名AI NPC。游戏中,AI NPC能够独立思考,结合实时且自然的语音对话,他们会像真人一样,充分表达自己的观点和推理,并根据局势变化临场伪装、结盟、指控,与玩家一同动态演绎故事。复杂的互动、真实的交流与推理,AI NPC为《太空杀》玩家带来了打破剧本瓶颈的持续新鲜体验。

图片

|AI 助手:从“说明书”到“外置大脑”,懂游戏也懂你

随着游戏技术和基础设施的不断迭代,游戏本身的复杂性也在不断增长,这为教学系统,尤其是新手引导带来了持续的挑战。以《王者荣耀》为例,游戏内已有近百位技能各异的英雄搭配百件功能各异的装备,玩家需要较长时间去熟悉。而游戏内的各种英雄介绍就像“说明书”,内容生硬,很难在实战中应用。如今,结合AI实时对话能力,AI成了玩家的“外置大脑”,彻底改变了新手玩家进游学习期的体验模式。

《王者荣耀》的AI Coaching可在训练对决中结合玩家及对局数据精准给出当前所使用英雄的技能与装备教学,并会进行实时对线指导,在逆风局、带线局等各种不同情况下给出不同的游戏策略,甚至预测局势走向,为玩家提供大局观指导,真正做到边玩边学。同时,AI还能够复刻各个英雄的音色,带来更沉浸的教学体验,强大的多语言能力可支持中、英、西、葡、阿、土等多语种,助力游戏全球化运营。

图片

除了《王者荣耀》,另一款国民级手游《和平精英》的数字代言人吉莉经过升级迭代,也将以语音对话的形式加入到玩家的实时对局中。玩家不仅能在游戏大厅与吉莉交流,在游戏中也能通过自由麦语音与吉莉实时对话,像是提问如何调节灵敏度、突击步枪与冲锋枪哪个秒伤更高等等,在游戏中遇到的任何问题,都能通过语音向吉莉发问并得到合理解答。吉莉还能够通过玩家语言中的语气词强度(如 "艹!这都能输")以及上下文语义特征(如反复提及 "队友太坑"),实时判断玩家的情绪状态,并针对不同情绪类型,调用差异化的响应策略,比如对沮丧玩家给予鼓励,为兴奋玩家打call……情绪价值拉满,与用户主动建立具有深度共鸣的互动关系。

图片

|AI 队友:从“人机操作”到“开黑大腿”,自然沟通并肩作战

多人竞技游戏中,队友的质量往往决定了游戏的成败和体验的优劣。但当玩家不想社交时,游戏匹配的人机队友却很难填补真人玩家的空缺。“人机操作”已经成了很多游戏中离谱操作的代名词。而AI驱动的智能队友,正在重新定义这一社交生态。

以往FPS玩家只能通过快捷键和指令轮盘,向AI队友下达"攻击"或"跟随"等简单命令。但这些命令缺乏目标和细节,很难实现玩家与人机队友之间的战术配合。而在《暗区突围》中,玩家可以用自然语言与自己的AI队友交流,AI队友可以观察实时的战斗环境,真正理解玩家的战术意图,进而灵活应对战场变化。“我清一楼你清二楼”、“正面牵制等我绕后”这些复杂的长序列战术指令AI 队友F.A.C.U.L.都可以听懂执行并推测玩家意图进行实时语音反馈。

图片

在《和平精英》的海岛地图中,玩家也可以与AI队友匹配共同战斗,而且有三个不同性格的队友可选。玩家可以尽情与AI交流或指挥,如果问他们能否给自己一些子弹,AI队友还会迅速跑过来响应玩家需求。对于不熟悉玩法的新人而言,AI队友的存在还具有优秀的引导能力,帮助玩家度过新手阶段。例如缩圈的时候他们会提醒玩家跑进安全区,附近如果有敌人的脚步声出现也会提醒玩家防守警戒。这种 AI 驱动的队友,不仅降低了玩家的社交门槛,还为那些不擅长团队协作的玩家提供了一个包容和支持的环境。它让玩家在游戏中感受到的不再是孤独,而是一种被陪伴、被支持的温暖。

图片

轻松实现全开麦实时语音交互

腾讯云 GME AI 实时对话解决方案

作为行业领先的RTC厂商,腾讯云实时音视频(TRTC)此前已依托腾讯海量游戏开发运营经验,基于真实游戏场景专门优化推出了一站式游戏语音解决方案——游戏多媒体引擎(GME)。随着AI能力的快速突破,以及腾讯内部在游戏AI方向上的超前探索,腾讯云TRTC进一步将GME与AI实时通话能力整合,为游戏行业用户搭建出性能最优、延时最低的对接通道,在内嵌腾讯云ASR的同时,整合业内领先的LLM/TTS方案进行深度优化,将AI对话总延迟低至1000ms,媲美人类对话反应速度,并融入声纹识别、语义断句、背景音、承接语等创新能力,使对话效果更自然、拟真。

图片

在实现音视频数据高效采集、处理、传输的基础上,GME AI实时对话解决方案叠加了智能降噪、智能打断、上下文管理等游戏场景所需的核心能力,只需少量开发就可快速实现全开麦的AI实时语音交互,方便游戏行业开发者快速将AI NPC、AI 游戏助手、AI 队友等AI新能力应用到自己的游戏中,为用户带来游戏交互新体验。

图片

RTC协议,全链路深度优化

全球AI对话总延迟低至1000ms以内

GME AI实时对话解决方案针对社交、游戏等场景的音视频编解码器进行深度优化,码率、延时、系统资源消耗等关键技术指标均为业界领先,通过流式分片传输、连接池等机制,全球端到端音视频传输延时可控制在300ms内,AI对话全链路总延迟低于1000ms。六大洲服务可用,全球3200+加速节点,且具备多服务容灾能力,保障业务全球高质量稳定运行。

基于真实游戏场景优化

全开麦自由交流,AI对话媲美真人

利用回声消除、噪声抑制等专利算法,强力抑制键盘声、鼠标声等游戏场景常见噪音。引入全新降噪引擎,输入端音视频实时AI降噪,提升ASR识别准确度。针对口语化表达、游戏专有名词识别困难等挑战,方案基于真实游戏场景音频数据进行标注与模型微调,并可针对不同游戏客户定制专属热词词库,实现包括英语、西班牙语、日语、韩语、中文以及23种方言和130种国际语言的ASR精准识别

方案内置双讲打断、上下文管理等AI实时对话核心能力。玩家可以用全开麦的方式与AI自由沟通。不需要玩家定义一句话是否说完,AI也能很清晰地识别玩家想表达的意思,在AI发言过程中,玩家也能随时打断AI,开启新话题或下达新指令,真正实现媲美真人的沟通交互体验。

3D空间音频等独有技术

带来更多有趣的游戏AI语音玩法

GME AI实时对话解决方案提供独有的3D语音技术,通过范围音频、人声模糊、空气衰减模拟等效果,完整还原声音的方位细节,玩家可根据队友语音“听声辩位”,带来沉浸式语音体验。方案还与Wwise音频引擎深度融合,独创性地解决了语音开麦时游戏背景音效丢失的问题,并可结合游戏音效实现更丰富玩法。同时,GME AI实时对话解决方案还支持音色克隆功能,提供复刻音色,支持自定义音量、语速等参数,为游戏角色赋予个性化的语音。

多端兼容,低成本接入

一次接入满足多样化语音需求

GME AI实时对话解决方案整合并优化了AI对话全链路所需的各项能力,一站式解决方案帮助开发者快速将AI对话功能无缝集成到各类游戏应用中,无需深入处理复杂的技术细节,显著缩短产品开发周期

GME AI实时对话解决方案适配主流主机平台;深度适配 UE、Unity、Cocos 等主流游戏引擎,支持包括iOS、Android、Windows、macOS、Web、Flutter在内的多个平台,兼容超过20000种设备模型。方案高度开放,支持企业自定义大模型(LLM)和语音合成(TTS),配置LLM和TTS服务的账户凭证即可将第三方LLM和TTS无缝集成到服务后台。

您可通过我们提供的无代码快速跑通AI实时对话功能(https://console.cloud.tencent.com/trtc/conversational-ai),全程零门槛无代码,快速配置、便捷测试AI实时对话能力。

相关文章:

AI in Game,大模型能力与实时音视频技术融合,交出AI应用新答卷

随着AI的技术进步和工具普及,尤其是在这两年的跃进之后,AI在游戏行业内的应用已经逐步由理念设想推向落地实践。从蔡浩宇披露的AI新游《Whispers From The Star》到GDC上各大厂家呈现的游戏AI新亮点,我们看到了更多AI与游戏的结合方式&#x…...

欢乐熊大话蓝牙知识11:如何打造一个低功耗蓝牙温湿度传感器?

🧊 如何打造一个低功耗蓝牙温湿度传感器? 用电像抠门老头,通信像特工密谈。 🌡️ 引子:为什么你需要一个低功耗 BLE 传感器? 你是不是有过这种需求: 想在办公室角落放个传感器看温湿度,却不想拉电源线?想给智能养宠箱加个环境感知模块,但不能三天一换电池?想造个…...

Linux 安装 Remmina

欢迎关注公号:每日早参,第一时间获取AI资讯! 为什么安装Remmina, 因为Mobaxterm免费版本有窗口限制。 Remmina 是一款功能强大的开源远程桌面客户端,适用于 Linux 和其他类 Unix 系统,也支持 Windows 平台。 安装指南…...

什么是HTTP HTTP 和 HTTPS 的区别

HTTP协议定义 超文本传输协议(HyperText Transfer Protocol, HTTP)是一种应用层协议,主要用于客户端与服务器之间的数据交换。它基于请求-响应模型运行,在每次会话中由客户端发起请求,服务器返回相应的内容。 HTTP 是…...

cos和dmz学习

COS(Capability Open Service) 组件主要为系统提供能力开放的入口和控制。系统中需要对外进行能力开放的组件将RESTful的API接口注册到COS组件中,第三方系统就可以通过调用API来获取组件提供的能力。应用场景:当你想调用的外部系统接口不支持外网访问时&…...

上升沿计数 stm32 中断

在STM32上利用中断实现上升沿计数,可以按照以下步骤进行,这里以STM32F1系列为例,使用HAL库进行代码编写: 1. STM32CubeMX配置 打开STM32CubeMX并创建一个新工程,选择对应的STM32微控制器型号(如STM32F103C8T6)。在Pinout & Configuration选项卡中,找到用于检测上升…...

Java 各版本核心新特性的详细说明

一、Java 8(2014)—— 函数式编程的里程碑 1. Lambda 表达式 作用:简化匿名内部类,支持函数式编程。示例:// 传统匿名内部类 Runnable r1 new Runnable() {Overridepublic void run() {System.out.println("He…...

Nginx 性能优化全解析:从进程到安全的深度实践

一、进程优化:释放硬件性能潜力 Nginx 通过多工作进程处理请求,合理配置进程参数能充分利用 CPU 资源,避免资源浪费。 1.1 worker_processes 参数详解 worker_processes用于设置 Nginx 工作进程的数量,它直接影响 Nginx 对 CP…...

Pycharm and Flask 的学习心得(10)重定向

一 定义: 服务器告诉浏览器:你现在访问的这个页面,请改去另一个地址访问。 浏览器接收到这个“指令”后,会 自动跳转到另一个网页。 二 如何写: 方法一:重定向到网址 方法二:重定向到自己的…...

单机Kafka配置ssl并在springboot使用

目录 SSL证书生成根证书生成服务端和客户端证书生成keystore.jks和truststore.jks辅助脚本单独生成truststore.jks 环境配置hosts文件kafka server.properties配置ssl 启动kafkakafka基础操作springboot集成准备工作需要配置的文件开始消费 SSL证书 证书主要包含两大类&#x…...

《棒球特长生》棒球升学途径·棒球1号位

美国大学棒球体系 | U.S. College Baseball System 美国大学棒球主要通过 NCAA(全国大学体育协会)和 NAIA(全美校际体育协会)组织,分为三个级别: NCAA Division I:竞技水平最高,提…...

JavaScript的call和apply

在 JavaScript 中,.call() 和 .apply() 都是 Function 原型上的方法,用于改变函数执行时的上下文对象(即 this 指向),它们的区别仅在于参数传递的形式不同。下面结合几个常见场景,说明它们的实际应用。 1. …...

DiT、 U-Net 与自回归模型的优势

DiT 相对于 U-Net 的优势 全局自注意力 vs. 局部卷积 U-Net 依赖卷积和池化/上采样来逐层扩大感受野,捕捉全局信息需要堆叠很多层或借助跳跃连接(skip connections)。DiT 在每个分辨率阶段都用 Transformer 模块(多头自注意力 ML…...

开源 FcDesigner 表单设计器组件事件详解

FcDesigner 是一款基于Vue的开源低代码可视化表单设计器工具,通过数据驱动表单渲染。可以通过拖拽的方式快速创建表单,提高开发者对表单的开发效率,节省开发者的时间。并广泛应用于在政务系统、OA系统、ERP系统、电商系统、流程管理等领域。 …...

Teigha应用——解析CAD文件(DWG格式)Teigha在CAD C#二次开发中的基本应用

Teigha是一款专为开发者设计的工具,其核心技术在于强大的API和丰富的功能集,提供了一系列工具和方法,使开发者能够轻松地读取、解析和操作DWG文件。它支持多种操作系统,能在处理大型DWG文件时保持高效性能,还可用于构建…...

C++23内存分配新特性:std::allocate_at_least

文章目录 一、背景与动机二、std::allocator::allocate_at_least的特性三、std::allocate_at_least的自由函数版本四、实际应用场景1. 动态容器的优化2. 自定义分配器 五、总结 在C23标准中, std::allocate_at_least和 std::allocator::allocate_at_least的引入为…...

JavaScript性能优化全景指南

JavaScript性能优化全景指南 Ⅰ. 加载性能优化 1.1 代码分割与懒加载 动态导入(ES2020) javascript // 路由级代码分割 const ProductPage () > import(/* webpackChunkName: "product" */ ./ProductPage.vue); // 交互驱动加载 document.querySelector(#char…...

04-jenkins学习之旅-java后端项目部署实践

1、创建被管理项目 2、构建流程说明 jenkins其实就是将服务部署拆分成了: 1、拉取代码(git) 2、打包编译 3、自定义脚本(jar复制、执行启动脚本) 4、部署成功后的一些通知等 3、demo配置 3.1、General 3.2 源码管理 添加用户名密码方式如下图 3.2.1 常见错误(r…...

基于Python flask 的豆瓣电影top250数据评分可视化

文章目录 基于Python flask 的豆瓣电影top250数据评分可视化项目简介项目结构效果展示源码获取 基于Python flask 的豆瓣电影top250数据评分可视化 博主介绍:✌安替-AnTi:CSDN博客专家、掘金/华为云//InfoQ等平台优质作者,硕士研究生毕业。专…...

Cat.4+WiFi6工业路由器介绍小体积大作用ER4200

ER42004G Cat.4WiFi6 工业路由器隶属于纵横智控ER系列,型号为ER4200,是一款坚固耐用、性能强大的网络设备,专为应对严苛环境而设计。它采用工业级品质设计,集成 4G Cat.4 全网络支持和 WiFi6 技术,可在稳定性和性能至关…...

大模型应用开发第三讲:大模型是Agent的“大脑”,提供通用推理能力(如GPT-4、Claude 3)

大模型应用开发第三讲:大模型是Agent的“大脑”,提供通用推理能力(如GPT-4、Claude 3) 资料取自《大模型应用开发:动手做AI Agent 》。 查看总目录:学习大纲 关于DeepSeek本地部署指南可以看下我之前写的…...

创建型模式之Abstract Factory(抽象工厂)

创建型模式之Abstract Factory(抽象工厂) 摘要: 本文介绍了抽象工厂模式(Abstract Factory),它是一种创建型设计模式,提供了一种创建一系列相关对象的接口而无需指定具体类。文章通过手机工厂示…...

GitLab 18.0 正式发布,15.0 将不再受技术支持,须升级【一】

GitLab 是一个全球知名的一体化 DevOps 平台,很多人都通过私有化部署 GitLab 来进行源代码托管。极狐GitLab 是 GitLab 在中国的发行版,专门为中国程序员服务。可以一键式部署极狐GitLab。 学习极狐GitLab 的相关资料: 极狐GitLab 官网极狐…...

【DeepSeek论文精读】12. DeepSeek-Prover-V2: 通过强化学习实现子目标分解的形式化数学推理

欢迎关注[【AIGC论文精读】](https://blog.csdn.net/youcans/category_12321605.html)原创作品 【DeepSeek论文精读】1. 从 DeepSeek LLM 到 DeepSeek R1 【DeepSeek论文精读】10. DeepSeek-Coder-V2: 突破闭源模型在代码智能领域的障碍 【DeepSeek论文精读】12. De…...

字符串day7

344 反转字符串 字符串理论上也是一个数组&#xff0c;因此只需要用双指针即可 class Solution { public:void reverseString(vector<char>& s) {for(int i0,js.size()-1;i<j;i,j--){swap(s[i],s[j]);}} };541 反转字符串 自己实现一个反转从start到end的字符串…...

vue2中,codemirror编辑器的使用

交互说明 在编辑器中输入{时&#xff0c;会自动弹出选项弹窗&#xff0c;然后可以选值插入。 代码 父组件 <variable-editorv-model"content":variables"variables"placeholder"请输入模板内容..."blur"handleBlur" />data…...

FastAPI与MongoDB分片集群:异步数据路由与聚合优化

title: FastAPI与MongoDB分片集群:异步数据路由与聚合优化 date: 2025/05/26 16:04:31 updated: 2025/05/26 16:04:31 author: cmdragon excerpt: FastAPI与MongoDB分片集群集成实战探讨了分片集群的核心概念、Motor驱动配置技巧、分片数据路由策略、聚合管道高级应用、分片…...

Perl单元测试实战指南:从Test::Class入门到精通的完整方案

阅读原文 前言:为什么Perl开发者需要重视单元测试? "这段代码昨天还能运行,今天就出问题了!"——这可能是每位Perl开发者都经历过的噩梦。在没有充分测试覆盖的情况下,即使是微小的改动也可能导致系统崩溃。单元测试正是解决这一痛点的最佳实践,它能帮助我们在…...

强大的免费工具,集合了30+功能

今天给大家分享一款免费的绿色办公软件&#xff0c;它涵盖了自动任务、系统工具、文件工具、PDF 工具、OCR 图文识别、文字处理、电子表格这七个模块&#xff0c;多达 30 余项实用功能&#xff0c;堪称办公利器。 作者开发这款软件的初衷是为了解决日常办公中常见的痛点问题&am…...

从0开始学习R语言--Day11--主成分分析

主成分分析&#xff08;PCA&#xff09; PCA是一种降维技术&#xff0c;它把一堆相关的变量&#xff08;比如身高、体重、年龄&#xff09;转换成少数几个不相关的新变量&#xff08;叫“主成分”&#xff09;&#xff0c;这些新变量能最大程度保留原始数据的信息。 核心理念 …...