当前位置: 首页 > news >正文

「专题速递」AR协作、智能NPC、数字人的应用与未来

9a07d3d622bad18771921881b0b1de9b.jpeg

c88e2a75e4d4d8ae5007079fc159beda.gif

元宇宙是一个融合了虚拟现实、增强现实、人工智能和云计算等技术的综合概念。它旨在创造一个高度沉浸式的虚拟环境,允许用户在其中交互、创造和共享内容。在元宇宙中,人们可以建立虚拟身份、参与虚拟社交,并享受无限的虚拟体验。

作为互联网大变局的核心概念之一,元宇宙正崭露头角,展现出足以重塑产业生态的潜力,描绘着一个与现实世界相对应的虚拟世界。虽然元宇宙仍处于早期的探索阶段,但我们坚信,舆论的泡沫消退之后,技术不会停止下前进的步伐——元宇宙的真正实现只是时间问题。

在本次技术大会中,我们将深入研究元宇宙相关的核心技术及其发展趋势,探讨AR协作、智能NPC、数字人的应用与未来。我们期待与参会者携手探索元宇宙相关技术的发展现状,并了解它将如何改变我们的生活和工作方式。

01

实现身份无关的多模态混合驱动的2D数字人实时生成技术

0654f145a683ef9937c60e7da251df57.jpeg

张玉兵

广州视源电子科技股份有限公司 

技术专家

我们致力于让思维表达更为平等和高效。有人思维清晰但不善表达,有人表达流畅但不喜出现在公开场合和镜头前,还有人因为突发疾病或其它原因而导致声音和形象欠佳。希望因为我们的存在,为更多的人扫除思维表达的障碍,让更多的人能够平等高效地表达自己的思维。

本次分享的思路:

1、介绍2D数字人克隆技术,解决教育培训和企业营销场景下降本增效的问题。其中包含两个技术特色:a)2D数字人表情编辑,解决了当前2D数字人只能对口型导致的不够真实而应用场景受限的问题,b)跨语言驱动,拓展了2D数字人的应用场景,可以应用跨语言出海业务的企业营销视频制作。

2、介绍不存在于这个世界上的2D虚拟人生成技术,解决了2D数字人制作过程中 a)用户定制数字人门槛较高 和 b)模特拍摄和肖像授权费用过高两个问题。其中的技术特色是:所采用神经网络渲染方案不依赖于视频前后帧间的信息,因此在制作不存在于这个世界上的新的虚拟人的过程中对算法的鲁棒性要求不高,可以对虚拟人素材进行评估筛选,保证了虚拟人生成的效果和稳定性。

3、介绍2D数字人脸表情、人头部姿态和肢体动作的实时驱动技术,解决在远程视频会议中完美出镜、视角矫正、背景替换、极致的低带宽传输等需求。技术特色是:a)实现身份无关的带有任意表情和动作的多模态混合驱动的2D数字人实时生成技术,b)同时结合轻量级的神经网络渲染技术极致优化运行时间,实现移动端实时运行。

4、介绍商业应用案例。

02

基于星火大模型的元宇宙NPC创新应用探索

5934f0645fcfec4065e3fb060adca4d7.png

刘健

科大讯飞

 MetaLab实验室研发负责人

元宇宙,这个虚拟的数字世界,将现实与虚构巧妙融合,创造出无尽的可能性。未来,大模型的融入将成为必然之选,它能赋予元宇宙更为真实、智能的交互体验,实现自然语言对话、内容生成等功能。这种结合将为元宇宙注入更丰富的内涵,提升用户的参与感和沉浸感,推动虚拟体验不断向前发展,激发创新、商业和社交领域的无限潜能。

本次分享将分为三个环节:首先,我们将简要介绍讯飞星火Spark,让您初步了解这一神奇的工具;其次,我们将深入探讨AI智能NPC的应用框架,带您领略大模型下智能NPC技术实现的原理;最后,我们将展示讯飞星火在云宇宙中的创新应用探索。通过以上三个环节,我们希望能够为您揭示元宇宙与大模型结合的实践探索之路。

03

AR协作的思考与实践

da4f8a0dfd5396a7b63e9e9fcdbb6fa4.jpeg

唐荣兴

亮风台 联合创始人&COO

主体内容会从经历的过去、现在、未来展开,稍列如下。

2003年开发PocketPC上的软件电话SIPPhone到现在刚好二十年,其间经历过2008年第一次创业的FeaturePhone上的视频通话,用户数千万级,感受过用户对沟通、交流的强烈需求。

第二次创业专注增强现实,2017年前后启动AR协作软件HiLeia的产品研发,感受到企业服务市场对AR协作的需求,感受到企业服务市场垂类场景对音视频通讯依然存在强烈的细分需求。

从二十年前的软件电话到音视频交流再到更加丰富内容与交互的AR协作,有幸见证了技术与场景的变迁与进化,似乎浓缩的是“音视频”从1维到2维再到3维的维度跃进?个人的思考、实践固然重要,行业的发展与用户需求递进才是本质与底层逻辑。

如果你希望参与到音视频技术大会当中,此刻刚刚好:“LiveVideoStackCon 2023音视频技术大会深圳站”门票限时9折优惠中,报名立享优惠,团体参会优惠更多哦!现在报名,与您相约深圳。

时间:2023年11月24日-25日

地点:深圳圣淘沙酒店(翡翠店)

获票方式:扫描下方二维码,或咨询票务微信,了解大会详情。

3aed5f44a86d1d07dc7ff4668ded11a4.png

优惠截止10月15日 

          票务服务:

微信同号13520771810

ticket@livevideostack.com

0d10d704e0cbcf99716d53e99edcffdf.jpeg

关于LiveVideoStackCon 音视频技术大会

LiveVideoStackCon是专注于音视频领域的技术大会,致力于分享一流的技术内容,在把握行业趋势和热点的同时持续挖掘技术深度。自首届以来的13场大会中,LiveVideoStackCon成为众多音视频技术人的舞台、国内多媒体生态的风向标,也成为大家技术交流、拓展专业网络、职场进阶的新方式。

LiveVideoStackCon 2023 深圳站,将以“沉浸·新视界”为主题,在2023年11月24日-25日在深圳和大家见面。本场音视频技术大会,依然聚焦在多媒体生态,精心打磨3场主题演讲、13场专题(包括一场圆桌专题)。本次大会规模约300+参会人员,50+技术分享,80+参会企业,并设有VIP社交晚宴、硬件体验区、扭蛋抽奖等各种活动,带来丰富、沉浸的技术大会体验。

▼点击下方阅读原文 ▼

进入LiveVideoStackCon 2023深圳站官网 了解更多精彩演讲

相关文章:

「专题速递」AR协作、智能NPC、数字人的应用与未来

元宇宙是一个融合了虚拟现实、增强现实、人工智能和云计算等技术的综合概念。它旨在创造一个高度沉浸式的虚拟环境,允许用户在其中交互、创造和共享内容。在元宇宙中,人们可以建立虚拟身份、参与虚拟社交,并享受无限的虚拟体验。 作为互联网大…...

什么是基于意图的网络(IBN)

基于意图的网络是一种网络技术,它根据业务意图(来自网络管理员的服务请求)配置 IT 基础架构,无需任何人工干预,它不断提供关键的网络见解,并不断调整硬件配置以确保满足意图,它将网络从以设备为…...

知识增强语言模型提示 零样本知识图谱问答10.8

知识增强语言模型提示 零样本知识图谱问答 摘要介绍相关工作方法零样本QA的LM提示知识增强的LM提示与知识问题相关的知识检索 摘要 大型语言模型(LLM)能够执行 零样本closed-book问答任务 ,依靠其在预训练期间存储在参数中的内部知识。然而&…...

虚拟现实项目笔记:SDK、Assimp、DirectX Sample Browser、X86和X64

文章目录 SDK是什么Assimp是什么DirectX Sample Browser是什么X86和X64生成解决方案和重新生成解决方案 SDK是什么 SDK是Software Development Kit的英文缩写,意思是软件开发包。 软件开发包中往往包含有多种辅助进行软件开发的内容,包括一些软件开发工…...

openwrt rm500u ncm方式拨号步骤记录

1.进入设备页面 用户名:root 2.创建接口 3.配置接口 国内APN 信息 中国移动APN:CMNET 中国联通APN:3GNET 中国电信APN:CTNET 4.防火墙配置 5.点击Save&Apply 6.配置完成后重启设备。重新进入设备页面,可以看…...

使用js代码将一个值为“1=增量,2=全量“的字符串转化为一个数组,数据格式为[{value:““,label:“‘‘}]

const str "1增量,2全量"; const arr str.split(",").map(item > {const [value, label] item.split("");return { value, label}; });...

图片调色盘

图片预览 配置安装 Color-Thief 安装包使用文档 yarn add colorthief -S // npm install colorthief --save代码 <template><div class"img-thief"><div class"container"><div class"thief-item" v-for"(item, in…...

一文读懂Base64

这几天在和第三方交互的时候&#xff0c;对方返回的数据是base64格式的数据&#xff0c;所以这两天又彻底捋了下Base64的来龙去脉。之前看过一篇文章说的非常好&#xff08;再找到给加上链接&#xff09;&#xff0c;我在这不详细说明了&#xff0c;只说转换过程。 还是使用中…...

CCF CSP认证 历年题目自练 Day20

题目一 试题编号&#xff1a; 201903-1 试题名称&#xff1a; 小中大 时间限制&#xff1a; 1.0s 内存限制&#xff1a; 512.0MB 问题描述&#xff1a; 题目分析&#xff08;个人理解&#xff09; 常规题目&#xff0c;先看输入&#xff0c;第一行输入n表示有多少数字&am…...

【Overload游戏引擎分析】从视图投影矩阵提取视锥体及overload对视锥体的封装

overoad代码中包含一段有意思的代码&#xff0c;可以从视图投影矩阵逆推出摄像机的视锥体&#xff0c;本文来分析一下原理 一、平面的方程 视锥体是用平面来表示的&#xff0c;所以先看看平面的数学表达。 平面方程可以由其法线N&#xff08;A, B, C&#xff09;和一个点Q(x0,…...

vue全局事件总线是什么?有什么用?解决了什么问题,与pinia有什么区别?

全局事件总线快速入门 概念基本概念&#xff08;是什么&#xff1f;&#xff09;核心概念 核心特性和优势(有什么用&#xff1f;)解决了什么问题&#xff1f;主要优势是什么&#xff1f; 案例演示&#xff1f;传递数据-案例演示传递事件-案例演示 与pinia有什么区别&#xff1f…...

【debian 12】:debian系统切换中文界面

目录 目录 项目场景 基础参数 原因分析 解决方案 1.ctrlaltT 打开终端 2.查询当前语言环境&#xff08;我的已经设置成了中文 zh_CN.UTF-8&#xff09; 3.打开语言配置界面 4.最后一步&#xff1a;重启 不要放弃任何一个机会&#xff01; 项目场景&#xff1a; 这两…...

es官方为我们提供的堆内存保护机制-熔断器( breaker )

总熔断器&#xff08;相当于似乎总闸&#xff09; 参数&#xff1a; indices.breaker.total.use_real_memory 默认值&#xff1a;true 在 elasticsearch.yml中配置。 参数&#xff1a; indices.breaker.total.limit 如果 indices.breaker.total.use_real_memory : true, in…...

靶场通关记录

OSCP系列靶场-Esay-CyberSploit1 总结 getwebshell → 源码注释发现用户名 → robots.txt发现base64密码 → SSH登录 提 权 思 路 → 内网信息收集 → 发现发行版本有点老 → 内核overlayfs提权 准备工作 启动VPN 获取攻击机IP > 192.168.45.220 启动靶机 获取目标机器I…...

全网最新最全的软件测试面试题

一、前言 与开发工程师相比&#xff0c;软件测试工程师前期可能不会太深&#xff0c;但涉及面还是很广的。 在一年左右的实习生或岗位的早期面试中&#xff0c;主要是问一些基本的问题。 涉及到的知识主要包括MySQL数据库的使用、Linux操作系统的使用、软件测试框架问题、测试…...

如何列出 Ubuntu 和 Debian 上已安装的软件包

当你安装了 Ubuntu 并想好好用一用。但在将来某个时候&#xff0c;你肯定会遇到忘记曾经安装了那些软件包。 这个是完全正常。没有人要求你把系统里所有已安装的软件包都记住。但是问题是&#xff0c;如何才能知道已经安装了哪些软件包&#xff1f;如何查看安装过的软件包呢&a…...

图论---最小生成树问题

在连通网的所有生成树中&#xff0c;所有边的代价和最小的生成树&#xff0c;称为最小生成树。解决最小生成树问题一般有两种算法&#xff1a;Kruskal算法和Prim算法。 Kruskal算法 原理&#xff1a;基本思想是从小到大加入边&#xff0c;是个贪心算法。我们将图中的每个边按…...

elementplus 时间范围选择器限制选择时间范围

<el-date-pickerv-model"form.time" type"daterange"range-separator"-"start-placeholder"开始时间"end-placeholder"结束":disabled-date"disabledDate"calendar-Change"calendarChange" />co…...

【网络】抓包工具Wireshark下载安装和基本使用教程

&#x1f341; 博主 "开着拖拉机回家"带您 Go to New World.✨&#x1f341; &#x1f984; 个人主页——&#x1f390;开着拖拉机回家_Linux,大数据运维-CSDN博客 &#x1f390;✨&#x1f341; &#x1fa81;&#x1f341; 希望本文能够给您带来一定的帮助&#x1…...

Metasequoia 4 水杉3D建模工具 附序列号

Metasequoia 4是一款非常强大的3D水杉建模工具&#xff0c;它基于多边形建模技术&#xff0c;可以用于创建各种对象并支持多种第三方3DCG软件的文件格式&#xff0c;是一款非常适合从爱好到业务&#xff0c;支持3D电脑绘图&#xff0c;3D印刷&#xff0c;游戏开发等的3D建模软件…...

eNSP-Cloud(实现本地电脑与eNSP内设备之间通信)

说明&#xff1a; 想象一下&#xff0c;你正在用eNSP搭建一个虚拟的网络世界&#xff0c;里面有虚拟的路由器、交换机、电脑&#xff08;PC&#xff09;等等。这些设备都在你的电脑里面“运行”&#xff0c;它们之间可以互相通信&#xff0c;就像一个封闭的小王国。 但是&#…...

【OSG学习笔记】Day 18: 碰撞检测与物理交互

物理引擎&#xff08;Physics Engine&#xff09; 物理引擎 是一种通过计算机模拟物理规律&#xff08;如力学、碰撞、重力、流体动力学等&#xff09;的软件工具或库。 它的核心目标是在虚拟环境中逼真地模拟物体的运动和交互&#xff0c;广泛应用于 游戏开发、动画制作、虚…...

React hook之useRef

React useRef 详解 useRef 是 React 提供的一个 Hook&#xff0c;用于在函数组件中创建可变的引用对象。它在 React 开发中有多种重要用途&#xff0c;下面我将全面详细地介绍它的特性和用法。 基本概念 1. 创建 ref const refContainer useRef(initialValue);initialValu…...

Java 8 Stream API 入门到实践详解

一、告别 for 循环&#xff01; 传统痛点&#xff1a; Java 8 之前&#xff0c;集合操作离不开冗长的 for 循环和匿名类。例如&#xff0c;过滤列表中的偶数&#xff1a; List<Integer> list Arrays.asList(1, 2, 3, 4, 5); List<Integer> evens new ArrayList…...

从零实现富文本编辑器#5-编辑器选区模型的状态结构表达

先前我们总结了浏览器选区模型的交互策略&#xff0c;并且实现了基本的选区操作&#xff0c;还调研了自绘选区的实现。那么相对的&#xff0c;我们还需要设计编辑器的选区表达&#xff0c;也可以称为模型选区。编辑器中应用变更时的操作范围&#xff0c;就是以模型选区为基准来…...

抖音增长新引擎:品融电商,一站式全案代运营领跑者

抖音增长新引擎&#xff1a;品融电商&#xff0c;一站式全案代运营领跑者 在抖音这个日活超7亿的流量汪洋中&#xff0c;品牌如何破浪前行&#xff1f;自建团队成本高、效果难控&#xff1b;碎片化运营又难成合力——这正是许多企业面临的增长困局。品融电商以「抖音全案代运营…...

解决本地部署 SmolVLM2 大语言模型运行 flash-attn 报错

出现的问题 安装 flash-attn 会一直卡在 build 那一步或者运行报错 解决办法 是因为你安装的 flash-attn 版本没有对应上&#xff0c;所以报错&#xff0c;到 https://github.com/Dao-AILab/flash-attention/releases 下载对应版本&#xff0c;cu、torch、cp 的版本一定要对…...

华为云Flexus+DeepSeek征文|DeepSeek-V3/R1 商用服务开通全流程与本地部署搭建

华为云FlexusDeepSeek征文&#xff5c;DeepSeek-V3/R1 商用服务开通全流程与本地部署搭建 前言 如今大模型其性能出色&#xff0c;华为云 ModelArts Studio_MaaS大模型即服务平台华为云内置了大模型&#xff0c;能助力我们轻松驾驭 DeepSeek-V3/R1&#xff0c;本文中将分享如何…...

Maven 概述、安装、配置、仓库、私服详解

目录 1、Maven 概述 1.1 Maven 的定义 1.2 Maven 解决的问题 1.3 Maven 的核心特性与优势 2、Maven 安装 2.1 下载 Maven 2.2 安装配置 Maven 2.3 测试安装 2.4 修改 Maven 本地仓库的默认路径 3、Maven 配置 3.1 配置本地仓库 3.2 配置 JDK 3.3 IDEA 配置本地 Ma…...

有限自动机到正规文法转换器v1.0

1 项目简介 这是一个功能强大的有限自动机&#xff08;Finite Automaton, FA&#xff09;到正规文法&#xff08;Regular Grammar&#xff09;转换器&#xff0c;它配备了一个直观且完整的图形用户界面&#xff0c;使用户能够轻松地进行操作和观察。该程序基于编译原理中的经典…...