当前位置: 首页 > news >正文

EmoAva:首个大规模、高质量的文本到3D表情映射数据集。

2024-12-03,由哈尔滨工业大学(深圳)的计算机科学系联合澳门大学、新加坡南洋理工大学等机构创建了EmoAva数据集,这是首个大规模、高质量的文本到3D表情映射数据集,对于推动情感丰富的3D头像生成技术的发展具有重要意义。

数据集地址:EmoAva|情感计算数据集|3D虚拟形象生成数据集

一、研究背景:

在人工智能领域,尤其是情感计算社区,生成能够反映人类面部情感的头像一直是一个重要研究方向。这种技术在虚拟客户支持、在线治疗等多个实际场景中有着广泛的应用前景。

目前遇到困难和挑战:

1、表情多样性。同一情感文本可以对应多种不同的面部表情,模型需要能够捕捉这种多样性。

2、情感内容一致性。生成的头像表情需要与输入文本的情感基调保持一致。

3、表情流畅性。在对话中,头像的面部表情变化应该是连续和流畅的,这意味着情感状态之间的过渡应该是自然无缝的。

数据集地址:EmoAva|情感计算数据集|3D虚拟形象生成数据集

二、让我们一起来看一下EmoAva数据集

EmoAva是一个包含15,000个文本到3D表情映射实例的大规模、高质量数据集,专为情感丰富的3D头像生成而设计。

EmoAva数据集包含了从电影和电视剧中提取的对话视频片段,通过先进的3D面部跟踪技术提取出3D表情代码和网格。

数据集构建:

包括从视频剪辑中提取音频和视频、使用WhisperX进行音频转录、切割视频以匹配文本、使用FaceNet进行初步筛选和手动细化以获取头部视频,最后使用EMOCA-v2提取3D表情向量。

数据集特点:

1、大规模和高质量,包含15,000个文本-3D表情实例和782,471个FLAME框架。

2、表情多样性,超过15%的实例展现了1到N的关系。

3、情感多样性,包括快乐、悲伤、中性等多种情感。

数据集使用方法:数据集可以用于训练和评估文本到3D表情映射模型,以及3D头像渲染模型,通过提供文本输入生成具有丰富情感的3D头像。

基准测试:

文章提出了一系列评估指标,包括表情多样性、表情流畅性和情感内容一致性,以有效评估模型在这些挑战中的表现。

 

Emo3D生成分解为两个连续的步骤:文本到3D表情映射(T3DEM)和3D头像渲染(3DAR)。

其中T3DEM是决定Emo3D生成质量的关键步骤,面临表情多样性、情感内容一致性和表情流畅性三个挑战。

1、文本到3D表情映射(T3DEM):确定Emo3D生成质量的关键步骤,包括表情多样性、情感内容一致性和表情流畅性三个挑战。

2、3D化身渲染(3DAR):渲染更高质量的微妙表情。

CTEG模型(连续文本到表情生成器)

T3DEM(文本到3D表情映射):CTEG模型正是针对这一步骤设计的。它负责将给定的文本转换成一系列的表情向量。这些表情向量需要满足三个挑战:表情多样性、情感内容一致性和表情流畅性。CTEG模型通过自回归条件变分自编码器(CVAE)和增强的注意力机制来生成丰富、一致和流畅的表情序列。

GiGA模型(全局信息高斯头像)

3DAR(3D头像渲染):一旦CTEG模型生成了表情向量,GiGA模型就接管这些向量,将它们用于3D头像的渲染和动画制作。GiGA模型通过在3D高斯表示中整合全局信息机制,能够捕捉微妙的微表情和情感状态之间的无缝过渡,从而使得从视频中重建的3D头像能够展现出丰富的情感表达。

两个模型的关系:

连续性:CTEG模型和GiGA模型在Emo3D生成过程中是连续工作的。CTEG模型的输出(表情向量)直接作为GiGA模型的输入,确保了从文本到3D头像生成的流畅性和一致性。

互补性:CTEG模型专注于文本到表情向量的转换,而GiGA模型专注于将这些表情向量转化为视觉上的3D头像。两者共同实现了从文本到具有丰富情感表达的3D头像的完整生成过程。

总结来说,CTEG模型负责理解和转换文本中的情感信息,生成表情向量,而GiGA模型则负责将这些表情向量转化为3D头像的动态表情,两者协同工作,完成了Emo3D生成的全过程。

这项工作的符号和标记。

来自EmoAva数据集的样本。每个实例包括一个演员所说的文本、相应的头部视频以及一系列3D表情向量(这里以3D网格的形式可视化)。

a:表情序列长度的分布。b:主要面部情感类别的分布

连续文本到表情生成器(CTEG)的架构。给定一段文本,该模型自回归地生成一系列表情向量。绿色块和粉色块分别代表表情感知注意力(EwA)模块和条件变分自回归解码器(CVAD)模块。

GiGA动机的说明。与GaussianAvatars(顶部)相比,GiGA中的3D高斯不仅受绑定网格三角形的影响,还受到其他区域(三角形)的影响。这种设计考虑了肌肉单元的连接,使得对微妙表情变化的建模更加精确。

全局信息高斯头像(GiGA)模型的框架。

CTEG模型生成的多样性的可视化展示。从相同的文本中使用不同的随机种子生成了四个表情序列。CTEG展现了出色的生成多样性。

三、让我们一起展望EmoAva数据集的应用

案例名称:Nora- 虚拟情感治疗助手

在快节奏的现代生活中,许多人面临着心理压力和情感问题。传统的面对面心理治疗受限于地理位置、时间安排和个人隐私顾虑。为了解决这些问题,一家名为“心灵绿洲”的远程心理健康服务公司开发了一个名为“EmoTherapist”的虚拟治疗师平台,利用EmoAva数据集提供逼真的情感支持和治疗。

比如,小k是一位忙碌的都市白领,由于工作压力大,他经常感到焦虑和孤独。他决定尝试“心灵绿洲”提供的“Nora”服务。在一个风和日丽的周六早晨,小k打开了“Nora”应用程序,开始了他的心理治疗之旅。

治疗过程:

1、初始设置:

小k选择了一个舒适的环境,戴上VR头盔,进入了虚拟治疗室。房间布置温馨,阳光透过窗户洒在柔软的沙发上。

2、遇见虚拟治疗师:

随着一阵轻柔的音乐,一位名叫“艾米”的虚拟治疗师出现在小k面前。艾米有着温和的眼神和温暖的微笑,她的面部表情和肢体语言都是基于EmoAva数据集生成的,能够模拟真实人类治疗师的情感反应。

3、情感识别与同步:

在对话开始时,艾米通过语音识别和面部表情分析技术,捕捉小k的情绪状态。她的3D面部表情与小k的情绪同步变化,显示出同理心和关注。

4、情感表达与反馈:

当小k分享工作压力时,艾米的表情变得严肃而关切。她轻轻地点头,眼神中流露出理解和支持。这种情感的反馈让李明感到被听见和理解。

5、情感调节练习:

艾米引导小k进行深呼吸练习和正念冥想,以减轻焦虑。在练习过程中,艾米的表情和语调都与练习的节奏相匹配,帮助小k更好地放松和集中注意力。

6、情感故事分享:

艾米邀请小k分享一个他感到特别焦虑的工作经历。在讲述过程中,艾米的表情随着故事的情绪起伏而变化,她的眉头紧锁,表现出担忧,然后又逐渐放松,鼓励小k找到解决问题的方法。

7、治疗结束与总结:

治疗结束时,艾米总结了小k的进步,并给予了积极的反馈。她的笑容温暖而鼓励,让小k感到轻松和希望。

8、后续行动计划:

艾米为小k制定了一个个性化的行动计划,包括日常的放松技巧和情绪管理策略,帮助他在日常生活中应对压力。

经过几次治疗,小k感到自己的情绪得到了显著改善。他发现与艾米的互动不仅减轻了他的焦虑,还提高了他的情绪管理能力。小k对“Nora”服务感到满意,并推荐给了他的朋友和同事。这种创新的服务模式不仅拓宽了心理健康服务的可及性,也为那些需要情感支持的人们提供了新的选择。

更多免费的数据集,请打开:遇见数据集

遇见数据集-让每个数据集都被发现,让每一次遇见都有价值遇见数据集,国内领先的百万级数据集搜索引擎,实时追踪全球数据集市场,助力把握数字经济时代机遇。icon-default.png?t=O83Ahttps://www.selectdataset.com/

相关文章:

EmoAva:首个大规模、高质量的文本到3D表情映射数据集。

2024-12-03,由哈尔滨工业大学(深圳)的计算机科学系联合澳门大学、新加坡南洋理工大学等机构创建了EmoAva数据集,这是首个大规模、高质量的文本到3D表情映射数据集,对于推动情感丰富的3D头像生成技术的发展具有重要意义…...

Elasticsearch vs 向量数据库:寻找最佳混合检索方案

图片来自Shutterstock上的Bakhtiar Zein 多年来,以Elasticsearch为代表的基于全文检索的搜索方案,一直是搜索和推荐引擎等信息检索系统的默认选择。但传统的全文搜索只能提供基于关键字匹配的精确结果,例如找到包含特殊名词“Python3.9”的文…...

【Flink-scala】DataStream编程模型之水位线

DataStream API编程模型 1.【Flink-Scala】DataStream编程模型之 数据源、数据转换、数据输出 2.【Flink-scala】DataStream编程模型之 窗口的划分-时间概念-窗口计算程序 3.【Flink-scala】DataStream编程模型之 窗口计算-触发器-驱逐器 文章目录 DataStream API编程模型前言…...

Python导入moviepy找不到editor 视频没有声音设置audio_codec参数

moviepy合成视频出错: 问题一:导入moviepy.editor找不到editor,No module named moviepy.editor问题二:合成的视频没有声音 问题一:导入moviepy.editor找不到editor,No module named moviepy.editor from …...

rsync 是一个非常强大的 Linux 工具,常用于文件和目录的同步、备份和传输。

rsync 是一个非常强大的 Linux 工具,常用于文件和目录的同步、备份和传输。它可以高效地同步本地和远程系统上的文件和目录,并且支持增量传输,仅同步发生变化的部分。rsync 支持压缩传输、删除多余文件、排除特定文件等多种功能,是日常运维、备份和迁移数据的重要工具。 一…...

触发器案例详解

目录 一、定义二、类型三、功能与用途四、创建与调用DML触发器格式示例DDL触发器格式示例登录触发器格式示例五、案例案例一:DML触发器 - 记录更新操作的触发器案例二:DML触发器 - 防止非法工资更新的触发器案例三:DDL触发器 - 记录表结构更改的触发器案例四:DDL触发器 - 防…...

jwt 与 sessionid 的区别及应用场景

在现代 Web 应用中,JWT(JSON Web Token)和SessionID是两种常用的用户认证和状态管理机制。本文从两者的原理、区别、优缺点以及适用场景展开分析,结合常见问题提出了最佳实践建议,帮助开发者更好地选择和使用。 JWT与S…...

tomcat和nginx

Tomcat 和 Nginx 都可以部署 Web 应用,但它们的核心功能和适用场景不同,因此在 2024 年生产环境及未来,是否使用 Tomcat 取决于需求和技术架构的特点。 1. Tomcat 的特点与适用场景 Tomcat 是 Java Servlet 容器,主要用来运行基于…...

服务器带宽与数据安全的重要性与作用

服务器带宽指的是服务器与外部网络通信的能力,即服务器发送和接收数据的速率。带宽越大,服务器在同一时间内能够处理的数据量就越多,数据传输的速度和稳定性也就越高。在数字化时代,企业对于数据的依赖程度日益加深,无…...

JSON数据处理

1. JSON注解 Data NoArgsConstructor AllArgsConstructor JsonIgnoreProperties(ignoreUnknowntrue) JSON注解: JsonIgnoreProperties(ignoreUnknowntrue) Hutool 日期格式化: DatePattern DateTimeFormat(pattern "yyyy-MM-dd HH:mm:ss")…...

FSWIND脉动风-风载时程生成器软件原理

大量风的实测资料表明,在风的时程曲线中,瞬时风速包含两个部分:一部分是自振周期一般在 10 分钟以上的平均风,另一部分是周期一般只有几秒左右的脉动风。平均风由于其周期一般比结构的自振周期大,因而考虑其作用性质相…...

搭建高可用负载均衡系统:Nginx 与云服务的最佳实践

搭建高可用负载均衡系统:Nginx 与云服务的最佳实践 引言 在项目开发过程中,我们通常在开发和测试阶段采用单机架构进行开发和测试。这是因为在这个阶段,系统的主要目的是功能实现和验证,单机架构足以满足开发人员的日常需求&…...

对比git命令与TortoiseGit工具,理解git解决冲突的过程

1 引言 此前用TortoiseSvn习惯了,所以,转到git时也同时选择了TortoiseGit工具。 同时,对比了可视化工具和git命令的操作,来深入理解git解决冲突的方式。 2 使用远程仓库替代本地仓库的内容 2.1 TortoiseGit做法 using “MERGE_…...

guava缓存的get方法的回调函数讲解一下

CacheBuilder.newBuilder()//设置缓存初始大小,应该合理设置,后续会扩容.initialCapacity(10)//最大值.maximumSize(100)//并发数设置.concurrencyLevel(5)//缓存过期时间,写入后10分钟过期.expireAfterWrite(600,TimeUnit.SECONDS)//统计缓存…...

React基础知识四 Hooks

什么是hooks? (coderwhy) hooks是react 16.8(2019年)出的新特性。 react有两种形式来创建组件——类式和函数式。在hooks之前类式组件就是react最主流的编程方式。 这个时候,函数式组件是非常鸡肋的,几乎没什么用。因…...

线性代数中的谱分解

一、谱分解的基本原理 谱分解(Spectral Decomposition)是线性代数中的一个重要概念,特别是在研究矩阵的特征值和特征向量时。它指的是将一个矩阵分解为其特征值和特征向量的组合,从而简化矩阵的运算和分析。谱分解通常适用于对称…...

Redis 数据结结构(一)—字符串、哈希表、列表

Redis(版本7.0)的数据结构主要包括字符串(String)、哈希表(Hash)、列表(List)、集合(Set)、有序集合(Sorted Set)、超日志&#xff08…...

【Python】用Python和Paramiko实现远程服务器自动化管理

《Python OpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门! 解锁Python编程的无限可能:《奇妙的Python》带你漫游代码世界 在现代IT环境中,远程服务器管理已成为运维工作的常态。随着自动化运维的需求不断增加,如何高效地管理远程服务器,提升操作的灵活性和效率…...

PDF处理的创新工具:福昕低代码平台尝鲜

在当今数字化时代,PDF文件的处理和管理变得越来越重要。福昕低代码平台是新发布的一款创新的工具,旨在简化PDF处理和管理的流程。通过这个平台,用户可以通过简单的拖拽界面上的按钮,轻松完成对Cloud API的调用工作流,而…...

openstack创建浮动IP全过程

1、创建外部网络,即是provider网络,有关provider网络的详细解释请参见我之前的文章openstack中的self-service和provider网络_openstack provider网络不能创建vlan吗-CSDN博客 network create --share --external --provider-physical-network physnet1…...

nginx漏洞修复

漏洞名称:web服务器http信息头公开 解决,在以下各个监听端口加上一行,然后重启****nginx server_tokens off; 漏洞名称:默认的nginx http服务器设置 解决:请求头加上以下参数 add_header Content-Security-Policy “…...

Jackson - 序列化时更改字段名称

在这个简短的教程中&#xff0c;我将向您展示如何在序列化时更改字段名称以映射到另一个JSON属性。 Jackson库提供了JsonProperty注解&#xff0c;用于改变序列化JSON中的属性名称。 依赖项 首先&#xff0c;在pom.xml文件中添加以下依赖项&#xff1a; <dependency>…...

策略模式实战 - 猜拳游戏

**可以整体的替换一套算法&#xff0c;这就是策略模式。**这样对于同一个问题&#xff0c;可以有多种解决方案——算法实现的时候&#xff0c;可以通过策略模式来非常方便的进行算法的整体替换&#xff0c;而各种算法是独立封装好的&#xff0c;不用修改其内部逻辑。 具体的实…...

AWS ECS Task 添加 Prometheus 监控采集配置详细指南

以下是一篇完整的博文,介绍如何在 AWS ECS 环境中实现 JVM 监控。 AWS ECS 环境下的 JVM 监控实践 概述 在 AWS ECS (Elastic Container Service) 环境中监控 Java 应用性能是一项重要任务。本文将详细介绍如何使用 AWS Distro for OpenTelemetry (ADOT) 结合 Spring Boot …...

5. 一分钟读懂“工厂方法模式”

5.1 模式介绍 你可能会发现&#xff0c;简单工厂模式没在经典设计模式里出现&#xff0c;别急&#xff0c;它其实只是个常用的编程技巧&#xff0c;而不是标准的设计模式。简单工厂模式有三个要素&#xff1a;1个产品接口、n个产品类、1个工厂类&#xff0c;工厂类通过if/else来…...

基于 AutoFlow 快速搭建基于 TiDB 向量搜索的本地知识库问答机器人

导读 本文将详细介绍如何通过 PingCAP 开源项目 AutoFlow 实现快速搭建基于 TiDB 的本地知识库问答机器人。如果提前准备好 Docker、TiDB 环境&#xff0c;整个搭建过程估计在 10 分钟左右即可完成&#xff0c;无须开发任何代码。 文中使用一篇 TiDB 文档作为本地数据源作为示…...

C语言学习:速通指针(2)

这里要学习的有以下内容 1. const修饰指针 2. 野指针 3. assert断⾔ 4. 指针的使⽤和传址调⽤ 那么从这里开始 1. const 修饰指针 const修饰变量 首先我们知道变量是可以修改的&#xff0c;如果把变量的地址交给⼀个指针变量&#xff0c;通过指针变量的也可以修改这个变…...

windows 上ffmpeg编译好的版本选择

1. Gyan.dev Gyan.dev 是一个广受信赖的 FFmpeg 预编译库提供者&#xff0c;提供多种版本的 FFmpeg&#xff0c;包括静态和动态链接版本。 下载链接: https://www.gyan.dev/ffmpeg/builds/ 特点&#xff1a; 提供最新稳定版和开发版。 支持静态和共享&#xff08;动态&…...

Java设计模式笔记(二)

十四、模版方法模式 1、介绍 1&#xff09;模板方法模式(Template Method Pattern)&#xff0c;又叫模板模式(Template Patern)&#xff0c;在一个抽象类公开定义了执行它的方法的模板。它的子类可以按需重写方法实现&#xff0c;但调用将以抽象类中定义的方式进行。 2&…...

Vue CLI的作用

Vue CLI&#xff08;Command Line Interface&#xff09;是一个基于Vue.js的官方脚手架工具&#xff0c;其主要作用是帮助开发者快速搭建Vue项目的基础结构和开发环境。以下是Vue CLI的具体作用&#xff1a; 1、项目模板与快速生成 Vue CLI提供了一系列预设的项目模板&#x…...