当前位置: 首页 > news >正文

数字人小灿:始于火山语音,发于 B 端百业

火爆的数字人市场又有新消息来袭:火山语音的数字人小灿来了!

数字人小灿首曝视频

今年以来,在生成式AI浪潮的助推下,大量企业争相布局数字人赛道。市场之所以如此火热,是因为AI数字人已被视为人工智能时代智能交互的入口级产品,对于未来AI的广泛应用具有重要意义。

与虚拟现实时代数字人“高处不胜寒”,市场接受度较低相比;如今,金融、汽车、文旅、政务、大型企业等B端行业用户均在迅速接受和尝试AI数字人,并密切关注着市场与技术的动态变化。

不过,AI数字人在商业化落地依然面临着诸多挑战,如何真正推动数字人走向普惠是当下市场的一道难题。为此,火山语音推出数字人小灿,为AI数字人在B端市场走出一条重要的落地路径,助推AI数字人走进广大B端业务场景。

数字人赛道火热,落地挑战不容忽视

IDC《中国 AI 数字人市场现状与机会分析》报告预测,到2026年,中国AI数字人市场规模将达到102.4亿元人民币。

毫无疑问,AI数字人市场前景非常广阔。但从虚拟现实时期开始,数字人虽然借势起跑,却始终面临着大规模商用场景缺乏、市场接受度低、技术成熟度不高、成本高居不下等挑战,以至于在B端市场举足不前。

以市场定位为例,超写实的3D虚拟数字人贴合真人形象,也更加符合B端市场各种场景的定位,却也受制于AI算法、文本转语音技术、算力等技术因素的综合影响,数字人产品质量良莠不齐,语音、表情、互动等生硬,在B端业务场景中定位也不够不清晰,华而不实逐渐沦为噱头。

与此同时,数字人又面临着高昂生产和运营成本、较长生产周期等问题,很多曾火爆一时的3D数字人均受困于成本问题,宛如流星般划过。业内人士介绍,一个3D AI数字人的年运营成本就高达数百万,也让诸多B端企业望而却步,市场接受度始终起不来。

事实上,数字人当前遇到的困境并不稀奇。究其原因,在产业发展的早期阶段,一项技术或产品要实现从小众到大众、从尝鲜者到主流群体的广泛应用,解决不了技术关和成本关两大难题,终究无法实现。

业界普遍认为,在政策导向、市场需求、资本支出和技术成熟度等因素的合理推动下,AI数字人在B端市场正处于爆发的前夕。当前,市场中尤其需要AI数字人的高质量“爆款”,率先实现质量、成本与效率的兼顾,攻克技术关和成本关,牵引AI数字人全面融入B端业务场景。

相比之下,火山语音在数字人赛道属于先思而后行,其数字人小灿的定位非常清晰,即成为“提升工作效率+情绪价值”的副驾驶;同时作为首个超写实数字人,数字人小灿具备“善听”、“会说”、“能想”等特征,加上一站式拟人化服务,为数字人在B端市场带来新的启发。

首个超写实数字人,小灿颜才兼备

数字人小灿作为火山语音首位数字员工,火山语音介绍,未来或作为AI产品与技术的先导官服务内外。

作为超写实数字人,数字人小灿堪称颜值担当,不仅形象靓丽,而且气质不错。除了颜值之外,数字人小灿具备逻辑学家的人格类型,专业可靠、高理性逻辑,且才华横溢,对AI应用充满了天马行空的幻想。

数字人小灿“提升工作效率+情绪价值”副驾驶的产品定位,以及颜才具备的特征,都与B端业务场景的需求十分契合。众所周知,在B端业务场景中,业务逻辑较为复杂,通常具有一定的专业性,如果AI数字人语音、表情、互动生硬,不懂倾听、不会表达和不具备逻辑性,无法提升业务场景效率,就很难胜任业务场景的交互重任。

以金融业为例,IDC《银行数字科技五大趋势》报告认为,到2025年,超过80%的银行都将部署数字人,承担90%的客服和理财咨询服务。当前各种类型的金融机构均在试水AI数字人,像客服、理财咨询这类B端金融场景,AI数字人需要“看懂文字、听懂语言、做懂业务”,不仅需要在场景中实现与客户的高效率交互,还需要具有共情能力,让服务有温度。

数字人小灿颜才兼备的背后,自然离不开火山语音在AI相关技术的深厚底蕴。

据悉在形象技术方面,火山语音联合字节游戏-朝夕光年江南团队,联合打造3D超写实形象,数字人小灿是艺术+AI技术结合体。数字人小灿具备开心、惊讶、愤怒等丰富的情感演绎能力,语音交互时表情自然流畅,这些离不开火山语音的3D超写实数字人整套形象设计、资产制作、高成本影视级cg管线视频内容制作能力,以及自研高逼真AI口型及动作驱动技术。例如在AI驱动动作层面,团队基于创新的Motion Blening技术,在动作切换时可生成过度帧,使得数字人在切换各类动作时不仅可以做到毫秒级切换,同时平滑效果自然无感知。

同时数字人小灿还是个“语言天才”,会说英语、日语、粤语、东北话等十多种外语及方言,高保真还原真人音色、说话风格和声学环境特点,在市场中遥遥领先,这同样离不开火山语音在语音领域的技术底蕴。例如“一条音频秒级别音色复刻”技术(zero shot TTS),仅需要输入5秒钟到1分钟的音频,可秒级别极速复刻高保真还原真人音色、说话风格以及声学环境等特点;此外在核心技术架构全自研的基础上,各种指标(音质、相似度等)均居于学术界前沿,韵律模块基于自回归GPT类大模型研发,支持code-switch,即无论prompt为中文/英文,支持输出中文、英文及混合内容。

事实上,除了深厚的技术底蕴外,火山语音此次还非常注重以数字人为抓手,推动AI技术在B端的实践与落地。

深入行业场景,AI让工作生活更轻松

不可否认,当前AI数字人市场的火爆,也造成了一定的乱象,市场中也存在着大量良莠不齐的产品与方案。

业界普遍认为,AI数字人是推动AI技术在工作生活中落地的一个好抓手,能够真正带来B端行业交互效率和体验的提升,让人们的生活与工作更加轻松自如。但AI数字人在B端的普惠落地,还需要深入行业场景,找到产品与场景中的结合点,从而让数字人产品的价值得以呈现;并且需要具备规模化复制能力,降低AI数字人迈向B端行业用户的门槛。

通过数字人小灿,火山语音在AI数字人市场目标很明确,就是通过持续多版数字人产品的迭代,实现AI数字人质量、效率和成本并重,并让AI数字人深入行业场景,进而推动AI数字人在B端走向普惠。

在行业场景价值呈现方面,火山语音的数字人产品包括“播报型数字人”和“交互型数字人”两种类型,专注播报、交互、直播三大核心场景,可以面向金融、大消费、泛互等行业提供涵盖“金融客服”、“智慧导览”、“智能助理”、“虚拟直播”等场景细分解决方案,为B端用户带来交互体验的全方位升级。

为进一步降低AI数字人的门槛,火山语音AI数字人可以实现快速复刻数字分身,仅需5-10分钟视频,就可1:1还原真人,再结合声音复刻即可快速实现形象与声音的近乎完美还原,加速AI数字人在内容生产、视频直播、车载环境等诸多场景中的落地。

更加重要的是,火山语音一直在技术层面持续迭代和优化数字人产品。例如,近年来,火山语音深度参与到“实时高逼真孪生数字人关键技术研发与应用示范”等多个国家重点项目建设,通过产学研用联动,推动AI数字人相关技术的应用。

随着数字人小灿的问世,火山语音已经在数字人领域已经取得阶段性成果,为市场带来了质量、成本和效率并重的AI数字人一体化服务。面向未来,随着AI数字人市场不断发展,火山语音的AI数字人产品与服务有望在B端行业中遍地开花。

相关文章:

数字人小灿:始于火山语音,发于 B 端百业

火爆的数字人市场又有新消息来袭:火山语音的数字人小灿来了! 数字人小灿首曝视频 今年以来,在生成式AI浪潮的助推下,大量企业争相布局数字人赛道。市场之所以如此火热,是因为AI数字人已被视为人工智能时代智能交互的入…...

蓝桥杯刷题

欢迎来到Cefler的博客😁 🕌博客主页:那个传说中的man的主页 🏠个人专栏:题目解析 🌎推荐文章:题目大解析(3) 👉🏻最大降雨量 原题链接&#xff1…...

Go Metrics SDK Tag 校验性能优化实践

背景 Metrics SDK 是与字节内场时序数据库 ByteTSD 配套的用户指标打点 SDK,在字节内数十万服务中集成,应用广泛,因此 SDK 的性能优化是个重要和持续性的话题。本文主要以 Go Metrics SDK 为例,讲述对打点 API 的 hot-path 优化的…...

二叉树问题——前/中/后/层遍历问题(递归与栈)

摘要 博文主要介绍二叉树的前/中/后/层遍历(递归与栈)方法 一、前/中/后/层遍历问题 144. 二叉树的前序遍历 145. 二叉树的后序遍历 94. 二叉树的中序遍历 102. 二叉树的层序遍历 103. 二叉树的锯齿形层序遍历 二、二叉树遍历递归解析 // 前序遍历递归LC144_二叉树的前…...

Vue3问题:如何实现级联菜单的数据懒加载?

前端功能问题系列文章,点击上方合集↑ 序言 大家好,我是大澈! 本文约3100字,整篇阅读大约需要5分钟。 本文主要内容分三部分,第一部分是需求分析,第二部分是实现步骤,第三部分是问题详解。 …...

STM32-电源管理(实现低功耗)

电源管理 STM32 HAL库对电源管理提供了完善的函数和命令。 工作模式(高功耗->低功耗):运行、睡眠、停止、待机。 若备份域电源正常供电,备份域内的RTC都可以正常运行,备份域内的寄存器的数据会被保存,不…...

vue 自己捣鼓周日程日历组件

需求:想要一个周日程表,记录每天的计划,点击可查看详情。可自定义时间段通过后台获取时间段显示 分析: 通过需求,超级课程表app这款软件其中课表和这个需求很像,只不过这个需求第一列的时间段是自定义的,不是上午下午两个,但是原理都差不多 原本想找一些第三方插件使…...

【力扣】2127. (分类讨论 + 拓扑排序)参加会议的最多员工数

【力扣】2127. (分类讨论 拓扑排序)参加会议的最多员工数 文章目录 【力扣】2127. (分类讨论 拓扑排序)参加会议的最多员工数1. 题目介绍2. 思路(**分类讨论 拓扑排序**)3. 解题代码4. Danger参考 1. 题…...

Flutter——最详细(Map)使用教程

Map简介 键值对的集合,您可以使用其关联的键从中检索值。 普通的 HashMap是无序的(不保证顺序),LinkedHashMap 按键插入顺序迭代,而像 SplayTreeMap 这样的排序映射按排序顺序迭代键。 1,添加元素 addEntri…...

vue的入门第一课

Vue.js是一款流行的JavaScript框架,用于构建交互式Web应用程序。本文将详细介绍Vue.js的基础知识,包括Vue.js的历史、设计模式、构造函数参数、el、data、computed、method、watch以及差值的使用。 Vue.js是什么? Vue.js是一款用于构建用户…...

已解决:conda找不到对应版本的cudnn如何解决?

1.解决方法 配置深度学习环境时,打算安装cudatoolkit11.2和cudnn8.1,当使用conda install cudnn8.0时,却搜索不到这个版本的包,解决方法如下: conda search cudnn -c conda-forge然后就可以使用如下命令进行安装对应…...

大语言模型的学习路线和开源模型的学习材料《二》

第三层 LLMs to Artifact 第一重 langchain 【LLMs 入门实战 —— 十二 】基于 本地知识库 的高效 🤖langchain-ChatGLM 介绍:langchain-ChatGLM是一个基于本地知识的问答机器人,使用者可以自由配置本地知识,用户问题的答案也是基于本地知识生成的。【LLMs 入门实战 ——…...

Flask-SQLAlchemy事件钩子介绍

一、前言 前几天在搜资料的时候无意中看到有介绍SQLAlchemy触发器,当时感觉挺奇怪的,触发器不是数据库层面的概念吗,怎么flask-SQLAlchemy这个ORM框架会有这玩意。 二、SQLAlchemy触发器一个简单例子 考虑到效率博客表中有两个字段&#xf…...

C++——list

目录 list介绍 list的函数接口 构造函数 push_front和pop_front push_back和pop_back insert erase 迭代器 front和back size resize empty clear list::sort unique reverse 迭代器的实现 list介绍 list是一种可以在常数范围内在任意位置进行插入和删除的序列…...

【Linux】第九站:make和makefile

文章目录 一、 Linux项目自动化构建工具make/Makefile1.make/makefile工作现象2.依赖关系与依赖方法3.如何清理4.为什么这里我们需要带上clean5.连续的make6.特殊符号 二、Linux下实现一个简单的进度条1.回车换行2.缓冲区3.倒计时的实现 一、 Linux项目自动化构建工具make/Make…...

一文了解什么是WebSocket

WebSocket 允许我们创建“实时”应用程序,与传统 API 协议相比,该应用程序速度更快且开销更少。​ 一、WebSocket 是如何工作的 按照传统的定义,WebSocket是一种双工协议,主要用于客户端-服务器通信通道。它本质上是双向的&…...

redis是什么

redis是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。和Memcached类似。redis支持存储的value类型相对更多,包括string(字符串)、list(链表)、set(集合)和zset(有序集合)。 一、 基本…...

基于深度学习的人脸专注度检测计算系统 - opencv python cnn 计算机竞赛

文章目录 1 前言2 相关技术2.1CNN简介2.2 人脸识别算法2.3专注检测原理2.4 OpenCV 3 功能介绍3.1人脸录入功能3.2 人脸识别3.3 人脸专注度检测3.4 识别记录 4 最后 1 前言 🔥 优质竞赛项目系列,今天要分享的是 🚩 基于深度学习的人脸专注度…...

跨境电商的新引擎:崛起的网红经济

随着全球数字化时代的崛起,跨境电商成为了国际贸易的新引擎,而在这个巨大的变革浪潮中,网红经济正在崭露头角,成为这一引擎的有力推动者。在这篇文章中,我们将深入探讨网红经济如何催生跨境电商的新动力,以…...

P2006 赵神牛的游戏 python解法

赵神牛的游戏 题目描述 在 DNF 中,赵神牛有一个缔造者,他一共有 k k k 点法力值,一共有 m m m 个技能,每个技能耗费的法力值为 a i a_i ai​,可以造成的伤害为 b i b_i bi​,而 boss 的体力值为 n n…...

Leetcode 3576. Transform Array to All Equal Elements

Leetcode 3576. Transform Array to All Equal Elements 1. 解题思路2. 代码实现 题目链接:3576. Transform Array to All Equal Elements 1. 解题思路 这一题思路上就是分别考察一下是否能将其转化为全1或者全-1数组即可。 至于每一种情况是否可以达到&#xf…...

pam_env.so模块配置解析

在PAM(Pluggable Authentication Modules)配置中, /etc/pam.d/su 文件相关配置含义如下: 配置解析 auth required pam_env.so1. 字段分解 字段值说明模块类型auth认证类模块,负责验证用户身份&am…...

04-初识css

一、css样式引入 1.1.内部样式 <div style"width: 100px;"></div>1.2.外部样式 1.2.1.外部样式1 <style>.aa {width: 100px;} </style> <div class"aa"></div>1.2.2.外部样式2 <!-- rel内表面引入的是style样…...

第 86 场周赛:矩阵中的幻方、钥匙和房间、将数组拆分成斐波那契序列、猜猜这个单词

Q1、[中等] 矩阵中的幻方 1、题目描述 3 x 3 的幻方是一个填充有 从 1 到 9 的不同数字的 3 x 3 矩阵&#xff0c;其中每行&#xff0c;每列以及两条对角线上的各数之和都相等。 给定一个由整数组成的row x col 的 grid&#xff0c;其中有多少个 3 3 的 “幻方” 子矩阵&am…...

RNN避坑指南:从数学推导到LSTM/GRU工业级部署实战流程

本文较长&#xff0c;建议点赞收藏&#xff0c;以免遗失。更多AI大模型应用开发学习视频及资料&#xff0c;尽在聚客AI学院。 本文全面剖析RNN核心原理&#xff0c;深入讲解梯度消失/爆炸问题&#xff0c;并通过LSTM/GRU结构实现解决方案&#xff0c;提供时间序列预测和文本生成…...

3-11单元格区域边界定位(End属性)学习笔记

返回一个Range 对象&#xff0c;只读。该对象代表包含源区域的区域上端下端左端右端的最后一个单元格。等同于按键 End 向上键(End(xlUp))、End向下键(End(xlDown))、End向左键(End(xlToLeft)End向右键(End(xlToRight)) 注意&#xff1a;它移动的位置必须是相连的有内容的单元格…...

使用 SymPy 进行向量和矩阵的高级操作

在科学计算和工程领域&#xff0c;向量和矩阵操作是解决问题的核心技能之一。Python 的 SymPy 库提供了强大的符号计算功能&#xff0c;能够高效地处理向量和矩阵的各种操作。本文将深入探讨如何使用 SymPy 进行向量和矩阵的创建、合并以及维度拓展等操作&#xff0c;并通过具体…...

html css js网页制作成品——HTML+CSS榴莲商城网页设计(4页)附源码

目录 一、&#x1f468;‍&#x1f393;网站题目 二、✍️网站描述 三、&#x1f4da;网站介绍 四、&#x1f310;网站效果 五、&#x1fa93; 代码实现 &#x1f9f1;HTML 六、&#x1f947; 如何让学习不再盲目 七、&#x1f381;更多干货 一、&#x1f468;‍&#x1f…...

【生成模型】视频生成论文调研

工作清单 上游应用方向&#xff1a;控制、速度、时长、高动态、多主体驱动 类型工作基础模型WAN / WAN-VACE / HunyuanVideo控制条件轨迹控制ATI~镜头控制ReCamMaster~多主体驱动Phantom~音频驱动Let Them Talk: Audio-Driven Multi-Person Conversational Video Generation速…...

Spring是如何解决Bean的循环依赖:三级缓存机制

1、什么是 Bean 的循环依赖 在 Spring框架中,Bean 的循环依赖是指多个 Bean 之间‌互相持有对方引用‌,形成闭环依赖关系的现象。 多个 Bean 的依赖关系构成环形链路,例如: 双向依赖:Bean A 依赖 Bean B,同时 Bean B 也依赖 Bean A(A↔B)。链条循环: Bean A → Bean…...