当前位置：首页 > news >正文

live2d + edge-tts 优雅的实现数字人讲话 ~

news 2026/2/11 2:38:50

震惊！live2d数字人竟开口说话 ~

之前有想做数字人相关项目，查了一些方案。看了一些三方大厂的商用方案，口型有点尴尬，而且很多是采用视频流的方案，对流量的消耗很大。后来了解了live2d 技术，常在博客网页上见到的看板娘就是live2d技术实现的 ~

说下demo的技术实现，核心采用 live2d 的模型[含有开口说话的动作] + 文本转语音接口

1、文本转语音接口

这个接口采用前面分享过的edge-tts项目

基于微软TTS，优雅的实现文本转语音-CSDN博客

代码仓库地址

GitHub edge-ttshttps://github.com/lyz1810/edge-tts

2、前端实现数字人开口说话

2.1 引入 Live2D 必要的 JavaScript 库

    <script src="./js/live2dcubismcore.min.js"></script><script src="./js/live2d.min.js"></script><script src="./js/pixi.min.js"></script><!-- if only Cubism 4 support--><script src="./js/cubism4.min.js"></script><script src="./js/jquery-3.1.1.min.js"></script><script src="https://unpkg.com/axios/dist/axios.min.js"></script>

2.2 创建页面画布和按钮

<canvas id=canvas></canvas>
<div id="control"><div class="label">1、测试说话</div><button id="play">测试音频</button><br/><br/><div class="label">2、调用接口生成音频</div><textarea id="text" style="width:400px;height:300px;">你好，欢迎光临</textarea><br/><br/><button id="start">开始说话</button>
</div><style>#control {position: absolute;top: 50px;left: 50px;color: #ffffff;font-size: 18px;}.label {font-size: 32px;font-weight: 800;}
</style>

2.3 创建了一个 PIXI 渲染器实例，用于渲染 Live2D 模型

    // 数字人模型const cubism4Model = "./assets/kei_vowels_pro/kei_vowels_pro.model3.json";const live2d = PIXI.live2d;(async function main() {const app = new PIXI.Application({view: document.getElementById("canvas"),autoStart: true,resizeTo: window,backgroundColor: 0x333333});const models = await Promise.all([live2d.Live2DModel.from(cubism4Model)]);models.forEach((model) => {app.stage.addChild(model);const scaleX = (innerWidth) / model.width;const scaleY = (innerHeight) / model.height;// fit the windowmodel.scale.set(Math.min(scaleX, scaleY));model.y = innerHeight * 0.1;draggable(model);});const model4 = models[0];console.log(innerWidth)// model4.x = innerWidth / 2;// 居中显示model4.x = (innerWidth - model4.width) / 2;model4.on("hit", (hitAreas) => {if (hitAreas.includes("Body")) {model4.motion("Tap");}if (hitAreas.includes("Head")) {model4.expression();}});})();

2.4 创建播放音频函数，播放音频并调用模型开口说话动作

function talk(model, audio) {var audio_link = audio;  //[Optional arg, can be null or empty] [relative or full url path] [mp3 or wav file] "./Keira.wav"var volume = 1; // [Optional arg, can be null or empty] [0.0 - 1.0]var expression = 8; // [Optional arg, can be null or empty] [index|name of expression]var resetExpression = true; // [Optional arg, can be null or empty] [true|false] [default: true] [if true, expression will be reset to default after animation is over]var crossOrigin = "anonymous"; // [Optional arg, to use not same-origin audios] [DEFAULT: null]model.speak(audio_link, {volume: volume,expression: expression,resetExpression: resetExpression,crossOrigin: crossOrigin})model.speak(audio_link)model.speak(audio_link, {volume: volume})model.speak(audio_link, {expression: expression, resetExpression: resetExpression})}

2.5 测试音频播放，并开口说话。点击测试音频按钮，测试正常播放调用。一切正常

        $("#play").click(function () {talk(model4, "./demo.mp3");});

2.6 核心来了，让模型根据文字内容开口说话

$("#start").click(function () {console.log($("#text").val());let text = $("#text").val().trim();if (text == "") {alert("请输入内容");return false;}$("#start").prop("disabled", true);axios.get("http://127.0.0.1:2020/dealAudio?file_name=test.mp3&voice=xiaoxiao&text=" + text).then(response => {console.log(response.data);const audioUrl = response.data + "?v=" + new Date().getTime();talk(model4, audioUrl);$("#start").prop("disabled", false);}).catch(error => {console.error('请求接口失败:', error);$("#start").prop("disabled", false);});});

这里调用的接口地址，采用的是文章开头提到的文本转语音助手

输入文字，点击开始说话

模型正常说话 ~

live2d的卡通数字人，感觉比3D建模的“真人数字人”效果要好很多，都是张口说话，live2d显的不会那么尴尬。

live2d的制作成本相对低很多，想商用的话感兴趣可以去查下模型制作教程 ~

代码也已开源，仓库地址

live2dSpeekhttps://github.com/lyz1810/live2dSpeek

live2d + edge-tts 优雅的实现数字人讲话 ~

震惊！live2d数字人竟开口说话 ~ 之前有想做数字人相关项目，查了一些方案。看了一些三方大厂的商用方案，口型有点尴尬，而且很多是采用视频流的方案，对流量的消耗很大。后来了解了live2d 技术，常在博客网页上…...

编程日记 2024/8/18 12:11:29

二进制安装php

下载php二进制包： 官网地址：https://www.php.net/releases/ PHP: Releaseshttps://www.php.net/releases/在里边可以选择自己要下载的包进行下载； 下载完成后进行解压： tar xvzf php-7.3.12.tar.gz 解压后进入目录进行预编…...

编程日记 2024/8/18 12:10:27

旧版Pycharm支持的python版本记录

编程日记 2024/8/18 12:09:26

java实现七牛云内容审核功能，文本、图片和视频的内容审核（鉴黄、鉴暴恐、敏感人物）

目录 1、七牛云内容审核介绍 2、查看内容审核官方文档 2.1、文本内容审核 2.1.1、文本内容审核的请求示例 2.1.2、文本内容审核的返回示例 2.2、图片内容审核 2.2.1、请求参数 2.2.2、返回参数 2.3、视频内容审核 3、代码实现 3.1、前期代码准备 3.2、文本内容审核…...

编程日记 2024/8/18 12:08:25

C++面试基础系列-struct

系列文章目录文章目录系列文章目录C面试基础系列-struct1.C中struct2.C中struct2.1.同名函数2.2.typedef定义结构体别名2.3.继承 3.总结3.1.C和C中的Struct区别 4.struct字节对齐5.struct与const 关于作者 C面试基础系列-struct 1.C中struct struct里面只能放数据类型&#…...

编程日记 2024/8/18 12:06:23

代码随想录算法训练营 | 动态规划 part05

完全背包有N件物品和一个最多能背重量为W的背包。第i件物品的重量是weight[i]，得到的价值是value[i] 。每件物品都有无限个（也就是可以放入背包多次），求解将哪些物品装入背包里物品价值总和最大。例子： 背包可容纳重…...

编程日记 2024/8/18 12:04:20

英特尔XPU大模型应用创新

...

编程日记 2024/8/18 12:02:18

仿Muduo库实现高并发服务器——socket网络通信模块

本项目就是基于TCP网络通信搭建的。 TCP: 客户端：socket(),connect(). 服务端：socket(),bind(),listen(),accept(). 下面代码就是对原生API网络套接字的封装。需要熟悉原生API网络套接字接口。下面这段代码，没什么好讲的，就不…...

编程日记 2024/8/18 12:01:17

模型神经网络（通俗解读）

系列文章分享模型，了解更多👉 模型_思维模型目录。仿脑智能，深度学习，精准识别。 1 神经网络的应用 1.1 鸢尾花分类经典问题神经网络的一个经典且详细的经典应用是鸢尾花分类问题。主要是通过构建一个神经网络模型来自动区分…...

编程日记 2024/8/18 11:59:14

事务的使用

1.如何使用事务: 1.1.事务的完成过程： 1.步骤1：开启事务2.步骤2：一系列的DML操作3.步骤3：事务结束状态：提交事务(COMMIT)，中止事务（事务回滚ROLLBACK） 1.2.事务分类： …...

编程日记 2024/8/18 11:58:14

【免费】企业级大模型应用推荐：星环科技无涯·问知

无涯问知是星环科技发布的大模型应用系统，那么我们先简单了解下星环科技吧！ 星环科技（股票代码：688031）致力于打造企业级大数据和人工智能基础软件，围绕数据的集成、存储、治理、建模、分析、挖掘和流通等数…...

编程日记 2024/8/18 11:57:13

从〇搭建PO模式的Web UI自动化测试框架

Page Object模式简介核心思想将页面元素和操作行为封装在独立的类中，形成页面对象（Page Object）。每个页面对象代表应用程序中的一个特定页面或组件。优点： 代码复用性高页面对象可以在多个测试用例中复用。易于维护 …...

编程日记 2024/8/18 11:56:11

在Ubuntu中重装Vscode（没有Edit Configurations(JSON)以及有错误但不标红波浪线怎么办？）

在学习时需要将vscode删除重装，市面上很多方法都不能删干净，删除之后拓展都还在。因此下面的方法可以彻底删除。注意，我安装时使用的是snap方法。如果你的VScode没有Edit Configurations(JSON)，以及有错误但不标红波浪线的话&…...

编程日记 2024/8/18 11:55:10

Oracle 用户-表空间-表之间关系常用SQL

问题： 当某一个表数据量特别大，突然插入数据一直失败，可能是表空间不足，需要查看表的使用率用户-表空间-表之间关系：用户可以有多个表空间，表空间可以有多个表，表只能拥有一个表空间和用户 1.…...

编程日记 2024/8/18 11:53:09

家政服务管理系统小程序的设计

管理员账户功能包括：系统首页，个人中心，用户管理，管理阿姨管理，家政公司管理，服务项目管理，家政预约管理，评价管理，留言板管理，系统管理微信端账号功能包括…...

编程日记 2024/8/18 11:47:56

【算法】并查集的介绍与使用

1.并查集的概论定义： 并查集是一种树型的数据结构，用于处理一些不相交集合的合并及查询问题（即所谓的并、查）。比如说，我们可以用并查集来判断一个森林中有几棵树、某个节点是否属于某棵树等。主要构成： …...

编程日记 2024/8/18 11:46:55

Shell——运算符

在 Shell 编程中，运算符用于执行各种类型的操作，如算术运算、字符串比较、文件测试等。以下是 Shell 中常用的运算符分类和示例： 1. 算术运算符 Shell 中使用 expr 或 $(( ... )) 来进行算术运算。 : 加法-: 减法*: 乘法/: 除法%: 取余**:…...

编程日记 2024/8/18 11:42:50

SweetAlert2

1. SweetAlert2 SweetAlert2是一个基于JavaScript的库, 用于在网页上替换标准的警告框(alert), 确认框(confirm)和提示框(prompt), 并提供更加美观和用户友好的界面.需要在项目中引入SweetAlert2, 可以通过CDN链接或者将库文件下载到你的项目中来实现这一点. 通过CDN引入:<…...

编程日记 2024/8/18 11:41:49

c语言中比较特殊的输入函数

目录一.getchar()函数 1.基本功能 2.使用方法 (1).读取单个字符 (2).读取多个字符（直到遇到换行符） (3).处理输入中的空白字符 3.返回值 4.应用场景 5.注意事项二.fgets()函数 1.函数原型 2.工作原理 3.使用示例 (1).从标准输入读取一行…...

编程日记 2024/8/18 11:39:47

Java版自动化测试之Selenium

1. 准备编程语言：Java JDK版本：17 Maven版本：3.6.1 2. 开始声明：本次只测试Java的Selenium自动化功能本次示例过程：打开谷歌游览器，进入目标网址，找到网页的输入框元素，输入指…...

编程日记 2024/8/18 11:34:42

练习（含atoi的模拟实现,自定义类型等练习）

一、结构体大小的计算及位段 （结构体大小计算及位段详解请看：自定义类型：结构体进阶-CSDN博客） 1.在32位系统环境，编译选项为4字节对齐，那么sizeof(A)和sizeof(B)是多少？ #pragma pack(4)st…...

编程新知 2026/1/30 15:16:30

鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个医院挂号小程序

一、开发准备环境搭建： 安装DevEco Studio 3.0或更高版本配置HarmonyOS SDK申请开发者账号项目创建： File > New > Create Project > Application (选择"Empty Ability") 二、核心功能实现 1. 医院科室展示 /…...

编程新知 2025/9/5 12:16:40

Qt Http Server模块功能及架构

Qt Http Server 是 Qt 6.0 中引入的一个新模块，它提供了一个轻量级的 HTTP 服务器实现，主要用于构建基于 HTTP 的应用程序和服务。功能介绍： 主要功能 HTTP服务器功能： 支持 HTTP/1.1 协议简单的请求/响应处理模型支持 GET…...

编程新知 2025/10/17 21:16:57

MySQL 知识小结（一）

一、my.cnf配置详解我们知道安装MySQL有两种方式来安装咱们的MySQL数据库，分别是二进制安装编译数据库或者使用三方yum来进行安装,第三方yum的安装相对于二进制压缩包的安装更快捷，但是文件存放起来数据比较冗余，用二进制能够更好管理咱们M…...

编程新知 2026/1/26 13:29:47

【前端异常】JavaScript错误处理：分析 Uncaught (in promise) error

在前端开发中，JavaScript 异常是不可避免的。随着现代前端应用越来越多地使用异步操作（如 Promise、async/await 等），开发者常常会遇到 Uncaught (in promise) error 错误。这个错误是由于未正确处理 Promise 的拒绝（r…...

编程新知 2026/1/1 23:11:45

通过MicroSip配置自己的freeswitch服务器进行调试记录

之前用docker安装的freeswitch的，启动是正常的， 但用下面的Microsip连接不上主要原因有可能一下几个 1、通过下面命令可以看 [rootlocalhost default]# docker exec -it freeswitch fs_cli -x "sofia status profile internal"Name …...

编程新知 2026/2/6 14:23:05

goreplay

1.github地址 https://github.com/buger/goreplay 2.简单介绍 GoReplay 是一个开源的网络监控工具，可以记录用户的实时流量并将其用于镜像、负载测试、监控和详细分析。 3.出现背景随着应用程序的增长，测试它所需的工作量也会呈指数级增长。GoRepl…...

编程新知 2026/2/10 4:32:45

k8s从入门到放弃之Pod的容器探针检测

k8s从入门到放弃之Pod的容器探针检测在Kubernetes（简称K8s）中，容器探测是指kubelet对容器执行定期诊断的过程，以确保容器中的应用程序处于预期的状态。这些探测是保障应用健康和高可用性的重要机制。Kubernetes提供了两种种类型…...

编程新知 2025/11/5 7:49:23

el-amap-bezier-curve运用及线弧度设置

文章目录简介示例线弧度属性主要弧度相关属性其他相关样式属性完整示例链接简介 ‌el-amap-bezier-curve 是 Vue-Amap 组件库中的一个组件，用于在高德地图上绘制贝塞尔曲线。‌ 基本用法属性path定义曲线的路径，可以是多个弧线段的组合。stroke-weight线条的宽度。stroke…...

编程新知 2025/11/5 3:45:37

多模态学习路线（2）——DL基础系列

目录前言一、归一化 1. Layer Normalization (LN) 2. Batch Normalization (BN) 3. Instance Normalization (IN) 4. Group Normalization (GN) 5. Root Mean Square Normalization（RMSNorm） 二、激活函数 1. Sigmoid激活函数（二分类&…...

编程新知 2026/2/4 12:22:11