当前位置: 首页 > article >正文

实时数字人——DH_LIVE

前两天亲手搭建了实时对话数字人VideoChat,今天来搭建下DH_LIVE。

DH_LIVE一个实时数字人解决方案,从输入文字到数字人对口型说话用时2-3秒。

今天就来实际操作下dh_live的搭建过程。

首先贴上git地址:https://github.com/kleinlee/DH_live

然后又找到了个带webui的开源地址:https://github.com/v3ucn/DH_live_webui 含一键启动脚本。

1、先来看下自己本地的环境配置:

图片

系统:win10

显卡:rtx 2060 super

2、创建 环境

conda create -n dhlive python==3.10

图片

3、创建好后激活环境,进入到项目目录

conda activate dhlive

4、安装环境

pip install -r requirements.txt

5、安装比较顺利,直接安装成功了,接着来试着启动下 

python api.py

报错了。如图:

图片

这种比较好解决,直接 pip install pydub 即可。

6、接着再次执行 第五步,又报错,如图:

图片

    pip install torchaudio

    7、继续执行第五步,还报错

    图片

    这是ffmpeg没有配置环境变量,配置下即可。

    我的电脑--》右键--》属性--》高级系统设置--》环境变量--》系统变量--》path--》新建--》添加ffmpeg的bin路径保存即可。后台回复"ffmpeg"可获取ffmpeg文件

    图片

    图片

    图片

    图片

    配置好后重启打开窗口执行ffmpeg

    图片

    看到输出即为配置成功。

    8、接着再执行第五步,又报错

    图片

    pip install edge_tts

    9、接着执行第五步,终于成功了

    图片

    经实测,效果还不错,就是口型有点不太对应。从输入到说话的间隔要看文本长度。

    后台回复“DH_LIVE”可获取到一键启动的项目文件,包含checkpoints模型文件。

    相关文章:

    实时数字人——DH_LIVE

    前两天亲手搭建了实时对话数字人VideoChat,今天来搭建下DH_LIVE。 DH_LIVE一个实时数字人解决方案,从输入文字到数字人对口型说话用时2-3秒。 今天就来实际操作下dh_live的搭建过程。 首先贴上git地址:https://github.com/kleinlee/DH_liv…...

    SDC命令详解:使用remove_sdc命令移除约束

    相关阅读 SDC命令详解https://blog.csdn.net/weixin_45791458/category_12931432.html?spm1001.2014.3001.5482 remove_sdc命令用于移除当前设计中设置的所有SDC约束,需要注意的是,UPF约束不会被移除,要想移除UPF约束,需要使用r…...

    基于 EFISH-SBC-RK3588 的无人机多光谱/红外热成像边缘计算方案

    一、硬件架构设计‌ ‌核心算力平台(EFISH-SBC-RK3588)‌ ‌处理器性能‌:搭载 8 核 ARM 架构(4Cortex-A762.4GHz 4Cortex-A551.8GHz),集成 6 TOPS NPU 与 Mali-G610 GPU,支持多光谱图像实时融…...

    UI界面工程,如何使用控制台

    我们通常会使用print函数向控制台输出调试信息。但创建UI界面工程时,默认不会显示控制台。 通过如下方法切换到控制台 项目属性—链接器—系统—子系统—窗口改为控制台...

    Elasticsearch 堆内存使用情况和 JVM 垃圾回收

    作者:来自 Elastic Kofi Bartlett 探索 Elasticsearch 堆内存使用情况和 JVM 垃圾回收,包括最佳实践以及在堆内存使用过高或 JVM 性能不佳时的解决方法。 堆内存大小是分配给 Elasticsearch 节点中 Java 虚拟机的 RAM 数量。 从 7.11 版本开始&#xff…...

    网络开发基础(游戏)之 域名解析

    域名 (Domain Name) 是互联网中用于标识和定位网站、服务器或其他网络资源的字符串(如 baidu.com、google.com),它充当了人类可读的“门牌号”。 其核心作用有以下几点: 1. 代替IP地址,便于记…...

    【数字图像处理】机器视觉(1)

    判别相对应的点 1. 图像灰度化 2. 局部特征 3. 仿射不变性特征 图像变化的类型 【1】几何变化:旋转、相似(旋转 各向相同的尺度缩放)、仿射(非各向相同的尺度缩放) 【2】灰度变化:仿射灰度变化 角点 角…...

    C++项目 —— 基于多设计模式下的同步异步日志系统(4)(双缓冲区异步任务处理器(AsyncLooper)设计)

    C项目 —— 基于多设计模式下的同步&异步日志系统(4)(双缓冲区异步任务处理器(AsyncLooper)设计) 异步线程什么是异步线程?C 异步线程简单例子代码解释程序输出关键点总结扩展:使…...

    Vue el-checkbox 虚拟滚动解决多选框全选卡顿问题 - 高性能处理大数据量选项列表

    一、背景 在我们开发项目中,经常会遇到需要展示大量选项的多选框场景,比如权限配置、数据筛选等。当选项数量达到几百甚至上千条时,传统的渲染方式全选时会非常卡顿,导致性能问题。本篇文章,记录我使用通过虚拟滚动实现…...

    案例速成k8s,个人笔记快速入门

    更多个人笔记见github个人笔记仓库 个人学习,学习过程中还会不断补充~ (后续会更新在github上) 案例代码仓库:k8s学习代码 每一步重要的我都commit了,可以通过可视化软件比如github desktop 查看 简述 接…...

    声音识别(声纹识别)和语音识别的区别

    目录 引言一、语音识别1.声学模型2.语言模型3.词典 二、声音识别(声纹识别)三、语音识别、声音识别、语义识别的区别四、总结 引言 咋一看这个标题是不是很多小伙伴都迷糊了,哇哈,这两个不是一样的吗? 结论是&#x…...

    使用Mybaitis-plus提供的各种的免写SQL的Wrapper的使用方式

    文章目录 内连接JoinWrappers.lambda和 new MPJLambdaWrapper 生成的MPJLambdaWrapper对象有啥区别?LambdaQueryWrapper 和 QueryWrapper的区别?LambdaQueryWrapper和MPJLambdaQueryWrapper的区别?在作单表更新时建议使用:LambdaU…...

    springboot-基于Web企业短信息发送系统(源码+lw+部署文档+讲解),源码可白嫖!

    摘要 当今社会已经步入了科学技术进步和经济社会快速发展的新时期,国际信息和学术交流也不断加强,计算机技术对经济社会发展和人民生活改善的影响也日益突出,人类的生存和思考方式也产生了变化。本系统采用B/S架构,数据库是MySQL…...

    秀丸编辑器 使用技巧

    参考资料 第II部〜知っていると便利な秀丸の機能 検索テキストファイルの16進表示について秀丸エディタヘルプ目次秀丸エディタQ&A集(第9.6版)(HTML 形式)テンプレート(Ver9.43対応版) 目录 零…...

    什么是量子计算?它能做什么?

    抛一枚硬币。要么正面朝上,要么反面朝上,对吧?当然,那是在我们看到硬币落地的结果之后。但当硬币还在空中旋转时,它既不是正面也不是反面,而是正面和反面都有一定的可能性。 这个灰色地带就是量子计算的简…...

    Python Web开发常用框架介绍

    Python Web开发常用框架介绍 Python 是一种简洁、易于学习且功能强大的编程语言,广泛应用于 Web 开发、数据分析、人工智能等领域。Python 的 Web 开发框架能帮助开发者更高效地创建和管理 Web 应用。本文将介绍几种常用的 Python Web 开发框架,帮助你选…...

    【新能源科学与技术】MATALB/Simulink小白教程(一)实验文档【新能源电力转换与控制仿真】

    DP读书:新能源科学与工程——专业课「新能源发电系统」 2025a 版本 MATLAB下面进入正题 仿真一:Buck 电路一、仿真目的二、仿真内容(一)Buck电路基本构成及工作原理(二)Buck电路仿真模型及元件连接&#xf…...

    [Unity]ColdKD树 冷处理解决含有删除操作的最近邻问题

    在 Unity 开发中,最近邻问题是一个常见的需求场景。例如,在游戏中的寻路系统、物体之间的交互检测、资源分配等场景中,都需要快速准确地找到某个点或物体的最近邻。然而,传统的暴力遍历方法在处理这类问题时,往往会暴露…...

    快速生成安卓证书并打包生成安卓apk(保姆教程)

    一.生成安卓证书 目前市面上生成可以快速生成安卓证书的网站有很多个人推荐香蕉云编以下是网站链接 香蕉云编-app打包上架工具类平台 1.进入网站如下图 2.点击生成签名证书 3.点击立即创建证书 4.点击创建安卓证书 5.按照指引完成创建 6.点击下载就可使用 二.打包安卓apk …...

    mysql mvvc 实现方案

    Mysql 事务隔离级别 并发问题 mysql中事务并发时,会产生的问题如下 脏读: 读到了其他事务中,暂未提交的数据 脏读 (Dirty Read) 是数据库事务隔离级别中最低的一种隔离级别 (READ UNCOMMITTED) 下可能出现的一种并发问题。 它指的是一个事务读取了另…...

    校园外卖服务系统的设计与实现(代码+数据库+LW)

    摘 要 传统信息的管理大部分依赖于管理人员的手工登记与管理,然而,随着近些年信息技术的迅猛发展,让许多比较老套的信息管理模式进行了更新迭代,外卖信息因为其管理内容繁杂,管理数量繁多导致手工进行处理不能满足广…...

    纷析云:开源财务管理软件的创新与价值

    在企业数字化转型中,纷析云作为一款优秀的开源财务管理软件,正为企业财务管理带来新变革,以下是其核心要点。 一、产品概述与技术架构 纷析云采用微服务架构,功能组件高内聚低耦合,可灵活扩展和定制。前端基于现代框…...

    Centos安装Dockers+Postgresql13+Postgis3.1

    centos8安装docker步骤 1、# 强制卸载 podman 和 buildah 执行命令: yum erase podman buildah 2、# 添加阿里云仓库 yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo 3、# 安装基础依赖包 yum install…...

    【计算机网络 | 第二篇】常见的通信协议(一)

    HTTP和HTTPS有什么区别? 端口号:HTTP默认是80端口,HTTPS默认是443。 URL前缀:HTTPHTTP 的 URL 前缀是 http://,HTTPS 的 URL 前缀是 https://。 安全性和资源消耗:HTTP协议运行在TCP上,都是明…...

    基于Java与MAVLink协议的多无人机(Cube飞控)集群控制与调度方案问题

    基于Java与MAVLink协议的多无人机(Cube飞控)集群控制与调度方案问题 背景需求: 我们目前有一个基于Cube飞控的无人机系统,需实现以下核心功能: 多机通信:通过MAVLink协议同时连接并控制多架无人机&#x…...

    单片机——使用printf调试

    配置printf()输出函数 1、来自于<stdio.h> 2、运行C语言时&#xff0c;输出到终端 3、单片机没有终端&#xff0c;需要使用串口&#xff0c;将要输出的内容传到电脑&#xff08;串口调试助手&#xff09;上 例子如下 #include <stdio.h> #include &qu…...

    4.23晚间工作总结

    主要工作&#xff1a;将ClassicDetail界面拆分成utils,apis,stores,css,vue多个文件&#xff0c;方便后续重用 具体代码截图&#xff1a;...

    Spring 用到了哪些设计模式?

    Spring 框架使用了多种设计模式&#xff0c;这些模式帮助其实现松耦合、高内聚和可扩展性。以下是 Spring 中常见的设计模式及其应用场景&#xff1a; 1. 工厂模式&#xff08;Factory Pattern&#xff09; 应用场景&#xff1a;Spring 的 BeanFactory 和 ApplicationContext 是…...

    JavaEE学习笔记(第二课)

    1、好用的AI代码工具cursor 2、Java框架&#xff1a;Spring(高级框架)、Servelt、Struts、EJB 3、Spring有两层含义&#xff1a; ①Spring Framework&#xff08;原始框架&#xff09; ②Spring家族 4、Spring Boot(为了使Spring简化) 5、创建Spring Boot 项目 ① ② ③…...

    约束constraint

    创建表时&#xff0c;可以给表的字段添加约束&#xff0c;可以保证数据的完整性、有效性。比如大家上网注册用户时常见的&#xff1a;用户名不能为空。对不起&#xff0c;用户名已存在。等提示信息。 约束通常包括&#xff1a; 非空约束&#xff1a;not null检查约束&#xf…...