当前位置: 首页 > news >正文

如何制作自己的数字人

如何制作自己的数字人呢?不用担心平台的使用授权,也不用担心哪一天自己自媒体被号被无故封杀,那么SadTalker将是你的首选,他是完全开源的数字人软件,现已达到Apache2的授权,完全自由的开源软件。作者自己试着搭建效果还不错,口形模拟、脖子的扭动、眨眼晴等都非常的自然。

制作方法
1、创建python环境
conda create -n sadtalker python=3.8
如果使用英伟达的GPU,你还需要安装pytorch,版本1.12.1
2、安装视频处理工具
conda install ffmpeg
3、下载sadtalker的原代码:
git clone https://github.com/Winfredy/SadTalker.gat将代码完整克隆。
4、进入下载目录,安装相关依赖
pip install -r requirements.txt


5、下载预训练模型
https://github.com/OpenTalker/SadTalker/releases
将下载的模型放在checkpoints文件夹下,如果没这个文件夹就自己建一个。
6、将gfpgan\weights\GFPGANv1.4.pth目下的权重文件考到anaconda3的weights目下。举个例子:
gfpgan\weights\GFPGANv1.4.pth 剪切到虚拟环境的  D:\Anaconda3\envs\sadtalker\Lib\site-packages\gfpgan\weights 这个目录下
7、语音文件放到:sadTalker\examples\driven_audio 目录下。语音文件可以自己录制,如果测试也可以用目下面已经录好的wav文件。
8、找一张个人的正面照片放到:sadTalker\examples\source_image 目录下。

接下来就可以生成数字人了:
python inference.py --driven_audio D:\project\SadTalker\examples\driven_audio\map_chinese.wav --source_image D:\project\SadTalker\examples\source_image\full_body.png --enhancer gfpgan --preprocess full --stil

安装git和anaconda,如果不会安装可以参考我在CSDN上的的相关文档,里面有详细的安装方法。

相关文章:

如何制作自己的数字人

如何制作自己的数字人呢?不用担心平台的使用授权,也不用担心哪一天自己自媒体被号被无故封杀,那么SadTalker将是你的首选,他是完全开源的数字人软件,现已达到Apache2的授权,完全自由的开源软件。作者自己试…...

JAVA毕业设计103—基于Java+Springboot+vue的药店管理系统(源码+数据库)

基于JavaSpringbootvue的药店管理系统(源码数据库) 一、系统介绍 本系统前后端分离 -功能: 登录、药库药品管理、统计查询、药房管理、物资管理、挂号管理、账号管理、角色管理、权限管理、登录日志管理、药品管理、药品类型管理、客人类型管理 二、所用技术 后端技术栈&a…...

LeetCode66——加一

LeetCode66——加一 题目描述: 给定一个由 整数 组成的 非空 数组所表示的非负整数,在该数的基础上加一。 最高位数字存放在数组的首位, 数组中每个元素只存储单个数字。你可以假设除了整数 0 之外,这个整数不会以零开头。 示例…...

CV计算机视觉每日开源代码Paper with code速览-2023.10.23

精华置顶 墙裂推荐!小白如何1个月系统学习CV核心知识:链接 点击CV计算机视觉,关注更多CV干货 论文已打包,点击进入—>下载界面 点击加入—>CV计算机视觉交流群 1.【目标检测】Zone Evaluation: Revealing Spatial Bias i…...

C语言 sizeof 函数内部进行计算

直接看代码 #include <stdio.h> int main() {int i 2;int j;j sizeof(i i);printf("i %d, j %d", i ,j);return 0; }执行结果&#xff1a; 可以看到 i的值一直是没有变的&#xff0c; j 是int类型下 sizeof占用的大小为 4个字节&#xff0c;不是i的 22…...

导致爬虫无法使用的原因有哪些?

随着互联网的普及和发展&#xff0c;爬虫技术也越来越多地被应用到各个领域。然而&#xff0c;在实际使用中&#xff0c;爬虫可能会遇到各种问题导致无法正常工作。本文将探讨导致爬虫无法使用的原因&#xff0c;并给出相应的解决方法。 一、目标网站反爬虫机制 许多网站为了…...

paddlepaddle使用实践过程中的问题记录

环境背景 python&#xff1a;3.10.11 系统&#xff1a;macOS Big Sur 11.7.10 cpu&#xff1a;Intel Core i7 2.6GHz 内存&#xff1a;16G paddle版本问题 初始安装的是的MacOS cpu 2.5.1版本&#xff0c;在python解释器中执行import paddle时报错&#xff1a; ImportError:…...

MySQL数据库 #3

文章目录 一、创建表的完整语法二、约束条件1.unsigned &#xff08;无符号&#xff09;2. zerofill &#xff08;0填充&#xff09;3. default &#xff08;默认值&#xff09;4. not null&#xff08;非空&#xff09;5. unique&#xff08;唯一&#xff09;6. primary key &…...

XQ350441.0、XQ350641.0、XQ350441.1、XQ350641.1、XQ350441.2、XQ350641.2三位五通电磁气动阀

XQ230440、XQ230640、XQ230840、XQ231040、XQ231540二位三通气动电磁阀&#xff1b;XQ250440、XQ250640、XQ250840、XQ251040、XQ251540二位五通电磁气动阀&#xff1b;XQ240440二位四通电磁气动阀&#xff1b;XQ230441、XQ230641、XQ230841、XQ231041、XQ231541二位三通电磁气…...

降本增效神器?Share Creators 智能数字资产管理系统真香!

降本增效似乎是一个持续又永久的话题。尤其在今年&#xff0c; 显得格外的重要~ 在各行各业都受到了疫情所带来巨大冲击的背景下&#xff0c;降本增效对很多企业来说不再是锦上添花&#xff0c;而可能是一条唯一的出路。 随着市场的收缩和竞争的加剧&#xff0c;在更“卷”的…...

2023年中国汽车差速器需求量、竞争现状及行业市场规模分析[图]

差速器是汽车驱动系统的主要部件&#xff0c;它的作用就是在向两边半轴传递动力的同时&#xff0c;允许两边半轴以不同的转速旋转&#xff0c;满足两边车轮尽可能以纯滚动的形式作不等距行驶&#xff0c;减少轮胎与地面的摩擦。汽车差速器是驱动车轮差速转弯或复杂路面强力通过…...

【ceph】ceph集群的节点机器重启,导致磁盘的lvm消失,如何恢复呢~~满满的都是干货

本站以分享各种运维经验和运维所需要的技能为主 《python零基础入门》&#xff1a;python零基础入门学习 《python运维脚本》&#xff1a; python运维脚本实践 《shell》&#xff1a;shell学习 《terraform》持续更新中&#xff1a;terraform_Aws学习零基础入门到最佳实战 《k8…...

竞赛选题 深度学习人脸表情识别算法 - opencv python 机器视觉

文章目录 0 前言1 技术介绍1.1 技术概括1.2 目前表情识别实现技术 2 实现效果3 深度学习表情识别实现过程3.1 网络架构3.2 数据3.3 实现流程3.4 部分实现代码 4 最后 0 前言 &#x1f525; 优质竞赛项目系列&#xff0c;今天要分享的是 &#x1f6a9; 深度学习人脸表情识别系…...

异步为什么会造成 HTTP 队首阻塞?

一、http 协议的队首阻塞 队首阻塞,队首的事情没有处理完的时候&#xff0c;后面的都要等着。 1.1 HTTP1.0 的队首阻塞 对于同一个 tcp 连接&#xff0c;所有的 http1.0 请求放入队列中&#xff0c;只有前一个请求的响应收到了&#xff0c;然后才能发送下一个请求。http1.0 的…...

使用hibernate,报出ORA-00933_ SQL 命令未正确结束

这里分享一个很容易出错的原因&#xff0c;一旦涉及到切换不同的数据源&#xff0c;就需要修改配置文件&#xff0c;有时候就会忘记了修改方言&#xff0c;而jpa是需要设置方言的。 比如我这里就是因为从mysql切换为了使用oracle&#xff0c;忘记了设置对应的方言&#xff0c;才…...

易点易动设备管理系统:提升企业备件管理和维修效率的智能解决方案

在当今竞争激烈的商业环境中&#xff0c;大型生产制造企业面临着日益复杂的设备管理挑战。为了提高生产效率和降低成本&#xff0c;企业需要一种高效的设备管理系统。易点易动设备管理系统是一款智能化的解决方案&#xff0c;旨在帮助企业提升备件管理和维修效率。本文将详细介…...

新上线游戏产品需不需要防御?

游戏运营免不了遭受恶意DDoS和CC攻击&#xff0c;且攻击常达百G以上&#xff0c;攻击流量过大&#xff0c;超过一般服务器的基础防护能力&#xff0c;不少企业面对大流量攻击显得束手无策&#xff0c;只能选择被迫停机&#xff0c;其次游戏行业利润高&#xff0c;很容易被黑客盯…...

Linux中的开发工具(yum,vim,gcc/g++,gdb,Makefile,git)

文章目录 1. Linux软件包管理器——yumyum 语法yum 常用命令安装 yum 仓库源 2. Linux编辑器——vimvim 的五种常用模式模式切换vim 基本操作命令模式命令集&#xff08;1&#xff09;光标命令&#xff08;2&#xff09;复制粘贴命令&#xff08;3&#xff09;撤销与重做&#…...

什么是自动证书管理环境(ACME)

组织的网站需要 24x7 全天候可用&#xff0c;以建立信任并提供信息&#xff0c;如果网站因证书过期而停机&#xff0c;那么很难恢复失去的客户信任、收入和品牌声誉&#xff0c;手动管理证书基础结构会使组织面临中断、中间人 &#xff08;MITM&#xff09; 攻击等的严重风险。…...

探索光模块的MSA多源协议

在当今高度互联的世界中&#xff0c;光模块作为网络设备的重要部分&#xff0c;其性能和质量直接影响到整个网络系统的运行。其中光模块由于其灵活性和高效性&#xff0c;已经成为数据中心和云计算领域的主要选择。本文易天光通信将深入探讨光模块的MSA协议&#xff0c;揭示其重…...

FigmaCN:打破语言壁垒,让Figma设计更高效的中文界面解决方案

FigmaCN&#xff1a;打破语言壁垒&#xff0c;让Figma设计更高效的中文界面解决方案 【免费下载链接】figmaCN 中文 Figma 插件&#xff0c;设计师人工翻译校验 项目地址: https://gitcode.com/gh_mirrors/fi/figmaCN 还在为Figma的英文界面而烦恼吗&#xff1f;你是否曾…...

Warcraft Helper完整指南:让经典魔兽争霸3在现代Windows系统焕发新生

Warcraft Helper完整指南&#xff1a;让经典魔兽争霸3在现代Windows系统焕发新生 【免费下载链接】WarcraftHelper Warcraft III Helper , support 1.20e, 1.24e, 1.26a, 1.27a, 1.27b 项目地址: https://gitcode.com/gh_mirrors/wa/WarcraftHelper 还在为魔兽争霸3在Wi…...

终极Gerber文件查看器Gerbv:免费开源PCB设计验证的5大优势

终极Gerber文件查看器Gerbv&#xff1a;免费开源PCB设计验证的5大优势 【免费下载链接】gerbv Maintained fork of gerbv, carrying mostly bugfixes 项目地址: https://gitcode.com/gh_mirrors/ge/gerbv 还在为PCB设计文件的查看和验证而烦恼吗&#xff1f;Gerbv这款强…...

insert_order 报单类型怎么选:限价、FAK 与 FOK 期货场景

前言 在天勤量化里&#xff0c;insert_order 是程序化下单的核心接口。报单类型选错&#xff0c;常见后果是撤单狂增、部分成交后敞口裸露&#xff0c;或回测里假设能成交而实盘挂在板上。下面按期货里常用的限价、FAK、FOK 等说明适用场景&#xff0c;并给出最小调用片段。 …...

如何安全使用R3nzSkin:5分钟快速上手指南

如何安全使用R3nzSkin&#xff1a;5分钟快速上手指南 【免费下载链接】R3nzSkin Skin changer for League of Legends (LOL) 项目地址: https://gitcode.com/gh_mirrors/r3n/R3nzSkin 想在英雄联盟中免费体验所有皮肤&#xff0c;又担心账号安全&#xff1f;R3nzSkin这款…...

从零上手RP2040:为树莓派Pico注入MicroPython灵魂

1. 为什么选择MicroPython&#xff1f; 对于刚接触树莓派Pico&#xff08;RP2040&#xff09;的新手来说&#xff0c;选择MicroPython作为开发语言是个明智的决定。这就像第一次学骑自行车时选择带辅助轮的车子——它降低了入门门槛&#xff0c;让你能快速感受到编程的乐趣。Mi…...

Legado-Harmony:免费开源阅读器打造个性化电子书库终极指南

Legado-Harmony&#xff1a;免费开源阅读器打造个性化电子书库终极指南 【免费下载链接】legado-Harmony 开源阅读鸿蒙版仓库 项目地址: https://gitcode.com/gh_mirrors/le/legado-Harmony legado-Harmony是一款专为鸿蒙系统设计的免费开源阅读应用&#xff0c;为用户提…...

NUS 提出 SkillGraph:让多模态多智能体边协作边进化

&#x1f4cc; 一句话总结&#xff1a; 本文提出 SkillGraph&#xff0c;将动态通信拓扑与自进化 Skill Bank 闭环耦合&#xff0c;让 VMAS 根据图像、问题和当前技能自动组织协作。在四个多模态基准、五种 MAS 结构和四类 VLM 上均稳定提升&#xff0c;最高平均提升约 3.0%。…...

NotebookLM问答功能深度解析:如何用3步配置让AI精准理解你的PDF/网页文档?

更多请点击&#xff1a; https://intelliparadigm.com 第一章&#xff1a;NotebookLM问答功能深度解析&#xff1a;如何用3步配置让AI精准理解你的PDF/网页文档&#xff1f; NotebookLM 是 Google 推出的面向研究者与知识工作者的实验性 AI 工具&#xff0c;其核心能力在于基于…...

告别商业收费与审核枷锁:深度拆解 Open-Generative-AI,构建 MIT 开源、零过滤的私有化视频生成工作站

发布日期&#xff1a; 2026-05-18标签&#xff1a; #Open-Generative-AI #Sora #Flux #Veo #AI视频生成 #私有化部署一、 引言在 2026 年&#xff0c;大模型生成图像与视频&#xff08;Text-to-Video&#xff09;的技术已经炉火纯青&#xff0c;但创作者们依然面临着三大难以言…...