当前位置: 首页 > news >正文

AI 绘画Stable Diffusion 研究(十三)SD数字人制作工具SadTlaker使用教程


免责声明:
本案例所用安装包免费提供,无任何盈利目的。


大家好,我是风雨无阻。

想必大家经常看到,无论是在产品营销还是品牌推广时,很多人经常以数字人的方式来为自己创造财富。而市面上的数字人收费都比较昂贵,少则几千,多则上万。


那么如何才能免费制作属于自己的数字人视频呢?


其实很简单,只需要在stable diffusion上安装sadtalker插件就能轻松生成自己的数字人。


如果还没安装sadtalker插件的朋友,请查看我的上一篇文章AI 绘画Stable Diffusion 研究(十二)SD数字人制作工具SadTlaker插件安装教程。


今天我们就来演示 如何使用SadTlaker插件制作一个会说话的数字人视频。

大家跟着我的步骤,赶紧实操起来,看看效果。


1、准备图片


图片: 准备一张人物正面图片,我们可以用sd 文生图或图生图功能生成,也可以是其他的图片。


这里再演示一下,使用sd 图生图,生成一张正面图片的步骤。

(1)、去C站找一张正面图作为参考

在这里插入图片描述


(2)、下载大模型: majicMIX realistic 麦橘写实 ,并把它放到 models\Stable-diffusion 目录下


然后重启 Stable-diffusion 让模型生效。

\sd-webui-aki-v4.2\models\Stable-diffusion

在这里插入图片描述


(3)、下载图片,并上传到图生图,然后设置相关参数

  • 上传图片
  • 设置正向提示词 、反向提示词
  • CLP 终止层数设置为:2
  • 设置随机种子
  • 设置采样方法
  • 设置重绘制尺寸
  • 开启面部修复(重要:不开启,人物面部会出现斑点或痣)

在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


(4)、点击生成,可以获得一张人物正面图片

在这里插入图片描述


2、准备音频文件

音频文件格式: MP3或wav 文件。

音频文件允许的长度:由显存大小决定。

音频文件的生成:可以使用chatgpt 生成文案,再使用配音工具生成音频,保存起来。当然也可以自己录制音频,这里就不再详细演示。

这里为了演示,提前准备了一段 14s 左右的音频。


3、使用SadTlaker 合成数字人视频


(1)、功能栏区域,切换到SadTlaker 标签页

在这里插入图片描述


(2)、上传刚刚sd 生成好的人物正面图片

在这里插入图片描述


(3)、上传准备的音频文件

在这里插入图片描述


(4)、参数设置及详解

  • 姿态样式: 人脸姿态,一共47个数字,每个姿态都不一样,大家可自行测试选择喜欢的姿态。

  • 脸部模型分辨率:根据分辨率选择自己对口型的模型,如果图片较大就选择512。

  • 预处理:这个设置,与图生图中的设置相同。

  • 静止模式:更少的手势,需要和完整与处理一起使用。

  • 使用GFPGAN 增强面部: 是否高清化处理


这是我的设置,如下:

在这里插入图片描述


(5)、点击“生成”按钮,合成视频

视频会在预览窗口显示视频处理状态,控制台也能看到处理进度。

只需等待处理完成即可。

在这里插入图片描述


A、使用预处理完整+静止模式的方式生成的视频:

SD插件SadTlaker制作的会说话的数人

B、使用预处理裁剪 方式生成的视频:

SD插件SadTlaker制作的会说话的数人2


对比效果:

A 方式生成的视频动作幅度更小,但是图片使用的是原尺寸。

B 方式生成的视频动作幅度更大,图片被裁剪,但是效果更真实自然一些。

好了,SD数字人制作教程就到此结束。

相关文章:

AI 绘画Stable Diffusion 研究(十三)SD数字人制作工具SadTlaker使用教程

免责声明: 本案例所用安装包免费提供,无任何盈利目的。 大家好,我是风雨无阻。 想必大家经常看到,无论是在产品营销还是品牌推广时,很多人经常以数字人的方式来为自己创造财富。而市面上的数字人收费都比较昂贵,少则几…...

伦敦金走势图行情值得关注

不知道大家是否了解过伦敦金这个投资品种,或者有否财经网站以及金融终端上看到过它的行情走势图。其实,伦敦金并不是一种实实在在的黄金,而是一种跟踪伦敦现货黄金市场价格走势的黄金保证金交易品种,它每天的行情走势变化&#xf…...

机器学习之数据清洗

一、介绍 数据清洗是机器学习中的一个重要步骤,它涉及对原始数据进行预处理和修复,以使数据适用于机器学习算法的训练和分析。数据清洗的目标是处理数据中的噪声、缺失值、异常值和不一致性等问题,以提高数据的质量和准确性。 二、方法 处理…...

T599聚合物电容器:在汽车应用中提供更长的使用寿命的解决方案

自从电子技术被引入汽车工业以来,汽车的技术含量一直在提升。诸多技术被应用在汽车上,使汽车的形象更接近于轮子上的超级计算机。更多传感器、更强大的计算能力和电力被装载到汽车上,汽车应用中的电子产品数量正在迅速增长。随着电动汽车和自…...

学习ts(五)类

定义 是面向对象程序设计(OOP)实现信息封装的基础 类是一种用户定义的引用数据类型,也称类类型 JavaScript的class,虽然本质是构造函数,但是使用起来已经方便了许多,js中没有加入修饰符和抽象类等特性 ts的class支持面…...

EasyImage简单图床 - 快速搭建私人图床云盘同时远程访问【无公网IP内网穿透】

憧憬blog主页 在强者的眼中,没有最好,只有更好。我们是移动开发领域的优质创作者,同时也是阿里云专家博主。 ✨ 关注我们的主页,探索iOS开发的无限可能! 🔥我们与您分享最新的技术洞察和实战经验&#xff0…...

从SVG到Canvas:选择最适合你的Web图形技术

SVG 和 Canvas 都是可以在 Web 浏览器中绘制图形的技术。 众所周知, icon 通常使用 svg(如 iconfont),而交互式游戏采用 Canvas。二者具体的区别是什么?该如何选择? 声明式还是命令式?绘制的图形…...

基于 Redis 实现分布式限流

基于 Redis 实现分布式限流 一、 简介二、分布式限流1 数据结构1.1 Redis List1.2 Redis Set1.3 Redis Sorted Set 2 实现分布式限流3 实现原理分析 三、分布式限流算法1. 计数器算法2. 漏斗算法3. 令牌桶算法 四、分布式限流实战1. 单机限流实现2. 基于Redis Clusters的分布式…...

前端下载文件方式(Blob)

以下以下载图标svg文件为例,实现点击按钮下载文件,其中icon结构如下: const DownloadSvg (props) > {function download(downfile) {const tmpLink document.createElement("a");const objectUrl URL.createObjectURL(downfi…...

【STM32】FreeRTOS软件定时器学习

软件定时器 FreeRTOS提供了现成的软件定时器功能,可以一定程度上替代硬件定时器,但精度不高。 实验:创建一个任务,两个定时器,按键开启定时器,一个500ms打印一次,一个1000ms打印一次。 实现&…...

【LeetCode】复写零

复写零 题目描述算法描述编程代码 链接: 复写零 题目描述 算法描述 编程代码 class Solution { public:void duplicateZeros(vector<int>& arr) {int n arr.size();int dest -1,cur 0;while(cur < n){if(arr[cur]){dest;}else{dest2;}cur;if(dest > n-1){…...

使用docker-maven-plugin插件构建镜像并推送至私服Harbor

前言 如下所示&#xff0c;建议使用 Dockerfile Maven 插件&#xff0c;但该插件也停止维护更新了。因此先暂时使用docker-maven-plugin插件。 一、开启Docker服务器的远程访问 1.1 开启2375远程访问 默认的dokcer是不支持远程访问的&#xff0c;需要加点配置&#xff0c;开…...

YOLO目标检测——动漫头像数据集下载分享

动漫头像数据集是用于研究和分析动漫头像相关问题的数据集&#xff0c;它包含了大量的动漫风格的头像图像。动漫头像是指以动漫风格绘制的虚构人物的头像图像&#xff0c;常见于动画、漫画、游戏等媒体。 数据集点击下载&#xff1a;YOLO动漫头像数据集50800图片.rar...

学习Vue:Vue3 VS Vue2

Vue 3作为Vue.js的最新版本&#xff0c;带来了一系列令人激动的新特性和改进&#xff0c;让开发者们在构建现代Web应用时体验更加顺畅和高效。本文将全面介绍Vue 3相对于Vue 2的改进&#xff0c;重点解释Composition API的使用&#xff0c;以及新引入的Teleport和Suspense等特性…...

1.2亿成都市城市安全风险综合监测预警平台建设项目

导读&#xff1a;原文《1.2亿&#xff01;成都市城市安全风险综合监测预警平台建设项目WORD》&#xff08;获取来源见文尾&#xff09;&#xff0c;本文精选其中精华及架构部分&#xff0c;逻辑清晰、内容完整&#xff0c;为快速形成售前方案提供参考。 部分页面&#xff1a; …...

《树莓派4B家庭服务器搭建指南》第二十期:在树莓派运行rsnapshot, 实现对服务器数据低成本增量本地备份

title: 020《树莓派4B家庭服务器搭建指南》第二十期&#xff1a;在树莓派运行rsnapshot, 实现对服务器数据低成本增量本地备份 我的天翼云服务器有/opt 和 /usr/share/nginx两个目录, 用来存储网站的内容, 数据无价, 为了避免珍贵的数据丢失&#xff0c;我决定使用树莓派运行 …...

大数据 算法

什么是大数据 大数据是指数据量巨大、类型繁多、处理速度快的数据集合。这些数据集合通常包括结构化数据&#xff08;如数据库中的表格数据&#xff09;、半结构化数据&#xff08;如XML文件&#xff09;和非结构化数据&#xff08;如文本、音频和视频文件&#xff09;。大数据…...

html | 基于iframe的简易富文本编辑器

效果图 支持: 选中后 ctrlI 斜体 代码 思路就是在iframe种嵌套html和css。 <pre> - 支持: 选中后 ctrlI 斜体 - todo: 鼠标实现单击斜体 </pre> <iframe name"richedit" style"height:30%; width:100%;"></iframe><script…...

HJ108 求最小公倍数

描述 正整数A和正整数B 的最小公倍数是指 能被A和B整除的最小的正整数值&#xff0c;设计一个算法&#xff0c;求输入A和B的最小公倍数。 数据范围&#xff1a;1≤a,b≤100000 1≤a,b≤100000 输入描述&#xff1a; 输入两个正整数A和B。 输出描述&#xff1a; 输出A和B…...

JVM - 垃圾收集器

目录 垃圾收集器 串行垃圾收集器 并行垃圾收集器 什么是 吞吐量优先 什么是 响应时间优先 &#xff1f; CMS&#xff08;并发&#xff09;垃圾收集器 G1 垃圾收集器 垃圾收集器 垃圾收集器大概可以分为&#xff1a; 串行垃圾收集器并行垃圾收集器CMS&#xff08;并发&a…...

工程师的调试礼仪:如何避免一次问候毁掉两小时工作成果

1. 项目概述&#xff1a;一次关于“Bug礼仪”的职场博弈在硬件开发的深水区&#xff0c;尤其是在产品临近交付的冲刺阶段&#xff0c;工程师与管理者之间的互动&#xff0c;往往比电路板上的信号完整性更考验“设计”。这不是一个关于具体芯片型号或调试命令的技术教程&#xf…...

iPhone 5s系统工程解析:LPDDR3内存与E2NAND存储的协同进化

1. 项目概述&#xff1a;iPhone 5s&#xff0c;一场被低估的系统性工程胜利2013年9月&#xff0c;当苹果发布iPhone 5s时&#xff0c;聚光灯几乎全部打在了那个划时代的64位A7处理器上。媒体和消费者的讨论都围绕着“桌面级性能”和“移动计算新时代”展开。作为一名在消费电子…...

边缘计算中的机器学习能效优化与混合架构实践

1. 边缘计算中的机器学习能效革命在智能手表、健康监测设备等穿戴式设备中&#xff0c;实时运行机器学习模型一直是个棘手的问题。传统方案要么耗电太快导致续航崩溃&#xff0c;要么精度太低失去实用价值。我们团队最近实验的一组数据很能说明问题&#xff1a;在常见的运动识别…...

Claude Code 多项目 API 配置管理实践

背景 Claude Code 的项目级配置文件 .claude/settings.json 中包含 API 提供商相关的环境变量。当同时维护多个项目&#xff0c;每个项目使用不同的 API 提供商&#xff08;Anthropic 直连、OpenRouter 代理、自建转发等&#xff09;时&#xff0c;每次切换项目都需要手动修改…...

光子储层计算在无人机动态补偿中的创新应用

1. 深度光子储层计算在无人机动态补偿中的创新应用在无人机控制领域&#xff0c;传统PID控制器面对复杂流体环境时往往力不从心。当无人机在狭窄空间或近地面飞行时&#xff0c;地面效应、天花板效应以及湍流再循环等未建模动力学因素会导致显著的性能下降。我在参与某城市峡谷…...

微软创新者窘境:从J的离开看大公司如何留住颠覆性人才

1. 从“J”的离去看微软的“创新者窘境”2010年5月&#xff0c;当微软宣布其娱乐与设备事业部&#xff08;E&D&#xff09;的重组&#xff0c;以及J Allard和Robbie Bach两位核心人物的离开时&#xff0c;科技圈的反应是复杂的。表面上看&#xff0c;这是一次常规的高层人事…...

Windows系统级课堂管理软件反控制技术实现:JiYuTrainer内核驱动与API拦截架构解析

Windows系统级课堂管理软件反控制技术实现&#xff1a;JiYuTrainer内核驱动与API拦截架构解析 【免费下载链接】JiYuTrainer 极域电子教室防控制软件, StudenMain.exe 破解 项目地址: https://gitcode.com/gh_mirrors/ji/JiYuTrainer 在现代化教育信息化环境中&#xff…...

如何解决Funannotate数据库安装失败:从403错误到完整部署的实战指南

如何解决Funannotate数据库安装失败&#xff1a;从403错误到完整部署的实战指南 【免费下载链接】funannotate Eukaryotic Genome Annotation Pipeline 项目地址: https://gitcode.com/gh_mirrors/fu/funannotate Funannotate是真核基因组注释的强大工具&#xff0c;但在…...

Cursor Pro免费升级完整指南:3分钟突破使用限制的实用教程

Cursor Pro免费升级完整指南&#xff1a;3分钟突破使用限制的实用教程 【免费下载链接】cursor-free-vip [Support 0.45]&#xff08;Multi Language 多语言&#xff09;自动注册 Cursor Ai &#xff0c;自动重置机器ID &#xff0c; 免费升级使用Pro 功能: Youve reached your…...

CanFestival回调函数避坑指南:为什么你的RPDO参数修改了却没生效?

CanFestival回调函数深度解析&#xff1a;RPDO参数修改失效的五大隐蔽原因与实战解决方案 在工业自动化领域&#xff0c;CanFestival作为开源的CANopen协议栈&#xff0c;被广泛应用于各类嵌入式设备中。然而&#xff0c;许多开发者在配置RPDO&#xff08;接收过程数据对象&…...