当前位置：首页 > news >正文

sadtalker-api/

news 2026/2/8 17:28:56

————

下载sadtalker工程文件，包括8=4+4个模型

。。。。。。。。。。。。。。。。

配置环境：

pip源，设置：

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

anaconda prompt, 进入命令行

how在 Windows 11的终端打开Anaconda-Prompt

开始安装执行SadTalker安装命令：

cd SadTalkerconda create -n sadtalker python=3.8conda activate sadtalkerpip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118conda install ffmpegpip install -r requirements.txt

运行项目（生成视频）

python inference.py --driven_audio E:\work\sadTalker\SadTalker\examples\driven_audio\chinese_news.wav --source_image E:\work\sadTalker\SadTalker\examples\source_image\art_2.png --result_dir E:\work\sadTalker\SadTalker\examples\ref_video --still --preprocess full --enhancer gfpgan

python inference.py

--driven_audio E:\work\sadTalker\SadTalker\examples\driven_audio\chinese_news.wav

--source_image E:\work\sadTalker\SadTalker\examples\source_image\art_2.png

--result_dir E:\work\sadTalker\SadTalker\examples\ref_video

--still

--preprocess full

--enhancer gfpgan

1、音频位置

2、图片位置

3、生成结果（视频）位置

4...各种效果

有问题，可能是没有配置正确。

把【项目包】里面的：gfpgan\weights\GFPGANv1.4.pth

剪切到

【虚拟环境】的 Lib\site-packages\gfpgan\weights 目录下

【运行】自己放了一张照片（报错）

报错：(sadtalker) E:\work\sadTalker\SadTalker>python inference.py --driven_audio E:\work\sadTalker\SadTalker\examples\driven_audio\chinese_news.wav --source_image E:\work\sadTalker\SadTalker\examples\source_image\133.png --result_dir E:\work\sadT
alker\SadTalker\examples\ref_video --still --preprocess full --enhancer gfpgan
using safetensor as default
3DMM Extraction for source image
Traceback (most recent call last):
File "inference.py", line 144, in <module>
main(args)
File "inference.py", line 46, in main
first_coeff_path, crop_pic_path, crop_info = preprocess_model.generate(pic_path, first_frame_dir, args.preprocess,\
File "E:\work\sadTalker\SadTalker\src\utils\preprocess.py", line 103, in generate
x_full_frames, crop, quad = self.propress.crop(x_full_frames, still=True if 'ext' in crop_or_resize.lower() else False, xsize=512)
File "E:\work\sadTalker\SadTalker\src\utils\croper.py", line 131, in crop
raise 'can not detect the landmark from source image'
TypeError: exceptions must derive from BaseException

似乎是在处理图像预处理时出现了问题，导致无法从源图像中检测到地标（landmark）

针对这个问题，建议你检查以下几点：

源图像路径是否正确，确保路径中没有拼写错误或者路径不存在。
源图像是否符合预期的格式和要求，例如是否包含必要的地标信息。🚩
检查预处理过程中的参数设置，确保参数设置正确并且与预期一致。

根据错误信息，似乎是在croper.py文件的第131行引发了异常。

不知道怎么解决，就直接用给的图片了

#######################################

parser.add_argument("--still", action="store_true", help="can crop back to the original videos for the full body animation")

--still: 这部分指定了参数的名称，即在命令行中使用 --still 来指定这个参数。
action="store_true": 这部分指定了当命令行中出现 --still 参数时，将其设为 True。这意味着不需要为 --still 参数提供额外的值，只需在命令行中出现即可将其设为 True。
help="can crop back to the original videos for the full body animation": 这部分提供了关于参数的简短描述，即当用户在命令行中使用 --help 时会显示的帮助信息。在这种情况下，它说明了 --still 参数的作用，即可以用于将视频裁剪回原始视频以进行全身动画。

因此，通过这段代码，当用户在命令行中使用 --still 参数时，脚本将会将其设为 True，并且提供了关于参数作用的简要说明。

fastapi运行，点击网址，加载不出

需要保存代码后，点击网址。

[Bug]: ModuleNotFoundError: No module named 'torchvision.transforms.functional_tensor' torchvision 0.17 promblem

Open ./venv/lib/python3.10/site-packages/basicsr/data/degradations.py and on line 8, simply change:

from torchvision.transforms.functional_tensor import rgb_to_grayscale

to:

from torchvision.transforms.functional import rgb_to_grayscale

api问题

{"driven_audio": "E:\work\sadTalker\SadTalker\examples\driven_audio\chinese_news.wav","source_image": "E:\work\sadTalker\SadTalker\examples\source_image\art_6.png","result_dir": "E:\work\sadTalker\SadTalker\examples\ref_video","preprocess": "full","enhancer": "gfpgan"
}

sadtalker-api/

———— 下载sadtalker工程文件，包括844个模型。。。。。。。。。。。。。。。。配置环境： pip源，设置： pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple anaconda prompt, 进入命令行 how在 …...

编程日记 2024/3/20 21:01:05

vue+elementUI实现指定列的单元格可编辑

template中的代码如下： <div v-if"(item.label 高压侧 || item.label 低压侧)&&coloumnHeader.label 单柱片数"><div class"editableCell"><div v-if"item.label 高压侧" dblclick"changeValue(sco…...

编程日记 2024/3/20 20:58:01

RK3568平台开发系列讲解（基础篇）内核是如何发送事件到用户空间

🚀返回专栏总目录文章目录一、相关接口函数二、udevadm 命令三、实验沉淀、分享、成长，让自己和他人都能有所收获！😄 一、相关接口函数 kobject_uevent 是 Linux 内核中的一个函数，用于生成和发送 uevent 事件。它是 udev 和其他设备管理工具与内核通信的一种方式。…...

编程日记 2024/3/20 20:55:58

力扣---打家劫舍---动态规划

思路 1： 我将res[i]定义为：一定要取第 i 个房子的前提下，能获取的最大金额。那么直接用cnt从头记录到尾，每个房子的res最大值即是答案。那么递推公式是什么？res[i]max(res[i-2],res[i-1],...,res[0])nums[i]。数组初始…...

编程日记 2024/3/20 20:49:52

mac安装rust环境

mac安装rust环境老规矩官方文档 1. mac官网使用的是脚本安装, 至于为啥没使用brew也没推荐俺也不太清楚 curl --proto https --tlsv1.2 -sSf https://sh.rustup.rs | sh2. 一般来说中途会遇见有一个选择我这里选择直接回车默认安装(如果以后我研究明白的话会进行更新, 现在是…...

编程日记 2024/3/20 20:47:49

1058：求一元二次方程

【题目描述】利用公式求一元二次方程axbxc0的根，其中a不等于0。结果要求精确到小数点后5位。【输入】输入一行，包含三个浮点数a,b,c（它们之间以一个空格分开），分别表示方程axbxc0的系数。【输出】输出一行&…...

编程日记 2024/3/20 20:41:41

创建 Node.js 的工程 mkdir myapp cd myapp npm init (一路回车)安装依赖包 npm install apollo/server graphql定义 Schema 创建 schema.graphql 文件，内容如下： type Book {title: String!author: Author! }type Author {name: String!books: [Boo…...

编程日记 2024/3/20 20:37:37

MATLAB和Python数值和符号计算可视化物理学气体动能和粒子速度

要点 Python物理学差分数值和符号计算热动力学计算：统计力学，分子动力学模型 Python寻找弹性物体的运动，LAMMPS 分子动力学模拟器模拟2D气体分子，Python原子模拟绘图，Python数值计算原子平衡性，Python绘制…...

编程日记 2024/3/20 20:36:36

阿里云-零基础入门NLP【基于机器学习的文本分类】

文章目录学习过程赛题理解学习目标赛题数据数据标签评测指标解题思路TF-IDF介绍TF-IDF 机器学习分类器TF-IDF LinearSVCTF-IDF LGBMClassifier 学习过程 20年当时自身功底是比较零基础(会写些基础的Python[三个科学计算包]数据分析)，一开始看这块其实挺懵的&am…...

编程日记 2024/3/20 20:35:35

蓝桥杯模块综合——高质量讲解AT24C02，BS18B20，BS1302,AD/DA(PCF8591)，超声波模块

AT24C02——就是一个存储的东西，可以给他写东西，掉电不丢失。 void EEPROM_Write(unsigned char * EEPROM_String,unsigned char addr , unsigned char num) {IIC_Start();IIC_SendByte(0xA0);IIC_WaitAck();IIC_SendByte(addr);IIC_WaitAck();while(nu…...

编程日记 2024/3/20 20:34:33

前端跨平台开发框架：简化多端开发的利器

🤍 前端开发工程师、技术日更博主、已过CET6 🍨 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1 🕠 牛客高级专题作者、打造专栏《前端面试必备》、《2024面试高频手撕题》 🍚 蓝桥云课签约作者、上架课程《Vue.js 和 E…...

编程日记 2024/3/20 20:32:31

cesium.js加载模型后，重新设置旋转角度属性值

// 加载模型var position Cesium.Cartesian3.fromDegrees(longitude, latitude, height);// 计算矩阵var rollAngleDegrees 15; // 设置翻滚角度var rollAngleRadians Cesium.Math.toRadians(rollAngleDegrees); // 将角度转换为弧度var orientation Cesium.Transforms.eas…...

编程日记 2024/3/20 20:31:30

②免费AI软件开发工具测评：通义灵码 VS 码上飞

前言我又双叒叕来测评了！上次给大家带来的是iFlyCode和CodeFlying两款产品的测评，受到了大家的一致好评~ 今天咱就继续来聊聊，这次我们选的的对象是通义灵码和码上飞，从名字上也能看到出来这两款产品一定是跟软件开发有关系的&…...

编程日记 2024/3/20 20:28:27

幻兽帕鲁游戏搭建（docker）

系列文章目录第一章： 幻兽帕陆游戏搭建文章目录系列文章目录前言一、镜像安装1.创建游戏目录2.拉取镜像3.下载配置文件4.启动游戏二、自定义配置总结前言这段时间一直在写论文还有找工作，也没学啥新技术，所以博客也很长时间没写了&am…...

编程日记 2024/3/20 20:27:25

unity报错出现Asset database transaction committed twice!

错误描述： 运行时报错 Assertion failed on expression: ‘m_ErrorCode MDB_MAP_RESIZED || !HasAbortingErrors()’Asset database transaction committed twice!Assertion failed on expression: ‘errors MDB_SUCCESS || errors MDB_NOTFOUND’ 解决办法&…...

编程日记 2024/3/20 20:25:24

去除项目git的控制端口号的关闭

以下操作都是在windows下。只是记录一下。 find . -name “.git” | xargs rm -rf 查看所有分支 git branch -a 查看当前分支 git branch -a 切换分支 git chenkout develop docker 查看容器的ip docker inspect -f ‘{{.Name}} - {{range .NetworkSettings.Networks}}{{.IP…...

编程日记 2024/3/20 20:24:22

交叉注意力融合时域、频域特征的FFT + CNN -BiLSTM-CrossAttention电能质量扰动识别模型

往期精彩内容： 电能质量扰动信号数据介绍与分类-Python实现-CSDN博客 Python电能质量扰动信号分类(一)基于LSTM模型的一维信号分类-CSDN博客 Python电能质量扰动信号分类(二)基于CNN模型的一维信号分类-CSDN博客 Python电能质量扰动信号分类(三)基于Transformer…...

编程日记 2024/3/20 20:17:15

简单的Charles抓包教程

安装Charles 安装地址：https://www.charlesproxy.com/download/ 开关本机抓包一般我们在抓取手机端内容时需要将Proxy菜单栏下的Windows Proxy取消勾选，禁止charles抓取本机上的请求信息。注：开启电脑端抓包后，会为电脑添加局…...

编程日记 2024/3/20 20:13:11

如何构建Docker自定义镜像

说明：平常我们使用Docker运行各种容器，极大地方便了我们对开发应用的使用，如MySQL、Redis，以及各种中间件，使用时只要拉镜像，运行容器即可。本文介绍如何创建一个Demo，自定义构建一个镜像。开…...

编程日记 2024/3/20 20:11:08

一起学数据分析_2

写在前面：代码运行环境为jupyter，如果结果显示不出来的地方就加一个print()函数。一、数据基本处理缺失值处理： import numpy as np import pandas as pd#加载数据train.csv df pd.read_csv(train_chinese.csv) df.head()# 查看数据基本…...

编程日记 2024/3/20 20:05:02

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向深度学习与微纳光子学的结合主要集中在以下几个方向： 逆向设计通过神经网络快速预测微纳结构的光学响应，替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。特征提取与优化从复杂的光学数据中自…...

编程新知 2026/2/8 15:03:04

【Linux】shell脚本忽略错误继续执行

在 shell 脚本中，可以使用 set -e 命令来设置脚本在遇到错误时退出执行。如果你希望脚本忽略错误并继续执行，可以在脚本开头添加 set e 命令来取消该设置。举例1 #!/bin/bash# 取消 set -e 的设置 set e# 执行命令，并忽略错误 rm somefile…...

编程新知 2025/9/11 15:27:32

树莓派超全系列教程文档--(61)树莓派摄像头高级使用方法

树莓派摄像头高级使用方法配置通过调谐文件来调整相机行为使用多个摄像头安装 libcam 和 rpicam-apps依赖关系开发包文章来源： http://raspberry.dns8844.cn/documentation 原文网址配置大多数用例自动工作，无需更改相机配置。但是，一…...

编程新知 2026/2/5 4:39:03

【WiFi帧结构】

文章目录帧结构MAC头部管理帧帧结构 Wi-Fi的帧分为三部分组成：MAC头部frame bodyFCS，其中MAC是固定格式的，frame body是可变长度。 MAC头部有frame control，duration，address1，address2，addre…...

编程新知 2026/2/7 17:33:19

MongoDB学习和应用(高效的非关系型数据库)

一丶 MongoDB简介对于社交类软件的功能，我们需要对它的功能特点进行分析： 数据量会随着用户数增大而增大读多写少价值较低非好友看不到其动态信息地理位置的查询… 针对以上特点进行分析各大存储工具： mysql：关系型数据库&am…...

编程新知 2026/1/23 10:24:30

2024年赣州旅游投资集团社会招聘笔试真

2024年赣州旅游投资集团社会招聘笔试真题 ( 满分 1 0 0 分时间 1 2 0 分钟 ) 一、单选题(每题只有一个正确答案，答错、不答或多答均不得分) 1.纪要的特点不包括()。 A.概括重点 B.指导传达 C. 客观纪实 D.有言必录【答案】: D 2.1864年，()预言了电磁波的存在，并指出…...

编程新知 2025/12/10 4:08:53

【SQL学习笔记1】增删改查+多表连接全解析（内附SQL免费在线练习工具）

可以使用Sqliteviz这个网站免费编写sql语句，它能够让用户直接在浏览器内练习SQL的语法，不需要安装任何软件。链接如下： sqliteviz 注意： 在转写SQL语法时，关键字之间有一个特定的顺序，这个顺序会影响到…...

编程新知 2026/2/5 4:36:53

页面渲染流程与性能优化

页面渲染流程与性能优化详解（完整版） 一、现代浏览器渲染流程（详细说明） 1. 构建DOM树浏览器接收到HTML文档后，会逐步解析并构建DOM（Document Object Model）树。具体过程如下： (…...

编程新知 2026/1/31 11:58:35

Qt Http Server模块功能及架构

Qt Http Server 是 Qt 6.0 中引入的一个新模块，它提供了一个轻量级的 HTTP 服务器实现，主要用于构建基于 HTTP 的应用程序和服务。功能介绍： 主要功能 HTTP服务器功能： 支持 HTTP/1.1 协议简单的请求/响应处理模型支持 GET…...

编程新知 2025/10/17 21:16:57

安卓基础（aar）

重新设置java21的环境，临时设置 $env:JAVA_HOME "D:\Android Studio\jbr" 查看当前环境变量 JAVA_HOME 的值 echo $env:JAVA_HOME 构建ARR文件 ./gradlew :private-lib:assembleRelease 目录是这样的： MyApp/ ├── app/ …...

编程新知 2026/1/25 8:10:56