当前位置：首页 > news >正文

chattts生成的音频与字幕修改完善，每段字幕对应不同颜色的视频，准备下一步插入视频。

news 2026/2/10 22:21:28

上一节中，实现了先生成一个固定背景的与音频长度一致的视频，然后插入字幕。再合并成一个视频的方法。

但是：这样有点单了，所以：

1.根据字幕的长度先生成视频片断

2.在片段上加上字幕。

3.合并所有片断，成为一个新的视频。

4.在新的视频上添加上音频。再次合成一个新的视频，即最后的视频。

可用代码1

from moviepy import VideoFileClip, AudioFileClip, TextClip, CompositeVideoClip, ImageClip
import cv2
import numpy as np
import random
import os
import warnings# 忽略特定的 UserWarning
# warnings.filterwarnings("ignore", category=UserWarning, message="In file .*\.mp4, .* bytes wanted but 0 bytes read at frame index .* \(out of a total .* frames\), at time .* sec. Using the last valid frame instead.")def parse_time(time_str):""" 解析 SRT 时间格式 """hours, minutes, seconds = time_str.split(':')seconds, milliseconds = seconds.split(',')return float(hours) * 3600 + float(minutes) * 60 + float(seconds) + float(milliseconds) / 1000def create_video(audio_path, subtitle_path, video_path, subtitle_position='center', use_temp_files=False):# 创建一个灰色背景的视频width, height = 1920, 1080  # 横屏视频分辨率fps = 24  # 视频帧率duration = AudioFileClip(audio_path).duration  # 视频时长与音频相同# 加载音频audio_clip = AudioFileClip(audio_path)# 读取字幕文件with open(subtitle_path, 'r', encoding='utf-8') as file:subtitles = file.readlines()# 处理字幕video_clips = []temp_files = []  # 用于存储临时文件路径for i in range(0, len(subtitles), 3):  # 4代表字幕文件中每一块所占行数index = subtitles[i].strip()time_range = subtitles[i + 1].strip().split(' --> ')start_time = time_range[0]end_time = time_range[1]text = subtitles[i + 2].strip()# 计算片段的持续时间start_seconds = parse_time(start_time)end_seconds = parse_time(end_time)clip_duration = end_seconds - start_seconds# 生成随机背景颜色random_color = (random.randint(0, 255), random.randint(0, 255), random.randint(0, 255))frame = np.zeros((height, width, 3), dtype=np.uint8)frame[:, :] = random_color# 创建视频片段fourcc = cv2.VideoWriter_fourcc(*'mp4v')if use_temp_files:output_path = f"temp_clip_{i}.mp4"out = cv2.VideoWriter(output_path, fourcc, fps, (width, height), isColor=True)for _ in range(int(fps * clip_duration)):out.write(frame)out.release()temp_files.append(output_path)# 检查临时视频文件是否存在且大小大于0if not os.path.exists(output_path) or os.path.getsize(output_path) == 0:raise Exception(f"Temporary video file {output_path} is missing or empty.")# 加载视频片段video_clip = VideoFileClip(output_path).with_duration(clip_duration)else:# 直接在内存中创建 VideoClipvideo_clip = ImageClip(frame).with_duration(clip_duration)# 折行处理font_size = 50font = cv2.FONT_HERSHEY_SIMPLEXmax_width = width * 0.8  # 最大宽度为视频宽度的80%words = text.split()lines = []line = ""for word in words:test_line = line + " " + word(test_width, _), _ = cv2.getTextSize(test_line, font, 1, font_size)if test_width <= max_width:line = test_lineelse:lines.append(line)line = wordlines.append(line)# 创建TextClipfinal_text = "\n".join(lines)subtitle_clip = TextClip(text=final_text, font_size=font_size, color='white',font='/usr/share/fonts/opentype/noto/NotoSerifCJK-Bold.ttc')subtitle_clip = subtitle_clip.with_start(0).with_end(clip_duration).with_position(('center', subtitle_position))# 创建灰色背景框text_width, text_height = subtitle_clip.sizepadding = 10  # 字幕框的内边距box_width = text_width + 2 * paddingbox_height = text_height + 2 * paddingbox_frame = np.zeros((box_height, box_width, 3), dtype=np.uint8) + 128  # 灰色背景box_clip = ImageClip(box_frame).with_start(0).with_end(clip_duration)# 设置背景框的位置if subtitle_position == 'center':box_position = ('center', 'center')elif subtitle_position == 'bottom':box_position = ('center', 'bottom')else:box_position = ('center', 'top')box_clip = box_clip.with_position(box_position, relative=True).with_duration(clip_duration)# 合成片段final_clip = CompositeVideoClip([video_clip, box_clip, subtitle_clip]).with_start(start_seconds)video_clips.append(final_clip)# 合成最终视频final_video = CompositeVideoClip(video_clips)final_video = final_video.with_audio(audio_clip)final_video.write_videofile(video_path, codec='libx264', fps=fps)# 清理临时文件if use_temp_files:for temp_file in temp_files:os.remove(temp_file)# 示例调用
audio_path = "wwww.wav"
subtitle_path = "wwww.srt"
video_path = "wwww.mp4"
subtitle_position = 'bottom'  # 可选值: 'center', 'bottom'
use_temp_files = False  # 设置为 True 以使用临时文件# 创建最终视频
create_video(audio_path, subtitle_path, video_path, subtitle_position, use_temp_files)

可用参考代码2：

from moviepy import VideoFileClip, AudioFileClip, TextClip, CompositeVideoClip, ImageClip
import cv2
import numpy as np
import random
import os
import warnings# 忽略特定的 UserWarning
# warnings.filterwarnings("ignore", category=UserWarning, message="In file .*\.mp4, .* bytes wanted but 0 bytes read at frame index .* \(out of a total .* frames\), at time .* sec. Using the last valid frame instead.")def parse_time(time_str):""" 解析 SRT 时间格式 """hours, minutes, seconds = time_str.split(':')seconds, milliseconds = seconds.split(',')return float(hours) * 3600 + float(minutes) * 60 + float(seconds) + float(milliseconds) / 1000def create_video(audio_path, subtitle_path, video_path, subtitle_position='center', use_temp_files=False):# 创建一个灰色背景的视频width, height = 1920, 1080  # 横屏视频分辨率fps = 24  # 视频帧率duration = AudioFileClip(audio_path).duration  # 视频时长与音频相同# 加载音频audio_clip = AudioFileClip(audio_path)# 读取字幕文件with open(subtitle_path, 'r', encoding='utf-8') as file:subtitles = file.readlines()# 处理字幕video_clips = []temp_files = []  # 用于存储临时文件路径for i in range(0, len(subtitles), 3):  # 4代表字幕文件中每一块所占行数index = subtitles[i].strip()time_range = subtitles[i + 1].strip().split(' --> ')start_time = time_range[0]end_time = time_range[1]text = subtitles[i + 2].strip()# 计算片段的持续时间start_seconds = parse_time(start_time)end_seconds = parse_time(end_time)clip_duration = end_seconds - start_seconds# 生成随机背景颜色random_color = (random.randint(0, 255), random.randint(0, 255), random.randint(0, 255))frame = np.zeros((height, width, 3), dtype=np.uint8)frame[:, :] = random_color# 创建视频片段fourcc = cv2.VideoWriter_fourcc(*'mp4v')if use_temp_files:output_path = f"temp_clip_{i}.mp4"out = cv2.VideoWriter(output_path, fourcc, fps, (width, height), isColor=True)for _ in range(int(fps * clip_duration)):out.write(frame)out.release()temp_files.append(output_path)# 检查临时视频文件是否存在且大小大于0if not os.path.exists(output_path) or os.path.getsize(output_path) == 0:raise Exception(f"Temporary video file {output_path} is missing or empty.")# 加载视频片段video_clip = VideoFileClip(output_path).with_duration(clip_duration)else:# 直接在内存中创建 VideoClipvideo_clip = ImageClip(frame).with_duration(clip_duration)# 折行处理font_size = 50font = cv2.FONT_HERSHEY_SIMPLEXmax_width = width * 0.8  # 最大宽度为视频宽度的80%words = text.split()lines = []line = ""for word in words:test_line = line + " " + word(test_width, _), _ = cv2.getTextSize(test_line, font, 1, font_size)if test_width <= max_width:line = test_lineelse:lines.append(line)line = wordlines.append(line)# 创建TextClipfinal_text = "\n".join(lines)subtitle_clip = TextClip(text=final_text, font_size=font_size, color='white',font='/usr/share/fonts/opentype/noto/NotoSerifCJK-Bold.ttc')subtitle_clip = subtitle_clip.with_start(0).with_end(clip_duration).with_position(('center', subtitle_position))# 创建灰色背景框text_width, text_height = subtitle_clip.sizepadding = 10  # 字幕框的内边距box_width = text_width + 2 * paddingbox_height = text_height + 2 * paddingbox_frame = np.zeros((box_height, box_width, 3), dtype=np.uint8) + 128  # 灰色背景box_clip = ImageClip(box_frame).with_start(0).with_end(clip_duration)# 设置背景框的位置if subtitle_position == 'center':box_position = ('center', 'center')elif subtitle_position == 'bottom':box_position = ('center', 'bottom')else:box_position = ('center', 'top')box_clip = box_clip.with_position(box_position, relative=True).with_duration(clip_duration)# 合成片段final_clip = CompositeVideoClip([video_clip, box_clip, subtitle_clip]).with_start(start_seconds)video_clips.append(final_clip)# 合成最终视频final_video = CompositeVideoClip(video_clips)final_video = final_video.with_audio(audio_clip)final_video.write_videofile(video_path, codec='libx264', fps=fps)# 清理临时文件if use_temp_files:for temp_file in temp_files:os.remove(temp_file)# 示例调用
audio_path = "wwww.wav"
subtitle_path = "wwww.srt"
video_path = "wwww.mp4"
subtitle_position = 'bottom'  # 可选值: 'center', 'bottom'
use_temp_files = False  # 设置为 True 以使用临时文件# 创建最终视频
create_video(audio_path, subtitle_path, video_path, subtitle_position, use_temp_files)

以上代码参考，下一步。我计划。使用视频及字幕建立数据库，然后使用字幕进行匹配，替换目前的随机背景色的视频片断。那位朋友有好的参考意见的。交流一下。

chattts生成的音频与字幕修改完善，每段字幕对应不同颜色的视频，准备下一步插入视频。

上一节中，实现了先生成一个固定背景的与音频长度一致的视频，然后插入字幕。再合并成一个视频的方法。但是：这样有点单了，所以： 1.根据字幕的长度先生成视频片断 2.在片段上加上字幕。 3.合并所有片断，…...

编程日记 2024/12/14 22:11:09

数据结构开始——时间复杂度和空间复杂度知识点笔记总结

好了，经过了漫长的时间学习c语言语法知识，现在我们到了数据结构的学习。首先，我们得思考一下什么是数据结构？ 数据结构(Data Structure)是计算机存储、组织数据的方式，指相互之间存在一种或多种特定关系的数据元素…...

编程日记 2024/12/14 22:09:07

路由策略与策略路由

路由策略常用有Router-Policy，Filter-Policy等控制路由是否可达，通过修改路由条目相关参数影响流量的转发基于控制平面，会影响路由表表项，但只能基于目地址进行策略判定，于路由协议相结合使用 Router-Policy …...

编程日记 2024/12/14 22:04:02

pytorch_fid 安装笔记

目录 torch安装： pytorch_fid安装 torch安装： pip install torch2.5.0 --index-url https://download.pytorch.org/whl/cu121 pytorch_fid安装 pip install pytorch_fid 安装后，torch也会自动安装，导致torch引用报错。...

编程日记 2024/12/14 22:03:01

Qt绘制仪表————附带详细说明和代码示例

文章目录 1 效果2 原理3 编码实践3.1 创建仪表属性类3.2 设置类属性3.3 绘制图案3.3.1 设置反走样3.3.2 绘制背景3.3.3 重新定义坐标原点3.3.4 绘制圆环3.3.5 绘制刻度线3.3.6 绘制刻度线上的描述值3.3.7 绘制指针3.3.8 绘制指针数值和单位3.3.9 控制指针变化扩展福利参考 1 效…...

编程日记 2024/12/14 22:02:00

百度地图JavaScript API核心功能指引

百度地图JavaScript API是一套由JavaScript语言编写的应用程序接口，它能够帮助您在网站中构建功能丰富、交互性强的地图应用，包含了构建地图基本功能的各种接口，提供了诸如本地搜索、路线规划等数据服务。百度地图JavaScript API支持HTTP和HT…...

编程日记 2024/12/14 22:00:59

mp4影像和m4a音频无损合成视频方法

第一步：复制高清视频地址 url 第二步:打开网址粘贴复制的视频url视频下载第三步：下载-影像.mp4和-音频.m4a 第四步：合并视频； 使用ffmpeg进行无损合成（如果没有安装ffmpeg请自行下载安装下载 FFmpeg (p2hp.com)&…...

编程日记 2024/12/14 21:57:55

Ubuntu下将Julia嵌入Jupyter内核

一.安装 Julia 如果 Julia 尚未安装： 打开终端，下载最新的 Julia 安装包： wget https://julialang-s3.julialang.org/bin/linux/x64/1.9/julia-1.9.3-linux-x86_64.tar.gz 解压并移动到 /opt： tar -xvzf julia-1.9.3-linux-x86_…...

编程日记 2024/12/14 21:55:52

openGauss开源数据库实战二十五

文章目录任务二十五 openGauss 数据库的物理备份与恢复任务目标实施步骤一、为进行物理备份做准备1.确保数据库工作在归档模式2.创建保存数据库物理备份的目录3.创建保存归档日志备份的目录二、进行openGauss数据库的物理备份1.备份数据库2.切换WAL3.备份归档日志三、openGa…...

编程日记 2024/12/14 21:54:51

[C/C++] List相关操作

List相关操作 1 链表二分目标： （1）对于偶数节点，正好对半分； （2）对于奇数节点，前后 1 （3）断开链表，方便后期合并 // 使用快慢指针完成中点…...

编程日记 2024/12/14 21:51:47

继电器控制与C++编程：实现安全开关控制的技术分享

在现代生活中，继电器作为一种重要的电气控制元件，在电气设备的安全控制中起到了至关重要的作用。通过低电流控制高电流，继电器能够有效地隔离控制电路与被控设备，从而保障使用者的安全。本项目将介绍如何通过树莓派Pico与继电器模块结合，使用C++编程实现继电器的控制。一…...

编程日记 2024/12/14 21:44:39

题解 - 找子序列（2024.12上海月赛丙组T4）

题目描述 Dave 有一个长度为 n 的非负整数序列 a1-n, 和一个非负整数 m 。他希望知道是否有一个 a 的非空子序列，使得子序列中所有元素的按位与(bitwise AND)结果为 m。换言之，他想知道是否存在一个下标序列 i1-k(k ≥ 1),满足 1 ≤ i1 < i2 < …...

编程日记 2024/12/14 21:43:37

在centos 7.9上面安装mingw交叉编译工具

1.说明为了在centos上面编译windows的程序，需要安装mingw工具，mingw工具是可以编译windows程序的一些工具链，使用方式和linux一致 2.下载脚本使用脚本方式编译，github的脚本位置：https://github.com/Zeranoe/ming…...

编程日记 2024/12/14 21:41:35

ubuntu wine mobaxterm找不到串口和解决方案

安装好打开MobaXterm时发现，没有可供选择的串口我们再检查wine设备映射 ls -la ~/.wine/dosdevices/ 串口是存在的，我们再来一番神操作，并没有回滚操作，不知是否是必要修改打开注册表，在HKEY_LOCAL_MACHINE中的…...

编程日记 2024/12/14 21:40:34

如何编译安装系统settings设置应用(5.0.0-Release)

本文介绍如何在OpenHarmony 5.0.0 r版本中修改系统设置应用，并且编译安装到开发板上开发环境 1.dayu200开发板 2.OpenHarmony 5.0.0r 固件 3.API12 full sdk （如果安装full sdk过程中出现报错hvigor ERROR: Cannot find module typescript,请参考 h…...

编程日记 2024/12/14 21:37:31

＜项目代码＞YOLOv8 车牌识别＜目标检测＞

项目代码下载链接 ＜项目代码＞YOLOv8 车牌识别＜目标检测＞https://download.csdn.net/download/qq_53332949/90121387YOLOv8是一种单阶段（one-stage）检测算法，它将目标检测问题转化为一个回归问题…...

编程日记 2024/12/14 21:36:30

协同办公软件新升级：细节优化，让办公更简单

细节决定成败，企业酷信协同办公系统通过贴近客户实际需求的一系列改进和创新，在技术架构、系统结构、管理理念和使用性能上，都达到了国内先进水平，同时具备独特的优势。让我们看看企业酷信是如何通过这些细节提升，为企…...

编程日记 2024/12/14 21:34:28

【原创学习笔记】西门子1200 PLC实现变频器控制

一、实现的功能及应用的场合通过PLC的不同指令，发送指令控制电机的启停和速度大小二、硬件配置 1、西门子1214 PLC 2.TIA V16 3.SINAMICS G120C 三、实现功能步骤 1.添加设备G120C PN-调整以太网地址根据实际情况选择有无滤波器，电机参数&#xf…...

编程日记 2024/12/14 21:33:28

SQL server学习02-使用T-SQL创建数据库

目录一， 使用T-SQL创建数据库 1，数据库的存储结构 2，创建数据库的语法结构 1）使用T-SQL创建学生成绩管理数据库二，使用T-SQL修改数据库 1，修改数据库的语法结构 1）修改学生成绩管理数…...

编程日记 2024/12/14 21:32:25

2024153读书笔记|《春烂漫：新平摄影作品选》——跳绳酷似人生路，起落平常，进退平常，莫惧征途万里长

2024153读书笔记|《春烂漫：新平摄影作品选》——跳绳酷似人生路，起落平常，进退平常，莫惧征途万里长《春烂漫：新平摄影作品选》作者新平，2019.12.25年读完的小书，当时就觉得挺不错，今…...

编程日记 2024/12/14 21:30:22

synchronized 学习

学习源： https://www.bilibili.com/video/BV1aJ411V763?spm_id_from333.788.videopod.episodes&vd_source32e1c41a9370911ab06d12fbc36c4ebc 1.应用场景不超卖，也要考虑性能问题（场景） 2.常见面试问题： sync出…...

编程新知 2025/12/14 17:38:17

stm32G473的flash模式是单bank还是双bank？

今天突然有人stm32G473的flash模式是单bank还是双bank？由于时间太久，我真忘记了。搜搜发现，还真有人和我一样。见下面的链接：https://shequ.stmicroelectronics.cn/forum.php?modviewthread&tid644563 根据STM32G4系列参考手…...

编程新知 2026/2/8 20:41:51

逻辑回归：给不确定性划界的分类大师

想象你是一名医生。面对患者的检查报告（肿瘤大小、血液指标），你需要做出一个**决定性判断**：恶性还是良性？这种“非黑即白”的抉择，正是**逻辑回归（Logistic Regression）** 的战场&a…...

编程新知 2025/10/27 21:25:04

【解密LSTM、GRU如何解决传统RNN梯度消失问题】

解密LSTM与GRU：如何让RNN变得更聪明？ 在深度学习的世界里，循环神经网络（RNN）以其卓越的序列数据处理能力广泛应用于自然语言处理、时间序列预测等领域。然而，传统RNN存在的一个严重问题——梯度消失&#…...

编程新知 2025/12/24 1:45:14

sipsak：SIP瑞士军刀！全参数详细教程！Kali Linux教程！

简介 sipsak 是一个面向会话初始协议 (SIP) 应用程序开发人员和管理员的小型命令行工具。它可以用于对 SIP 应用程序和设备进行一些简单的测试。 sipsak 是一款 SIP 压力和诊断实用程序。它通过 sip-uri 向服务器发送 SIP 请求，并检查收到的响应。它以以下模式之一…...

编程新知 2026/1/29 8:51:33

计算机基础知识解析：从应用到架构的全面拆解

目录前言 1、计算机的应用领域：无处不在的数字助手 2、计算机的进化史：从算盘到量子计算 3、计算机的分类：不止 “台式机和笔记本” 4、计算机的组件：硬件与软件的协同 4.1 硬件：五大核心部件 4.2 软件&#…...

编程新知 2026/1/31 9:44:27

day51 python CBAM注意力

目录一、CBAM 模块简介二、CBAM 模块的实现 （一）通道注意力模块 （二）空间注意力模块 （三）CBAM 模块的组合三、CBAM 模块的特性四、CBAM 模块在 CNN 中的应用一、CBAM 模块简介在之前的探索中…...

编程新知 2026/1/21 20:27:19

数据库优化实战指南：提升性能的黄金法则

在现代软件系统中，数据库性能直接影响应用的响应速度和用户体验。面对数据量激增、访问压力增大，数据库性能瓶颈经常成为项目痛点。如何科学有效地优化数据库，提升查询效率和系统稳定性，是每位开发与运维人员必备的技能。本文结…...

编程新知 2026/1/14 10:20:05

【免杀】C2免杀技术（十五）shellcode混淆uuid/ipv6/mac

针对 shellcode 混淆（Shellcode Obfuscation）的实战手段还有很多，如下表所示：类型举例目的编码 / 加密XOR、AES、RC4、Base64、Poly1305、UUID、IP/MAC改变字节特征，避开静态签名或 YARA结构伪装PE Stub、GIF/PNG 嵌入、RTF OLE、UUID、IP/MAC看起来像合法文件/数据，弱…...

编程新知 2025/12/10 2:33:54

基于微信小程序的作业管理系统源码数据库文档

作业管理系统摘要随着社会的发展，社会的方方面面都在利用信息化时代的优势。互联网的优势和普及使得各种系统的开发成为必需。本文以实际运用为开发背景，运用软件工程原理和开发方法，它主要是采用java语言技术和微信小程序来完成对系统的…...

编程新知 2026/2/4 5:41:52

相关文章：