零代码编程:用ChatGPT将SRT字幕文件批量转为Word文本文档
一个文件夹中有多个srt视频字幕文件,srt文件里面有很多时间轴:

现在想将其批量转为word文档,去掉里面与字符无关的时间轴,在ChatGPT中输入提示词:
你是一个Python编程专家,要完成一个批量将SRT字幕文件转为Word文本文档的任务,具体步骤如下:
打开文件夹:F:\儿童学习教育\Abadas.适合2岁以上.BBC儿童学习单词的动画;
读取里面所有的srt字幕文件;
将srt字幕文件里面的时间和数字序号全部去掉,只保留字幕文本,另存为word文档;
比如,原有的srt字幕文件内容为:
1
00:00:20,560 --> 00:00:22,760
'Hey, Abadas!'
2
00:00:22,760 --> 00:00:26,120
ALL: Hello, Ben! Come and play with us!
3
00:00:26,120 --> 00:00:30,000
And... # We'll have a...
转换后的word文档内容为:
'Hey, Abadas!'
ALL: Hello, Ben! Come and play with us!
And... # We'll have a...
注意:每一步都要输出相关信息
每一行代码都要给出详细的注释
ChatGPT的回复:
以下是一个使用 python-docx 和 re(正则表达式模块)将 SRT 字幕文件转为 Word 文档的 Python 脚本。请先安装 python-docx 库,可以通过 pip install python-docx 来安装。
import os
import re
from docx import Document
# 设置源文件夹路径
source_dir = 'F:/儿童学习教育/Abadas.适合2岁以上.BBC儿童学习单词的动画'
# 遍历源文件夹中的所有字幕文件
for file_name in os.listdir(source_dir):
# 确保是 SRT 文件
if file_name.endswith('.srt'):
file_path = os.path.join(source_dir, file_name)
print(f'正在处理字幕文件: {file_path}')
with open(file_path, 'r', encoding='utf-8') as f:
content = f.read()
# 使用正则表达式将时间和数字序号去掉
pattern = re.compile(r'\d+\n\d{2}:\d{2}:\d{2},\d+ --> \d{2}:\d{2}:\d{2},\d+\n')
text_only = re.sub(pattern, '', content)
# 创建一个 Word 文档,并将处理后的文本添加到文档中
doc = Document()
doc.add_paragraph(text_only)
# 将 Word 文档保存为一个新文件
word_file_path = file_path.replace('.srt', '.docx')
doc.save(word_file_path)
print(f'已将字幕文件保存为 Word 文档: {word_file_path}')
注意:此脚本假设所有的 SRT 文件都使用 UTF-8 编码。如果你的 SRT 文件使用其他编码,你可能需要修改 open() 函数中的 encoding 参数。此外,脚本假设 SRT 文件的时间戳和文本之间没有额外的空行。如果有额外的空行,你可能需要修改或添加正则表达式来处理它们。最后,这个脚本会直接修改你的文件系统,因此在运行之前请确保你已经备份了原始数据,或者在一个安全的环境下运行这个脚本。在运行这个脚本之前,请确保你的Python环境有足够的权限来读取和写入文件。以上代码未进行错误处理,实际使用时应考虑加入错误处理机制。

转换后的word文档如下:

相关文章:
零代码编程:用ChatGPT将SRT字幕文件批量转为Word文本文档
一个文件夹中有多个srt视频字幕文件,srt文件里面有很多时间轴: 现在想将其批量转为word文档,去掉里面与字符无关的时间轴,在ChatGPT中输入提示词: 你是一个Python编程专家,要完成一个批量将SRT字幕文件转为…...
力扣刷题第二十六天--二叉树
前言 昨天看总决赛,差距太大,看的没意思,真的是一点变通没有啊。难受,没有写题的状态了。大概率是最后一次看比赛了,青春已复过,白日忽相催。召唤师要和生活对线了。英雄们的语音,台词…...
电脑显示msvcp140_1.dll丢失的5个常用解决方法,亲测可修复
常见于计算机操作中的"msvcp140_1.dll丢失"错误警示,往往令部分应用程序无法正常启动。为了解决这个问题,我们需要采取一些措施来修复丢失的文件。本文将介绍6个解决msvcp140_1.dll丢失的方法,帮助大家快速恢复计算机的正常运行。 …...
hive sql 行列转换 开窗函数 炸裂函数
hive sql 行列转换 开窗函数 炸裂函数 准备原始数据集 学生表 student.csv 讲师表 teacher.csv 课程表 course.csv 分数表 score.csv 员工表 emp.csv 雇员表 employee.csv 电影表 movie.txt 学生表 student.csv 001,彭于晏,1995-05-16,男 002,胡歌,1994-03-20,男 003,周杰伦,…...
Continuity” of stochastic integral wrt Brownian motion
See https://imathworks.com/math/math-continuity-of-stochastic-integral-wrt-brownian-motion/...
设置 wsl 桥接模式
一、环境要求 Win10/Win11 专业版,并已安装 Hyper-V 二、具体步骤 打开 Hyper-V 管理器 创建虚拟交换机 WSL Bridge 修改wsl配置文件 .wslconfig .wslconfig 文件所在路径如下: C:\Users\<UserName>\.wslconfig若 .wslconfig 文件不存在&am…...
[uni-app] uni.showToast 一闪而过问题/设定时间无效/1秒即逝
toast一闪就消失 1.猜测频繁点击导致 – 排除 2.猜测再定时器内导致-- 排除 3.和封装的接口调用一起导致 - 是改原因 深挖发现: axios封装中, 对loading/hindloading进行了配置, 看来是 showToast 与 loading等冲突导致的 wx.hideLoading(Object object) 解决办法 再封装的…...
7、信息打点——资产泄露CMS识别Git监控SVNDS_Store备份
知识点: CMS指纹识别、源码获取方式习惯&配置&特征等获取方式托管资产平台资源搜索监控 如何获取源码 直接识别CMS,根据CMS获取网站源码。CMS直接识别工具:云悉指纹识别平台。识别不了CMS,则通过以下方式获取源码&…...
【运维篇】5.6 Redis server 主从复制配置
文章目录 0. 前言1. 配置方式步骤1: 准备硬件和网络步骤2: 安装Redis步骤3: 配置主服务器的Redis步骤4: 配置从服务器的Redis步骤5: 测试复制功能步骤6: 监控复制状态 2. 参考文档 0. 前言 在Redis运维篇的第5.6章节中,将讨论Redis服务器的主从复制配置。在开始之前…...
Hive语法,函数--学习笔记
1,排序处理 1.1cluster by排序 ,在Hive中使用order by排序时是全表扫描,且仅使用一个Reduce完成。 在海量数据待排序查询处理时,可以采用【先分桶再排序】的策略提升效率。此时, 就可以使用cluster by语法。 cluster…...
LeetCode热题100——动态规划
动态规划 1. 爬楼梯2. 杨辉三角3. 打家劫舍 1. 爬楼梯 假设你正在爬楼梯。需要 n 阶你才能到达楼顶。 每次你可以爬 1 或 2 个台阶。你有多少种不同的方法可以爬到楼顶呢? // 题解:每次都有两种选择,1或者2 int climbStairs(int n) {if (n …...
初识树(c语言)
树 定义:树是一种非线性的数据结构,它是由n(n>0)个有限结点组成一个具有层次关系的集合。 有一个特殊的结点,称为根结点,根节点没有前驱结点 除根节点外,其余结点被分成M(M>0)个互不相交…...
听GPT 讲Rust源代码--src/librustdoc(2)
题图来自 Chromium项目将支持Rust编程语言[1] File: rust/src/librustdoc/html/render/search_index.rs 在Rust源代码中,rust/src/librustdoc/html/render/search_index.rs文件的作用是生成搜索索引,用于在Rust文档页面上进行关键字搜索。该文件实现了一…...
多目标应用:基于非支配排序的蜣螂优化算法NSDBO求解微电网多目标优化调度(MATLAB)
一、微网系统运行优化模型 微电网优化模型介绍: 微电网多目标优化调度模型简介_IT猿手的博客-CSDN博客 二、基于非支配排序的蜣螂优化算法NSDBO 基于非支配排序的蜣螂优化算法NSDBO简介: https://blog.csdn.net/weixin46204734/article/details/128…...
泉盛UV-K5/K6全功能中文固件
https://github.com/wu58430/uv-k5-firmware-chinese/releases 主要功能: 中文菜单 许多来自 OneOfEleven 的模块: AM 修复,显著提高接收质量长按按钮执行 F 操作的功能复制快速扫描菜单中的频道名称编辑频道名称 频率显示选项扫描列表分配…...
基于JPBC的无证书聚合签名方案实现
基于JPBC的无证书聚合签名方案实现 摘要 一开始签名方案是基于PKI的,无证书签名起源于 基于身份密码体制, 2009 年第一篇无证书签名方案1被提出,随后出现了一些列方案2,3;包括无配对的无证书聚合签名方案4,更多内容参考文献5. 暂时没有看见…...
FreeRTOS内存管理分析
目录 heap_1.c内存管理算法 heap_2.c内存管理算法 heap_3.c内存管理算法 heap_4.c内存管理算法 heap_5.c内存管理算法 内存管理对应用程序和操作系统来说非常重要,而内存对于嵌入式系统来说是寸土寸金的资源,FreeRTOS操作系统将内核与内存管理分开实…...
hashMap索引原理
平日里面经常使用map这种数据结构,令人称奇的是他的访问速度为什么那么快?为什么可以通过key以接近O(1)的速度查找? 一、基础数据结构特点分析 1.1数组 查找的时间复杂度为O(1) 插入时间复杂度为O(n) 1.2链表 查找的时间复杂度为O(n) 插…...
qcow2、raw、vmdk等镜像格式工具
如果没有qemu,可以从这里下载安装:https://qemu.weilnetz.de/w64/...
GaussDB新特性Ustore存储引擎介绍
1、 Ustore和Astore存储引擎介绍 Ustore存储引擎,又名In-place Update存储引擎(原地更新),是openGauss 内核新增的一种存储模式。此前的版本使用的行存储引擎是Append Update(追加更新)模式。相比于Append…...
天梯赛L3-026传送门:用Splay树模拟‘交换后缀’,保姆级代码逐行解析
天梯赛L3-026传送门:用Splay树模拟‘交换后缀’,保姆级代码逐行解析 在算法竞赛中,数据结构的选择往往决定了解决问题的效率与优雅程度。天梯赛L3-026传送门这道题目,表面上看是一个关于路径操作的模拟题,实则暗藏了对…...
从无人机飞控到机械臂:一个Python函数搞定旋转向量转矩阵的工程实战
从无人机飞控到机械臂:一个Python函数搞定旋转向量转矩阵的工程实战 在机器人控制和三维空间计算中,旋转向量的处理是核心问题之一。无论是无人机飞控系统的姿态解算,还是机械臂末端的运动规划,都需要将旋转向量转换为旋转矩阵。这…...
学术界的“智能导航仪“来了!宏智树AI如何用自研大模型重构论文写作体验
当论文写作遇上人工智能,是"代写"还是"赋能"?宏智树AI给出新答案:用真实文献智能工具,做你学术路上的靠谱搭档✨凌晨三点的图书馆,屏幕蓝光映着疲惫的脸。文献找不到、数据不会分析、问卷设计没思…...
Flutter与Firebase集成实战:构建跨平台CRUD应用与AI辅助开发体验
1. 项目概述与动机 最近在尝试用 Cursor 这个 AI 编程工具来辅助开发一个移动应用,项目是一个西班牙语词汇构建器。作为一个有多年移动开发经验的工程师,我一直在寻找能提升开发效率、同时又能深入理解新技术栈边界的方法。这个项目恰好满足了我的两个核…...
华硕B660M主板装Ubuntu 22.04,避开N卡黑屏和磁盘识别坑的保姆级教程
华硕B660M主板Ubuntu 22.04实战指南:NVIDIA显卡与磁盘识别的终极解决方案 当高性能硬件遇上开源系统,总会碰撞出意想不到的火花。作为一名长期在Linux环境下工作的开发者,我最近为团队配置了一批搭载华硕B660M主板和NVIDIA 30系列显卡的开发机…...
从SIM卡密钥泄露事件看移动通信安全:供应链攻击与纵深防御
1. 事件背景与核心问题剖析2015年初,一则来自《The Intercept》的报道在信息安全领域投下了一颗重磅炸弹。报道基于爱德华斯诺登提供的文件披露,美国国家安全局(NSA)和英国政府通信总部(GCHQ)曾联合执行了一…...
Review Gate V2:基于MCP协议的多模态AI编程助手深度集成方案
1. 项目概述:从“单次对话”到“深度协作”的AI工作流革命如果你和我一样,是Cursor IDE的重度用户,那你一定对那个每月500次请求的限制又爱又恨。爱的是,它背后的Claude模型能力确实强大;恨的是,面对一个复…...
别再用PVE了!在Debian 12裸机上用QEMU直通网卡给OpenWRT,性能更猛
裸机QEMU直通方案:突破虚拟化瓶颈的OpenWRT性能优化实践 当你在深夜调试家庭网络时,是否经历过这样的场景:明明硬件配置足够强大,但通过PVE虚拟化的OpenWRT总是无法跑满千兆带宽,游戏延迟时不时出现波动,而…...
娱乐圈天降紫微星逆势而生,海棠山铁哥在无人看好中登巅峰
逆势而生 紫微星传奇“天降紫微星,从来不是被捧出来的,而是闯出来的。”紫微星的降临,从不是顺境中的锦上添花,而是逆境中的破局而生。 它无关资本堆砌的光环,无关流量炒作的热度,无关圈层人脉的加持&…...
开发者生态建设:如何让你的平台成为开发者的首选?
在软件测试领域,平台的选择早已不再只是功能清单的比拼。测试从业者每天面对的是复杂的技术栈、持续交付的压力、自动化用例的维护负担,以及团队协作中无数隐性的沟通成本。一个平台能否成为测试开发者的首选,本质上取决于它是否真正理解并融…...
