当前位置: 首页 > article >正文

faster_whisper,视频转文字,并生成字幕文件

faster_whisper视频转文字并生成字幕文件附带exe使用说明–model选 tiny/base/small/medium/large越大越准、越耗资源。模型路径(medium)C:\Users\XXX.cache\huggingface\hub\models–Systran–faster-whisper-medium\snapshots\08e178d48790749d25932bbc082711ddcfdfbc4f直接运行run.exe选择视频文件等待结果结果保存在视频所在文件夹文件名与视频文件名相同格式为txt和srt使用PotPlayer播放视频自动读取同名的字幕文件暂停的时候可以复制当前字幕内容到剪贴板# 16核CPU 强制优化 禁用GPU importos os.environ[OMP_NUM_THREADS]16os.environ[MKL_NUM_THREADS]16os.environ[NUMBA_NUM_THREADS]16os.environ[HF_HUB_DISABLE_SYMLINKS_WARNING]1os.environ[CUDA_VISIBLE_DEVICES]-1# 彻底禁用GPU# fromfaster_whisperimportWhisperModelimportopenccimporttkinterastkfromtkinterimportttk,filedialog,messageboximportsubprocessimportjsonimportdatetime# SRT字幕时间格式转换defformat_srt_time(sec):hint(sec//3600)mint((sec%3600)//60)sint(sec%60)msint((sec-int(sec))*1000)returnf{h:02d}:{m:02d}:{s:02d},{ms:03d}# 模型选择弹窗下拉菜单 defselect_model():# win tk.Tk()# win.title(选择模型)# win.geometry(300x150)# win.resizable(False, False)# win.attributes(-topmost, True) # 窗口置顶# # 模型选项可自行增删# model_options [small, medium, large]# tk.Label(win, text请选择识别模型, font(微软雅黑, 12)).pack(pady20)# selected tk.StringVar(valuemodel_options[0])# combo ttk.Combobox(win, textvariableselected, valuesmodel_options, statereadonly, font(微软雅黑, 11))# combo.pack(pady5)# result None# def confirm():# nonlocal result# result selected.get()# win.destroy()# tk.Button(win, text确认, commandconfirm, width10, font(微软雅黑, 10)).pack(pady10)# win.mainloop()# return resultreturnmedium# 选择模型model_nameselect_model()ifnotmodel_name:exit()# 初始化 roottk.Tk()root.withdraw()ccopencc.OpenCC(t2s)# 选择视频video_pathfiledialog.askopenfilename(title选择视频文件,filetypes[(视频格式,*.mp4 *.mkv *.mov *.avi *.flv *.wmv),(所有文件,*.*)])ifnotvideo_path:exit()# 输出文件video_diros.path.dirname(video_path)video_nameos.path.splitext(os.path.basename(video_path))[0]txt_fileos.path.join(video_dir,f{video_name}.txt)srt_fileos.path.join(video_dir,f{video_name}.srt)# 获取视频时长defget_video_duration(video):try:ressubprocess.run([ffprobe,-v,error,-show_entries,formatduration,-of,json,video],stdoutsubprocess.PIPE)returnfloat(json.loads(res.stdout)[format][duration])except:return100total_timeget_video_duration(video_path)# 加载模型纯CPU 16核 print(f\n加载模型{model_name})modelWhisperModel(model_size_or_pathmodel_name,devicecpu,compute_typeint8,cpu_threads16,num_workers16)# 开始识别 print(f\n视频总时长{total_time:.1f}秒开始识别...\n)segments,infomodel.transcribe(video_path,languagezh,vad_filterFalse)# 写入标准SRT 纯文本withopen(txt_file,w,encodingutf-8)asf_txt,\open(srt_file,w,encodingutf-8)asf_srt:idx1forseginsegments:textcc.convert(seg.text.strip())start_strformat_srt_time(seg.start)end_strformat_srt_time(seg.end)print(f[{start_str}→{end_str}]{text})f_txt.write(text\n)# 标准SRT格式f_srt.write(f{idx}\n)f_srt.write(f{start_str}--{end_str}\n)f_srt.write(f{text}\n\n)idx1# 完成提示messagebox.showinfo(完成,f模型{model_name}\n识别成功\n已生成\n1. 纯文本.txt\n2. SRT字幕PotPlayer直接用)

相关文章:

faster_whisper,视频转文字,并生成字幕文件

faster_whisper,视频转文字,并生成字幕文件(附带exe) 使用说明: –model:选 tiny/base/small/medium/large(越大越准、越耗资源)。 模型路径(medium):C:\Users\XXX.cache…...

使用 OpenClaw 配置 Taotoken 实现自动化工作流

使用 OpenClaw 配置 Taotoken 实现自动化工作流 1. 自动化工作流中的多模型集成需求 在构建智能体工作流时,开发者常需要灵活调用不同的大模型能力。传统方式需要为每个模型单独维护 API 密钥和接入点,这增加了系统复杂度和维护成本。Taotoken 提供的统…...

你的效率革命:为什么这款跨平台桌面待办工具值得一试?

你的效率革命:为什么这款跨平台桌面待办工具值得一试? 【免费下载链接】My-TODOs A cross-platform desktop To-Do list. 跨平台桌面待办小工具 项目地址: https://gitcode.com/gh_mirrors/my/My-TODOs 你是否经常被各种任务搞得焦头烂额&#xf…...

AO3镜像站终极指南:3分钟快速访问全球同人创作宝库

AO3镜像站终极指南:3分钟快速访问全球同人创作宝库 【免费下载链接】AO3-Mirror-Site 项目地址: https://gitcode.com/gh_mirrors/ao/AO3-Mirror-Site Archive of Our Own(AO3)镜像站是专为中文用户设计的免费访问解决方案&#xff0…...

免费音频编辑神器Audacity:5分钟搞定专业级音频处理的完整指南

免费音频编辑神器Audacity:5分钟搞定专业级音频处理的完整指南 【免费下载链接】audacity Audio Editor 项目地址: https://gitcode.com/GitHub_Trending/au/audacity 您是否曾为音频中的杂音烦恼?是否羡慕专业录音棚的清晰音质?现在…...

Fomu FPGA开发板入门:从Verilog到RISC-V软核的渐进式学习指南

1. 从零开始:认识你的Fomu硬件开发板如果你对FPGA(现场可编程门阵列)感兴趣,但又觉得它高深莫测、入门门槛太高,那么Fomu这个小玩意儿可能会彻底改变你的看法。它是一块可以塞进USB接口的FPGA开发板,把整个…...

Windows安卓应用安装革命:APK Installer轻量级解决方案深度解析

Windows安卓应用安装革命:APK Installer轻量级解决方案深度解析 【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer APK Installer是一款专为Windows系统设计的…...

Audacity音频编辑框架:从信号处理到现代架构的技术演进

Audacity音频编辑框架:从信号处理到现代架构的技术演进 【免费下载链接】audacity Audio Editor 项目地址: https://gitcode.com/GitHub_Trending/au/audacity Audacity作为开源音频编辑软件的标杆,其技术架构的演进历程反映了音频处理领域从传统…...

YaeAchievement:3分钟完成原神成就数据一键导出,告别繁琐手动记录

YaeAchievement:3分钟完成原神成就数据一键导出,告别繁琐手动记录 【免费下载链接】YaeAchievement 更快、更准的原神数据导出工具 项目地址: https://gitcode.com/gh_mirrors/ya/YaeAchievement 还在为整理原神上千个成就而烦恼吗?每…...

深度解密:如何用CyberpunkSaveEditor逆向工程《赛博朋克2077》存档系统

深度解密:如何用CyberpunkSaveEditor逆向工程《赛博朋克2077》存档系统 【免费下载链接】CyberpunkSaveEditor A tool to edit Cyberpunk 2077 sav.dat files 项目地址: https://gitcode.com/gh_mirrors/cy/CyberpunkSaveEditor CyberpunkSaveEditor是一款基…...

新手友好:通过快马生成的代码理解智能车避障算法基本原理

新手友好:通过快马生成的代码理解智能车避障算法基本原理 作为一个刚接触智能车领域的新手,我最近在InsCode(快马)平台上体验了一个非常有趣的智能车避障算法模拟项目。这个项目特别适合像我这样的初学者,因为它用Python模拟了一个二维平面上…...

Cursor Free VIP终极指南:三步解锁AI编程助手完整功能

Cursor Free VIP终极指南:三步解锁AI编程助手完整功能 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve reached your tri…...

2026年权威解读:GEO优化系统贴牌源头服务商哪家强?横向测评TOP5公司避坑攻略

当用户不再依赖传统搜索引擎输入关键词,转而直接向ChatGPT、DeepSeek、豆包等AI大模型提问“上海哪家宠物寄养靠谱?”“本地连锁宠物店推荐”时,企业营销的主战场已经发生了根本性迁移。这种变革催生了GEO(生成式引擎优化&#xf…...

低精度Transformer训练中的Flash Attention稳定性优化

1. 低精度Transformer训练的技术背景与挑战在深度学习领域,低精度训练已经成为训练大规模Transformer模型的标配技术。这种技术通过将模型权重、激活值和梯度从传统的32位浮点数(FP32)降低到16位格式(如BF16或FP16)&am…...

观察在ubuntu服务器上通过taotoken调用api的延迟与稳定性表现

观察在 Ubuntu 服务器上通过 Taotoken 调用 API 的延迟与稳定性表现 1. 测试环境与基础配置 本次观察基于一台位于华东地区的 Ubuntu 22.04 LTS 生产服务器,通过企业级宽带接入互联网。Taotoken API Key 通过环境变量管理,使用 OpenAI 兼容的 Python S…...

AI赋能网络安全:NeuroSploit项目解析与智能漏洞挖掘实践

1. 项目概述:当AI遇上网络安全最近在GitHub上看到一个挺有意思的项目,叫“NeuroSploit”。光看名字,Neuro(神经)和Sploit(漏洞利用)这两个词组合在一起,就让人嗅到一股跨界融合的味道…...

Magicoder代码大模型:OSS-Instruct数据合成与本地部署实战

1. 项目概述:当代码生成遇上“开源魔法” 如果你最近在关注代码大模型(Code LLM)的进展,大概率已经听说过 Magicoder 这个名字。这个由伊利诺伊大学厄巴纳-香槟分校(UIUC)团队开源的项目,在 Hu…...

NeuroSploit:基于深度学习的二进制漏洞自动化利用框架解析与实践

1. 项目概述与核心价值最近在安全研究圈子里,一个名为“NeuroSploit”的项目引起了我的注意。这个由JoasASantos开源的仓库,名字本身就充满了想象力——“神经”与“漏洞利用”的结合。乍一看,你可能会联想到一些科幻电影里的场景&#xff0c…...

Horizon开源云原生应用平台:声明式定义与插件化架构实践

1. 项目概述:一个面向未来的开源云原生应用平台最近在开源社区里,一个名为“Thysrael/Horizon”的项目逐渐进入了我的视野。作为一个长期关注云原生和开发者工具生态的从业者,我对这类旨在提升应用交付与管理效率的平台总是抱有极大的兴趣。H…...

零售业供应链数字化实战:拆解爱室丽Ashley的EDI项目如何用3周快速上线(AS2+API方案解析)

零售业供应链数字化实战:拆解爱室丽Ashley的EDI项目如何用3周快速上线(AS2API方案解析) 在家居零售行业,供应链效率直接决定了企业的市场竞争力。当订单响应速度慢、库存信息滞后成为常态时,头部企业早已开始通过数字化…...

2025届必备的十大AI写作神器实际效果

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 在当下的学术写作情形里,论文AI网站借助自然语言处理跟深度学习技术,…...

给App开发者的冷知识:你的应用想进系统分区?聊聊/system/priv-app/、/system/app/和/system_ext/app/的门槛

Android系统分区应用部署指南:从/system/priv-app/到/system_ext/app/的深度解析 在Android生态系统中,系统分区应用的部署策略一直是开发者们关注的焦点。不同于普通应用商店分发的APK,能够进入系统分区的应用往往意味着更高的权限、更深的系…...

Win11Debloat:让Windows系统重获新生的优化工具,释放30%系统性能

Win11Debloat:让Windows系统重获新生的优化工具,释放30%系统性能 【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other change…...

终极风扇控制指南:免费开源工具让你完全掌控PC散热系统

终极风扇控制指南:免费开源工具让你完全掌控PC散热系统 【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Trending/f…...

如何用Tiny11Builder突破Windows臃肿限制,打造极致精简系统镜像

如何用Tiny11Builder突破Windows臃肿限制,打造极致精简系统镜像 【免费下载链接】tiny11builder Scripts to build a trimmed-down Windows 11 image. 项目地址: https://gitcode.com/GitHub_Trending/ti/tiny11builder Windows系统臃肿问题困扰着无数开发者…...

多模态AI模型KV缓存优化:OxyGen框架解析与实践

1. 项目背景与核心挑战在人工智能领域,视觉-语言-动作多模态模型正成为研究热点。这类模型需要同时处理图像、文本和动作序列等多种模态的输入输出,典型应用包括具身智能体、机器人控制和交互式系统等。然而在实际部署时,我们发现一个关键瓶颈…...

保姆级教程:在Ubuntu 20.04上用Git和Qt Creator搞定Gitee代码同步(含SSH-Askpass报错解决)

Ubuntu 20.04下Qt项目与Gitee无缝集成的全流程指南 在Linux环境下进行Qt开发时,版本控制与远程仓库的协同工作往往成为新手开发者的第一个"拦路虎"。不同于Windows或macOS的图形化操作,Ubuntu系统下的Git配置需要更多命令行介入,而…...

GAAI框架:为AI编码工具引入治理层,实现可控的软件交付

1. 项目概述:一个为AI编码工具注入“纪律”的治理框架如果你和我一样,在过去一年里深度使用过Claude Code、Cursor、Windsurf这类AI编码工具,那你一定体验过那种“冰火两重天”的感觉。一方面,它们能瞬间生成代码、修复bug&#x…...

大模型 (LLM) 推理加速核心技术解析:从 KV Cache 到 PagedAttention 实战

大模型 (LLM) 推理加速核心技术解析:从 KV Cache 到 PagedAttention 实战 在 AI Infrastructure (AI Infra) 领域,大语言模型(LLM)的部署与推理优化是当前最具挑战性的方向。与传统的 CV 模型不同,LLM 的推理过程&…...

CyberpunkSaveEditor终极指南:深度解析《赛博朋克2077》存档编辑器的技术实现与应用

CyberpunkSaveEditor终极指南:深度解析《赛博朋克2077》存档编辑器的技术实现与应用 【免费下载链接】CyberpunkSaveEditor A tool to edit Cyberpunk 2077 sav.dat files 项目地址: https://gitcode.com/gh_mirrors/cy/CyberpunkSaveEditor CyberpunkSaveEd…...