当前位置: 首页 > news >正文

20241217使用M6000显卡在WIN10下跑whisper来识别中英文字幕

20241217使用M6000显卡在WIN10下跑whisper来识别中英文字幕
2024/12/17 17:21


缘起,最近需要识别法国电影《地下铁》的法语字幕,使用 字幕小工具V1.2【whisper套壳/GUI封装了】 无效。
那就是直接使用最原始的whisper来干了。
当你重装WIN10的时候,你就会发现有些东西需要是必须安装的了!


步骤:
1、在NVIDIA的官网下载并安装M6000显卡在WIN10下的最新驱动程序。
2、安装ffmpeg预编译版本。
3、安装python3.8,一定不要去Microsoft的软件商城里安装最新的python3.13等。最新的python不好安装Torch。
4、安装torch
5、安装whisper
6、开始识别。需要使用large模式


20240131在WIN10下配置whisper
2024/1/31 18:25


首先你要有一张NVIDIA的显卡,比如我用的PDD拼多多的二手GTX1080显卡。【并且极其可能是矿卡!】800¥
2、请正确安装好NVIDIA最新的545版本的驱动程序和CUDA。
2、安装Torch
3、配置whisper


【详细步骤】
1、在NVIDIA的官网下载并安装M6000显卡在WIN10下的最新驱动程序。
https://www.nvidia.cn/
https://www.nvidia.cn/drivers/lookup/
NVIDIA RTX / Quadro
Quadro Series
Quadro M6000
Windows 10 64-bit
Chinese (Simplified)


2、ffmpeg下载以及安装:【必须安装,否则运行时报错的!】
http://www.ffmpeg.org/download.html
Windows EXE Files

Windows builds by BtbN

Windows builds from gyan.dev
git
Links
https://www.gyan.dev/ffmpeg/builds/ffmpeg-git-full.7z
https://www.gyan.dev/ffmpeg/builds/ffmpeg-git-essentials.7z
参考名称:ffmpeg-2020-11-04-git-cfdddec0c8-essentials_build.7z
其它的预编译的ffmpeg也可以,但是没有测试!

解压缩之后得到三个exe文件,直接放到:
C:\Windows
ffmpeg.exe
ffplay.exe
ffprobe.exe


3、安装python3.8.10,一定不要去Microsoft的软件商城里安装最新的python3.13等。最新的python不好安装Torch。
https://www.python.org/downloads/
https://www.python.org/downloads/release/python-3810/
https://www.python.org/ftp/python/3.8.10/python-3.8.10-amd64.exe


4、安装torch
https://blog.csdn.net/m0_52156129/article/details/129263703
如何在你的电脑上完成whisper的简单部署

【根据你的位置或者网速,你下载的速度可能会很慢或者中断,重来即可!^_】
https://pytorch.org/get-started/locally/
Stable (2.5.1)
Windows
Pip
Python
CUDA 12.4

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124

第一个文件特别大,可能要下载很久很久的。2GB的文件,200KBps的网速,搞了5-6个小时。下载的人崩溃!
通过技术手段上网用处不明显!


5、安装whisper
C:\Users\wb491>pip install -U openai-whisper
C:\Users\wb491>whisper -h


6、开始识别。需要使用large模式


参考资料:
https://blog.csdn.net/wb4916/article/details/135960188
20240131在WIN10下配置whisper


https://blog.csdn.net/wb4916/article/details/135757404
20240122在WIN10+GTX1080下使用字幕小工具V1.2的使用总结(whisper)


https://blog.csdn.net/m0_52156129/article/details/129263703
如何在你的电脑上完成whisper的简单部署

【根据你的位置或者网速,你下载的速度可能会很慢或者中断,重来即可!^_】
https://pytorch.org/get-started/locally/
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

pip3 install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu118
pip3 install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu121


START LOCALLY
Select your preferences and run the install command. Stable represents the most currently tested and supported version of PyTorch. This should be suitable for many users. Preview is available if you want the latest, not fully tested and supported, builds that are generated nightly. Please ensure that you have met the prerequisites below (e.g., numpy), depending on your package manager. Anaconda is our recommended package manager since it installs all dependencies. You can also install previous versions of PyTorch. Note that LibTorch is only available for C++.

NOTE: Latest PyTorch requires Python 3.8 or later. For more details, see Python section below.


C:\2014[乌托邦(澳洲版) 第一季]Utopia.AU.S01.1080p.WEB-DL.AAC2.0.H.264-ABH[rartv]-7.83GB>nvcc --version
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2023 NVIDIA Corporation
Built on Tue_Jun_13_19:42:34_Pacific_Daylight_Time_2023
Cuda compilation tools, release 12.2, V12.2.91
Build cuda_12.2.r12.2/compiler.32965470_0

C:\2014[乌托邦(澳洲版) 第一季]Utopia.AU.S01.1080p.WEB-DL.AAC2.0.H.264-ABH[rartv]-7.83GB>pip3 install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu121
C:\Users\wb491>pip install -U openai-whisper
C:\Users\wb491>whisper -h
C:\2014[乌托邦(澳洲版) 第一季]Utopia.AU.S01.1080p.WEB-DL.AAC2.0.H.264-ABH[rartv]-7.83GB>whisper Utopia.AU.S01E04.Onwards.and.Upwards.1080p.WEB-DL.AAC2.0.H.264-ABH.mkv --model small --language Chinese

相关文章:

20241217使用M6000显卡在WIN10下跑whisper来识别中英文字幕

20241217使用M6000显卡在WIN10下跑whisper来识别中英文字幕 2024/12/17 17:21 缘起,最近需要识别法国电影《地下铁》的法语字幕,使用 字幕小工具V1.2【whisper套壳/GUI封装了】 无效。 那就是直接使用最原始的whisper来干了。 当你重装WIN10的时候&#…...

搜索召回:召回聚合

召回聚合 用户的查询意图往往是复杂多样的,可能涉及到不同的领域、主题和语义层面。因此,召回体系中通常通过多路召回的方式从不同角度去理解和满足用户的查询需求。此外,多路召回通过各召回通道并行计算可以在海量数据中能够快速响应&#…...

NTFS 文件搜索库

NTFS 文件搜索库 中文 | English 一个快速搜索NTFS卷文件的库 在这里插入图片描述 特性 快速扫描 NTFS 格式驱动器上的所有文件实时快速同步文件变更(创建, 更名, 删除)支持通配符查询文件名或文件路径重启自动更新文件变动, 无需重新进行全盘扫描 API描述 初始化并指定…...

【GoF23种设计模式】02_单例模式(Singleton Pattern)

文章目录 前言一、什么是单例模式?二、为什么要用单例模式?三、如何实现单例模式?总结 前言 提示:设计者模式有利于提高开发者的编程效率和代码质量: GoF(Gang of Four,四人帮)设计…...

UniApp:uni-segmented-control 自定义布局

自定义tabs选项&#xff0c;items 为tabs名称数组&#xff0c;横向滚动 <scroll-view scroll-x><view class"segmented-control"><view v-for"(item, index) in items" :key"index" class"control-item ":class"…...

【算法day17-day18】回溯:解决组合问题

不好意思呀各位&#xff0c;最近在忙期末考今天才彻底结束&#xff0c;来让我们继续算法之路吧~ 题目引用 组合电话号码的字母组合组合总和组合总和II分割回文串 1.组合 给定两个整数 n 和 k&#xff0c;返回范围 [1, n] 中所有可能的 k 个数的组合。 你可以按 任何顺序 返回…...

从监控异常发现网络安全

前言 最近在前端异常监控系统中&#xff0c;发现一些异常信息&#xff0c;从中做了一些分析&#xff0c;得到一些体会&#xff0c;因此作文。 发现异常 某天早上打开监控系统发现&#xff0c;当天凌晨1点过测试环境有2个前端上报的异常&#xff0c;报错的原因都是由于没有获取…...

Qt之自定义标题栏拓展(十)

Qt开发 系列文章 - user-defined-titlebars&#xff08;十&#xff09; 目录 前言 一、方式一 1.效果演示 2.创建标题栏类 3.可视化UI设计 4.定义相关函数 5.使用标题栏类 二、方式二 1.效果演示 2.创建标题栏类 3.定义相关函数 1.初始化函数 2.功能函数 3.窗口关…...

Verilog中initial的用法

在 Verilog 语言中&#xff0c;initial 语句用于在仿真开始时执行一次性初始化操作。它是顺序执行的&#xff0c;用来描述在仿真启动时立即运行的代码块&#xff0c;通常用于赋初值、生成波形或控制信号行为。 语法 initial begin // 语句1 // 语句2 ... end特点 只…...

(14)D-FINE网络,爆锤yolo系列

yolo过时了&#xff1f;传统的yolo算法在小目标检测方面总是不行&#xff0c;最新算法DEIM爆锤yolo&#xff0c;已经替yolo解决。 一、创新点 ​ 这个算法名为DEIM&#xff0c;全称是DETR with Improved Matching for Fast Convergence&#xff0c;其主要创新点在于提出了一…...

Python :冬至快乐

第1部分&#xff1a;基础设置 首先创建一个新的 Python 文件&#xff0c;命名为 fireworks.py。 步骤 1.1: 导入必要的库 import pygame import random import sys from pygame.locals import * import math import time这些库的作用&#xff1a; pygame: 用于创建游戏和图…...

重拾设计模式--状态模式

文章目录 状态模式&#xff08;State Pattern&#xff09;概述状态模式UML图作用&#xff1a;状态模式的结构环境&#xff08;Context&#xff09;类&#xff1a;抽象状态&#xff08;State&#xff09;类&#xff1a;具体状态&#xff08;Concrete State&#xff09;类&#x…...

稀疏矩阵的存储与计算 gaxpy

1, gaxpy 数学公式 其中&#xff1a; &#xff0c; &#xff0c; 2, 具体实例 3&#xff0c;用稠密矩阵的方法 本节将用于验证第4节中的稀疏计算的结果 hello_gaxpy_dense.cpp #include <stdio.h> #include <stdlib.h>struct Matrix_SP {float* val; //…...

基于LabVIEW的USRP信道测量开发

随着无线通信技术的不断发展&#xff0c;基于软件无线电的设备&#xff08;如USRP&#xff09;在信道测量、无线通信测试等领域扮演着重要角色。通过LabVIEW与USRP的结合&#xff0c;开发者可以实现信号生成、接收及信道估计等功能。尽管LabVIEW提供了丰富的信号处理工具和图形…...

基于LSTM长短期记忆神经网络的多分类预测【MATLAB】

在深度学习中&#xff0c;长短期记忆网络&#xff08;LSTM, Long Short-Term Memory&#xff09;是一种强大的循环神经网络&#xff08;RNN&#xff09;变体&#xff0c;专门为解决序列数据中的长距离依赖问题而设计。LSTM因其强大的记忆能力&#xff0c;广泛应用于自然语言处理…...

物联网:全面概述、架构、应用、仿真工具、挑战和未来方向

中文论文标题&#xff1a;物联网&#xff1a;全面概述、架构、应用、仿真工具、挑战和未来方向 英文论文标题&#xff1a;Internet of Things: a comprehensive overview, architectures, applications, simulation tools, challenges and future directions 作者信息&#x…...

volatility2工具的使用vol2工具篇

vol2工具 命令格式&#xff1a;vol.py -f [image] --profile[profile] [plugin] 1、查看系统的操作版本&#xff0c;系统镜像信息 2.查看用户名密码信息&#xff0c;当前操作系统中的password hash&#xff0c;例如SAM文件内容 3.从注册表提取LSA密钥信息&#xff08;已解密&…...

R 基础运算

R 基础运算 R 是一种广泛使用的统计编程语言&#xff0c;它提供了强大的数据操作和分析功能。基础运算在 R 中非常重要&#xff0c;因为它们是进行更复杂计算和数据分析的基础。本文将详细介绍 R 中的基础运算&#xff0c;包括算术运算、逻辑运算、向量化和矩阵运算。 一、算…...

javaScriptBOM

1.1、BOM概述 1.1.1、BOM简介 BOM&#xff08;browser Object&#xff09;即浏览器对象模型&#xff0c;它提供了独立于内容而与浏览器窗口进行交互的对象&#xff0c;其核心对象是window。 BOM由一系列的对象构成&#xff0c;并且每个对象都提供了很多方法与属性 BOM缺乏标准…...

Godot RPG 游戏开发指南

Godot RPG 游戏开发指南 一、基础准备 1. 开发环境 下载并安装最新版 Godot 4.x选择使用 GDScript 或 C# 作为开发语言准备基础美术资源&#xff08;角色、地图、道具等&#xff09; 2. 项目结构 project/ ├── scenes/ # 场景文件 ├── scripts/ # 脚…...

Adafruit 3.5寸TFT触摸屏驱动指南:SPI与8位并行模式详解

1. 项目概述与核心价值如果你正在为你的Arduino、树莓派Pico或者任何一款微控制器项目寻找一块足够大、足够亮、还能用手指戳戳点点的屏幕&#xff0c;那么Adafruit这块3.5英寸的320x480彩色TFT触摸屏绝对是一个让人眼前一亮的选择。我手头经手过不少显示屏&#xff0c;从单色O…...

基于 HarmonyOS 6.0 的智能记账页面开发实践:ArkUI 页面构建与跨端设计深度解析

基于 HarmonyOS 6.0 的智能记账页面开发实践&#xff1a;ArkUI 页面构建与跨端设计深度解析 前言 随着 HarmonyOS 6.0 的持续演进&#xff0c;鸿蒙生态已经不再局限于传统移动端开发&#xff0c;而是逐渐形成覆盖手机、平板、智慧屏、车机以及 IoT 设备的全场景开发体系。相比传…...

科技史上的今天:5月14日-百年技术沉淀,引领时代变革

2015年&#xff1a;HTTP/2 正式发布2015年5月14日&#xff0c;HTTP/2 标准正式发布&#xff0c;作为HTTP/1.1的重大升级&#xff0c;采用二进制分帧、多路复用等技术&#xff0c;解决串行阻塞痛点&#xff0c;显著提升网页加载速度与传输效率&#xff0c;为现代Web及物联网通信…...

深蓝词库转换:打破输入法数据孤岛的终极解决方案

深蓝词库转换&#xff1a;打破输入法数据孤岛的终极解决方案 【免费下载链接】imewlconverter ”深蓝词库转换“ 一款开源免费的输入法词库转换程序 项目地址: https://gitcode.com/gh_mirrors/im/imewlconverter 你是否曾因更换设备或操作系统而面临输入法词库无法迁移…...

基于NeoKey Trinkey的智能媒体控制器:从电容触摸到USB HID实战

1. 项目概述&#xff1a;从一块小板子到桌面交互神器如果你和我一样&#xff0c;桌上堆满了各种开发板&#xff0c;那么第一次看到Adafruit的NeoKey Trinkey时&#xff0c;大概率会觉得它“平平无奇”——一块比大拇指指甲盖大不了多少的板子&#xff0c;集成了一个机械按键、一…...

羽毛球网前步伐 膝盖疼痛把脉

文章目录 引言 I 羽毛球网前步伐 手脚方向一致 对比 膝盖疼痛把脉 II 知识扩展 调整跑步姿势来避免膝盖受伤的三个具体方法 宽楦‌(Wide Last) 引言 羽毛球网前步伐技术要点:采用"女前男后"站位,通过并步快速移动(2-3步到位),击球后斜跳回中。强调手脚协调(脚…...

【独家首发】Midjourney啤酒印相失效诊断手册:识别8类常见色偏/纹理崩坏场景并实时修复

更多请点击&#xff1a; https://intelliparadigm.com 第一章&#xff1a;Midjourney Beer印相技术原理与失效本质 Midjourney Beer印相&#xff08;非官方术语&#xff0c;实为社区对特定图像生成伪影的戏称&#xff09;并非真实存在的官方技术&#xff0c;而是用户在使用 Mi…...

终极PHP代码规范指南:让你的代码更易读、可维护的10个核心技巧

终极PHP代码规范指南&#xff1a;让你的代码更易读、可维护的10个核心技巧 【免费下载链接】clean-code-php :bathtub: Clean Code concepts adapted for PHP 项目地址: https://gitcode.com/gh_mirrors/cl/clean-code-php clean-code-php是一个将Robert C. Martin的《C…...

kkFileView容器网络性能优化:基于SR-IOV的硬件加速终极指南

kkFileView容器网络性能优化&#xff1a;基于SR-IOV的硬件加速终极指南 【免费下载链接】kkFileView Universal File Online Preview Project based on Spring-Boot 项目地址: https://gitcode.com/GitHub_Trending/kk/kkFileView 在现代云原生应用中&#xff0c;容器化…...

手把手教你用Verilog实现SPI Flash读写控制器(附完整FPGA源码)

从零构建SPI Flash控制器&#xff1a;Verilog实战指南与FPGA源码解析 在嵌入式系统和数字电路设计中&#xff0c;SPI Flash存储器因其高速度、低功耗和易用性成为非易失性存储的首选方案。本文将带领读者从硬件描述语言基础出发&#xff0c;逐步构建一个完整的SPI Flash读写控制…...