当前位置：首页 > news >正文

windows基于cpu安装pytorch运行faster-whisper-large-v3实现语音转文字

news 2026/2/10 1:40:12

1.创建虚拟环境
conda create -n faster-whisper python=3.10
conda activate faster-whisper

2.安装cpu版本的pytorch
pip3 install torch torchvision torchaudio -i https://pypi.tuna.tsinghua.edu.cn/simple

3.验证pytorch安装结果

(faster-whisper) H:\big-model\faster-whisper-large-v3>python
Python 3.10.16 | packaged by Anaconda, Inc. | (main, Dec 11 2024, 16:19:12) [MSC v.1929 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>>
>>> import torch
>>> import torchvision
>>> import torchaudio
>>>
>>> print(f"PyTorch version: {torch.__version__}")
PyTorch version: 2.6.0+cpu
>>> print(f"torchvision version: {torchvision.__version__}")
torchvision version: 0.21.0+cpu
>>> print(f"torchaudio version: {torchaudio.__version__}")
torchaudio version: 2.6.0+cpu
>>> print(f"NumPy version: {torch.__version__}")
NumPy version: 2.6.0+cpu
>>>

4.安装ctranslate2和faster-whisper
pip3 install ctranslate2 faster-whisper -i https://pypi.tuna.tsinghua.edu.cn/simple

5.下载faster-whisper-large-v3模型
执行下面的python语句会去外网Hugging Face Hub自动下载，要翻墙，下载慢。

>>> model = WhisperModel("large-v3")

可以手动下载放到H:\big-model\faster-whisper-large-v3目录下

下载地址：https://huggingface.co/Systran/faster-whisper-large-v3/tree/main

6.测试语音转文字

>>> from faster_whisper import WhisperModel
>>> model_path = "H:\\big-model\\faster-whisper-large-v3"
>>> model = WhisperModel(model_path, device="cpu")
[2025-02-12 21:39:43.689] [ctranslate2] [thread 2996] [warning] The compute type inferred from the saved model is float16, but the target device or backend do not support efficient float16 computation. The model weights have been automatically converted to use the float32 compute type instead.
>>> 
>>>
>>> audio_file = "H:\\big-model\\audio\\628941565166328648.mp3"
>>> segments, info = model.transcribe(audio_file, beam_size=5)
>>> for segment in segments:
...     print("[%.2fs -> %.2fs] %s" % (segment.start, segment.end, segment.text))
...
[0.00s -> 2.70s] 下面我们来看一下理财的三要素
[2.70s -> 6.38s] 安全性、流动性和收益性
[6.38s -> 11.94s] 世界上任何的投资行为都是在这三性中综合考量

done

windows基于cpu安装pytorch运行faster-whisper-large-v3实现语音转文字

1.创建虚拟环境 conda create -n faster-whisper python3.10 conda activate faster-whisper 2.安装cpu版本的pytorch pip3 install torch torchvision torchaudio -i https://pypi.tuna.tsinghua.edu.cn/simple 3.验证pytorch安装结果 (faster-whisper) H:\big-model\faste…...

编程日记 2025/2/15 12:08:14

AI大模型（如GPT、BERT等）可以通过自然语言处理（NLP）和机器学习技术，显著提升测试效率

在软件测试中，AI大模型（如GPT、BERT等）可以通过自然语言处理（NLP）和机器学习技术，显著提升测试效率。以下是几个具体的应用场景及对应的代码实现示例： 1. 自动生成测试用例 AI大模型可以根据需求文档或用户故事自动生成测试用例。代码示例（使用 OpenAI GPT API）： …...

编程日记 2025/2/15 12:06:08

【Prometheus】prometheus黑盒监控balckbox全面解析与应用实战

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯，先赞后看哦~🎈🎈 🏆 作者简介：景天科技苑 🏆《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。 🏆《博客》：Python全…...

编程日记 2025/2/15 12:05:04

CSS实现单行、多行文本溢出显示省略号（…）

在网页设计中，我们常常遇到这样的情况：文本内容太长，无法完全显示在一个固定的区域内。为了让界面看起来更整洁，我们可以使用省略号（…）来表示内容溢出。这不仅能提升用户体验，还能避免内容溢出…...

编程日记 2025/2/15 12:04:02

服务器中部署大模型DeepSeek-R1 | 本地部署DeepSeek-R1大模型 | deepseek-r1部署详细教程

0. 部署前的准备首先我们需要足够算力的机器，这里我在vultr中租了有一张A16显卡一共16GB显存的服务器作为演示。部署的模型参数为14b的。如果需要部署满血版本671b的，需要更大的算力支持，这里由于是个人资金有限，就演示14b的部署…...

编程日记 2025/2/15 12:02:59

元学习之孪生网络Siamese Network

简介：元学习是一种思想，一般以神经网络作为特征嵌入的工具，实现对数据特征的提取，然后通过构造某种指标以引导优化器对模型参数进行优化。而最小化距离是最常见的学习目标，这就是熟知的度量学习，度量学习里…...

编程日记 2025/2/15 12:01:54

深入HBase——引入

引入前面我们通过深入HDFS到深入MapReduce ，从设计和落地，去深入了解了大数据最底层的基石——存储与计算是如何实现的。这个专栏则开始来看大数据的三驾马车中最后一个。通过前面我们对于GFS和MapReduce论文实现的了解，我们知道GFS在数…...

编程日记 2025/2/15 12:00:52

Python创建FastApi项目模板

1. 项目结构规范 myproject/ ├── app/ │ ├── core/ # 核心配置 │ │ ├── config.py # 环境配置 │ │ └── security.py # 安全配置 │ ├── routers/ # 路由模块 │ │ └── users.py # 用户路由 │ ├…...

编程日记 2025/2/15 11:59:51

TCNE 网络安全

一.概况 CTF（Capture The Flag）在网络安全领域中指的是网络技术人员之间进行技术竞技的一种比赛形式，它起源于1996年的DEFCON全球黑客大会，以代替之前黑客们通过互相发起真实攻击进行技术比拼的方式，现已成为全球范围网…...

编程日记 2025/2/15 11:57:45

车规MCU处理器选择Cortex-M7还是Cortex-R52？

车规mcu处理器选择Cortex-M7还是Cortex-R52？跟随小编从具体应用场景、安全等级（ASIL）、性能、成本进行分析吧。 01安全等级需求 ASIL-D（如刹车、转向）→ 必选R52。R52原生支持ASIL-D，硬件级错误检测&#…...

编程日记 2025/2/15 11:56:41

什么是计算机中的 “终端”？

在我们初学编程的时候，会遇到一个很重要的概念 ——终端。那它到底是什么呢？ 在计算机领域，终端就像是我们和计算机进行对话的 “窗口”。我们可以在这个窗口里，用一些特定的命令来告诉计算机该做什么。比如，让计算机…...

编程日记 2025/2/15 11:55:38

LeetCode刷题---字符串---819

最常见的单词 819. 最常见的单词 - 力扣（LeetCode） 题目： 给你一个字符串 paragraph 和一个表示禁用词的字符串数组 banned ，返回出现频率最高的非禁用词。题目数据保证至少存在一个非禁用词，且答案唯一。 par…...

编程日记 2025/2/15 11:53:33

SSH IBM AIX服务器相关指标解读

（一）ZPU使用率含义在IBM AIX服务器中，ZPU使用率反映了特定处理单元（ZPU，假设是某种自定义或特定环境下的处理单元）的资源利用程度。它表示ZPU在一段时间内处于忙碌状态执行任务的时间比例。例如&#xff…...

编程日记 2025/2/15 11:52:28

Wireshark TS | 再谈虚假的 TCP Spurious Retransmission

前言在之前的《虚假的 TCP Spurious Retransmission》文章中曾提到一个错误判断为 TCP Spurious Retransmission，实际为 TCP Out-Of-Order 的案例，本次继续探讨一个虚假的 TCP Spurious Retransmission 案例。问题背景 TCP Spurious Retransmission…...

编程日记 2025/2/15 11:50:21

基于kafka、celery的日志收集报警项目

项目环境：centOS7.9 mariadb5.6 celery5.0 kafka3.6.1 项目时间：2025年1月项目描述：这个项目搭建了一个基于 Nginx 和 Flask 的 Web 集群，使用 Filebeat 将 Nginx 的访问日志发送到 Kafka 集群。通过 Python 消费者程序解析日志…...

编程日记 2025/2/15 11:49:19

QML使用ChartView绘制饼状图

一、工程配置首先修改CMakeLists.txt，按下图修改： find_package(Qt6 6.4 REQUIRED COMPONENTS Quick Widgets) PRIVATEtarget_link_libraries(appuntitledPRIVATE Qt6::QuickPRIVATE Qt6::Widgets )其次修改main.cpp，按下图修改&#xff…...

编程日记 2025/2/15 11:48:14

头歌实验--面向对象程序设计

目录实验五类的继承与派生第1关：简易商品系统任务描述答案代码第2关：公司支出计算任务描述答案代码第3关：棱柱体问题任务描述答案代码实验五类的继承与派生第1关：简易商品系统任务描述答案代码 #incl…...

编程日记 2025/2/15 11:47:07

DeepSeek-R1 蒸馏 Qwen 和 Llama 架构企业级RAG知识库

“DeepSeek-R1的输出，蒸馏了6个小模型”意思是利用DeepSeek-R1这个大模型的输出结果，通过知识蒸馏技术训练出6个参数规模较小的模型，以下是具体解释： - **知识蒸馏技术原理**：知识蒸馏是一种模型压缩技术，核…...

编程日记 2025/2/15 11:46:05

App UI自动化--Appium学习--第二篇

如果第一篇在运行代码的时候出现问题，建议参考我的上一篇文章解决。 1、APP界面信息获取 adb logcat|grep -i displayed代码含义是获取当前应用的包名和界面名。根据日志信息修改代码当中的包名和界面名，就可以跳转对应的界面。 2、界面元素获取所…...

编程日记 2025/2/15 11:45:03

【SpringBoot实现全局API限频】最佳实践

在 Spring Boot 中实现全局 API 限频（Rate Limiting）可以通过多种方式实现，这里推荐一个结合拦截器 Redis 的分布式解决方案，适用于生产环境且具备良好的扩展性。方案设计思路核心目标：基于客户端标识&#xff08…...

编程日记 2025/2/15 11:44:01

后进先出（LIFO）详解

LIFO 是 Last In, First Out 的缩写，中文译为后进先出。这是一种数据结构的工作原则，类似于一摞盘子或一叠书本： 最后放进去的元素最先出来 -想象往筒状容器里放盘子： （1）你放进的最后一个盘子&#xff08…...

编程新知 2026/2/8 1:22:58

CMake基础：构建流程详解

目录 1.CMake构建过程的基本流程 2.CMake构建的具体步骤 2.1.创建构建目录 2.2.使用 CMake 生成构建文件 2.3.编译和构建 2.4.清理构建文件 2.5.重新配置和构建 3.跨平台构建示例 4.工具链与交叉编译 5.CMake构建后的项目结构解析 5.1.CMake构建后的目录结构 5.2.构…...

编程新知 2026/2/2 7:39:34

渲染学进阶内容——模型

最近在写模组的时候发现渲染器里面离不开模型的定义，在渲染的第二篇文章中简单的讲解了一下关于模型部分的内容，其实不管是方块还是方块实体，都离不开模型的内容 🧱 一、CubeListBuilder 功能解析 CubeListBuilder 是 Minecraft Java 版模型系统的核心构建器，用于动态创…...

编程新知 2025/11/25 22:59:17

Cloudflare 从 Nginx 到 Pingora：性能、效率与安全的全面升级

在互联网的快速发展中，高性能、高效率和高安全性的网络服务成为了各大互联网基础设施提供商的核心追求。Cloudflare 作为全球领先的互联网安全和基础设施公司，近期做出了一个重大技术决策：弃用长期使用的 Nginx，转而采用其内部开发…...

编程新知 2026/1/29 21:20:51

ServerTrust 并非唯一

NSURLAuthenticationMethodServerTrust 只是 authenticationMethod 的冰山一角要理解 NSURLAuthenticationMethodServerTrust, 首先要明白它只是 authenticationMethod 的选项之一, 并非唯一 1 先厘清概念点说明authenticationMethodURLAuthenticationChallenge.protectionS…...

编程新知 2026/1/29 5:29:57

【JavaSE】绘图与事件入门学习笔记

-Java绘图坐标体系坐标体系-介绍坐标原点位于左上角，以像素为单位。在Java坐标系中,第一个是x坐标,表示当前位置为水平方向，距离坐标原点x个像素;第二个是y坐标，表示当前位置为垂直方向，距离坐标原点y个像素。坐标体系-像素 …...

编程新知 2025/12/19 20:46:15

3-11单元格区域边界定位(End属性)学习笔记

返回一个Range 对象，只读。该对象代表包含源区域的区域上端下端左端右端的最后一个单元格。等同于按键 End 向上键(End(xlUp))、End向下键(End(xlDown))、End向左键(End(xlToLeft)End向右键(End(xlToRight)) 注意：它移动的位置必须是相连的有内容的单元格…...

编程新知 2026/2/9 15:39:14

Angular微前端架构：Module Federation + ngx-build-plus (Webpack)

以下是一个完整的 Angular 微前端示例，其中使用的是 Module Federation 和 npx-build-plus 实现了主应用（Shell）与子应用（Remote）的集成。 🛠️ 项目结构 angular-mf/ ├── shell-app/ # 主应用&…...

编程新知 2025/12/3 10:52:37

九天毕昇深度学习平台 | 如何安装库？

pip install 库名 -i https://pypi.tuna.tsinghua.edu.cn/simple --user 举个例子： 报错 ModuleNotFoundError: No module named torch 那么我需要安装 torch pip install torch -i https://pypi.tuna.tsinghua.edu.cn/simple --user pip install 库名&#x…...

编程新知 2026/1/31 2:13:57

Docker 本地安装 mysql 数据库

Docker: Accelerated Container Application Development 下载对应操作系统版本的 docker ；并安装。基础操作不再赘述。打开 macOS 终端，开始 docker 安装mysql之旅第一步 docker search mysql 》〉docker search mysql NAME DE…...

编程新知 2026/2/9 17:06:25

相关文章：