当前位置：首页 > news >正文

本地部署语音转文字（whisper，SpeechRecognition）

news 2026/5/14 11:27:49

本地部署语音转文字

1.whisper
- 1.首先安装Chocolatey
- 2.安装
- 3.使用
2.SpeechRecognition
- 1.环境
- 2.中文包
- 3.格式转化
- 4.运行
3.效果

1.whisper

1.首先安装Chocolatey

https://github.com/openai/whisper
以管理员身份运行PowerShell

Set-ExecutionPolicy Bypass -Scope Process -Force; [System.Net.ServicePointManager]::SecurityProtocol = [System.Net.ServicePointManager]::SecurityProtocol -bor 3072; iex ((New-Object System.Net.WebClient).DownloadString('https://chocolatey.org/install.ps1'))
choco -v#查看版本确定安装成功
Set-ExecutionPolicy AllSigned
Set-ExecutionPolicy Bypass -Scope Process -Force; [System.Net.ServicePointManager]::SecurityProtocol = [System.Net.ServicePointManager]::SecurityProtocol -bor 3072; iex ((New-Object System.Net.WebClient).DownloadString('https://community.chocolatey.org/install.ps1'))

2.安装

choco install ffmpeg
pip install setuptools-rust
pip install -U openai-whisper

3.使用

whisper 1207.m4a --language Chinese --model medium --device cuda:0

2.SpeechRecognition

1.环境

pip install SpeechRecognition
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pocketsphinx

2.中文包

在这个虚拟环境的\site-packages\speech_recognition\pocketsphinx-data目录下添加zh-CN中文包。

3.格式转化

因为这个离线只支持一下三种格式，所以利用ffmpeg将语音转换成wav格式，这个包在装whisper的时候已经装好了，所以直接用：

 ffmpeg -i 12072.m4a output.wav

1.WAV
2.AIFF/AIFF-C
3.FLAC

4.运行

import speech_recognition as sr
audio_file = 'output.wav'
r = sr.Recognizer()
with sr.AudioFile(audio_file) as source:audio = r.record(source)
# 识别音频文件
result = r.recognize_sphinx(audio, language="zh-CN")
print(result)

3.效果

在这里插入图片描述

本地部署语音转文字（whisper，SpeechRecognition）

本地部署语音转文字 1.whisper1.首先安装Chocolatey2.安装3.使用 2.SpeechRecognition1.环境2.中文包3.格式转化4.运行 3.效果 1.whisper 1.首先安装Chocolatey https://github.com/openai/whisper 以管理员身份运行PowerShell Set-ExecutionPolicy Bypass -Scope Process -…...

编程日记 2023/12/16 2:15:34

js new 原理

mdn new new 调用函数时，该函数将被用作构造函数类只能用 new 运算符实例化不使用 new 调用一个类将抛出 TypeError。过程 new Foo(…) 执行时： 创建一个空的简单 JavaScript 对象。为方便起见，我们称之为 newInstance。如果构造函数…...

编程日记 2023/12/16 2:12:31

智能优化算法应用：基于黏菌算法3D无线传感器网络(WSN)覆盖优化 - 附代码

智能优化算法应用：基于黏菌算法3D无线传感器网络(WSN)覆盖优化 - 附代码文章目录智能优化算法应用：基于黏菌算法3D无线传感器网络(WSN)覆盖优化 - 附代码1.无线传感网络节点模型2.覆盖数学模型及分析3.黏菌算法4.实验参数设定5.算法结果6.参考文献7.MA…...

编程日记 2023/12/16 2:08:28

LeetCode每日一题——2132.用邮票贴满网格图

参考资料： 2132. 用邮票贴满网格图 - 力扣（LeetCode） 题目描述给你一个 m x n 的二进制矩阵 grid ，每个格子要么为 0 （空）要么为 1 （被占据）。给你邮票的尺寸为 stampHeight x…...

编程日记 2023/12/16 2:07:27

PyQt6 表单布局Form Layout (QFormLayout)

锋哥原创的PyQt6视频教程： 2024版 PyQt6 Python桌面开发视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili2024版 PyQt6 Python桌面开发视频教程(无废话版) 玩命更新中~共计43条视频，包括：2024版 PyQt6 Python桌面开发视频教程(无废话版…...

编程日记 2023/12/16 2:06:26

Python: any()函数

在Python中，any函数是一个内置函数，它接受一个可迭代对象作为参数，并返回一个布尔值。当可迭代对象中至少一个元素为真（非零、非空、非None等）时，any函数返回True；否则，返回False。 …...

编程日记 2023/12/16 2:05:26

一些AG10K FPGA 调试的建议-Douglas

PLL AGM FPGA 在配置成功时，PLL 已经完成锁定，lock 信号已经变高；如果原设计中用 lock 信号输出实现系统 reset 的复位功能，就不能正确完成上电复位；同时，为了保证 PLL 相移的稳定，我们需要在 P…...

编程日记 2023/12/16 2:03:22

【模型量化】神经网络量化基础及代码学习总结

1 量化的介绍量化是减少神经网络计算时间和能耗的最有效的方法之一。在神经网络量化中，权重和激活张量存储在比训练时通常使用的16-bit或32-bit更低的比特精度。当从32-bit降低到8-bit，存储张量的内存开销减少了4倍，矩阵乘法的计算成本则二…...

编程日记 2023/12/16 1:52:12

次模和K次模是多项式可解吗？

次模是多项式可解吗 **是的，**次模函数的最优化问题通常是多项式时间可解的。这是因为次模性质导致了问题的结构，使得可以利用高效的算法进行求解。具体来说，针对次模函数的最优化问题，例如极大化或极小化这样的目标函数&#xf…...

编程日记 2023/12/16 1:50:11

网络安全——SQL注入实验

一、实验目的要求： 二、实验设备与环境： 三、实验原理： 四、实验步骤： 五、实验现象、结果记录及整理： 六、分析讨论与思考题解答： 七、实验截图： 一、实验目的要求： 1、…...

编程日记 2023/12/16 1:48:09

【cocotb】【达坦科技DatenLord】Cocotb Workshop分享

https://www.bilibili.com/video/BV19e4y1k7EE/?spm_id_from333.337.search-card.all.click&vd_sourcefd0f4be6d0a5aaa0a79d89604df3154a 方便RFM实现 cocotb_test 替代makefile ， 类似python 函数执行...

编程日记 2023/12/16 1:47:08

Kafka系列之：统计kafka集群Topic的分区数和副本数，批量增加topic副本数

Kafka系列之：统计kafka集群Topic的分区数和副本数，批量增加topic副本数一、创建KafkaAdminClient二、获取kafka集群topic元信息三、获取每个topic的名称、分区数、副本数四、生成增加topic副本的json文件五、执行增加topic副本的命令六、确认topic增加副本是否成功一、创建K…...

编程日记 2023/12/16 1:45:06

开具实习证明：在线实习项目介绍

大数据在线实习项目，是在线上为学生提供实习经验的项目。我们希望能够帮助想要在毕业后从事数据科学类工作的学生更加顺利地适应从教室到职场的转换；也帮助那些在工作中需要处理数据、实现数据价值的其他职能的从业者高效快速地掌握每天都能用起来的数据…...

编程日记 2023/12/16 1:43:05

MFC逆向之CrackMe Level3 过反调试 + 写注册机

今天我来分享一下,过反调试的方法以及使用IDA还原代码写注册机的过程由于内容太多,我准备分为两个帖子写,这个帖子主要是写IDA还原代码,下一个帖子是写反调试的分析以及过反调试和异常这个CrackMe Level3是一个朋友发我的,我也不知道他在哪里弄的,我感觉挺好玩的,对反调试…...

编程日记 2023/12/16 1:42:04

【Centos】

一、Virtualbox安装Centos 1、Virtualbox 下载地址: Virtualbox 2、Centos 下载地址: Centos 3、Virtualbox安装Centos教程 Virtualbox安装Centos教程: Virtualbox安装Centos教程...

编程日记 2023/12/16 1:34:59

1+X大数据平台运维职业技能等级证书中级

hadoop： 由于我的功能限制，我无法直接为您执行这些操作或提供实际的截图。但我可以为您提供一步步的指导，帮助您完成这些任务。 1. 解压JDK安装包到“/usr/local/src”路径，并配置环境变量。 - 解压JDK：tar -zxf jd…...

编程日记 2023/12/16 1:33:58

网络基础（五）：网络层协议介绍

目录一、网络层 1、网络层的概念 2、网络层功能 3、IP数据包格式二、ICMP协议 1、ICMP的作用和功能 2、ping命令的使用 2.1ping命令的通用格式 2.2ping命令的常用参数 2.3TypeCode：查看不同功能的ICMP报文 2.4ping出现问题 3、Tracert 4、冲突域 5、…...

编程日记 2023/12/16 1:31:57

浅显易懂 @JsonIgnore 的作用

1.JsonIgnore作用在json序列化/反序列化时将java bean中使用了该注解的属性忽略掉 2.这个注解可以用在类/属性上例如：在返回user对象时，在pwd属性上使用这个注解，返回user对象时会直接去掉pwd这个字段，不管这个属性有没…...

编程日记 2023/12/16 1:28:55

【计算机设计大赛作品】诗意千年—唐朝诗人群像的数字展现_附源码—信息可视化赛道获奖项目深入剖析【可视化项目案例-20】

🎉🎊🎉 你的技术旅程将在这里启航！记得看本专栏里顶置的可视化宝典导航贴哦！ 🚀🚀 本专栏为可视化专栏，包含现有的所有可视化技术。订阅专栏用户在文章底部可下载对应案例完整源码以供大家深入的学习研究。 🎓 每一个案例都会提供完整代码和详细的讲解，不论你…...

编程日记 2023/12/16 1:26:53

「Swift」Xcode多Target创建

前言：我们日常开发中会使用多个环境，如Dev、UAT，每个环境对应的业务功能都不同，但每个环境之间都只存在较小的差异，所以此时可以使用创建多个Target来实现，每个Target对应这个一个App，可以实现一…...

编程日记 2023/12/16 1:25:52

UHP驱动器热管理：Flotherm仿真与优化实践

1. UHP高电流驱动器热设计挑战在投影仪用超高压(UHP)灯驱动器的开发中，热管理始终是制约产品小型化和功率提升的关键瓶颈。飞利浦工业技术中心的案例显示，当驱动器体积从150x73x32mm缩减到120x41x24mm时，功率密度从0.02mW/mm激增至0.18mW/mm—…...

编程新知 2026/5/14 11:11:28

el-tree 动态子节点注入：从点击事件到数据更新的完整实践

1. 理解动态子节点注入的核心需求在实际开发中，我们经常会遇到需要动态加载树形数据的场景。比如一个文件管理系统，用户点击文件夹时才加载其中的内容；或者一个组织架构图，只有展开某个部门时才显示下属员工。这种按需加载的方式…...

编程新知 2026/5/14 11:06:57

Python统一调用多款AI大模型：python-tgpt库实战指南

1. 项目概述：一个让Python与AI对话更简单的工具如果你最近在尝试用Python调用各种大语言模型（LLM）的API，比如OpenAI的GPT、Google的Gemini，或者开源的Llama、Mistral，那你大概率经历过这样的场景&#xff1…...

编程新知 2026/5/14 11:06:57

保姆级教程：用ISO镜像给Vcenter 6.7 U3e无损升级到7.0（附每一步截图和注意事项）

从vCenter 6.7 U3e到7.0的无损升级实战指南在虚拟化运维领域，vCenter的版本迭代往往意味着性能提升和功能增强。对于仍在使用6.7版本的管理员而言，升级到7.0不仅能获得更高效的资源管理能力，还能体验更直观的操作界面。本文将详细解析从6.7 …...

编程新知 2026/5/14 10:32:49

# 软考软件设计师每日精练 | 2026-04-25

📝 软考软件设计师每日精练 | 2026-04-25📅 距离2026年5月23日软考还有 28天！ 今日重点：算法策略辨析线性规划知识产权深化项目管理工具🎯 模块一：算法策略辨析（必考 ★★★★★&#xff…...

编程新知 2026/5/14 10:03:49

基于MCP协议与SearXNG构建AI智能体私有化搜索接口

1. 项目概述：一个为AI智能体打造的“搜索引擎接口”最近在折腾AI智能体（Agent）开发的朋友，可能都听说过MCP（Model Context Protocol）这个协议。简单来说，它就像给AI智能体装上了一套标准化的“插…...

编程新知 2026/5/14 9:20:26

AI编程助手技能化：开源agent-skills项目实战指南

1. 项目概述：为AI编程助手注入“专业技能包” 如果你和我一样，日常重度依赖 Claude Code、Cursor 这类 AI 编程助手来辅助开发和研究，那你肯定遇到过这样的场景：想让 AI 帮你深入理解一篇复杂的数学论文，或者验证一个…...

编程新知 2026/5/14 9:18:17

2026年电工杯比赛思路、Python代码、Matlab代码、论文(持续更新中......)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势：🌞🌞🌞博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。 ⛳️座右铭&a…...

编程新知 2026/5/14 8:39:34

Perplexity + Sage期刊深度协同方案（科研人私藏版）：从模糊关键词到JCR一区论文PDF的全自动链路搭建

更多请点击： https://intelliparadigm.com 第一章：Perplexity Sage期刊深度协同方案（科研人私藏版）：从模糊关键词到JCR一区论文PDF的全自动链路搭建核心协同逻辑：语义增强型检索闭环 Perplexity 的实时…...

编程新知 2026/5/14 6:51:11

株洲彩钢板厂家

彩钢板彩色涂层钢板以冷轧/镀锌钢板为基材，表面脱脂、磷化后，辊涂彩色有机涂层（聚酯、氟碳等），再烘烤成型。二、主要分类（3大类）1. 彩钢压型板（单板/彩钢瓦）• 结构&a…...

编程新知 2026/5/14 6:51:10