当前位置：首页 > news >正文

实时采集到的语音进行语音识别

news 2026/2/9 22:42:23

要在.NET Framework 4.8中使用C#实现离线实时语音识别，可以使用开源库Vosk（支持离线ASR）配合音频处理库NAudio。

步骤 1：安装依赖库
1.1.
安装NuGet包：
- Install-Package NAudio（处理音频输入）
- Install-Package Vosk（离线语音识别引擎）
2.2.
下载语音模型：
- 前往 Vosk Models 下载适合的模型（如小型英文模型 vosk-model-small-en-us-0.15）。
- 解压模型到项目目录（如 Models/vosk-model-small-en-us-0.15）。

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using NAudio.Wave;
using Vosk;
using System.Windows.Forms;
namespace 语音识别
{
public class RealTimeSpeechRecognizer
{private readonly VoskRecognizer _recognizer;private readonly WaveInEvent _waveIn;private readonly RichTextBox _rtb;public RealTimeSpeechRecognizer(string modelPath, RichTextBox rtb){_rtb = rtb;// 初始化VoskModel model = new Model(modelPath);_recognizer = new VoskRecognizer(model, 16000.0f);_recognizer.SetWords(true);// 初始化音频输入_waveIn = new WaveInEvent{WaveFormat = new WaveFormat(16000, 16, 1),DeviceNumber = 0};_waveIn.DataAvailable += OnAudioDataAvailable;}public void StartListening() => _waveIn.StartRecording();public void StopListening() => _waveIn.StopRecording();// 解析JSON结果（兼容部分结果）private string ParseJsonResult(string json, bool isPartial = false){dynamic obj = Newtonsoft.Json.JsonConvert.DeserializeObject(json);return isPartial ? obj.partial : obj.text;}// 线程安全更新RichTextBoxprivate void ShowText(string text){if (_rtb.InvokeRequired){_rtb.BeginInvoke(new Action<string>(ShowText), text);}else{_rtb.AppendText(text);_rtb.ScrollToCaret();}}// 其他字段和构造函数保持不变...private string _lastPartialText = string.Empty;private void OnAudioDataAvailable(object sender, WaveInEventArgs e){if (_recognizer.AcceptWaveform(e.Buffer, e.BytesRecorded)){string result = ParseJsonResult(_recognizer.Result());ClearLastPartial(); // 清理临时部分AppendFinalText(result);}else{string partial = ParseJsonResult(_recognizer.PartialResult(), isPartial: true);UpdatePartialText(partial);}}private void UpdatePartialText(string newPartial){if (newPartial == _lastPartialText) return;// 在主线程更新UI_rtb.BeginInvoke(new Action(() =>{int selectionStart = _rtb.TextLength - _lastPartialText.Length;// 删除旧临时内容if (selectionStart >= 0 && _lastPartialText.Length > 0){_rtb.Select(selectionStart, _lastPartialText.Length);_rtb.SelectedText = "";}// 追加新内容_rtb.AppendText(newPartial);_rtb.ScrollToCaret();// 更新临时记录_lastPartialText = newPartial;}));}private void AppendFinalText(string text){_rtb.BeginInvoke(new Action(() =>{_rtb.AppendText(text + "\n");_lastPartialText = string.Empty; // 重置临时部分}));}private void ClearLastPartial(){if (string.IsNullOrEmpty(_lastPartialText)) return;_rtb.BeginInvoke(new Action(() =>{int start = _rtb.TextLength - _lastPartialText.Length;if (start >= 0){_rtb.Select(start, _lastPartialText.Length);_rtb.SelectedText = "";}}));}
}}

using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.Windows.Forms;
namespace 语音识别
{
public partial class Form1 : Form
{
private RealTimeSpeechRecognizer _recognizer;
public Form1()
{
InitializeComponent();
btnStop.Enabled = false;
}private void button1_Click(object sender, EventArgs e){_recognizer.StopListening();btnStart.Enabled = true;btnStop.Enabled = false;}private void btnStart_Click(object sender, EventArgs e){string modelPath = @"E:\Models\vosk-model-small-cn-0.22"; // 中文模型路径_recognizer = new RealTimeSpeechRecognizer(modelPath, richTextBox1);btnStart.Enabled = false;btnStop.Enabled = true;_recognizer.StartListening();}
}}

实时采集到的语音进行语音识别

要在.NET Framework 4.8中使用C#实现离线实时语音识别，可以使用开源库Vosk（支持离线ASR）配合音频处理库NAudio。步骤 1：安装依赖库 1.1. 安装NuGet包： - Install-Package NAudio（处理音频输入&#xff09…...

编程日记 2025/3/11 15:17:56

Ollama 本地部署 DeepSeek R1 及 Python 运行 open-webui 界面（windows）

DeepSeek R1 ollama open-webui 本地部署（windows） DeepSeek-R1本地部署配置要求 Github地址：https://github.com/deepseek-ai/DeepSeek-R1?tabreadme-ov-file 模型规模最低 GPU 显存推荐 GPU 型号纯 CPU 内存需求适用场景1.5B4GBRTX 3…...

编程日记 2025/3/11 15:15:52

牛客周赛:84:C:JAVA

链接：登录—专业IT笔试面试备考平台_牛客网来源：牛客网题目描述 \hspace{15pt}本题为《D.小红的陡峭值（三）》的简单版本，两题的唯一区别在于本题的数据范围更小。 \hspace{15pt}小红定义一个字符串的陡峭值为&a…...

编程日记 2025/3/11 15:12:47

5. 前后端实现文件上传与解析

1. 说明在实际开发中，比较常见的一个功能是需要在前端页面中选择系统中的某个文件上传到服务器中进行解析，解析后的文件内容可以用来在服务器中当作参数，或者传递给其它组件使用，或者需要存储到数据库中。所以本文就提供一种方式…...

编程日记 2025/3/11 15:08:41

SpringBoot 接入豆包火山方舟大模型

火山方舟控制台开通模型推理、知识库应用入口； 文档中心各类接口说明及SDK 获取； 向量数据库VikingDB 文档下翻找到有java操作案例； 实现目标功能效果： 通过SDK调用豆包大模型，在代码内实现问答的效果&#xf…...

编程日记 2025/3/11 15:07:40

IDEA接入阿里云百炼中免费的通义千问[2025版]

安装deepseek 上一篇文章IDEA安装deepseek最新教程2025中说明了怎么用idea安装codeGPT插件，并接入DeepSeek，无奈接入的官方api已经不能使用了，所以我们尝试从其他地方接入阿里云百炼https://bailian.console.aliyun.com/ 阿里云百炼‌是阿…...

编程日记 2025/3/11 14:57:24

下载kali linux遇到的一些问题

kali官网：kali官网跳转问题一：未启动VM Service VMware Workstation 未能启动 VMware Authorization Service。您可以尝试手动启动VMware Authorization Service。如果此问题仍然存在，请联系VMware 支持部门。解决办法： 步骤1…...

编程日记 2025/3/11 14:56:22

常见排序算法深度评测：从原理到10万级数据实战

常见排序算法深度评测：从原理到10万级数据实战摘要本文系统解析冒泡排序、选择排序、插入排序、希尔排序、归并排序、快速排序、堆排序和基数排序8种经典算法，通过C语言实现10万随机数排序并统计耗时。测试显示：快速排序综合性能最优&…...

编程日记 2025/3/11 14:53:18

Scaled_dot_product_attention(SDPA)使用详解

在学习huggingFace的Transformer库时，我们不可避免会遇到scaled_dot_product_attention(SDPA)这个函数，它被用来加速大模型的Attention计算，本文就详细介绍一下它的使用方法，核心内容主要参考了torch.nn.functional中该函数的注释…...

编程日记 2025/3/11 14:51:15

Linux练级宝典-＞Linux进程概念介绍

目录进程基本概念 PCB概念 task_struct tack_struct内容分类 PID和PPID fork函数创建子进程进程优先级概念 4个名词进程地址空间进程地址空间的意义内核进程调度队列优先级活动队列过期队列进程基本概念一个正在执行的程序。担当分配系统资源的实体&#…...

编程日记 2025/3/11 14:47:08

OpenHarmony 5.0 mpegts封装的H265视频播放失败的解决方案

问题现象 OpenHarmony 5.0版本使用AVPlayer播放mpegts封装格式的H.265(HEVC)编码格式的视频时出现报错导致播放失败问题原因 OpenHarmony 5.0版本AVPlayer播放器使用histreamer引擎，因为 libav_codec_hevc_parser.z.so 动态库未开源导致H265编码格式视频解析不到…...

编程日记 2025/3/11 14:45:00

Qt从入门到入土（九) -model/view（模型/视图）框架

简介 Qt的模型/视图（Model/View）架构是一种用于分离数据处理和用户界面展示的设计模式。它允许开发者将数据存储和管理（模型）与数据的显示和交互（视图）解耦，从而提高代码的可维护性和可扩展性。…...

编程日记 2025/3/11 14:43:58

缓存之美：Guava Cache 相比于 Caffeine 差在哪里？

大家好，我是方圆。本文将结合 Guava Cache 的源码来分析它的实现原理，并阐述它相比于 Caffeine Cache 在性能上的劣势。为了让大家对 Guava Cache 理解起来更容易，我们还是在开篇介绍它的原理： Guava Cache 通过分段（…...

编程日记 2025/3/11 14:42:57

[漏洞篇]XSS漏洞详解

[漏洞篇]XSS漏洞一、介绍概念 XSS：通过JS达到攻击效果 XSS全称跨站脚本(Cross Site Scripting)，为避免与层叠样式表(Cascading Style Sheets, CSS)的缩写混淆，故缩写为XSS。这是一种将任意 Javascript 代码插入到其他Web用户页面里执行以…...

编程日记 2025/3/11 14:39:52

【Leetcode 每日一题】2269. 找到一个数字的 K 美丽值

问题背景一个整数 n u m num num 的 k k k 美丽值定义为 n u m num num 中符合以下条件的子字符串数目： 子字符串长度为 k k k。子字符串能整除 n u m num num。给你整数 n u m num num 和 k k k，请你返回 n u m num num 的 k k k 美丽值…...

编程日记 2025/3/11 14:37:50

IO进程线程（线程）

作业 1.创建两个线程，分支线程1拷贝文件的前一部分，分支线程2拷贝文件的后一部分 2.创建三个线程，实现线程A打印A，线程B打印B，线程C打印C；重复打印顺序ABC。信号量实现： 条件变量实现&#x…...

编程日记 2025/3/11 14:34:47

1-002：MySQL InnoDB引擎中的聚簇索引和非聚簇索引有什么区别？

在 MySQL InnoDB 存储引擎中，索引主要分为聚簇索引（Clustered Index） 和非聚簇索引（Secondary Index）。它们的主要区别如下： 1. 聚簇索引（Clustered Index） 定义聚簇索引是表数…...

编程日记 2025/3/11 14:33:45

tomcat单机多实例部署

一、部署方法多实例可以运行多个不同的应用，也可以运行相同的应用，类似于虚拟主机，但是他可以做负载均衡。方式一： 把tomcat的主目录挨个复制，然后把每台主机的端口给改掉就行了。优点是最简单最直接，…...

编程日记 2025/3/11 14:29:39

概述题目：A Unified Self-Distillation Framework for Multimodal Sentiment Analysis with Uncertain Missing Modalities 发表：The Thirty-Eighth AAAI Conference on Artificial Intelligence (AAAI-24) 年份：2024 Github：暂…...

编程日记 2025/3/11 14:27:37

解决asp.net mvc发布到iis下安全问题

解决asp.net mvc发布到iis下安全问题环境信息1.The web/application server is leaking version information via the "Server" HTTP response2.确保您的Web服务器、应用程序服务器、负载均衡器等已配置为强制执行Strict-Transport-Security。3.在HTML提交表单中找不…...

编程日记 2025/3/11 14:24:29