当前位置：首页 > news >正文

sherpa-onnx说话人识别+语音识别自动开启（VAD）+语音识别Python API

news 2026/5/16 6:35:35

专栏总目录

获取该开源项目的渠道，是我在b站上，看到了由csukuangfj制作的一套语音识别视频。以下地址均为csukuangfj在视频中提供，感谢分享！

新一代 Kaldi: 说话人识别+VAD+语音识别之 Python API_哔哩哔哩_bilibili

开源项目地址：GitHub - k2-fsa/sherpa-onnx: Speech-to-text, text-to-speech, and speaker recognition using next-gen Kaldi with onnxruntime without Internet connection. Support embedded systems, Android, iOS, Raspberry Pi, RISC-V, x86_64 servers, websocket server/client, C/C++, Python, Kotlin, C#, Go, NodeJS, Java, Swift, Dart, JavaScript

文档地址：sherpa-onnx — sherpa 1.3 documentation

我之前已经使用了sherpa-ncnn和安装了kaldi，所以有些需要安装依赖的情况，跟大家会有不同。相关依赖安装情况，可以参考使用sherpa-ncnn进行中文语音识别（ubuntu22）-CSDN博客和详细解析Ubuntu22 部署Kaldi大模型_kaldi布署-CSDN博客两篇文章。

一、安装sherpa-onnx模型

文档中介绍了多种语言及环境的使用方法，这里只针对python开发包的安装使用进行测试。

（一）下载模型脚本文件

从开源项目地址下载文件：GitHub - k2-fsa/sherpa-onnx: Speech-to-text, text-to-speech, and speaker recogni

sherpa-onnx说话人识别+语音识别自动开启（VAD）+语音识别Python API

专栏总目录获取该开源项目的渠道，是我在b站上，看到了由csukuangfj制作的一套语音识别视频。以下地址均为csukuangfj在视频中提供，感谢分享！新一代 Kaldi: 说话人识别+VAD+语音识别之 Python API_哔哩哔哩_bilibili 开源项目地址：GitHub - k2-fsa/sherpa-onnx: Speech-t…...

编程日记 2024/6/19 9:31:35

提取人脸——OpenCV

提取人脸导入所需的库创建窗口显示原始图片显示检测到的人脸创建全局变量定义字体对象定义一个函数select_image定义了extract_faces函数设置按钮运行GUI主循环运行显示导入所需的库 tkinter：用于创建图形用户界面。 filedialog：用于打开文件对话框。 …...

编程日记 2024/6/19 9:30:31

python数据可视化：在图形中添加注释matplotlib.pyplot.annotate()

【小白从小学Python、C、Java】【考研初试复试毕业设计】【Python基础AI数据分析】 python数据可视化： 在图形中添加注释 matplotlib.pyplot.annotate() 请问关于以下代码表述正确的选项是？ import matplotlib.pyplot as plt x [1, 2, 3, 4, 5] y […...

编程日记 2024/6/19 9:28:26

IDEA debug 调试Evaluate Expression应用

链接： https://blog.csdn.net/xfx_1994/article/details/104136849?utm_mediumdistribute.pc_aggpage_search_result.none-task-blog-2aggregatepagefirst_rank_v2~rank_aggregation-2-104136849.pc_agg_rank_aggregation&utm_termidea%E4%B8%ADevaluate&s…...

编程日记 2024/6/19 9:26:23

04-echarts-立体柱状图扩展

柱状图扩展一、前言二、思路1、新增面①、在drawShape方法中，新增一个实际左侧面，②、在drawShape方法中，新增一个实际右侧面，③ 绘制 2、新增series对象① 添加实际值的左侧面和右侧面三、效果图一、前言事情是这样子的&am…...

编程日记 2024/6/19 9:25:20

HTML5 Web Workers: 异步编程的强大力量

在现代Web开发中，随着应用程序变得越来越复杂，用户界面的流畅性和响应性成为了决定用户体验好坏的关键因素之一。传统的JavaScript执行模型中，所有脚本都在同一个线程上运行，这意味着复杂的计算任务会阻塞UI更新，导致页…...

编程日记 2024/6/19 9:23:16

Flutter第十二弹 Flutter多平台运行

目标： 1.在多平台调试启动Flutter程序运行一、安卓模拟器 1.1 检查当前Flutter适配的版本 flutter doctor提供了Flutter诊断。 $ flutter doctor --verbose /Users/zhouronghua/IDES/flutter/bin/flutter doctor --verbose [✓] Flutter (Channel master, 2.1…...

编程日记 2024/6/19 9:21:11

30天学会QT---------------大项目之在线考试系统

前段时间真的很忙很忙，忙完这段时间，总算是有空来写文章了，开始写的时候我就以为能够有时间准备和写这个，但是发现有时候忙着忙着就忘记了，没有办法来写项目，真的是非常尴尬。现在有时间了，就有充分的时间来写了。为了避免笔记断更，我决定先存稿来写。 1、如何规划项…...

编程日记 2024/6/19 9:20:06

搜维尔科技：力反馈主手—手术机器人应用〈腔镜手术机器人平台—进入手术室动物实验〉

力反馈主手—手术机器人应用〈腔镜手术机器人平台—进入手术室动物实验〉搜维尔科技：力反馈主手—手术机器人应用〈腔镜手术机器人平台—进入手术室动物实验〉...

编程日记 2024/6/19 9:19:01

缓存技术实战[一文讲透!](Redis、Ecache等常用缓存原理介绍及实战)

目录文章目录目录缓存简介工作原理缓存分类1.按照技术层次分类2.按照应用场景分类3.按照缓存策略分类应用场景1.硬件缓存2.软件缓存数据库缓存Web开发应用层缓存 3.分布式缓存4.微服务架构5.移动端应用6.大数据处理7.游戏开发缓存优点缓存带来的问题常见常用Java缓存技术1…...

编程日记 2024/6/19 9:16:58

初识es（elasticsearch）

初识elasticsearch 什么是elasticsearch？： 一个开源的分部署搜索引擎、可以用来实现搜索、日志统计、分析、系统监控等功能。什么是文档和词条？ 每一条数据就是一个文档对文档中的内容进行分词，得到的词语就是词条什么是正向…...

编程日记 2024/6/19 9:15:56

AI在线免费视频工具2：视频配声音

1、视频配声音 https://deepmind.google/discover/blog/generating-audio-for-video/ https://www.videotosoundeffects.com/ （免费在线使用）...

编程日记 2024/6/19 9:14:52

Kafka 如何保证消息顺序及其实现示例

Kafka 如何保证消息顺序及其实现示例 Kafka 保证消息顺序的机制主要依赖于分区（Partition）的概念。在 Kafka 中，消息的顺序保证是以分区为单位的。下面是 Kafka 如何保证消息顺序的详细解释： ⭕分区内消息顺序顺序写入&#…...

编程日记 2024/6/19 9:13:50

内存分配器性能优化

背景在之前我们提到采用自定义的内存分配器来解决防止频繁 make 导致的 gc 问题。gc 问题本质上是 CPU 消耗，而内存分配器本身如果产生了大量的 CPU 消耗那就得不偿失。经过测试初代内存分配器实现过于简单，产生了很多 CPU 消耗，因此必须优…...

编程日记 2024/6/19 9:12:47

《OKR工作法》读书笔记

花了两个晚上的时间看完了《OKR工作法》这本书，谈不上有什么感想，因为工作后，其实就一直在用这种方法，所谓当局者迷嘛，习以为常也就谈不上多少新的启发。所以，这篇文章纯粹是一篇读书笔记，把我认…...

编程日记 2024/6/19 9:10:41

2025年计算机毕业设计题目参考-简单容易

2025年最新计算机毕业设计题目参考-第二批以下可以参考企业员工薪酬关系系统的设计基于SpringBoot在线远程考试系统 SpringBootVue的乡政府管理系统 springboot青年公寓服务平台 springboot大学生就业需求分析系统基于Spring Boot的疗养院管理系统基于SpringBoot的房屋交…...

编程日记 2024/6/19 9:09:39

3.8. 马氏链-一般状态空间的马氏链(Harris链)

一般状态空间的马氏链-Harris链 1. Harris链及示例1.1. Harris链1.2. 示例2. 修改的Harris链（ X ˉ n \bar{X}_{n} Xˉn）2.1. 修改的Harris链（ X ˉ n \bar{X}_{n} Xˉn）2.2. 三个引理（可以从 X ˉ n \bar{X}_{n} Xˉn的结论推出 X n X_{n} Xn的结论）3. 推广相关…...

编程日记 2024/6/19 9:08:36

Python8 使用结巴（jieba）分词并展示词云

Python的结巴（jieba）库是一个中文分词工具，主要用于对中文文本进行分词处理。它可以将输入的中文文本切分成一个个独立的词语，为后续的文本处理、分析、挖掘等任务提供基础支持。结巴库具有以下功能和特点： 中文分词&a…...

编程日记 2024/6/19 9:06:33

python中scrapy

安装环境 pip install scrapy 发现Twisted版本不匹配卸载pip uninstall Twisted 安装 pip install Twisted22.10.0 新建scrapy项目 scrapy startproject 项目名注意：项目名称不允许使用数字开头，也不能包含中文 eg: scrapy startproject scrapy_baidu_…...

编程日记 2024/6/19 9:05:31

基础语法总结 —— Python篇

1、环境搭建建议直接安装 PyCharm （Community Edition） Python3.x版本，前者是一个很好用的编译器，后者是Python的运行环境之类的，安装参考https://mp.csdn.net/mp_blog/creation/editor/139511640 2、标识符第一个…...

编程日记 2024/6/19 8:58:20

别光训练模型了！用YOLOv5+OpenCV做个实时手势控制小游戏（Python源码分享）

用YOLOv5OpenCV打造手势控制游戏：从模型部署到交互设计实战当计算机视觉遇上游戏设计，会碰撞出怎样的火花？本文将带你跨越AI模型部署与交互开发的鸿沟，用不到200行Python代码实现一个可通过手势控制的"太空侵略者"风格…...

编程新知 2026/5/16 5:36:00

代理池管理工具ccproxypal：自动化代理验证、调度与API集成实战

1. 项目概述与核心价值最近在折腾一些需要处理大量网络请求和代理配置的项目时，发现了一个挺有意思的工具，叫lngdao/ccproxypal。乍一看这个名字，可能有点摸不着头脑，但如果你也经常和代理服务器、请求转发、IP池管理这些事儿打交…...

编程新知 2026/5/16 5:34:00

大语言模型对抗性攻击与防御：Decepticon框架原理与实践

1. 项目概述：当AI学会“伪装”，一场攻防博弈的新范式最近在安全圈和AI研究领域，一个名为“Decepticon”的项目引起了我的注意。这个项目来自PurpleAILAB，名字本身就充满了对抗的意味——“Decepticon”直译是“霸天虎”&#xff0…...

编程新知 2026/5/16 5:13:36

Wonder3D完整教程：如何用单张图片快速生成3D模型

Wonder3D完整教程：如何用单张图片快速生成3D模型【免费下载链接】Wonder3D Single Image to 3D using Cross-Domain Diffusion for 3D Generation 项目地址: https://gitcode.com/gh_mirrors/wo/Wonder3D 想要将一张普通的图片变成立体的3D模型吗&#xff1…...

编程新知 2026/5/16 4:35:45

Go语言外部服务调用可靠性实践：Icepick库的重试、熔断与并发控制

1. 项目概述与核心价值最近在折腾一个需要深度集成多个外部API的后端服务，遇到了一个老生常谈但又极其棘手的问题：如何优雅、可靠地处理那些可能失败的外部调用？重试、熔断、降级、超时控制……这些概念听起来都懂，但真要把它们组…...

编程新知 2026/5/16 4:35:43

AI计算工作量化模型：跨硬件效能评估与能效优化

1. AI工作量化模型的核心价值与应用场景在当今AI技术快速渗透到各行各业的背景下，如何准确衡量AI系统的计算效率和工作量成为一个关键问题。传统上，我们使用FLOPs（每秒浮点运算次数）等指标来评估计算性能，但这些指标存…...

编程新知 2026/5/16 4:19:15

RAG系统评估实战：使用renumics-rag进行量化分析与性能优化

1. 项目概述：一个为RAG应用量身定制的开源评估工具如果你正在构建或优化一个基于检索增强生成（RAG）的系统，那么你大概率会遇到一个核心痛点：如何科学、量化地评估它的好坏？是看它回答得“像不像人”&#x…...

编程新知 2026/5/16 2:31:13

15分钟掌握ColorUI：打造高颜值小程序的终极色彩解决方案

15分钟掌握ColorUI：打造高颜值小程序的终极色彩解决方案【免费下载链接】coloruicss 鲜亮的高饱和色彩，专注视觉的小程序组件库项目地址: https://gitcode.com/gh_mirrors/co/coloruicss 还在为小程序界面设计而烦恼吗？ColorUI色彩系…...

编程新知 2026/5/16 1:17:42

NotebookLM辅助CRISPR靶点筛选实操：从NCBI SRA原始数据到脱靶风险摘要，限时开放实验日志包

更多请点击： https://intelliparadigm.com 第一章：NotebookLM生物学研究辅助 NotebookLM 是 Google 推出的基于 LLM 的研究型笔记工具，专为科研人员设计，其核心能力在于对私有文档（如 PDF、TXT）进行深度语…...

编程新知 2026/5/16 1:13:15

调试效率翻倍：在VSCode里实时查看PY32的RTT日志（JLink OB就行）

嵌入式开发效率革命：VSCode集成JLink RTT日志全攻略 1. 嵌入式开发者的效率痛点与解决方案在嵌入式开发领域，调试信息的输出一直是影响开发效率的关键环节。传统方式通常需要依赖串口输出，开发者不得不在多个工具间频繁切换——编写代码时使…...

编程新知 2026/5/16 0:36:58

专栏总目录

一、安装sherpa-onnx模型

（一）下载模型脚本文件

相关文章：