当前位置：首页 > news >正文

[PaddlePaddle飞桨] PaddleSpeech-自动语音识别-小模型部署

news 2026/5/25 22:12:25

PaddleSpeech的GitHub项目地址
环境要求：

gcc >= 4.8.5
paddlepaddle <= 2.5.1
python >= 3.8
OS support: Linux(recommend), Windows, Mac OSX

pip下载指令：

python -m pip install paddlepaddle-gpu==2.5.1 -i https://pypi.tuna.tsinghua.edu.cn/simple  pip install paddlespeech==1.4.1

小模型配置代码：

from paddlespeech.cli.asr.infer import ASRExecutorASR_MODELS = ['conformer_wenetspeech-zh-16k', 'conformer_online_wenetspeech-zh-16k','conformer_u2pp_online_wenetspeech-zh-16k','conformer_online_multicn-zh-16k', 'conformer_aishell-zh-16k', 'conformer_online_aishell-zh-16k','transformer_librispeech-en-16k', 'deepspeech2online_wenetspeech-zh-16k','deepspeech2offline_aishell-zh-16k','deepspeech2online_aishell-zh-16k', 'deepspeech2offline_librispeech-en-16k','conformer_talcs-codeswitch_zh_en-16k']
ASR_MODEL = 'conformer_wenetspeech'
ASR_EXECUTOR = ASRExecutor()

音频文件保存代码：

import io
import os
import uuid
import soundfile as sf
# 将音频数据转换并保存为16kHz采样率、16位量化深度、单声道的WAV文件
def save_audio_file(file_path, file_content):# 生成一个唯一的文件名unique_filename = str(uuid.uuid4()) + ".wav"# 确保目录存在if not os.path.exists(file_path):os.makedirs(file_path)try:# 将文件流转换为音频数据audio_data, sample_rate = sf.read(io.BytesIO(file_content.read()))# 构建完整的文件路径file_path_with_file_name = os.path.join(file_path, unique_filename)# # 重采样音频数据到16kHz，单声道，16位if sample_rate != 16000:from scipy.signal import resamplenum_samples = int(len(audio_data) * (16000 / sample_rate))audio_data = resample(audio_data, num_samples)sample_rate = 16000# 保存音频数据为16位，16kHz，单声道的WAV文件sf.write(file_path_with_file_name, audio_data, 16000, subtype='PCM_16')return file_path_with_file_name, sample_rateexcept Exception as e:print(f"Error saving file: {e}")return None

获取语音识别结果代码：

import os
# 获取指定文件的语音识别结果
def get_text_with_asr(file_path_with_file_name, sample_rate):if not os.path.exists(file_path_with_file_name):return Noneasr_result = ASR_EXECUTOR(audio_file=file_path_with_file_name,model=ASR_MODEL,# sample_rate=sample_rate,# lang='zh')return asr_result

音频转文字代码：

import os
# 音频转文字(上传音频文件)
def audio_to_text(file_content, file_name):file_path_without_file_name = '.' + STATIC_FILE_PATH + "/"if not os.path.exists(file_path_without_file_name):os.makedirs(file_path_without_file_name)file_path_with_file_name, sample_rate = save_audio_file(file_path_without_file_name, file_content)asr_result = get_text_with_asr(file_path_with_file_name, sample_rate)return asr_result

[PaddlePaddle飞桨] PaddleSpeech-自动语音识别-小模型部署

PaddleSpeech的GitHub项目地址环境要求： gcc > 4.8.5 paddlepaddle < 2.5.1 python > 3.8 OS support: Linux(recommend), Windows, Mac OSXpip下载指令： python -m pip install paddlepaddle-gpu2.5.1 -i https://pypi.tuna.tsinghua.edu.c…...

编程日记 2024/7/13 23:45:47

redis查询慢，你们是如何排查优化的?（总结篇）

1，先进行基准测试，查看redis是否存在查询过慢情况，根据自己的情况而定 2、检查网络连接是否出现延迟，数据丢包问题（可能性小 3、开启慢查询日志，通过日志可以清楚知道哪些命令比较耗时，同时避…...

编程日记 2024/7/13 23:43:45

Docker 容器出现 IP 冲突

Docker 容器出现 IP 冲突的情况可能由以下几个原因导致： 静态 IP 分配：如果你在 docker-compose.yml 文件中为多个容器手动设置了相同的静态 IP 地址，那么这些容器在启动时就会出现 IP 冲突。确保每个容器分配的静态 IP 地址是唯一的。桥接网…...

编程日记 2024/7/13 23:41:43

paddlepaddle2.6,paddleorc2.8,cuda12,cudnn,nccl,python10环境

1.安装英伟达显卡驱动首先需要到NAVIDIA官网去查自己的电脑是不是支持GPU运算。网址是：CUDA GPUs | NVIDIA Developer。打开后的界面大致如下，只要里边有对应的型号就可以用GPU运算，并且每一款设备都列出来相关的计算能力（Compu…...

编程日记 2024/7/13 23:38:40

【D3.js in Action 3 精译】1.3 D3 视角下的数据可视化最佳实践（上）

当前内容所在位置第一部分 D3.js 基础知识第一章 D3.js 简介 1.1 何为 D3.js？1.2 D3 生态系统——入门须知 1.2.1 HTML 与 DOM1.2.2 SVG - 可缩放矢量图形1.2.3 Canvas 与 WebGL1.2.4 CSS1.2.5 JavaScript1.2.6 Node 与 JavaScript 框架1.2.7 Observable 记事本 1…...

编程日记 2024/7/13 23:36:38

如何在Linux上如何配置虚拟主机

在Linux上配置虚拟主机可以通过使用Apache HTTP服务器来实现。Apache是一个开源的跨平台的Web服务器软件，可以在多种操作系统上运行并支持虚拟主机的配置。以下是在Linux上配置虚拟主机的步骤： 安装Apache HTTP服务器在终端中运行以下命令来安装Apache…...

编程日记 2024/7/13 23:35:38

c语言alpha-beta剪枝六子棋

c语言Alpha-Beta剪枝算法六子棋[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-2i5w8kc1-1720756528545)(https://i-blog.csdnimg.cn/direct/464b9db7d6384a63ab8c3213efff0e99.png)] 1.介绍 Alpha-Beta剪枝算法是一种用于优化博弈树搜索的算法&…...

编程日记 2024/7/13 23:31:34

基于PyTorch深度学习实践技术应用

近年来，Python语言由于其开源、简单等特点，受到了广大程序开发者的偏爱，丰富的函数库使得其在各行各业中得到了广泛的应用。伴随着新一轮人工智能（尤其是深度学习）的快速发展，许多深度学习框架应运而生&…...

编程日记 2024/7/13 23:30:33

数据湖仓一体(五)安装spark

上传安装包到/opt/software目录并解压 [bigdatanode106 software]$ tar -zxvf spark-3.3.1-bin-hadoop3.tgz -C /opt/services/ 重命名文件 [bigdatanode106 services]$ mv spark-3.3.1-bin-hadoop3 spark-3.3.1 配置环境变量 [bigdatanode106 ~]$ sudo vim /etc/profile…...

编程日记 2024/7/13 23:28:32

项目收获总结--本地缓存方案选型及使用缓存的坑

本地缓存方案选型及使用缓存的坑一、摘要二、本地缓存三、本地缓存实现方案3.1 自己编程实现一个缓存3.2 基于 Guava Cache 实现本地缓存3.3 基于 Caffeine 实现本地缓存3.4 基于 Encache 实现本地缓存3.5 小结四、使用缓存的坑4.1 缓存穿透4.2 缓存击穿4.3 缓存雪崩4.4 数据…...

编程日记 2024/7/13 23:27:31

java使用poi-tl模版引擎导出word之if判断条件的使用

文章目录模版中if语句条件的使用1.数据为False或空集合2.非False或非空集合模版中if语句条件的使用如果区块对的值是 null 、false 或者空的集合，位于区块中的所有文档元素将不会显示，这就等同于if语句的条件为 false。语法示例：{{?stat…...

编程日记 2024/7/13 23:26:29

扩散的魔法：如何打造未来生物打印？

生物打印技术正在快速发展，它允许我们将生物材料、细胞和生长因子等生物活性成分精确地打印成具有特定形状和功能的结构。而扩散现象在生物打印中扮演着至关重要的角色，它影响着打印结构的特性、机械性能、生物功能和形态。为了更好地利用扩散现象&#…...

编程日记 2024/7/13 23:25:29

Bag of mice(概率dp)

https://www.luogu.com.cn/problem/CF148D 思路： 概率dp，设f[a][b]为白鼠为a个，黑鼠为b个时，赢的期望。 f[i][0]1; 1.当先手取到白鼠时 a/(ab); 2.当先手未取到白鼠，先手要向赢，后手也不能取到白鼠&am…...

编程日记 2024/7/13 23:22:26

Python的基础语法——持续更新版

1、type查看数据类型 # 直接输出结果 print(type("Hello")) # 先用变量存储 string_type type("Hello") print(string_type) 2、类型转化任何类型可以转化为字符串，但字符串不可以随意转化，要求字符串类内容都是数字 # 类型…...

编程日记 2024/7/13 23:20:23

百度智能云将大模型引入网络故障定位的智能运维实践

物理网络中，某个设备发生故障，可能会引起一系列指标异常的告警。如何在短时间内从这些告警信息中找到真正的故障原因，犹如大海捞针，对于运维团队是一件很有挑战的事情。在长期的物理网络运维工作建设中，百度智能云通…...

编程日记 2024/7/13 23:18:21

晚上定时编译android系统

1、问题可能偶然想晚上定时编译android系统 2、解决 at.sh #!/bin/sh# at -f at.sh now1min # at -lset -e set -xecho $SHELLecho at build begin /bin/date >> at_build.log/bin/bash -c source build/envsetup.sh >> at_build.log 2>&1; lunch xxx-us…...

编程日记 2024/7/13 23:16:19

轻薄鼠标的硬核选购攻略，很多人都在“高性价比”鼠标上栽跟头了

轻薄款设计的鼠标是目前鼠标市场的出货大头， 也是价格最卷的一类鼠标。比游戏鼠标或许更卷一些。这和当前的移动办公趋势关系很大。这类鼠标主要跟笔记本和iPad搭配。核心的使用场景是办公。因此轻薄和静音是这类鼠标的核心卖点。同时用户并不愿意付出太…...

编程日记 2024/7/13 23:11:15

Python制作签到系统

import datetime sign_in_records {} def sign_in(username): today datetime.date.today() if username not in sign_in_records: sign_in_records[username] [] sign_in_records[username].append(today) print(f"{username} 签到成功&#…...

编程日记 2024/7/13 23:10:14

面试题007-Java-Spring

面试题007-Java-Spring 目录面试题007-Java-Spring题目自测题目答案1. 简单介绍一下Spring？2. Spring有哪些模块？3. 什么是Spring IoC ?4. 什么是依赖注入？有哪几种方式可以进行依赖注入？5. 什么是Spring AOP ？6. 什…...

编程日记 2024/7/13 23:09:13

后端之路——登录校验前言（Cookie\ Session\ JWT令牌）

前言：Servlet 【登录校验】这个功能技术的基础是【会话技术】，那么在讲【会话技术】的时候必然要谈到【Cookie】和【Session】这两个东西，那么在这之前必须要先讲一下一个很重要但是很多人都会忽略的一个知识点：【Servlet】什么是…...

编程日记 2024/7/13 23:08:12

深度解析HS2-HF Patch：从技术框架到创作工具链的完整升级方案

深度解析HS2-HF Patch：从技术框架到创作工具链的完整升级方案【免费下载链接】HS2-HF_Patch Automatically translate, uncensor and update HoneySelect2! 项目地址: https://gitcode.com/gh_mirrors/hs/HS2-HF_Patch 你是否曾因Honey Select 2的原版体验受…...

编程新知 2026/5/25 21:31:51

Adobe-GenP 3.0：轻松激活Adobe全家桶的完整指南

Adobe-GenP 3.0：轻松激活Adobe全家桶的完整指南【免费下载链接】Adobe-GenP Adobe CC 2019/2020/2021/2022/2023 GenP Universal Patch 3.0 项目地址: https://gitcode.com/gh_mirrors/ad/Adobe-GenP Adobe-GenP 3.0是一款专为Adobe Creative Cloud系列软件…...

编程新知 2026/5/25 20:57:14

InVideo插件深度解析：如何在Unreal Engine中实现高效视频流播放与录制

InVideo插件深度解析：如何在Unreal Engine中实现高效视频流播放与录制【免费下载链接】InVideo 基于UE4实现的rtsp的视频播放插件项目地址: https://gitcode.com/gh_mirrors/in/InVideo InVideo是一个基于Unreal Engine 5开发的RTSP视频播放插件&#xff0…...

编程新知 2026/5/25 20:57:14

别再只用鼠标了！用Leap Motion手势控制Unity游戏，保姆级配置避坑指南（2024版）

2024年Unity手势交互开发实战：Leap Motion从配置到游戏逻辑全解析在游戏开发领域，交互方式的创新往往能带来全新的体验。想象一下，玩家不再需要键盘鼠标，仅凭自然的手部动作就能操控游戏角色——这正是Leap Motion手势识别技术为U…...

编程新知 2026/5/25 20:49:10

NBTExplorer：让Minecraft数据编辑从专业工具变成人人可用的可视化平台

NBTExplorer：让Minecraft数据编辑从专业工具变成人人可用的可视化平台【免费下载链接】NBTExplorer A graphical NBT editor for all Minecraft NBT data sources 项目地址: https://gitcode.com/gh_mirrors/nb/NBTExplorer 你是否曾经面对Minecraft世界文件…...

编程新知 2026/5/25 19:36:54

基于C#实现（WinForm）P2P聊天程序

♻️ 资源大小： 29.8MB ➡️ 资源下载：https://download.csdn.net/download/s1t16/87430269 p2p聊天程序一、功能介绍 1.1 登录用户凭用户名和密码登录系统，可以更换服务器 IP 和端口，以防网络不畅通，连接服务…...

编程新知 2026/5/25 18:03:50

Fiddler手机断网真相：TLS握手与证书固定的协议级拦截

1. 为什么Fiddler一开，手机就断网？这不是配置问题，是协议层的“信任危机”Fiddler抓包手机流量，本该是移动开发、测试、安全分析中最基础的操作之一。但几乎每个刚上手的人，都会在第二天早上发现：手机Wi-Fi…...

编程新知 2026/5/25 16:19:43

终极指南：用AlwaysOnTop免费开源工具彻底改变你的Windows工作方式

终极指南：用AlwaysOnTop免费开源工具彻底改变你的Windows工作方式【免费下载链接】AlwaysOnTop Make a Windows application always run on top 项目地址: https://gitcode.com/gh_mirrors/al/AlwaysOnTop 你是否经常在多个窗口间来回切换，浪费宝…...

编程新知 2026/5/25 16:15:26

原来专业的赛事专用匹克球厂家有这么多门道？

引言在匹克球运动蓬勃发展的当下，专业赛事专用匹克球的选择至关重要。很多人可能不知道，看似普通的赛事专用匹克球背后，其实隐藏着诸多门道。接下来，我们就一起深入探究专业赛事专用匹克球厂家的秘密。核心技术与材料的门道专业赛…...

编程新知 2026/5/25 15:28:08

第5章薪资重构——AI时代的程序员价值重估

第5章薪资重构——AI时代的程序员价值重估核心问题：AI时代，程序员的薪资会发生怎样的变化？哪些人在涨薪？哪些人在降薪？ 5.1 问题定义：薪资分化的真相是什么？ 5.1.1 一个令人震惊的数据 2026年第一季度，一个对比让整个技术圈哗然：同一家公司内部： - 一个AI方向…...

编程新知 2026/5/25 15:11:52

相关文章：