音频分割:长语音音频 分割为 短语音音频 - python 实现
在做语音任务时,有是会用到的语音音频是长音频,这就需要我们将长音频分割为短音频。
该示例将声音的音量和静默时间结合作为语音的分割条件。
使用音量和静默时间结合的分割条件,能够比较好的进行自然断句,不会话语没有说完就切断音频。
按照 python 库:
pip install pydub
具体实现代码如下:
#-*-coding:utf-8-*-
# date:2024-10
# Author: DataBall - XIAN
# Function: 长音频分割为短音频from pydub import AudioSegment
from pydub.silence import split_on_silence
import os
import wave
import shutil
# 初始化
chunks_path = "./short_audio/" # 保存分割段音频的保存路径
audiopath = "audio/test_long.wav"
audiotype = 'wav' # 音频类型
print("audiopath:",audiopath)
# 读入音频
sound = AudioSegment.from_file(audiopath, format=audiotype)
'''根据 音量 和 静默 时间长度 条件进行音频分割示例:音量阈值 -25 dB , 静默阈值:300ms
'''
chunks = split_on_silence(sound,min_silence_len=300,silence_thresh=-25)# 保存分割后的短音频
print('开始保存')
for i in range(len(chunks)):new = chunks[i]save_name = "{}{}.{}".format(chunks_path,i,audiotype)new.export(save_name, format=audiotype)
助力快速掌握数据集的信息和使用方式。
数据可以如此美好
相关文章:
音频分割:长语音音频 分割为 短语音音频 - python 实现
在做语音任务时,有是会用到的语音音频是长音频,这就需要我们将长音频分割为短音频。 该示例将声音的音量和静默时间结合作为语音的分割条件。 使用音量和静默时间结合的分割条件,能够比较好的进行自然断句,不会话语没有说完就切断…...
【Echarts动态排序图,series使用背景色更新动画,背景底色不同步跟随柱子动画】大家有没有解决方案
echarts动态排序图背景色动画不同步 echarts试一试 series下面添加了showBackground属性,动画时底色背景不同步跟随柱图 showBackground: true, backgroundStyle: {borderRadius: 9,color: RGB(255,199,91, 0.2) }const data []; for (let i 0; i < 5; i) {d…...
FLINK SQL 元数据持久化扩展
Flink SQL元数据持久化扩展是一个复杂但重要的过程,它允许Flink作业在重启或失败后能够恢复状态,从而确保数据处理的连续性和准确性。以下是对Flink SQL元数据持久化扩展的详细分析: 一、元数据持久化的重要性 在Flink中,元数据…...
MySQL【知识改变命运】04
复习: 1:CURD 1.1Create (创建) 语法: insert [into] 表名 [column[,column]] valuse(value_list)[,vaule_list]... value_list:value,[value]...创建一个实例表: 1.1.1单⾏数据全列插⼊ values_l…...
AD9680(adc直采芯片)使用说明
写这篇文章之前我是没有使用过AD9680的芯片,但是使用过GMS011芯片(是国内24S)下的公司出来的芯片,寄存器和管脚全对标。 在这里我就大概说一下芯片的说用方法 一、硬件设计 该芯片支持双通道射频直采 支持协议JESD204B 14位 采样…...
无人机之位置信息计算篇
一、主要导航技术 卫星导航 全球定位系统(GPS):无人机上装有专门的接收器,用于捕获GPS系统发射的无线电信号。当无人机接收到来自至少四颗卫星的信号时,通过计算信号抵达时间的微小差异,即可运用三角定位…...
安卓cpu知识
背景 目前的cpu都是多核的,为了有更好的能效,每个核的频率从低往高不等。市面上,大家根据频率不同,都叫大小核。既然分了大小核,那么多核心,就要有不同的cpu调度策略。所以cpu上的所有核,又会根…...
图书管理新纪元:Spring Boot进销存系统
1系统概述 1.1 研究背景 随着计算机技术的发展以及计算机网络的逐渐普及,互联网成为人们查找信息的重要场所,二十一世纪是信息的时代,所以信息的管理显得特别重要。因此,使用计算机来管理图书进销存管理系统的相关信息成为必然。开…...
Application protocol
5 应用协议 在 TS 31.101 [11] 的对应条款中所述的要求适用于 USIM 应用。 在执行后续章节“USIM 安全相关程序”和“订阅相关程序”中的程序之前,必须执行“USIM 管理程序”中列出的程序。“USIM 安全相关程序”中列出的程序是强制性的。“订阅相关程序”中列出的程…...
金融信用评分卡建模项目:AI辅助
最近我一直忙着开发一个信用评分卡建模工具,所以没有时间更新示例或动态。今天,我很高兴地跟大家分享,这个工具的基本框架已经完成了,并且探索性的将大语言模型(AI)整合了进去。目前ai在工具中扮演智能助手…...
java对接GPT 快速入门
统一对接GPT服务的Java说明 当前,OpenAI等GPT服务厂商主要提供HTTP接口,这使得大部分Java开发者在接入GPT时缺乏标准化的方法。 为解决这一问题,Spring团队推出了Spring AI ,它提供了统一且标准化的接口来对接不同的AI服务提供商…...
微信小程序引入组件教程
1、安装 node.js 下载网址:https://nodejs.org 2.通过 npm 安装 npm init -y npm i vant/weapp -S --production 3、修改 app.json 将 app.json 中的 “style”: “v2” 去除 4、修改 project.config.json 关于修改 project.config.json 的详细内容&#x…...
STM32—SPI通信外设
1.SPI外设简介 STM32内部集成了硬件SPI收发电路,可以由硬件自动执行时钟生成、数据收发等功能,减轻CPU的负担可配置8位/16位数据帧、高位先行/低位先行时钟频率:fpclk/(2,4,8,16,32,64,128,256)支持多主机模型、主或从操作可精简为半双工/单…...
Ubuntu:用户不在sudoers文件中
1、问题 执行sudo xxx命令时,显示: user 不在sudoers文件中 需要查看系统版本进入恢复模式修复。 2、重启进入恢复模式 查看系统命令:uname -r 可能显示为:6.8.0-45-generic 重启Ubuntu系统,在开机时按ESC进入模…...
五、Spring Boot集成Spring Security之认证流程2
一、Spring Boot集成Spring Security专栏 一、Spring Boot集成Spring Security之自动装配 二、Spring Boot集成Spring Security之实现原理 三、Spring Boot集成Spring Security之过滤器链详解 四、Spring Boot集成Spring Security之认证流程 五、Spring Boot集成Spring Se…...
接口测试(全)
🍅 点击文末小卡片,免费获取软件测试全套资料,资料在手,涨薪更快 1、什么是接口测试 顾名思义,接口测试是对系统或组件之间的接口进行测试,主要是校验数据的交换,传递和控制管理过程࿰…...
【学习】word保存图片
word中有想保存的照片 直接右键另存为的话,文件总是不清晰,截屏的话,好像也欠妥。 怎么办? 可以另存为 网页 .html 可以得到: 原图就放到了文件夹里面...
【实战篇】用SkyWalking排查线上[xxl-job xxl-rpc remoting error]问题
一、组件简介和问题描述 SkyWalking 简介 Apache SkyWalking 是一个开源的 APM(应用性能管理)工具,专注于微服务、云原生和容器化环境。它提供了分布式追踪、性能监控和依赖分析等功能,帮助开发者快速定位和解决性能瓶颈和故障。…...
三勾软件/ java+springboot+vue3玖玖云电商ERP多平台源码
玖玖云ERP系统、支持多平台订单同步,仓库发货,波次拣货,售后服务,电商ERP一站式解决方案 项目介绍 玖玖云ERP系统基于javaspringbootelement-plusuniapp打造的面向开发的电商管理ERP系统,方便二次开发或直接使用。主…...
020 elasticsearch7.10.2 elasticsearch-head kibana安装
文章目录 全文检索流程ElasticSearch介绍ElasticSearch应用场景elasticsearch安装允许远程访问设置vm.max_map_count 的值 elasticsearch-head允许跨域 kibana 商品数量超千万,数据库无法使用索引 如何使用全文检索: 使用lucene,在java中唯一…...
国产信创库fio破坏主备库以及备份故障处理--惜分飞旁
一、各自优势和对比 这是检索出来的数据,据说是根据第三方评测与企业数据,三款产品在代码生成质量上各有侧重: 产品 语言优势 场景亮点 核心差异 百度 Comate C核心代码质量第一;Python首生成率达92.3% SQL生成准确率提升35%&…...
OpenClaw云端体验:Qwen3-14b_int4_awq镜像一键部署与自动化测试
OpenClaw云端体验:Qwen3-14b_int4_awq镜像一键部署与自动化测试 1. 为什么选择云端体验OpenClaw 作为一个长期关注AI自动化工具的技术爱好者,我一直在寻找能够快速验证OpenClaw可行性的方案。本地部署虽然可控性强,但配置过程繁琐——从Pyt…...
FastAPI OpenAPI文档:从基础配置到高级定制的完整指南
FastAPI OpenAPI文档:从基础配置到高级定制的完整指南 【免费下载链接】fastapi FastAPI framework, high performance, easy to learn, fast to code, ready for production 项目地址: https://gitcode.com/GitHub_Trending/fa/fastapi 想要快速构建API并自…...
喜马拉雅音频批量下载工具:Go+Qt5跨平台架构解析与高效离线管理方案
喜马拉雅音频批量下载工具:GoQt5跨平台架构解析与高效离线管理方案 【免费下载链接】xmly-downloader-qt5 喜马拉雅FM专辑下载器. 支持VIP与付费专辑. 使用GoQt5编写(Not Qt Binding). 项目地址: https://gitcode.com/gh_mirrors/xm/xmly-downloader-qt5 在数…...
如何一键保存流媒体视频:N_m3u8DL-CLI-SimpleG的懒人式下载指南
如何一键保存流媒体视频:N_m3u8DL-CLI-SimpleG的懒人式下载指南 【免费下载链接】N_m3u8DL-CLI-SimpleG N_m3u8DL-CLIs simple GUI 项目地址: https://gitcode.com/gh_mirrors/nm3/N_m3u8DL-CLI-SimpleG 你是不是也遇到过这样的烦恼?看到喜欢的在…...
GoJieba词性标注功能实战:从基础用法到高级配置
GoJieba词性标注功能实战:从基础用法到高级配置 【免费下载链接】gojieba "结巴"中文分词的Golang版本 项目地址: https://gitcode.com/gh_mirrors/go/gojieba GoJieba作为"结巴"中文分词的Golang版本,提供了强大的中文处理能…...
Simulink电气仿真避坑指南:为什么我的可变RLC模型总报错?可能是你源选错了
Simulink电气仿真避坑指南:可变RLC模型报错的根源与解决方案 在电力电子和电机控制仿真领域,Simulink无疑是工程师们的首选工具。但许多用户在尝试搭建可变RLC元件时,总会遇到各种莫名其妙的报错和收敛问题。这往往不是因为你的电路设计有问…...
快速搭建AI绘画平台:基于图图的嗨丝造相与阿里云GPU的完整解决方案
快速搭建AI绘画平台:基于图图的嗨丝造相与阿里云GPU的完整解决方案 1. 项目概述与准备工作 1.1 什么是图图的嗨丝造相-Z-Image-Turbo 图图的嗨丝造相-Z-Image-Turbo是一个基于Z-Image-Turbo模型的LoRA变体,专门针对特定服饰风格(如大网渔网…...
Ostrakon-VL-8B开箱即用:Gradio Web UI直连7860端口,无前端开发成本
Ostrakon-VL-8B开箱即用:Gradio Web UI直连7860端口,无前端开发成本 1. 引言:让视觉理解像聊天一样简单 想象一下,你是一家连锁餐饮店的运营经理,每天需要查看几十家门店后厨的监控照片,检查卫生状况和食…...
Youtu-VL-4B-Instruct企业应用:电商商品图OCR识别+视觉问答构建智能客服中台
Youtu-VL-4B-Instruct企业应用:电商商品图OCR识别视觉问答构建智能客服中台 1. 引言:当客服遇到商品图,一场效率革命正在发生 想象一下这个场景:一位顾客在电商平台看中了一款商品,但他对商品详情页上的信息有疑问。…...
