当前位置: 首页 > news >正文

wsj0数据集原始文件.wv1.wv2转换成wav文件

文章目录

      • 准备
      • 一、获取WSJO数据集
      • 二、安装sph2pipe
      • 三、转换代码
      • 四、结果展示

​ 最近做语音分离实验需要用到wsj0-2mix数据集,但是从李宏毅语音分离教程里面获取的wsj0-2mix只有一部分。从网上获取到了完整的WSJO数据集后,由于原始的语音文件后缀是wv1或者wv2,创建wsj0-2mix需要wav文件,所以需要通过工具进行转换。网上的教程使用后只能生成一堆空文件夹,无法生成转换后的wav文件。因此,在成功解决这个问题后,把采用的方法分享一下,按照下列步骤能完美进行转换。

准备

  • 平台:Windows
  • 工具:
    • python
    • sph2pipe
  • 数据集:WSJO

一、获取WSJO数据集

官网可以申请该数据集,想要的可以私信或者发加q3280461976

二、安装sph2pipe

大家按照之前网上的方法只能生成一堆空文件夹就是因为没有安装sph2pipe。按照下列步骤操作

  1. 下载sph2pipe(https://www.ldc.upenn.edu/language-resources/tools/sphere-conversion-tools),选择版本2.5,2.1在Windows下已经无法运行

image-20231129160431454

  1. 配置环境变量,如下将sph2pipe.exe的路径加入你电脑的系统变量Path里面,

    image-20231129161056053

  2. 找到你下载的文件,可以看到里面有一个exe文件

image-20231129160558692

  1. 验证sph2pipe能否成功运行,首先运行cmd或者powershell,保证当前目录里面含有sph2pipe.exe文件,输入sph2pipe,有如下提示就可以了

image-20231129160803574

  1. 下面就可以使用sph2pipe进行类型转换

三、转换代码

下面就是转换代码,详细说一下你需要改哪些地方,特别是第三点,非常重要!!!

  1. root_dir:改成你下载的wsj0的根目录文件,代码里面有例子
  2. my_path:改成你想要保存转换后wav文件存储的路径
  3. cmd = "E: \sph2pipe_v2.5.tar \sph2pipe_v2.5\sph2pipe -f wav " + speech_dir + " " + target_dir:把E: \sph2pipe_v2.5.tar \sph2pipe_v2.5改成你sph2pipe.exe存在的路径,注意代码中是“\ \”(双斜杠),
"""
# example:
# 11-1.1/wsj0/si_tr_s/01t/01to030v.wv1 is converted to wav and
# stored in YOUR_PATH/wsj0/si_tr_s/01t/01to030v.wav
"""
import os# 你下载的wsj0的根目录 例子:E:\\csr_1_comp_LDC93S6A\\csr_1_comp,
root_dir = ""# the disc number
disc_dir = []
for list_disc in os.listdir(root_dir):if list_disc not in ["text", "11-13.1"]: #doc file and 11-13.1 file do not contain .wv files# the data dir for each discdisc_dir.append(os.path.join(root_dir, list_disc, "wsj0"))# 转换后的文件想要保存的位置
my_path = ""
if not os.path.exists(my_path):os.mkdir(my_path)
# # the sub_data dir for each disc
for i, list_sub_data in enumerate(disc_dir):for sub_data_dir in os.listdir(list_sub_data):if (not sub_data_dir.startswith("si")) and (not sub_data_dir.startswith("sd")):continues_dir = os.path.join(my_path, sub_data_dir)if not os.path.exists(s_dir):os.mkdir(s_dir)if sub_data_dir[0][0] == 's':datatype_dir = os.path.join(list_sub_data, sub_data_dir)for list_spk in os.listdir(datatype_dir):spk_dir = os.path.join(s_dir, list_spk)spk_dir_abs = os.path.join(datatype_dir, list_spk)if not os.path.exists(spk_dir):os.mkdir(spk_dir)for wv_file in os.listdir(spk_dir_abs):if (not wv_file.endswith('.wv1')) and (not wv_file.endswith('.wv2')):continuespeech_dir = os.path.join(spk_dir_abs, wv_file)if wv_file.split('.')[1] == "wv1":target_name = wv_file.split(sep='.')[0] + '.wav'elif wv_file.split('.')[1] == 'wv2':target_name = wv_file.split(sep='.')[0] + '_1.wav'target_dir = spk_dir + '\\' + target_name# 一定要注意!!! sph2pipe -f wav前面的路径必须包含上面讲到的sph2pipe.exe,你只需要根据你sph2pipe.exe存放的位置修改这段路径:E:\\sph2pipe_v2.5.tar\\sph2pipe_v2.5cmd = "E:\\sph2pipe_v2.5.tar\\sph2pipe_v2.5\\sph2pipe -f wav " + speech_dir + " " + target_diros.system(cmd)

四、结果展示

  1. 编译器窗口:如果你没有按照sph2pipe,终端输出的就是一堆红色乱码,然后生成的文件夹都是空的

    image-20231129162213776

  2. 生成文件,比如我打开第一个sd_dt_05,完美转换

image-20231129162310664image-20231129162508838

image-20231129162528077

相关文章:

wsj0数据集原始文件.wv1.wv2转换成wav文件

文章目录 准备一、获取WSJO数据集二、安装sph2pipe三、转换代码四、结果展示 ​ 最近做语音分离实验需要用到wsj0-2mix数据集,但是从李宏毅语音分离教程里面获取的wsj0-2mix只有一部分。从网上获取到了完整的WSJO数据集后,由于原始的语音文件后缀是wv1或…...

Flask Session 登录认证模块

Flask 框架提供了强大的 Session 模块组件,为 Web 应用实现用户注册与登录系统提供了方便的机制。结合 Flask-WTF 表单组件,我们能够轻松地设计出用户友好且具备美观界面的注册和登录页面,使这一功能能够直接应用到我们的项目中。本文将深入探…...

【运维】hive 高可用详解: Hive MetaStore HA、hive server HA原理详解;hive高可用实现

文章目录 一. hive高可用原理说明1. Hive MetaStore HA2. hive server HA 二. hive高可用实现1. 配置2. beeline链接测试3. zookeeper相关操作 一. hive高可用原理说明 1. Hive MetaStore HA Hive元数据存储在MetaStore中,包括表的定义、分区、表的属性等信息。 hi…...

C#开发的OpenRA游戏之属性SelectionDecorations(13)

C#开发的OpenRA游戏之属性SelectionDecorations(13) 在前面分析SelectionDecorations属性类时,会发现它有下面这个属性: public class SelectionDecorations : SelectionDecorationsBase, IRender { readonly Interactable interactable; 它是定义了一个Interactabl…...

接手了一个外包开发的项目,我感觉我的头快要裂开了~

嗨,大家好,我是飘渺。 最近,我和小伙伴一起接手了一个由外包团队开发的微服务项目,这个项目采用了当前流行的Spring Cloud Alibaba微服务架构,并且是基于一个“大名鼎鼎”的微服务开源脚手架(附带着模块代…...

git常规使用方法,常规命令

Git是一种分布式版本控制系统,它可以记录软件的历史版本,并提供了多人协作开发、版本回退等功能。以下是Git的基本使用方法: 安装Git:下载安装包并进行安装,安装完成后在命令行中输入 git --version 进行验证。 初始化…...

【JavaScript】3.3 JavaScript工具和库

文章目录 1. 包管理器2. 构建工具3. 测试框架4. JavaScript 库总结 在你的 JavaScript 开发之旅中,会遇到许多工具和库。这些工具和库可以帮助你更有效地编写和管理代码,提高工作效率。在本章节中,我们将探讨一些常见的 JavaScript 工具和库&…...

开发基于 ChatGPT 分析热点事件并生成文章的网站应用【热点问天】把百度等热点用chatGPT来对热点事件分析海量发文章 开发步骤 多种方式获取利润

这样做的优点: 1.不用每个人都问chatGPT同样的问题。 2.已经生成的,反应快速。 3.内容分析的客观,真实,基于数据,无法造假。 4.无其它目的这种基于 ChatGPT 分析热点事件并生成文章的网站,可以通过多种方式…...

龙迅LT8668SXC适用于TPYE-C/DP/HDMI转EDP/VBO同时环出一路HDMI/DP,支持分辨率缩放功能。

1.描述 应用功能:LT8668SXC适用于TYPE-C/DP1.4/HDMI2.1转EDP/VBO同时环出一路HDMI/DP应用方案 分辨率:高达8K30HZ, 工作温度范围:−40C to 85C 产品封装:QFN88 (10*10)最小包装数:1680pcs 2.产品应用 •视频…...

跳板机原理

跳板机原理 跳板机(Jump Server)是一种网络安全设备或计算机,用于管理和保护内部网络中的其他计算机或系统。跳板机通常位于内部网络和外部网络之间,充当连接这两个网络的中间节点或跳板。以下是跳板机的主要功能和用途&#xff1…...

璞华大数据产品入选中国信通院“铸基计划”

武汉璞华大数据技术有限公司HawkEye设备数字化管理平台产品,凭借优秀的产品技术能力,通过评估后,入选中国信通院“铸基计划”《高质量数字化转型产品及服务全景图(2023)》的工业数字化领域。 “铸基计划”是中国信通院…...

1146. 新的开始,prim算法,超级原点

发展采矿业当然首先得有矿井,小 FF 花了上次探险获得的千分之一的财富请人在岛上挖了 n 口矿井,但他似乎忘记了考虑矿井供电问题。 为了保证电力的供应,小 FF 想到了两种办法: 在矿井 i 上建立一个发电站,费用为 vi&…...

HTTP常见响应码

HTTP(Hypertext Transfer Protocol)是用于在客户端和服务器之间传输资源的协议。HTTP响应码(HTTP status code)用来表示服务器对请求的处理结果。以下是常见的HTTP响应码及其概要: 1. 响应码大类: 主要分…...

物联网边缘计算是什么?如何实现物联网边缘计算?

物联网边缘计算是一种在物联网设备和网络中实施计算和数据处理的技术。它允许在物联网设备或网络边缘进行数据分析和处理,而不需要将所有数据传输到远程数据中心或云端进行处理。物联网边缘计算将计算和数据处理的能力迁移到物联网设备的边缘,使得设备能…...

带着GPT-4V(ision)上路,自动驾驶新探索

On the Road with GPT-4V(ision): Early Explorations of Visual-Language Model on Autonomous Driving GitHub | https://github.com/PJLab-ADG/GPT4V-AD-Exploration arXiv | https://arxiv.org/abs/2311.05332 自动驾驶技术的追求取决于对感知、决策和控制系统的复杂集成。…...

19. Python 数据处理之 Pandas

目录 1. 认识 Pandas2. 安装和导入 Pandas3. Pandas 数据结构4. Pandas 基本功能5. Pandas 数据分析 1. 认识 Pandas Pandas 是 Python 的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型、标记型数据。 Pandas 的出…...

【计网 可靠数据传输RDT】 中科大笔记 (十 一)

目录 0 引言1 RDT的原理RDT的原理: 2 RDT的机制与作用2.1 重要协议停等协议(Stop-and-Wait):连续ARQ协议: 2.2 机制与作用实现机制:RDT的作用: 🙋‍♂️ 作者:海码007📜 专栏&#x…...

ubuntu下训练自己的yolov5数据集

参考文档 yolov5-github yolov5-github-训练文档 csdn训练博客 一、配置环境 1.1 安装依赖包 前往清华源官方地址 选择适合自己的版本替换自己的源 # 备份源文件 sudo cp /etc/apt/sources.list /etc/apt/sources.list_bak # 修改源文件 # 更新 sudo apt update &&a…...

ROC及曲线面积汇总学习

目录 ROC基础 生成模拟数据 率的计算 R语言计算测试 ROCR: pROC ROC绘制 单个ROC 两个ROC Logistic回归的ROC曲线 timeROC ROC基础 ROC曲线的横坐标是假阳性率,纵坐标是真阳性率,需要的结果是这个率表示疾病阳性的率(…...

LeetCode Hot100 35.搜索插入位置

题目: 给定一个排序数组和一个目标值,在数组中找到目标值,并返回其索引。如果目标值不存在于数组中,返回它将会被按顺序插入的位置。 请必须使用时间复杂度为 O(log n) 的算法。 方法:灵神 二分查找 闭区间写法 c…...

在Laravel 8中配置和使用基于IP的API限流策略

引言在Web开发中,API限流是保护服务器免受恶意请求和滥用的重要手段。Laravel框架提供了简单而强大的限流功能,可以轻松实现基于IP地址的请求限制。本文将详细介绍如何在Laravel 8中配置和使用基于IP的API限流策略。为什么需要API限流?API限流…...

从零到一:用Poste.io和Docker打造你的专属邮件服务器,告别第三方服务限制

从零到一:用Poste.io和Docker打造你的专属邮件服务器,告别第三方服务限制 在数字化通信日益重要的今天,拥有一个完全自主控制的邮件服务器不仅是技术能力的体现,更是数据主权的重要保障。想象一下,当你的每一封邮件都经…...

深入拆解ISP Pipeline:Tuning工程师如何像侦探一样排查图像问题?

深入拆解ISP Pipeline:Tuning工程师如何像侦探一样排查图像问题? 当一张照片出现偏色、噪点或细节丢失时,普通用户可能只会抱怨"拍得不好",而ISP Tuning工程师看到的却是一个待解的谜题。就像侦探通过蛛丝马迹还原案件真…...

Keploy实战:基于真实流量的API自动化测试与Mock生成

1. Keploy是什么?它能解决什么问题? 第一次听说Keploy时,我也和大多数开发者一样疑惑:这工具到底能干嘛?简单来说,Keploy就像是你团队里的一个"影子测试工程师",它能悄无声息地记录下…...

从体素到三维模型:解析Volumetric Method在复杂场景重建中的核心算法

1. 什么是Volumetric Method?从体素到三维世界的魔法 第一次接触三维重建时,我被那些从照片变成立体模型的演示惊呆了。后来才知道,这背后藏着一种叫Volumetric Method的技术,它就像用乐高积木搭建世界——把空间切成无数小方块&a…...

给硬件小白的保姆级教程:手把手搞定RK3399 Linux-SDK的MIPI屏幕驱动配置

从零点亮RK3399的MIPI屏幕:一份没有硬件基础也能上手的实战指南 当你第一次拿到RK3399开发板和那块神秘的MIPI屏幕时,可能会被各种专业术语吓到——DTS配置、初始化序列、GPIO引脚、背光控制...这些概念对于软件背景的开发者来说,简直就像天书…...

如何轻松绕过Windows 11安装限制:终极MediaCreationTool.bat使用指南

如何轻松绕过Windows 11安装限制:终极MediaCreationTool.bat使用指南 【免费下载链接】MediaCreationTool.bat Universal MCT wrapper script for all Windows 10/11 versions from 1507 to 21H2! 项目地址: https://gitcode.com/gh_mirrors/me/MediaCreationTool…...

自动驾驶控制 - 基于运动学模型的LQR算法路径跟踪仿真

自动驾驶控制-基于运动学模型的LQR算法路径跟踪仿真matlab和simulink联合仿真,运动学模型实现的lqr横向控制,可以跟踪双移线,五次多项式,以及其他各种自定义路径。 效果如图,几乎0误差,双移线路径误差在0.0…...

STM32CubeMX实战:定时器触发DAC+DMA生成高精度正弦波信号

1. 为什么需要定时器触发DACDMA生成正弦波 在嵌入式系统开发中,生成精确的模拟信号是个常见需求。比如音频设备需要产生声波,电机控制需要生成驱动波形,测试设备需要输出标准信号源。传统做法是用CPU逐个写入DAC寄存器,但这会占用…...

精华贴分享|【没什么用系列】【百帖纪念】量化让我越来越觉得:我和 AI,其实都在被同一种机制训练

本文来源于量化小论坛策略分享会板块精华帖,作者为PlumeSoft,发布于2026年3月18日。以下为精华帖正文:声明最近几个月在疯狂使用AI,越用越有感慨。打不过就加入,这个帖子是由我构思,ChatGPT主笔&#xff0c…...