当前位置: 首页 > news >正文

参考mfa官方文档实践笔记(亲测)

  1. 按顺序执行以下指令:
    conda create -n aligner -c conda-forge montreal-forced-alignerconda config --add channels conda-forgeconda activate alignerconda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia 
  2. 如果报错:
    Solving environment: failed with initial frozen solve. Retrying with flexible solve.

    替换为pip 执行指令:

    pip3 install torch torchvision torchaudio -i  https://pypi.tuna.tsinghua.edu.cn/simple
  3. 接着执行以下指令:
    pip install speechbrain -i  https://pypi.tuna.tsinghua.edu.cn/simple conda update --all pip uninstall montreal-forced-aligner conda install -c conda-forge montreal-forced-aligner
  4. 对于英文:
    1. 执行以下指令:
      mfa model download acoustic english_us_arpamfa model download dictionary english_us_arpa mfa model inspect acoustic english_us_arpa  // 可以看到声学模型的一些特性mfa validate corpus_dir_path english_us_arpa english_us_arpa
    2. 如果报错:
      initdb: error: cannot be run as root
      initdb: hint: Please log in (using, e.g., "su") as the (unprivileged) user that will own the server process.
      1. 原因:不可以在root权限下操作

      2. 解决:切换到普通用户就可以执行了

      3. 如果语料库发生了变化,mfa validate 指令加上--clean

    3. 执行对齐指令:
      mfa align corpus_dir_path english_us_arpa english_us_arpa align_result_dir_path
    4. 如果报错:
      sqlalchemy.exc.OperationalError: (psycopg2.OperationalError) server closed the connection unexpectedly
      This probably means the server terminated abnormally
      before or while processing the request.

      1. 解决:网络问题,再重复执行即可
      2. 注意corpus目录下wav和转录文件需要名字是对应的。
  5. 对于中文
    1. 由于官网给的词典好像用不了,这里(跳转中...,提取码:mma3)提供了准备的词典和声学模型,下载即可
    2. 执行以下指令:
      mfa validate corpus_dir_root dictionary_path acoustic_modle_pathmfa align corpus_dir_root dictionary_path acoustic_modle_path alignment_result_dir

相关文章:

参考mfa官方文档实践笔记(亲测)

按顺序执行以下指令: conda create -n aligner -c conda-forge montreal-forced-alignerconda config --add channels conda-forgeconda activate alignerconda install pytorch torchvision torchaudio pytorch-cuda11.7 -c pytorch -c nvidia 如果报错&#xff1…...

【 第六章 拦截器,注解配置springMVC,springMVC执行流程】

第六章 拦截器,注解配置springMVC,springMVC执行流程 1.拦截器: ①springMVC中的拦截器用于拦截控制器方法的执行。 ②springMVC的拦截器需要实现HandlerInterceptor或者继承HandlerInterceptorAdapter类。 ③springMVC的拦截器必须在spring…...

一种编译器视角下的python性能优化

“Life is short,You need python”!老码农很喜欢python的优雅,然而,在生产环境中,Python这样的没有优先考虑性能构建优化的动态语言特性可能是危险的,因此,流行的高性能库如TensorFlow 或PyTor…...

太逼真!这个韩国虚拟女团你追不追?

“她们看上去太像真人了”, 韩国虚拟女团MAVE的首支MV和打歌舞台引发网友阵阵惊呼。现在,她们的舞蹈已经有真人在挑战了。 这一组虚拟人的“逼真”倒不在脸,主要是MAVE女团的舞台动作接近自然,不放近景看,基本可以达到…...

安全与道路测试:自动驾驶系统安全性探究

随着自动驾驶技术的迅速发展,如何确保自动驾驶系统的安全性已成为业界关注的焦点。本文将探讨自动驾驶系统的潜在风险、安全设计原则和道路测试要求。 潜在风险 自动驾驶系统在改善交通安全和提高出行效率方面具有巨大潜力,但其安全性仍面临许多挑战&a…...

chatGPT学英语,真香!!!

文章目录学习目标学习内容目标方式过程学习时间学习产出学习目标 能够在三个月的练习后,和真人外教比较流畅的沟通! 最近chatGPT实在是太火了,各种事情都能干,能改论文、写代码和翻译。 看到B站很多教程教我们直接用chatGPT进行…...

12 Cache Memory

内存的层次结构 计算机内存的层级结构是一种将不同类型的存储设备按照速度、容量和访问时间组织起来的方式。这种层级结构提高了计算机的性能,使得处理器能够高效地访问数据。通常,内存层级结构可分为以下几个层次: 寄存器:寄存器…...

【CSS系列】第一章 · CSS基础

写在前面 Hello大家好, 我是【麟-小白】,一位软件工程专业的学生,喜好计算机知识。希望大家能够一起学习进步呀!本人是一名在读大学生,专业水平有限,如发现错误或不足之处,请多多指正&#xff0…...

【Java代码审计】表达式注入

1 前置知识 1.1 EL表达式 EL表达式主要功能: 获取数据:可以从JSP四大作用域中获取数据执行运算:执行一些关系运算,逻辑运算,算术运算获取web开发常用对象:通过内置 的11个隐式对象获取想要的数据调用jav…...

Python-GEE遥感云大数据分析、管理与可视化

Python-GEE遥感云大数据分析、管理与可视化近年来遥感技术得到了突飞猛进的发展,航天、航空、临近空间等多遥感平台不断增加,数据的空间、时间、光谱分辨率不断提高,数据量猛增,遥感数据已经越来越具有大数据特征。遥感大数据的出…...

信息学奥赛一本通 1375:骑马修栅栏(fence) | 洛谷 P2731 [USACO3.3]骑马修栅栏 Riding the Fences

【题目链接】 ybt 1375:骑马修栅栏(fence) 洛谷 P2731 [USACO3.3]骑马修栅栏 Riding the Fences 【题目考点】 1. 图论:欧拉回路 欧拉回路存在的条件:图中所有顶点的度都是偶数欧拉路径存在的条件:图中只有两个度为奇数的顶点…...

Spring Boot 应用的打包和发布

1. 创建项目(example-fast) 基于 Spring Boot 创建一个 WEB 项目 example-fast。 2. 编译打包 2.1 采用 IDEA 集成的 Maven 环境来对 Spring Boot 项目编译打包,可谓是超级 easy 2.2 mvn 命令打包 # mvn clean 清理编译 # install 打包 #…...

linux:iptables (3) 命令行操练(一)

目录 1.命令行手册查缺补漏 2.开始练习,从最陌生的参数练习开启 2.1 --list-rules -S :打印链或所有链中的规则 2.2 --zero -Z 链或所有链中的零计数器 2.3 --policy -P 修改默认链的默认规则 2.4 --new -N 接下来练习添加和删除自定义链 1.命令行手册查缺补…...

synchronized(this) 与synchronized(class) 有啥区别

前言 synchronized(this) 与 synchronized(class) 相同处:均对代码加锁,实现互斥性。synchronized(this) 与 synchronized(class) 区别:作用域不同。 synchronized (this) synchronized(this)使用的是对象锁。this为关键词,表示…...

BOSS直拒、失联招聘,消失的“金三银四”,失业的测试人出路在哪里?

裁员潮涌,经济严冬。最近很多测试人过得并不好,行业缩水对测试岗位影响很直接干脆,究其原因还是测试门槛在IT行业较低,同质化测试人员比较多。但实际上成为一位好测试却有着较高的门槛,一名优秀的测试应当对产品的深层…...

华为OD机试【密室逃生游戏】

密室逃生游戏 题目 小强增在参加《密室逃生》游戏,当前关卡要求找到符合给定 密码 K(升序的不重复小写字母组 成) 的箱子, 并给出箱子编号,箱子编号为 1~N 。 每个箱子中都有一个 字符串 s ,字符串由大写字…...

【Python学习笔记(六)】json解析模块的使用

json解析模块的使用 前言 json 是一种轻量级的数据交换格式,通过对象和数组的组合来表示数据。在 Python3 中可以使用 json 模块来对 json 数据进行编解码。 json 模块 是 Python 标准库模块,无需手动安装,可以直接导入 import json # 导入…...

《Spring系列》第3章 基于注解管理Bean

基于注解方式管理Bean 1.通过注解管理Bean 1) 基础注解 Component Service Controller Repository 2) 基于XML的注解扫描 a> 引入依赖 spring-aop-5.1.5.RELEASE.jarb> 开启组件扫描 最简单的开启注解 <context:component-scan base-package"com.jianan&q…...

【Redis】十大数据类型(下篇)

文章目录redis位图(bitmap) --- 底子还是string基本命令图示setbit key offset value setbit 键 偏移位 只能零或者1getbit key offset 查看获取字符串长度 strlen统计key中包含1的个数 bitcount keybitop 统计两个比特key是否都为1技术落地&#xff1a;打卡签到&#xff0c;频…...

【第十一届“泰迪杯”数据挖掘挑战赛】B题产品订单的数据分析与需求预测“解题思路“”以及“代码分享”

【第十一届泰迪杯B题产品订单的数据分析与需求预测产品订单的数据分析与需求预测 】第一大问代码分享&#xff08;后续更新LSTMinformer多元预测多变量模型&#xff09; PS: 代码全写有注释&#xff0c;通俗易懂&#xff0c;包看懂&#xff01;&#xff01;&#xff01;&…...

NotebookLM文献精读陷阱警示:化学人必避的5类幻觉引用、2种结构误识别及实时校验方案

更多请点击&#xff1a; https://kaifayun.com 第一章&#xff1a;NotebookLM文献精读陷阱警示&#xff1a;化学人必避的5类幻觉引用、2种结构误识别及实时校验方案 NotebookLM 作为基于语义理解的AI文献助手&#xff0c;在化学领域高频出现“看似合理、实则失真”的推理错误。…...

Claude插件开发实战:从架构设计到生产部署的完整指南

1. 项目概述&#xff1a;Claude插件生态的“瑞士军刀”如果你和我一样&#xff0c;长期在AI应用开发的一线摸爬滚打&#xff0c;那你一定对Claude这个AI模型不陌生。它强大的推理能力和对长文本的友好处理&#xff0c;让很多开发者都将其作为构建智能应用的核心引擎。但一个模型…...

个人开发者对比使用Taotoken前后在模型API管理与调用上的效率变化

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 个人开发者使用 Taotoken 前后在模型 API 管理与调用上的效率变化 作为一名个人开发者&#xff0c;在探索和应用大模型能力时&…...

阶段与关口:项目管理中的核心触发器与决策机制解析

1. 从“触发器”说起&#xff1a;为什么我们需要阶段与关口&#xff1f;在汽车电子、软件开发乃至任何复杂的项目管理中&#xff0c;我们常常听到“触发器”这个词。它就像一个开关&#xff0c;一个信号&#xff0c;标志着某个条件已经满足&#xff0c;可以启动下一系列动作。今…...

冻肉切丁机性价比排名:企业采购选型策略深度解析

冻肉切丁机性价比排名与企业采购选型策略&#xff1a;FAQ深度解析“不是越贵越好&#xff0c;适合才是王道——冻肉切丁机采购需平衡性能、成本与场景适配性”企业采购冻肉切丁机时&#xff0c;常被市场上五花八门的性价比排名绕晕&#xff0c;既担心买贵了浪费成本&#xff0c…...

LLMRank:基于大模型排序学习的自动化评估方案与实践指南

1. 项目概述&#xff1a;当大模型学会“自我评价”&#xff0c;我们该如何用好它&#xff1f; 最近在折腾大语言模型&#xff08;LLM&#xff09;应用落地的朋友&#xff0c;估计都绕不开一个核心问题&#xff1a; 怎么判断模型生成的内容到底好不好&#xff1f; 是通顺就行…...

终极指南:如何使用FlicFlac快速完成Windows音频格式转换

终极指南&#xff1a;如何使用FlicFlac快速完成Windows音频格式转换 【免费下载链接】FlicFlac Tiny portable audio converter for Windows (WAV FLAC MP3 OGG APE M4A AAC) 项目地址: https://gitcode.com/gh_mirrors/fl/FlicFlac 在Windows平台上处理音频文件时&…...

LinuxCNC RS274NGC解释器工作流详解:从G代码文本到电机动作的完整旅程

LinuxCNC RS274NGC解释器工作流详解&#xff1a;从G代码文本到电机动作的完整旅程 在工业自动化领域&#xff0c;G代码作为数控机床的通用编程语言&#xff0c;其解释执行过程往往被视为黑箱操作。本文将深入剖析LinuxCNC中RS274NGC解释器的完整工作流&#xff0c;揭示一段G代码…...

从 BGE 到 Qwen3:中文 RAG Reranker 模型解析

在 RAG 系统中&#xff0c;Reranker 往往是决定最终检索质量的关键一环&#xff0c;却也是最容易被忽视的模块。本文从 Reranker 的基本原理出发&#xff0c;介绍 Reranker Encoder 和 Decoder 两类架构的工作机制&#xff0c;随后解析目前中文场景下最主流的两大模型系列BGE-R…...

金融数据分析实战:从Python工具链到量化策略回测全流程解析

1. 项目概述&#xff1a;为什么我们需要一个“金融技能”仓库&#xff1f;在金融行业摸爬滚打了十几年&#xff0c;我见过太多聪明人因为工具和方法的缺失&#xff0c;在数据分析和决策上走了弯路。无论是刚入行的分析师&#xff0c;还是希望提升个人理财能力的职场人&#xff…...