当前位置: 首页 > news >正文

华工研究生语音课

 

这门课讲啥

语音蕴含的信息、语音识别的目的

语音的准平稳性、分帧、预加重、时域特征分析(能量和过零率)、端点检测(双门限法)

语音的基频及检测(主要是自相关法、野点的处理)

声音的产生过程(声门脉冲、声道模型、辐射),两大听觉特性(时频分析和掩蔽效应)

LPC分析(原理、窗函数、建模为全极点模型、最小均方误差、系数的三种解法与对比)

MFCC分析(Mel频率、Mel滤波器组以及这两者设计的原因:模仿人耳听觉特性。同态信号处理方法、复倒谱和倒谱、MFCC求法、差分MFCC)

VQ(简要了解原理、知道一些聚类算法)

谱距离(距离的特性、对数谱距离、倒谱距离、截断倒谱距离)

DTW(为什么要对齐、线性时间规整算法、了解动态规划的思想、约束条件、动态时间规整算法)

DTW模板训练的过程(包括鲁棒性训练和聚类还有一个Casual啥的,三类对比)

语音识别系统的决策准则(k近邻)、两类评价指标(速度和准确率,具体指标有哪些)、语音识别的自适应问题

HMM概念(了解其参数意义、齐次假设、观测独立性假设、两类主要拓扑结构)

HMM三大基本问题以及经典解法(评估、最佳路径、训练。大概知道其解法)

HMM的实际应用问题

 

这门课考啥

贺老师课上讲得比较深入,主要围绕语音识别系统展开,上完对语音识别的经典流程有个了解。但考试考的比较简单,没有计算题,以概念为主,如:

什么是短时平稳

为啥不用矩形窗

解释某个算法某个变量的含义

为啥用从左到右的HMM结构

为啥不用线性时间规整,而去用DTW?

DTW的约束条件

为啥引入差分MFCC

HMM三大问题是什么,对应算法的名字

 

整体来说,课程广度和深度足够,考试也友好,是值得选修的一门课。

 

 

 

 

 

相关文章:

华工研究生语音课

这门课讲啥 语音蕴含的信息、语音识别的目的 语音的准平稳性、分帧、预加重、时域特征分析(能量和过零率)、端点检测(双门限法) 语音的基频及检测(主要是自相关法、野点的处理) 声音的产生过程&#xf…...

KingbaseES 原生XML系列二 -- XML数据操作函数

KingbaseES 原生XML系列二--XML数据操作函数(DELETEXML,APPENDCHILDXML,INSERTCHILDXML,INSERTCHILDXMLAFTER,INSERTCHILDXMLBEFORE,INSERTXMLAFTER,INSERTXMLBEFORE,UPDATEXML) XML的简单使其易于在任何应用程序中读写数据,这使XML很快成为数据交换的一种公共语言。…...

【Flink】DataStream API使用之源算子(Source)

源算子 创建环境之后,就可以构建数据的业务处理逻辑了,Flink可以从各种来源获取数据,然后构建DataStream进项转换。一般将数据的输入来源称为数据源(data source),而读取数据的算子就叫做源算子&#xff08…...

树莓派硬件介绍及配件选择

目录 树莓派Datasheet下载地址: Raspberry 4B 外观图: 技术规格书: 性能介绍: 树莓派配件选用 电源的选用: 树莓派外壳选用: 内存卡/U盘选用 树莓派Datasheet下载地址: Raspberry Pi …...

O2OA (翱途) 平台 V8.0 发布新增数据台账能力

亲爱的小伙伴们,O2OA (翱途) 平台开发团队经过几个月的持续努力,实现功能的新增、优化以及问题的修复。2023 年度 V8.0 版本已正式发布。欢迎大家到 O2OA 的官网上下载进行体验,也希望大家在藕粉社区里多提宝贵建议。本篇我们先为大家介绍应用…...

数控解锁怎么解 数控系统解锁解密

Amazon Fargate 在中国区正式落地,因 数控解锁使用 Serverless 架构,更加适合对性能要求不敏感的服务使用,Pyroscope 是一款基于 Golang 开发的应用程序性能分析工具,Pyroscope 的服务端为无状态服务且性能要求不敏感,…...

3.0 响应式系统的设计与实现

1、Proxy代理对象 Proxy用于对一个普通对象代理,实现对象的拦截和自定义,如拦截其赋值、枚举、函数调用等。里面包含了很多组捕获器(trap),在代理对象执行相应的操作时捕获,然后在内部实现自定义。 const…...

Rust 快速入门60分① 看完这篇就能写代码了

Rust 一门赋予每个人构建可靠且高效软件能力的语言https://hannyang.blog.csdn.net/article/details/130467813?spm1001.2014.3001.5502关于Rust安装等内容请参考上文链接,写完上文就在考虑写点关于Rust的入门文章,本专辑将直接从Rust基础入门内容开始讲…...

【5.JS基础-JavaScript的DOM操作】

1 认识DOM和BOM 所以我们学习DOM,就是在学习如何通过JavaScript对文档进行操作的; DOM Tree的理解 DOM的学习顺序 DOM的继承关系图 2 document对象 3 节点(Node)之间的导航(navigator) 4 元素&#xff0…...

【大数据之Hadoop】二十九、HDFS存储优化

纠删码和异构存储测试需要5台虚拟机。准备另外一套5台服务器集群。 环境准备: (1)克隆hadoop105为hadoop106,修改ip地址和hostname,然后重启。 vim /etc/sysconfig/network-scripts/ifcfg-ens33 vim /etc/hostname r…...

SuperMap GIS基础产品组件GIS FAQ集锦(2)

SuperMap GIS基础产品组件GIS FAQ集锦(2) 【iObjects for Spark】读取GDB参数该如何填写? 【解决办法】可参考以下示例: val GDB_params new util.HashMapString, java.io.Serializable GDB_params.put(FeatureRDDProviderParam…...

C语言printf()函数中整型格式说明符详解

每个整型在printf()函数中对应不同的格式说明符,以实现该整型的打印输出。格式说明符必须使用小写。现在让我们看看各个整型及其格式说明符: 短整型(short) 10进制:%hd16进制:无负数格式,正数使用%hx8进制:无负数格式,正数使用%ho c short s 34; printf("%hd", s…...

阿里云服务器地域和可用区怎么选择合适?

阿里云服务器地域和可用区怎么选择?地域是指云服务器所在物理数据中心的位置,地域选择就近选择,访客距离地域所在城市越近网络延迟越低,速度就越快;可用区是指同一个地域下,网络和电力相互独立的区域&#…...

Java序列化引发的血案

1、引言 阿里巴巴Java开发手册在第一章节,编程规约中OOP规约的第15条提到: **【强制】**序列化类新增属性时,请不要修改serialVersionUID字段,避免反序列失败;如果完全不兼容升级,避免反序列化混乱&#x…...

为Linux系统添加一块新硬盘,并扩展根目录容量

我的原来ubuntu20.04系统装的时候不是LVM格式的分区, 所以先将新硬盘转成LVM,再将原来的系统dd到新硬盘,从新硬盘的分区启动,之后再将原来的分区转成LVM,在融入进来 1:将新硬盘制作成 LVM分区 我的新硬盘…...

树莓派Opencv调用摄像头(Raspberry Pi 11)

前言:本人初玩树莓派opencv,使用的是树莓派Raspberry Pi OS 11,系统若不一致请慎用,本文主要记录在树莓派上通过Opencv打开摄像头的经验。 1、系统版本 进入树莓派,打开终端输入以下代码(查看系统的版本&…...

国产ChatGPT命名图鉴

很久不见这般热闹的春天。 随着ChatGPT的威名席卷全球,大洋对岸的中国厂商也纷纷亮剑,各式本土大模型你方唱罢我登场,声势浩大的发布会排满日程表。 有趣的是,在这些大模型产品初入历史舞台之时,带给世人的第一印象其…...

操作系统——进程管理

0.关注博主有更多知识 操作系统入门知识合集 目录 0.关注博主有更多知识 4.1进程概念 4.1.1进程基本概念 思考题: 4.1.2进程状态 思考题: 4.1.3进程控制块PCB 4.2进程控制 思考题: 4.3线程 思考题: 4.4临界资源与临…...

第四十一章 Unity 输入框 (Input Field) UI

本章节我们学习输入框 (Input Field),它可以帮助我们获取用户的输入。我们点击菜单栏“GameObject”->“UI”->“Input Field”,我们调整一下它的位置,效果如下 我们在层次面板中发现,这个InputField UI元素包含两个子元素&…...

10.集合

1.泛型 1.1泛型概述 泛型的介绍 ​ 泛型是JDK5中引入的特性&#xff0c;它提供了编译时类型安全检测机制 泛型的好处 把运行时期的问题提前到了编译期间避免了强制类型转换 泛型的定义格式 <类型>: 指定一种类型的格式.尖括号里面可以任意书写,一般只写一个字母.例如:…...

注释标准模板

观看main函数能够看出框架&#xff0c;框架要简单&#xff0c;比如训练不给它细分&#xff0c;数据流向关注转为哪个数据&#xff0c;而不是关注维度&#xff0c;维度在调试的时候才关注 1、>表示数据流向 2、# #包围的表示框架 3、# 表示普通的框架内的注释 4、# -----补充…...

STM32+LWIP实战:ETH外设配置避坑指南(基于HAL库)

STM32LWIP实战&#xff1a;ETH外设配置避坑指南&#xff08;基于HAL库&#xff09; 第一次在STM32上移植LWIP协议栈时&#xff0c;我盯着PHY芯片的Link灯整整三天没亮。直到发现CubeMX生成的代码里漏了一个关键寄存器配置——这个教训让我意识到&#xff0c;ETH外设的配置远不是…...

小型葡萄除梗破碎机的设计【三维proe+7张cad图纸+CAXA图纸+毕业论文】

小型葡萄除梗破碎机是葡萄加工领域的关键设备&#xff0c;其核心作用在于高效分离葡萄果粒与果梗&#xff0c;同时实现果粒的适度破碎&#xff0c;为后续发酵或榨汁工艺提供优质原料。传统人工除梗破碎效率低、劳动强度大&#xff0c;且易因操作差异影响原料品质。该设备通过机…...

绿联NAS上利用Docker部署SearXNG与Open-WebUI的YAML配置实战

1. 绿联NAS与Docker的完美组合 如果你手头有一台绿联NAS&#xff0c;那你就拥有了一个强大的家庭数据中心。作为国产NAS中的佼佼者&#xff0c;绿联NAS不仅提供了友好的操作界面&#xff0c;还内置了Docker支持&#xff0c;这让它成为了技术爱好者折腾的理想平台。我用了大半年…...

comsol三次谐波,本征手性BIC,远场偏振图,手性透射曲线,二维能带图,Q因子图,电场图

comsol三次谐波&#xff0c;本征手性BIC,远场偏振图&#xff0c;手性透射曲线&#xff0c;二维能带图&#xff0c;Q因子图&#xff0c;电场图&#xff0c;所见即所得 大子刊nc复现&#xff0c;在连续介质中束缚态驱动下具有最大和可调谐手征光学响应的平面手征超表面当平面超表…...

OpenClaw+Qwen3.5-9B长文本处理:128K上下文资料归档实践

OpenClawQwen3.5-9B长文本处理&#xff1a;128K上下文资料归档实践 1. 为什么需要自动化资料归档 作为一名经常需要阅读大量文献的研究人员&#xff0c;我长期被两个问题困扰&#xff1a;一是PDF里的关键信息难以快速提取&#xff0c;二是不同来源的资料无法自动归类。直到发…...

7π/6 与 π/6 的关系

参考角&#xff08;Reference Angle&#xff09;的解释&#xff1a;7π/6 与 π/6 的关系 这在三角函数中非常重要&#xff0c;尤其是计算 sin、cos、tan 等值时。让我一步步解释清楚&#xff0c;特别是为什么 7π/6 的参考角是 π/6&#xff0c;以及它们之间的关系。整个解释…...

3步解锁专业翻译:DeepL免费插件零成本使用全攻略

3步解锁专业翻译&#xff1a;DeepL免费插件零成本使用全攻略 【免费下载链接】bob-plugin-akl-deepl-free-translate **DeepL免秘钥,免启服务**,双击使用,免费无限次使用,(**新增DeepL单词查询功能**)根据网页版JavaScript加密算法逆向开发的bobplugin;所以只要官网的算法不改,…...

LibreCAD完全指南:零基础掌握开源CAD绘图的实战秘籍

LibreCAD完全指南&#xff1a;零基础掌握开源CAD绘图的实战秘籍 【免费下载链接】LibreCAD LibreCAD is a cross-platform 2D CAD program written in C17. It can read DXF/DWG files and can write DXF/PDF/SVG files. It supports point/line/circle/ellipse/parabola/splin…...

卡证检测矫正模型惊艳案例:护照芯片区域反光消除+四角点亚像素定位

卡证检测矫正模型惊艳案例&#xff1a;护照芯片区域反光消除四角点亚像素定位 你有没有遇到过这样的烦恼&#xff1f;用手机拍身份证、护照或者驾照&#xff0c;准备上传办理业务时&#xff0c;系统总是提示“照片不清晰”、“证件边缘不完整”或者“请拍摄正面照”。尤其是护…...