基于PSD-ML算法的语音增强算法matlab仿真
目录
1.算法运行效果图预览
2.算法运行软件版本
3.部分核心程序
4.算法理论概述
1.加窗处理:
2.分帧处理:
3.功率谱密度估计:
4.滤波处理:
5.逆变换处理:
6.合并处理:
5.算法完整程序工程
1.算法运行效果图预览
2.算法运行软件版本
matlab2022A
3.部分核心程序
............................................................................
% 处理最后一帧,如果最后一帧的长度小于帧长,用零填充至帧长
y_seg = y(1+(Nframe-1)*(Len_frame-Len_loop):end);
y_seg = [y_seg; zeros(Len_frame-length(y_seg), 1)];
y_t = [y_t y_seg];
%应用汉宁窗函数
window= hann(Len_frame);%apply hanning window
y_fft = zeros(size(y_t));
for idx = 1 : Nframey_fft(:, idx) = fft(window .* y_t(:, idx));
end%计算带噪语音的功率谱密度(PSD)估计值,采用Barlett方法,L为周期图的段数
L = 12;
Pyy = func_Bartlett(y_fft,L); % 噪声功率谱密度(PSD)估计,选择MS或MMSE方法,这里采用MS方法,M为段数,B为偏差补偿系数
M = 12;
B = 1;
Pnn = func_nPSD(Pyy,M,B);% 目标语音功率谱密度(PSD)估计,选择ML或DD方法,这里采用ML方法,得到SNR的ML估计值SNR_ml
SNR_ml = func_PSDML(Pyy,Pnn);%DD方法的代码被注释掉了,alpha为平滑系数,取值一般在0.96-0.99之间
% 使用wiener函数计算Wiener增益,得到降噪后的频域信号s_hat_k
y_wiener_fft = func_wiener(y_fft,SNR_ml);% 进行逆变换和重叠相加操作,得到降噪后的时域信号s_t
y_wiener_ifft= ifft(y_wiener_fft);% Inverse FFT transform
% 取s_t的前半部分作为s_t_est1
y_wiener2 = y_wiener_ifft(1:Len_frame-Len_loop/2, 1);
% 取s_t的后半部分作为s_t_est2
y_wiener3 = y_wiener_ifft(1+Len_loop/2:end,end);
% 去掉s_t的第一列和最后一列
y_wiener_ifft(:, 1) = [];
y_wiener_ifft(:, end) = [];
% 去掉s_t的前hop_length/2行和后hop_length/2行
y_wiener_ifft(1:Len_loop/2, :) = [];
y_wiener_ifft(end-(Len_loop/2-1): end, :) = [];
% 将s_t重塑为一列向量
y_wiener_ifft = reshape(y_wiener_ifft, [], 1);
% 取s_t的实部作为最终的降噪后的时域信号s_t
y_wiener_ifft = real(y_wiener_ifft);
71
4.算法理论概述
PSD-ML(Power Spectral Density Maximum Likelihood)算法是一种基于最大似然估计的语音增强算法,通过对语音信号的功率谱密度进行估计,并利用估计结果对原始语音信号进行滤波处理,以达到增强语音信号的目的。下面将详细介绍PSD-ML算法的原理和数学公式。
PSD-ML算法的基本思想是利用最大似然估计对语音信号的功率谱密度进行估计,并根据估计结果对原始语音信号进行滤波处理。具体实现过程中,首先需要将语音信号分成多个重叠的帧,并对每帧信号进行加窗处理以减少频谱泄漏。然后,利用快速傅里叶变换(FFT)将每帧信号转换为频域表示,并根据功率谱密度的估计结果对频域信号进行滤波处理。最后,将滤波后的频域信号通过逆快速傅里叶变换(IFFT)转换回时域表示,并将重叠的帧进行合并以得到增强后的语音信号。
假设原始语音信号为x(n),加窗后的信号为x_w(n),分帧后的第i帧信号为x_i(n),其对应的功率谱密度为P_i(k),其中k表示频率索引。则PSD-ML算法的数学公式可以表示为:
1.加窗处理:
x_w(n) = w(n) * x(n)
其中,w(n)为窗函数,如汉明窗或汉宁窗等。
2.分帧处理:
x_i(n) = x_w(n+iL)
其中,L为帧长,i为帧索引。
3.功率谱密度估计:
P_i(k) = |X_i(k)|^2 / N
其中,X_i(k)为第i帧信号的FFT变换结果,N为帧长。
4.滤波处理:
Y_i(k) = G_i(k) * X_i(k)
其中,G_i(k)为滤波器的增益函数,可以根据功率谱密度的估计结果计算得到。
5.逆变换处理:
y_i(n) = IFFT{Y_i(k)}
其中,IFFT表示逆快速傅里叶变换。
6.合并处理:
y(n) = ∑ y_i(n-iL)
其中,∑表示对所有重叠的帧进行合并。
需要注意的是,在实际应用中,为了进一步提高语音增强的效果,可以采用一些优化策略,如自适应滤波器、多通道滤波器等。同时,也需要根据实际应用场景和需求来选择合适的窗函数、帧长、滤波器类型等参数。
5.算法完整程序工程
OOOOO
OOO
O
相关文章:

基于PSD-ML算法的语音增强算法matlab仿真
目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 1.加窗处理: 2.分帧处理: 3.功率谱密度估计: 4.滤波处理: 5.逆变换处理: 6.合并处理: 5.算法完整程序工程 1.算法…...

【1++的Linux】之文件(一)
👍作者主页:进击的1 🤩 专栏链接:【1的Linux】 文章目录 一,初识文件二,文件接口 一,初识文件 文件就是文件内容属性。因此对文件的操作无非就是对文件内容的操作和对文件属性的操作。 我们访问…...

Kafka 高可用
正文 一、高可用的由来 1.1 为何需要Replication 在Kafka在0.8以前的版本中,是没有Replication的,一旦某一个Broker宕机,则其上所有的Partition数据都不可被消费,这与Kafka数据持久性及Delivery Guarantee的设计目标相悖。同时Pr…...

关于分布式操作系统
关于分布式操作系统,如果你不太理解的话,可以把它看成是传统操作系统延展。二者的区别在于,传统的操作系统都是单机系统,只能在一台计算机上运行,而分布式操作系统是多机系统,每台计算机都是系统中的一个计…...
Pytorch使用DataLoader, num_workers!=0时的内存泄露
描述一下背景,和遇到的问题: 我在做一个超大数据集的多分类,设备Ubuntu 22.04i9 13900KNvidia 409064GB RAM,第一次的训练的训练集有700万张,训练成功。后面收集到更多数据集,数据增强后达到了1000万张。…...

chromedriver下载与安装方法
下载与安装: 1.查看Chrome浏览器版本 首先,需要检查Chrome浏览器的版本。请按照以下步骤进行: 打开Chrome浏览器。 点击浏览器右上角的菜单图标(三个垂直点)。 选择“帮助”(Help)。 在下拉菜单中选择“…...

数据库查询详解
数据库查询操作 前置:首先我们创建一个练习的数据库 /* SQLyog Professional v12.09 (64 bit) MySQL - 5.6.40-log : Database - studentsys ********************************************************************* *//*!40101 SET NAMES utf8 */;/*!40101 SET …...

c++视觉ROI 区域和ROI 区域图像叠加
ROI 区域提取和ROI 区域图像叠加 ROI 区域提取 #include <opencv2/opencv.hpp>int main() {// 读取图像cv::Mat image cv::imread("1.jpg");// 检查图像是否成功加载if (image.empty()) {std::cerr << "Error: Could not read the image." …...
scrapy爬虫系列之安装及入门介绍
前面介绍了很多Selenium基于自动测试的Python爬虫程序,主要利用它的xpath语句,通过分析网页DOM树结构进行爬取内容,同时可以结合Phantomjs模拟浏览器进行鼠标或键盘操作。但是,更为广泛使用的Python爬虫框架是——Scrapy爬虫。这是一篇在Windows系统下介绍 Scrapy爬虫安装及…...

洛谷刷题:数组
好累,学习令我快乐 一、小鱼比可爱 题目链接:https://www.luogu.com.cn/problem/P1428 题目描述 人比人,气死人;鱼比鱼,难死鱼。小鱼最近参加了一个“比可爱”比赛,比的是每只鱼的可爱程度。参赛的鱼被从…...
【Linux常用命令4】系统状态监测命令---2
last:查看所有系统的登录记录 执行last命令时,它会读取/var/log目录下名称为wtmp的文件,并把该文件记录的登录系统或终端的用户名单全部显示出来。默认显示wtmp的记录,btmp能显示的更详细,可以显示远程登录࿰…...
uboot启动流程-uboot代码重定位说明二
一. uboot启动流程 本文学习 uboot 的启动流程中涉及的 uboot 代码重定位部分。 _main 函数中会调用 relocate_code 函数。 relocate_code 函数分两个部分: 1. 拷贝 uboot 代码部分 2. 有关 " 重定位后有关函数调用或全局变量地址的问题"的解决方法…...
<HarmonyOS第一课>ArkTS开发语言介绍——闯关习题及答案
判断题 1.循环渲染ForEach可以从数据源中迭代获取数据,并为每个数组项创建相应的组件。( 对 ) 2.Link变量不能在组件内部进行初始化。( 对 ) 单选题 1.用哪一种装饰器修饰的struct表示该结构体具有组件化能力&#…...

香橙派、树莓派、核桃派、鲁班猫安装jupyter notebook【ubuntu、Debian开发板操作类似】
文章目录 前言一、安装环境二、使用方法总结 前言 香橙派树莓派鲁班猫安装一下调试代码还是比较方便的。 一、安装环境 假设已经安装好了miniconda3。如果还没安装可以参考我另外一篇博文,有写怎么安装。 pip install jupyter notebook # 生成Jupyter Notebook的…...

tomcat整体架构
Tomcat介绍 Tomcat是Apache Software Foundation(Apache软件基金会)开发的一款开源的Java Servlet 容器。它是一种Web服务器,用于在服务器端运行Java Servlet和JavaServer Pages (JSP)技术。它可 以为Java Web应用程序提供运行环境&#x…...

实现协议互通:探索钡铼BL124EC的EtherCAT转Ethernet/IP功能
钡铼BL124EC是一种用于工业网络通信的网关设备,专门用于将EtherCAT协议转换成Ethernet/IP协议。它充当一个桥梁,连接了使用不同协议的设备,使它们能够无缝地进行通信和互操作。 具体来说,BL124EC通过支持EtherCAT(以太…...

Android之App跳转其他软件
文章目录 前言一、效果图二、实现步骤1.弹框xml(自己替换图标)2.弹框utils3.两个弹框动画4.封装方便调用5.调用6.长按事件方法7.跳转步骤8.复制utils 总结 前言 最近遇到一个需求,就是App内大面积需要长按复制并跳转指定App,没办法,只能埋头…...
【Element UI】解决 el-dialog 弹框组件设置 custom-class 样式不生效问题
文章目录 问题描述解决方法 问题描述 <template><el-dialog class"myDialog" v-model"show" title"弹窗" custom-class"customDialog"><div>弹窗内容</div></el-dialog> </template> <script…...
前端菜鸟浅谈Web前端开发技术
Web前端开发技术按照过程遵循了由容易到困难,这就请求Web前端开发工作技术员方面要熟练学习基础的Web开发技术,关于网站性能的美化、SEO以及基础的关于服务器端方面的知识;另一方面还对开发人员有具体要求,比如能够熟练且灵敏的使…...

Springboot项目log4j与logback的Jar包冲突问题
异常信息关键词: SLF4J: Class path contains multiple SLF4J bindings. ERROR in ch.qos.logback.core.joran.spi.Interpreter24:14 - no applicable action for [properties], current ElementPath is [[configuration][properties]] 详细异常信息:…...

多云管理“拦路虎”:深入解析网络互联、身份同步与成本可视化的技术复杂度
一、引言:多云环境的技术复杂性本质 企业采用多云策略已从技术选型升维至生存刚需。当业务系统分散部署在多个云平台时,基础设施的技术债呈现指数级积累。网络连接、身份认证、成本管理这三大核心挑战相互嵌套:跨云网络构建数据…...

idea大量爆红问题解决
问题描述 在学习和工作中,idea是程序员不可缺少的一个工具,但是突然在有些时候就会出现大量爆红的问题,发现无法跳转,无论是关机重启或者是替换root都无法解决 就是如上所展示的问题,但是程序依然可以启动。 问题解决…...

【JVM】- 内存结构
引言 JVM:Java Virtual Machine 定义:Java虚拟机,Java二进制字节码的运行环境好处: 一次编写,到处运行自动内存管理,垃圾回收的功能数组下标越界检查(会抛异常,不会覆盖到其他代码…...
测试markdown--肇兴
day1: 1、去程:7:04 --11:32高铁 高铁右转上售票大厅2楼,穿过候车厅下一楼,上大巴车 ¥10/人 **2、到达:**12点多到达寨子,买门票,美团/抖音:¥78人 3、中饭&a…...
质量体系的重要
质量体系是为确保产品、服务或过程质量满足规定要求,由相互关联的要素构成的有机整体。其核心内容可归纳为以下五个方面: 🏛️ 一、组织架构与职责 质量体系明确组织内各部门、岗位的职责与权限,形成层级清晰的管理网络…...

(二)原型模式
原型的功能是将一个已经存在的对象作为源目标,其余对象都是通过这个源目标创建。发挥复制的作用就是原型模式的核心思想。 一、源型模式的定义 原型模式是指第二次创建对象可以通过复制已经存在的原型对象来实现,忽略对象创建过程中的其它细节。 📌 核心特点: 避免重复初…...
Rust 异步编程
Rust 异步编程 引言 Rust 是一种系统编程语言,以其高性能、安全性以及零成本抽象而著称。在多核处理器成为主流的今天,异步编程成为了一种提高应用性能、优化资源利用的有效手段。本文将深入探讨 Rust 异步编程的核心概念、常用库以及最佳实践。 异步编程基础 什么是异步…...
LLM基础1_语言模型如何处理文本
基于GitHub项目:https://github.com/datawhalechina/llms-from-scratch-cn 工具介绍 tiktoken:OpenAI开发的专业"分词器" torch:Facebook开发的强力计算引擎,相当于超级计算器 理解词嵌入:给词语画"…...
.Net Framework 4/C# 关键字(非常用,持续更新...)
一、is 关键字 is 关键字用于检查对象是否于给定类型兼容,如果兼容将返回 true,如果不兼容则返回 false,在进行类型转换前,可以先使用 is 关键字判断对象是否与指定类型兼容,如果兼容才进行转换,这样的转换是安全的。 例如有:首先创建一个字符串对象,然后将字符串对象隐…...
Java求职者面试指南:Spring、Spring Boot、MyBatis框架与计算机基础问题解析
Java求职者面试指南:Spring、Spring Boot、MyBatis框架与计算机基础问题解析 一、第一轮提问(基础概念问题) 1. 请解释Spring框架的核心容器是什么?它在Spring中起到什么作用? Spring框架的核心容器是IoC容器&#…...