当前位置: 首页 > article >正文

语音信号处理中的小波分解法降噪方法MATLAB例程

语音信号处理--降噪方法之小波分解法 MATLAB例程语音降噪这事儿日常太刚需了——打电话时的背景杂音、录音里的环境噪音都得想办法干掉。小波分解法算是语音降噪里的老牌选手了比起傅里叶只能看全局频率小波能同时抓时域和频域的局部信息对语音这种时变信号特别友好。咱直接拿MATLAB撸一遍流程边写边唠。首先得搞点实验素材加载一段语音文件MATLAB里audioread直接搞定% 加载原始语音替换成你的音频路径 [y, Fs] audioread(your_audio.wav); % 播放原音 sound(y, Fs);这里y是一维数组存的是每个采样点的音频数据Fs是采样率比如常见的44100Hz、16000Hz。要是没自己的音频也能直接生成个正弦波模拟语音y sin(2pi440*(0:1/Fs:1-1/Fs));就440Hz的标准A音。然后给干净语音加点“料”模拟环境杂音比如加高斯白噪音% 加高斯白噪音信噪比10dB数值越小噪音越大 y_noisy awgn(y, 10, measured); sound(y_noisy, Fs); % 听听噪音版是不是内味儿就来了awgn函数里的measured是先测量原语音能量再加噪保证信噪比准确。这时候播放的话应该是清晰的语音里混着滋滋的白噪音跟户外打电话那感觉一模一样。接下来核心操作——小波分解。咱选db4小波Daubechies4工程里常用的紧支撑正交小波计算快还稳分解3层试试% 用db4小波对含噪语音做3层分解 [C, L] wavedec(y_noisy, 3, db4);这里得唠唠返回值C是所有小波系数的拼接数组L是个长度为分解层数2的数组前3个是各层细节系数的长度最后一个是近似系数的长度。分解后最低层的近似系数是语音的主体低频成分人声基频就在这而d1、d2、d3这三层细节系数里大部分都是噪音的高频成分——毕竟人声的高频细节没那么多噪音却在高频区瞎晃。语音信号处理--降噪方法之小波分解法 MATLAB例程然后就得把混在细节系数里的噪音干掉靠的是阈值处理。先把各层细节系数抠出来% 提取各层细节系数d1是最细的高频层噪音最密集 d1 detcoef(C, L, 1); d2 detcoef(C, L, 2); d3 detcoef(C, L, 3);接下来算阈值MATLAB里有自动计算阈值的工具比如基于统计的sqtwolog方法对付高斯噪音特别好用% 按系数长度自动计算阈值 thr1 wthrmngr(sqtwolog, length(d1)); thr2 wthrmngr(sqtwolog, length(d2)); thr3 wthrmngr(sqtwolog, length(d3));然后用软阈值处理细节系数软阈值比硬阈值处理后更平滑听感更好% s代表软阈值硬阈值用h d1_denoised wthresh(d1, s, thr1); d2_denoised wthresh(d2, s, thr2); d3_denoised wthresh(d3, s, thr3);这里必须唠唠软阈值和硬阈值的区别硬阈值是系数绝对值小于阈值直接置0大于的话原样保留软阈值是小于置0大于的话还要减去阈值。硬阈值处理后可能有“毛刺感”听着像电流声软阈值虽然会损失一丢丢细节但整体更顺滑语音降噪里一般优先选软阈值。处理完细节系数就得把系数拼回去重构语音了。先把近似系数抠出来再替换处理后的细节系数% 提取第3层近似系数语音核心成分 a3 appcoef(C, L, db4); % 拼接新的小波系数近似系数 处理后的各层细节系数顺序是d3, d2, d1 C_new [a3, d3_denoised, d2_denoised, d1_denoised]; % 重构降噪后的语音 y_denoised waverec(C_new, L, db4);这里要注意系数顺序wavedec返回的C里是近似系数在前然后是d3、d2、d1所以拼C_new的时候得按这个顺序来不然重构出来的语音直接变调跟外星人说话似的。最后听听效果再画个图对比下% 播放降噪后语音 sound(y_denoised, Fs); % 画图对比原音、噪音、降噪后 figure; subplot(3,1,1); plot(y); title(原始语音); xlabel(采样点); ylabel(幅值); subplot(3,1,2); plot(y_noisy); title(含噪语音); xlabel(采样点); ylabel(幅值); subplot(3,1,3); plot(y_denoised); title(小波分解降噪后语音); xlabel(采样点); ylabel(幅值);看时域图的话含噪语音是抖得厉害的“波浪线”降噪后曲线明显平滑了和原音的趋势几乎重合听感上滋滋的白噪音基本消失人声清晰度拉满。最后扯点实用小技巧小波基选择db系列db2-db8是通用款计算快sym系列对称性更好处理后相位失真小要是想保留更多唇齿音细节试试coiflet小波。分解层数不用贪多一般3-5层足够。层数太多的话高频细节里会混入语音的谐波成分阈值处理会把有用信号也干掉反而得不偿失。阈值方法除了sqtwolog还有rigrsure自适应阈值根据系数能量调整、minimaxi极值阈值适合小样本可以都试试毕竟语音降噪最终还是得耳朵说了算。亲测下来这套流程对付日常的环境白噪音效果拉满要是遇到非平稳噪音比如汽车喇叭、脚步声可能得结合小波包分解把每个频带都拆开处理但那就是进阶玩法了咱先把基础的小波分解降噪玩明白再说~

相关文章:

语音信号处理中的小波分解法降噪方法MATLAB例程

语音信号处理--降噪方法之小波分解法 MATLAB例程语音降噪这事儿,日常太刚需了——打电话时的背景杂音、录音里的环境噪音,都得想办法干掉。小波分解法算是语音降噪里的老牌选手了,比起傅里叶只能看全局频率,小波能同时抓时域和频域…...

Mbed OS下BLE鼠标HID服务开发指南

1. 项目概述Mbed BLE Mouse 是一个面向 Arduino 兼容开发板的蓝牙低功耗(BLE)人机接口设备(HID)库,专为运行 Mbed OS 的嵌入式平台设计。该库将具备 BLE 能力的微控制器(如 Arduino Nano 33 BLE、Nano 33 B…...

零门槛实战:Python百度搜索API从入门到精通

零门槛实战:Python百度搜索API从入门到精通 【免费下载链接】python-baidusearch 自己手写的百度搜索接口的封装,pip安装,支持命令行执行。Baidu Search unofficial API for Python with no external dependencies 项目地址: https://gitco…...

未来最有前景的行业及终身发展方向指南

未来最有前景的行业及终身发展方向指南根据最新行业趋势分析,以下5个行业不仅前景广阔,更适合作为终身职业发展方向,并附上具体实施步骤:一、人工智能与大模型应用为什么值得长期投入:国家"十五五"规划重点支…...

Python处理MDX词典数据实战:从解析到Excel导出完整流程

Python处理MDX词典数据实战:从解析到Excel导出完整流程 在语言学习和词典开发领域,MDX格式因其高效的压缩和检索能力成为主流词典存储格式之一。但对于需要批量分析或迁移数据的开发者而言,直接操作这种二进制文件始终是个技术门槛。本文将带…...

手把手教你用云测试平台搞定安卓/iOS/鸿蒙兼容性测试(含Testin/百度MTC实战)

云测试平台实战指南:零成本解决安卓/iOS/鸿蒙兼容性问题 当你的应用需要同时覆盖三大移动平台时,真机设备采购成本可能高达数十万元。去年我们团队上线一款社交应用时,仅购买主流测试设备就花掉了23万预算——直到发现云测试平台能以1/100的…...

25岁的Java工程师:我的AI转型之路,附完整学习路线与资料下载

一位Java开发者在AI大模型兴起后面临职业危机,通过博学谷的系统培训成功转型AI领域。经过6个月刻苦学习,在老师指导下克服数学基础薄弱等困难,最终获得月薪15K的AI工作机会。作者分享了自己的转型经历、完整学习路线和AI大模型资源&#xff0…...

SourceTree 合并提交实战:5分钟搞定零散提交的批量处理(附Cherry Pick技巧)

SourceTree高效提交管理:从零散提交到优雅合并的完整指南 在团队协作开发中,代码提交历史就像项目的日记本——杂乱无章的记录会让后续的维护和问题追踪变得异常困难。想象一下,当你需要回溯某个功能的开发过程时,面对几十个"…...

Anaconda3安装和安装pycharm(保姆级教程)

目录 一.安装Anaconda3 二.安装pycharm 三.设置配置(可选根据自己的习惯来) Anaconda3 与 PyCharm 介绍、安装及关系 Anaconda3 是一个集成了 Python 解释器、大量数据分析和机器学习常用库(如 numpy、pandas),还自带 conda 环境管理工具的…...

(理论篇)深入剖析认证崩溃——从弱口令到暴力破解

概述:在应用程序的安全防御体系中,身份认证是守卫系统大门的第一道关卡。这道关卡的失守,通常被称为“认证崩溃”。 攻击者通过利用认证或会话管理中的缺陷,能够成功破译密码、密钥或会话令牌,从而获得非授权访问权限。…...

RAW图像处理避坑指南:如何正确分离和组合RGGB四通道(Python版)

RAW图像处理避坑指南:如何正确分离和组合RGGB四通道(Python版) 第一次处理RAW图像时,我犯了一个低级错误——直接把RGGB四个通道当作普通的RGB图像来处理。结果生成的图像色彩完全错乱,红色变成了诡异的紫色&#xff0…...

ret2text Ctfhub

简单的栈溢出gets函数,v4,在ebp-0x70shiftF12先传入形参,因为是64位,可以查看是将sh写入rdi寄存器中,之后调用函数system将常量区的地址写入rdi寄存器中,之后对rdi进行寄存器间接寻址.rodata:字…...

CoPaw赋能物联网(IoT)后端开发:设备数据解析与告警规则生成

CoPaw赋能物联网(IoT)后端开发:设备数据解析与告警规则生成 1. 物联网开发的现实挑战 想象一下这样的场景:你刚接手一个大型物联网平台项目,需要接入上百种不同类型的设备。这些设备来自不同厂商,协议文档…...

Vue-Flow-Editor:用SVG魔法点亮你的流程图创作之旅

Vue-Flow-Editor:用SVG魔法点亮你的流程图创作之旅 【免费下载链接】vue-flow-editor Vue Svg 实现的flow可视化编辑器 项目地址: https://gitcode.com/gh_mirrors/vu/vue-flow-editor 想象一下,你正在设计一个复杂的业务流程,脑海中…...

windows下git使用教程2(gitee仓库与代码提交)

前序文章: windows下git使用教程1(安装与使用) 代码仓库gitee的使用 介绍了git的基础操作,这篇文章介绍一下远程仓库和代码提交的操作。 1.远程仓库 远程仓库是托管在网络服务器上的 Git 仓库,和你本地电脑上的 本…...

技术解密:LilToon卡通渲染着色器的模块化革命与跨平台实践指南

技术解密:LilToon卡通渲染着色器的模块化革命与跨平台实践指南 【免费下载链接】lilToon Feature-rich shaders for avatars 项目地址: https://gitcode.com/gh_mirrors/li/lilToon 在Unity实时渲染生态中,卡通渲染技术长期面临风格化与性能优化的…...

从知识概念预测到精准推送:构建下一代个性化习题推荐引擎

1. 为什么我们需要下一代习题推荐系统? 每次打开在线学习平台时,你是否遇到过这样的困扰:系统推荐的题目要么简单得像112,要么难到让你怀疑人生?更糟的是,反复出现的同类题型让你想摔键盘。这背后暴露的正是…...

仅限首批MCP认证伙伴内部流出:OAuth 2026架构设计图原始版(含签名链路、密钥轮转SOP与审计日志字段规范)

第一章:OAuth 2026架构设计图概览与MCP认证背景OAuth 2026 是下一代授权框架的演进标准,由 IETF OAuth Working Group 于 2025 年底正式发布,旨在应对零信任架构、跨域设备协同及量子安全过渡等新兴挑战。其核心创新在于将传统“客户端-资源服…...

espeak-ng语音合成终极指南:快速掌握127种语言免费TTS技术

espeak-ng语音合成终极指南:快速掌握127种语言免费TTS技术 【免费下载链接】espeak-ng espeak-ng: 是一个文本到语音的合成器,支持多种语言和口音,适用于Linux、Windows、Android等操作系统。 项目地址: https://gitcode.com/GitHub_Trendi…...

HG-ha/MTools性能基准:各平台AI任务执行时间对比

HG-ha/MTools性能基准:各平台AI任务执行时间对比 本文基于实际测试数据,对比HG-ha/MTools在不同硬件平台上的AI任务执行性能,为开发者提供选型参考 1. 工具概览与测试背景 HG-ha/MTools是一款功能强大的现代化桌面工具集,集成了图…...

Android USB OTG相机完整指南:如何快速连接外部摄像头到手机

Android USB OTG相机完整指南:如何快速连接外部摄像头到手机 【免费下载链接】Android-USB-OTG-Camera 项目地址: https://gitcode.com/gh_mirrors/an/Android-USB-OTG-Camera 想要在Android手机上使用USB摄像头吗?Android USB OTG相机项目为你提…...

11-C#.Net-多线程-Async-Await篇-学习笔记

一、async/await 基础 1.1 什么是async/await 定义 C# 5.0 (.NET 4.5) 引入的语法糖C# 7.1 开始,Main入口也可以使用C# 8.0 支持异步流(await foreach)和异步释放(await using) 什么是语法糖 由编译器提供的便捷功能底层实现不变,但写代码更简洁类似的语…...

Fish Speech 1.5声音克隆教程:如何用手机录音制作高质量参考音频

Fish Speech 1.5声音克隆教程:如何用手机录音制作高质量参考音频 想用自己的声音,或者朋友、家人的声音,来生成一段全新的语音吗?Fish Speech 1.5的声音克隆功能就能帮你实现。但很多人第一步就卡住了:怎么录一段合格…...

腾视科技AI大模型应用:提效、破局与落地,重塑智能新生态

当AI大模型技术从实验室走向产业落地,企业却普遍面临 “成效难显、成本高企、复用性差” 的三重困境。腾视科技深耕大模型应用领域,以 “顶层设计 敏捷迭代” 的方法论,结合全栈式技术产品矩阵,推出AI大模型应用解决方案&#xf…...

实测coze-loop:粘贴代码选目标,AI自动重构+解释优化思路

实测coze-loop:粘贴代码选目标,AI自动重构解释优化思路 1. 为什么开发者需要智能代码优化工具 在日常开发中,我们经常遇到这样的困境:一段功能正常的代码,随着业务发展逐渐暴露出性能瓶颈或可维护性问题。传统优化方…...

腾视科技重磅推出TensorAI智能体平台,开启智能助手新体验

在人工智能技术飞速发展的当下,浙江腾视算擎科技有限公司(以下简称:腾视科技TENSORTEC)凭借深厚的技术积累与创新思维,正式推出腾视科技TensorAI类“豆包”应用平台(AI智能体平台),为…...

90后农学毕业,放弃高薪销售,逆袭转型人工智能,我经历了什么?!转行人工智能大模型

我叫王东,90后,和大家分享一下我的人工智能转型之路。 农学毕业,投身互联网做销售 机遇难求,养殖梦碎 我是土生土长的农村人,小时候经常和小鱼小虾打交道,上大学的时候就选择了农学专业,想着毕业…...

DeerFlow应用案例:如何用AI研究助手快速分析行业趋势并生成报告

DeerFlow应用案例:如何用AI研究助手快速分析行业趋势并生成报告 1. 引言:当研究遇上AI,效率革命正在发生 想象一下这个场景:老板在周一晨会上突然问你:“小张,下周我们要开一个关于‘AI智能体在金融风控领…...

SQL如何多字段取极值?| 附多行业案例实战

目录 一、先理清:多字段取极值的两类核心场景 二、GREATEST()/LEAST()基础用法 1. 函数语法 2. 基础示例 三、最易踩的坑:NULL值的致命影响 1. 坑的示例 四、NULL值坑的解决方案:替换空值再取极值 1. 通用方案:COALESCE函数(所有数据库兼容) 修复后的示例代码 …...

叠加百分比标签

Matlab&python绘制混淆矩阵求解绘图,带百分比的混淆矩阵,颜色多变风格多样。最近在模型评估的时候发现,带百分比的混淆矩阵比纯数字版本直观太多了。今天直接上代码,聊聊Matlab和Python两种实现方案,顺便分享几个配…...