当前位置：首页 > news >正文

js -音频变音（听不出说话的人是谁）

news 2026/2/11 4:21:39

学习参考来源：
https://zhuanlan.zhihu.com/p/634848804
https://developer.mozilla.org/zh-CN/docs/Web/API/Web_Audio_API

实际效果：
http://www.qingkong.zone/laboratory?type=audio-confusion

前言

本文内容可结合上面学习参考来源，结合学习。
之前我遇到的需求主要是对人声进行变音处理，以确保无法通过声音识别出是谁说的这个话，保护隐私。通过Web Audio API即可实现该变声效果。

1. 获取Audio上下文

const audioCtx = new (window.AudioContext || window.webkitAudioContext)();

2. 用 audioCtx 与音频源做关联

各个音频源关联方法：

（1）与audio，vidio标签或 Audio实例

const audio = new Audio()
const sourceNode = audioCtx.createMediaElementSource(audio)

（2）获取麦克风

const stream = await navigator.mediaDevices.getUserMedia({ audio: true}).catch(function (error) {console.log(error);});
const sourceNode = audioCtx.createMediaStreamSource(stream)

（3）使用缓冲器

const loadAudioBuffer = async (url) => {const response = await fetch(url);const arrayBuffer = await response.arrayBuffer();return await audioCtx.decodeAudioData(arrayBuffer);
}
// 获取 audioBuffer
loadAudioBuffer(props.url).then((audioBuffer) => {audioCtx.audioBuffer = audioBuffer;
}).catch((error) => {console.error("Failed to load audio buffer:", error);
});// 创建缓冲区
const bufferNode = audioCtx.createBufferSource()

需要注意：缓冲区只能播放一次，所以创建缓冲区逻辑要与播放逻辑放在一起

3. 使用缓冲区后，改写原有音频播放、暂停

声音流添加处理效果就像穿项链一样，一个接一个（引自学习参考来源1）

// 创建多个不同作用功能的node节点
var analyser = audioCtx.createAnalyser();
var distortion = audioCtx.createWaveShaper();
var gainNode = audioCtx.createGain();
var biquadFilter = audioCtx.createBiquadFilter();
var convolver = audioCtx.createConvolver();// 将所有节点连接在一起source = audioCtx.createMediaStreamSource(stream);
source.connect(analyser);
analyser.connect(distortion);
distortion.connect(biquadFilter);
biquadFilter.connect(convolver);
convolver.connect(gainNode);
gainNode.connect(audioCtx.destination);

上述代码是帮助你理解 AudioContext 的处理节点如何添加，不是实现代码。
audioCtx.destination 是 AudioContext 的输出源

播放

  if (flag) {// 创建缓冲区bufferNode = audioCtx.createBufferSource()bufferNode.buffer = audioCtx.audioBuffer;bufferNode.playbackRate.value = umlautValue;// 用于修改音量gainNode = audioCtx.createGain();bufferNode.connect(gainNode);gainNode.connect(audioCtx.destination);gainNode.gain.value = audioData.volume / 100;bufferNode.startTime = audioCtx.currentTime - audioData.currentTime;bufferNode.start(0, audioData.currentTime);bufferNode.onended = () => {audioData.status = "play";cancelAnimationFrame(animationFrameId);};} else {audio.play()}

暂停

  if (flag) {bufferNode.stop();audioData.currentTime = audioCtx.currentTime - bufferNode.startTime;cancelAnimationFrame(animationFrameId);} else {audio.pause()}

4. 使用 requestAnimationFrame 代替 timeupdate 获取实时信息

const updateCurrentTime = () => {if (bufferNode && bufferNode.playbackState === bufferNode.PLAYING_STATE) {audioData.currentTime = audioCtx.currentTime - bufferNode.startTime;audioData.currentValue = audioData.currentTime / audioData.duration * 100 * umlautValue;audioData.currentFormat = `${moment.utc(audioData.currentTime * 1000 * umlautValue).format("mm:ss")} / ${moment.utc(audioData.duration * 1000).format("mm:ss")}`;}animationFrameId = requestAnimationFrame(updateCurrentTime);
}

在需要关闭的地方

cancelAnimationFrame(animationFrameId);

5. 音频变音核心逻辑

本文走的是变速变调的路子，改变声音播放速率情况下，音调音色也会随着改变，例如玩过磁带的都知道，按快进功能会使声音变尖提高音调，慢放功能使声音变粗，降低音调。

为了让音频进度条与加速或减速的速率保持一致，需创建个变量做统一管理

const umlautValue = 1.5

6. 结尾

在销毁前记得销毁这些节点

  if (bufferNode) {bufferNode.stop();}if (gainNode) {gainNode.disconnect();}cancelAnimationFrame(animationFrameId);

喜欢的话不妨点个小小的赞与关注，您的赞与关注将是我源源不断的前进动力。

js -音频变音（听不出说话的人是谁）

学习参考来源： https://zhuanlan.zhihu.com/p/634848804 https://developer.mozilla.org/zh-CN/docs/Web/API/Web_Audio_API 实际效果： http://www.qingkong.zone/laboratory?typeaudio-confusion 前言本文内容可结合上面学习参考来源，结合…...

编程日记 2025/1/10 8:39:53

鸿蒙UI（ArkUI-方舟UI框架）

参考：https://developer.huawei.com/consumer/cn/doc/harmonyos-guides-V13/arkts-layout-development-overview-V13 ArkUI简介 ArkUI（方舟UI框架）为应用的UI开发提供了完整的基础设施，包括简洁的UI语法、丰富的UI功能&#xff…...

编程日记 2025/1/10 8:38:51

常见的http状态码 + ResponseEntity

常见的http状态码 ResponseStatus(HttpStatus.CREATED) 是 Spring Framework 中的注解，用于指定 HTTP 响应状态码。 1. 基本说明 HttpStatus.CREATED 对应 HTTP 状态码 201表示请求成功且创建了新的资源通常用于 POST 请求的处理方法上 2. 使用场景和示例基本…...

编程日记 2025/1/10 8:37:50

pikachu - Cross-Site Scripting（XSS）

pikachu - Cross-Site Scripting（XSS） 声明！ 笔记只是方便各位师傅的学习和探讨，文章所提到的网站以及内容，只做学习交流，其他均与本人无关，切勿触碰法律底线，否则后果自负&#x…...

编程日记 2025/1/10 8:33:45

操作系统之文件系统的基本概念

目录用户和磁盘视角的文件文件控制块（FCB）和索引结点（inode） 文件的操作创建文件（create系统调用） 写文件（write系统调用） 读文件（read系统调用） 重…...

编程日记 2025/1/10 8:32:43

深入探讨 Android 中的 AlarmManager：定时任务调度及优化实践

引言在 Android 开发中，AlarmManager 是一个非常重要的系统服务，用于设置定时任务或者周期性任务。无论是设置一个闹钟，还是定时进行数据同步，AlarmManager 都是不可或缺的工具之一。然而，随着 Android 系统的不断演…...

编程日记 2025/1/10 8:31:42

西电-算法分析-研究生课程复习笔记

24年秋的应该是张老师最后一次用卷面考试，他说以后这节课的期末考试都是在OJ上刷题了张老师上课还挺有意思的，上完之后能学会独立地思考算法设计问题了。整节课都在强调规模压缩这个概念，考试也是考个人对这些的理解，还挺好玩的哈…...

编程日记 2025/1/10 8:28:36

编译时找不到需要的库，如何在PyCharm中为你的项目添加需要的库

丰富的库支持是 Python 语言的一大特点，但是在使用 PyCharm 进行Python 代码编译的时候，遇到一些需要使用到的库提示不能解析时，该如何添加呢？ 比如下图所示的代码，可以看到需要使用 selenium、b4、jieba 这些库&…...

编程日记 2025/1/10 8:20:29

ip addr 命令给Linux网络接口配置多个IP地址值

问一下Chatgpt 怎么使用ip addr 命令给Linux网络接口配置多个IP地址值根据Chatgpt的提示执行了命令，命令执行成功，看下执行结果。 ifconfig 命令查看接口IP地址 ip addr show 命令查看接口IP地址...

编程日记 2025/1/10 8:19:27

C#语言的数据库编程

C#语言的数据库编程在现代软件开发中，数据库是不可或缺的一部分。无论是企业级应用还是个人项目，数据的存储与管理都是程序的核心功能之一。C#作为一种强类型、面向对象的编程语言，广泛应用于Windows平台的开发，尤其是在构建与数…...

编程日记 2025/1/10 8:18:26

时频分析之S变换

S变换的提出 1996年，由R.G Stockwell 提出了S变换，和其他时频分析工具一样，通过S变换，我们可以同时从时域以及频域观察一个信号的能量分布。S变换融合了短时傅里叶变换和小波变换的优点。关于S变换，最早发表于TSP上的…...

编程日记 2025/1/10 8:09:17

第二十八周学习周报

目录摘要Abstract1 GFPGAN1.1 总体结构1.2 实验研究1.3 代码分析总结摘要本周主要的学习内容是GFPGAN模型。GFPGAN是一种基于生成对抗网络(GAN)的模型，其利用封装在预训练的人脸GAN中的丰富多样的先验进行人脸图像的修复。这种生成面部先验（GFP&…...

编程日记 2025/1/10 7:58:05

SurfaceFlinger MessageQueue 有2个作用： 处理SurfaceFlinger INVALIDATE、REFRESH事件管理SurfaceFlinger主线程挂起和恢复 SurfaceFlinger::run() { while (true) { mEventQueue->waitMessage(); } } waitMessage {do {IPCThreadState::self()->flushComm…...

编程日记 2025/1/10 7:56:03

component-动态控制 div width 的值根据传入的变量决定width的值 vue

1.实现根据参数的值，div显示不同的长度 <div class"node-line" :style"lineProgress"></div> <script>export default {name: "trainSummaryInfo",data(){return{linePercentage:200,}},computed:{lineProgress…...

编程日记 2025/1/10 7:49:58

C#中的常用集合

目录一、动态数组ArrayList 二、List 三、栈（Stack） 四、队列（Queue） 五、字典（Dictionary）,int> 一、动态数组ArrayList ArrayList 是 C# 中提供的一种动态数组类，位于命名空间 Syste…...

编程日记 2025/1/10 7:42:52

插入实体自增主键太长，mybatis-plaus自增主键

1、问题 spring-boot整合mybtais执行insert语句时，主键id为长文本数据。 2、分析问题 1)数据库主键是否自增 2）数据库主键的种子值设置的多少 3、解决问题 1）数据库主键设置的时自增 3）种子值是1 所以排查是数据库的问题 4、继…...

编程日记 2025/1/10 7:41:51

晨辉面试抽签和评分管理系统之一：考生信息管理和编排

晨辉面试抽签和评分管理系统（下载地址:www.chenhuisoft.cn）是公务员招录面试、教师资格考试面试、企业招录面试等各类面试通用的考生编排、考生入场抽签、候考室倒计时管理、面试考官抽签、面试评分记录和成绩核算的面试全流程信息化管理软件。提供了考生…...

编程日记 2025/1/10 7:39:49

【MySQL】MVCC详解, 图文并茂简单易懂

欢迎来到啊妮莫的学习小屋祝读本文的朋友都天天开心呀目录 MVCC简介快照读与当前读快照读当前读隔离级别隐藏字段和Undo Log版本链✨MVCC原理--ReadView✨ReadView简介设计思路适用隔离级别重要内容 ReadView规则MVCC整体流程不同隔离级别下的MVCC读已提交可重复读总结 M…...

编程日记 2025/1/10 7:38:48

中国数字化发展的问题与机会

橙蜂智能公司致力于提供先进的人工智能和物联网解决方案，帮助企业优化运营并实现技术潜能。公司主要服务包括AI数字人、AI翻译、埃域知识库、大模型服务等。其核心价值观为创新、客户至上、质量、合作和可持续发展。橙蜂智农的智慧农业产品涵盖了多方面的功能，如智能化推荐、…...

编程日记 2025/1/10 7:37:47

【ROS2】☆ launch之Python

☆重点 ROS1和ROS2其中一个很大区别之一就是launch的编写方式。在ROS1中采用xml格式编写launch，而ROS2保留了XML 格式launch，还另外引入了Python和YAML 编写方式。选择哪种编写取决于每位开发人员的爱好，但是ROS2官方推荐使用Python方式编写…...

编程日记 2025/1/10 7:32:43

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造，完美适配AGV和无人叉车。同时，集成以太网与语音合成技术，为各类高级系统（如MES、调度系统、库位管理、立库等）提供高效便捷的语音交互体验。 L…...

编程新知 2026/2/10 23:40:34

龙虎榜——20250610

上证指数放量收阴线，个股多数下跌，盘中受消息影响大幅波动。深证指数放量收阴线形成顶分型，指数短线有调整的需求，大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技代表标的：御银股份、雄帝科技驱动…...

编程新知 2026/2/10 23:39:36

Flask RESTful 示例

目录 1. 环境准备2. 安装依赖3. 修改main.py4. 运行应用5. API使用示例获取所有任务获取单个任务创建新任务更新任务删除任务中文乱码问题： 下面创建一个简单的Flask RESTful API示例。首先，我们需要创建环境，安装必要的依赖，然后…...

编程新知 2026/2/8 20:42:43

云计算——弹性云计算器（ECS）

弹性云服务器：ECS 概述云计算重构了ICT系统，云计算平台厂商推出使得厂家能够主要关注应用管理而非平台管理的云平台，包含如下主要概念。 ECS（Elastic Cloud Server）：即弹性云服务器，是云计算…...

编程新知 2025/8/16 21:50:27

visual studio 2022更改主题为深色

visual studio 2022更改主题为深色点击visual studio 上方的工具-> 选项在选项窗口中，选择环境 -> 常规 ，将其中的颜色主题改成深色点击确定，更改完成...

编程新知 2026/1/25 11:13:37

跨链模式：多链互操作架构与性能扩展方案

跨链模式：多链互操作架构与性能扩展方案 ——构建下一代区块链互联网的技术基石一、跨链架构的核心范式演进 1. 分层协议栈：模块化解耦设计现代跨链系统采用分层协议栈实现灵活扩展（H2Cross架构）： 适配层&#xf…...

编程新知 2026/2/5 14:15:13

【配置 YOLOX 用于按目录分类的图片数据集】

现在的图标点选越来越多，如何一步解决，采用 YOLOX 目标检测模式则可以轻松解决要在 YOLOX 中使用按目录分类的图片数据集（每个目录代表一个类别，目录下是该类别的所有图片），你需要进行以下配置步骤&#x…...

编程新知 2026/1/30 4:52:56

c#开发AI模型对话

AI模型前面已经介绍了一般AI模型本地部署，直接调用现成的模型数据。这里主要讲述讲接口集成到我们自己的程序中使用方式。微软提供了ML.NET来开发和使用AI模型，但是目前国内可能使用不多，至少实践例子很少看见。开发训练模型就不介绍了&am…...

编程新知 2026/2/1 8:59:45

USB Over IP专用硬件的5个特点

USB over IP技术通过将USB协议数据封装在标准TCP/IP网络数据包中，从根本上改变了USB连接。这允许客户端通过局域网或广域网远程访问和控制物理连接到服务器的USB设备（如专用硬件设备），从而消除了直接物理连接的需要。USB over IP的…...

编程新知 2026/2/6 13:42:22

Python ROS2【机器人中间件框架】简介

销量过万TEEIS德国护膝夏天用薄款优惠券冠生园百花蜂蜜428g 挤压瓶纯蜂蜜巨奇严选鞋子除臭剂360ml 多芬身体磨砂膏280g健70%-75%酒精消毒棉片湿巾1418cm 80片/袋3袋大包清洁食品用消毒优惠券AIMORNY52朵红玫瑰永生香皂花同城配送非鲜花七夕情人节生日礼物送女友热卖妙洁棉…...

编程新知 2026/1/29 9:12:46

js -音频变音（听不出说话的人是谁）

前言

1. 获取Audio上下文

2. 用 audioCtx 与音频源做关联

3. 使用缓冲区后，改写原有音频播放、暂停

4. 使用 requestAnimationFrame 代替 timeupdate 获取实时信息

5. 音频变音核心逻辑

6. 结尾

相关文章：

js -音频变音（听不出说话的人是谁）

鸿蒙UI（ArkUI-方舟UI框架）

常见的http状态码 + ResponseEntity

pikachu - Cross-Site Scripting（XSS）

操作系统之文件系统的基本概念

深入探讨 Android 中的 AlarmManager：定时任务调度及优化实践

西电-算法分析-研究生课程复习笔记

编译时找不到需要的库，如何在PyCharm中为你的项目添加需要的库

ip addr 命令给Linux网络接口配置多个IP地址值

C#语言的数据库编程

时频分析之S变换

第二十八周学习周报

SurfaceFlinger MessageQueue原理

component-动态控制 div width 的值根据传入的变量决定width的值 vue

C#中的常用集合

插入实体自增主键太长，mybatis-plaus自增主键

晨辉面试抽签和评分管理系统之一：考生信息管理和编排

【MySQL】MVCC详解, 图文并茂简单易懂

中国数字化发展的问题与机会

【ROS2】☆ launch之Python

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

龙虎榜——20250610

Flask RESTful 示例

云计算——弹性云计算器（ECS）

visual studio 2022更改主题为深色

跨链模式：多链互操作架构与性能扩展方案

【配置 YOLOX 用于按目录分类的图片数据集】

c#开发AI模型对话

USB Over IP专用硬件的5个特点

Python ROS2【机器人中间件框架】简介