当前位置: 首页 > article >正文

语聊房中的声浪效果是怎么实现的

在语聊房、K 歌房等实时音频场景中我们经常能看到随着用户说话或唱歌界面上会出现动态的声浪波形或音量柱状图。这种视觉反馈不仅让用户感知到音频正在传输还能增强互动体验。那么这种声浪效果是如何实现的呢本文将基于ZEGO 实时音视频 SDKZEGO Express SDK为例详细讲解声浪效果的技术实现。一、什么是声浪效果1.1 什么是声浪声浪效果是指根据音频信号的音量大小实时在界面上渲染出动态的视觉效果。常见的表现形式包括音量波动动画头像周围的圆环随音量大小变化柱状图频谱类似音乐播放器的频谱可视化波形动画模拟声波传播的动态效果1.2 声浪常见的应用场景语聊房显示正在说话的用户K 歌房展示主播的音调与音量变化视频会议标识当前发言人在线教育提示学生发言状态1.3 声浪实现的技术原理声浪效果的实现流程可以概括为三个步骤音频采集 → 音量计算 → UI 渲染ZEGO Express SDK 负责音频采集和音量计算开发者只需监听回调并将数据渲染到 UI 上。二、ZEGO SDK 提供的声浪能力ZEGO Express SDK 提供了完整的声浪监控能力包括声浪音量和音频频谱两种数据类型。2.1 核心 API 介绍声浪监控 API// 启动声浪监控支持版本1.1.0 public void startSoundLevelMonitor(int millisecond) // 停止声浪监控 public void stopSoundLevelMonitor()参数说明millisecond声浪回调周期单位毫秒取值范围 [100, 3000]默认 100ms音频频谱监控 API// 启动音频频谱监控支持版本1.1.0 public void startAudioSpectrumMonitor() // 停止音频频谱监控 public void stopAudioSpectrumMonitor()特点固定回调周期100ms适用于 K 歌场景的音调与音量变化动画2.2 回调接口说明ZEGO SDK 通过IZegoEventHandler提供四个回调接口本地音频回调// 本地采集的声浪回调 public void onCapturedSoundLevelUpdate(double soundLevel) // 本地采集的音频频谱回调 public void onCapturedAudioSpectrumUpdate(float[] audioSpectrum)远端音频回调// 远端拉流的声浪回调 public void onRemoteSoundLevelUpdate(HashMapString, Double soundLevels) // 远端拉流的音频频谱回调 public void onRemoteAudioSpectrumUpdate(HashMapString, float[] audioSpectrums)关键点远端回调使用HashMap结构key为流 IDvalue为对应的声浪/频谱数据这样设计是因为语聊房中可能同时存在多路远端音频流三、实现步骤详解3.1 前置准备在使用声浪监控功能前需要完成以下准备工作// 1. 创建 ZEGO Express Engine 实例 ZegoExpressEngine engine ZegoExpressEngine.createEngine( appID, appSign, true, ZegoScenario.GENERAL, application, null ); // 2. 加入房间 engine.loginRoom(roomID, user); // 3. 推流本地音频 engine.startPublishingStream(streamID); // 4. 拉流远端音频 engine.startPlayingStream(streamID);3.2 监听声浪回调创建自定义的事件处理器实现声浪回调接口class MyEventHandler extends IZegoEventHandler { Override public void onCapturedSoundLevelUpdate(double soundLevel) { // 处理本地声浪数据 // soundLevel 范围0.0 ~ 100.0 updateLocalSoundLevelUI(soundLevel); } Override public void onRemoteSoundLevelUpdate(HashMapString, Double soundLevels) { // 处理远端声浪数据 for (Map.EntryString, Double entry : soundLevels.entrySet()) { String streamID entry.getKey(); Double soundLevel entry.getValue(); updateRemoteSoundLevelUI(streamID, soundLevel); } } Override public void onCapturedAudioSpectrumUpdate(float[] audioSpectrum) { // 处理本地音频频谱数据 // audioSpectrum 为频谱值数组范围 [0, 2^30] updateLocalSpectrumUI(audioSpectrum); } Override public void onRemoteAudioSpectrumUpdate(HashMapString, float[] audioSpectrums) { // 处理远端音频频谱数据 for (Map.EntryString, float[] entry : audioSpectrums.entrySet()) { String streamID entry.getKey(); float[] spectrum entry.getValue(); updateRemoteSpectrumUI(streamID, spectrum); } } }3.3 启动声浪监控// 设置事件回调 engine.setEventHandler(new MyEventHandler()); // 启动声浪监控设置 100ms 回调周期 engine.startSoundLevelMonitor(100);注意事项调用startSoundLevelMonitor后onCapturedSoundLevelUpdate会立即触发未推流且未预览时本地声浪回调值为 0远端声浪需要在startPlayingStream之后才会回调3.4 处理远端多路流数据在语聊房场景中房间内可能有多个用户同时推流。为了正确处理每路流的声浪数据需要先获取流列表class MyEventHandler extends IZegoEventHandler { // 保存房间内的流列表 private ListZegoStream streamList new ArrayList(); Override public void onRoomStreamUpdate(String roomID, ZegoUpdateType updateType, ArrayListZegoStream streamList, JSONObject extendedData) { if (updateType ZegoUpdateType.ADD) { // 有新流加入 this.streamList.addAll(streamList); } else { // 有流移除 this.streamList.removeAll(streamList); } } Override public void onRemoteSoundLevelUpdate(HashMapString, Double soundLevels) { // 遍历保存的流列表获取对应的声浪数据 for (ZegoStream stream : streamList) { String streamID stream.streamID; if (soundLevels.containsKey(streamID)) { Double soundLevel soundLevels.get(streamID); // 根据流 ID 更新对应用户的 UI updateUserSoundLevelUI(stream.user.userID, soundLevel); } } } }四、进阶音频频谱可视化如果需要实现更炫酷的音频可视化效果如 K 歌房的频谱动画可以使用音频频谱监控功能。4.1 频谱数据特点回调周期固定 100ms数据格式float[]数组每个元素代表一个频段的能量值数值范围[0, 2^30]适用场景主播 K 歌场景让主播或观众看到音调与音量变化的动画4.2 启动频谱监控// 启动音频频谱监控 engine.startAudioSpectrumMonitor();4.3 频谱数据渲染将频谱数组映射到 UI 柱状图Override public void onCapturedAudioSpectrumUpdate(float[] audioSpectrum) { // audioSpectrum 长度通常为 512 或 1024 // 可以根据需要进行降采样例如只显示 32 个柱状图 int barCount 32; float[] displaySpectrum new float[barCount]; // 将频谱数据分组求平均 int groupSize audioSpectrum.length / barCount; for (int i 0; i barCount; i) { float sum 0; for (int j 0; j groupSize; j) { sum audioSpectrum[i * groupSize j]; } displaySpectrum[i] sum / groupSize; } // 更新 UI自定义 View 绘制柱状图 spectrumView.updateSpectrum(displaySpectrum); }五、实战技巧与注意事项5.1 性能优化合理设置回调周期// 对于普通语聊房200ms 的回调周期足够 engine.startSoundLevelMonitor(200); // 对于 K 歌房等对实时性要求高的场景使用 100ms engine.startSoundLevelMonitor(100);UI 渲染使用节流策略private long lastUpdateTime 0; private static final long UPDATE_INTERVAL 50; // 50ms 更新一次 UI Override public void onCapturedSoundLevelUpdate(double soundLevel) { long currentTime System.currentTimeMillis(); if (currentTime - lastUpdateTime UPDATE_INTERVAL) { updateUI(soundLevel); lastUpdateTime currentTime; } }5.2 常见问题问题 1未推流时声浪回调值为 0原因启动声浪监控后即使未启动本地音频采集onCapturedSoundLevelUpdate也会有回调但声浪值为 0。解决方案在推流或预览后再处理声浪数据。问题 2远端声浪没有回调原因onRemoteSoundLevelUpdate需要在拉流startPlayingStream之后才会回调。解决方案确保已成功拉流可以通过onPlayerStateUpdate回调确认拉流状态。问题 3声浪数据跳变明显原因音频信号本身存在波动直接渲染会导致 UI 抖动。解决方案对声浪数据进行平滑处理private double smoothedSoundLevel 0; private static final double SMOOTH_FACTOR 0.3; Override public void onCapturedSoundLevelUpdate(double soundLevel) { // 指数移动平均 smoothedSoundLevel smoothedSoundLevel * (1 - SMOOTH_FACTOR) soundLevel * SMOOTH_FACTOR; updateUI(smoothedSoundLevel); }5.3 混流场景处理在混流场景下如果需要获取混流后的声浪数据可以通过拉取混流后的流来获取// 拉取混流后的流 engine.startPlayingStream(mixStreamID); // 在 onRemoteSoundLevelUpdate 中获取混流的声浪 Override public void onRemoteSoundLevelUpdate(HashMapString, Double soundLevels) { if (soundLevels.containsKey(mixStreamID)) { Double mixedSoundLevel soundLevels.get(mixStreamID); updateMixedSoundLevelUI(mixedSoundLevel); } }六、完整示例代码以下是一个完整的语聊房声浪效果实现示例public class VoiceChatActivity extends AppCompatActivity { private ZegoExpressEngine engine; private String roomID room_001; private String userID user_001; private String streamID stream_001; Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout.activity_voice_chat); initZegoEngine(); joinRoom(); startPublishing(); startSoundLevelMonitor(); } private void initZegoEngine() { // 创建引擎 engine ZegoExpressEngine.createEngine( YOUR_APP_ID, YOUR_APP_SIGN, true, ZegoScenario.GENERAL, getApplication(), null ); // 设置事件回调 engine.setEventHandler(new IZegoEventHandler() { Override public void onCapturedSoundLevelUpdate(double soundLevel) { runOnUiThread(() - { // 更新本地用户的声浪 UI updateLocalSoundLevel(soundLevel); }); } Override public void onRemoteSoundLevelUpdate(HashMapString, Double soundLevels) { runOnUiThread(() - { // 更新远端用户的声浪 UI for (Map.EntryString, Double entry : soundLevels.entrySet()) { updateRemoteSoundLevel(entry.getKey(), entry.getValue()); } }); } Override public void onRoomStreamUpdate(String roomID, ZegoUpdateType updateType, ArrayListZegoStream streamList, JSONObject extendedData) { if (updateType ZegoUpdateType.ADD) { // 有新流加入开始拉流 for (ZegoStream stream : streamList) { engine.startPlayingStream(stream.streamID); } } } }); } private void joinRoom() { ZegoUser user new ZegoUser(userID); engine.loginRoom(roomID, user); } private void startPublishing() { engine.startPublishingStream(streamID); } private void startSoundLevelMonitor() { // 启动声浪监控100ms 回调一次 engine.startSoundLevelMonitor(100); } private void updateLocalSoundLevel(double soundLevel) { // 更新本地用户头像的声浪动画 // 例如根据 soundLevel 调整圆环的大小或透明度 localUserView.setSoundLevel(soundLevel); } private void updateRemoteSoundLevel(String streamID, double soundLevel) { // 更新远端用户头像的声浪动画 RemoteUserView userView findUserViewByStreamID(streamID); if (userView ! null) { userView.setSoundLevel(soundLevel); } } Override protected void onDestroy() { super.onDestroy(); // 停止声浪监控 engine.stopSoundLevelMonitor(); // 登出房间 engine.logoutRoom(roomID); // 销毁引擎 ZegoExpressEngine.destroyEngine(null); } }七、总结声浪效果的实现核心流程可以总结为初始化 SDK创建 ZEGO Express Engine 实例设置回调实现IZegoEventHandler中的声浪回调接口启动监控调用startSoundLevelMonitor开启声浪监控处理数据在回调中获取声浪数据并渲染到 UI性能优化合理设置回调周期对数据进行平滑处理ZEGO Express SDK 的优势在于低延迟声浪数据实时回调延迟低至 100ms高精度提供精确的音量值和频谱数据易集成API 简洁几行代码即可实现跨平台支持 Android、iOS、Web、Flutter 等多平台参考资料ZEGO Express Android SDK API 文档ZEGO Express 示例代码 – 声浪和频谱模块音量变化与音频频谱文档希望这篇文章能帮助您理解语聊房声浪效果的实现原理。如果您有任何问题欢迎查阅 ZEGO 官方文档或联系技术支持。

相关文章:

语聊房中的声浪效果是怎么实现的

在语聊房、K 歌房等实时音频场景中,我们经常能看到随着用户说话或唱歌,界面上会出现动态的声浪波形或音量柱状图。这种视觉反馈不仅让用户感知到音频正在传输,还能增强互动体验。那么,这种声浪效果是如何实现的呢?本文…...

Gemma-3 Pixel Studio惊艳效果:动态思维链可视化——图文推理过程展示

Gemma-3 Pixel Studio惊艳效果:动态思维链可视化——图文推理过程展示 1. 核心亮点:不只是看图说话 你可能用过不少能“看图说话”的AI工具,上传一张图片,AI给你一段描述。但Gemma-3 Pixel Studio带来的体验完全不同——它不仅能…...

100天精通c语言【第二天】之主函数的嵌套

打印100-1不使用任何形式的循环和额外定义的函数&#xff1f;​ #include <stdio.h>int a 100;int main() {if (a 1) {printf("%d\n", a);return 0;} else if (a ! 1) {printf("%d\n", a);a - 1;main();} }​...

5个让键盘脱胎换骨的SharpKeys使用技巧:从小白到效率专家的进阶指南

5个让键盘脱胎换骨的SharpKeys使用技巧&#xff1a;从小白到效率专家的进阶指南 【免费下载链接】sharpkeys SharpKeys is a utility that manages a Registry key that allows Windows to remap one key to any other key. 项目地址: https://gitcode.com/gh_mirrors/sh/sha…...

OpenViking 调研

文章目录什么是 OpenViking1. 文件系统管理范式&#xff08;FileSystem Paradigm&#xff09;2. 模型准备3. 环境配置来源&#xff1a; https://github.com/volcengine/OpenViking 什么是 OpenViking OpenViking 是火山开源的一种AI Agent 能力的开源上下文数据库。 使用 Ope…...

思源宋体全场景应用指南:从技术特性到商业价值的深度解析

思源宋体全场景应用指南&#xff1a;从技术特性到商业价值的深度解析 【免费下载链接】source-han-serif-ttf Source Han Serif TTF 项目地址: https://gitcode.com/gh_mirrors/so/source-han-serif-ttf 价值定位&#xff1a;三大维度重新定义开源中文字体标准 技术特性…...

TensorFlow-v2.15新手必看:手把手教你连接SSH,远程管理开发环境

TensorFlow-v2.15新手必看&#xff1a;手把手教你连接SSH&#xff0c;远程管理开发环境 1. 引言 1.1 为什么需要远程连接&#xff1f; 想象一下这个场景&#xff1a;你正在本地电脑上跑一个复杂的深度学习模型训练&#xff0c;结果风扇狂转&#xff0c;电脑烫得能煎鸡蛋&…...

视频流下载工具:从技术原理到实战应用的全方位解决方案

视频流下载工具&#xff1a;从技术原理到实战应用的全方位解决方案 【免费下载链接】hls-downloader Web Extension for sniffing and downloading HTTP Live streams (HLS) 项目地址: https://gitcode.com/gh_mirrors/hl/hls-downloader 开篇痛点直击 在线教育课程即将…...

RexUniNLU在电商场景实战:精准抽取订单信息,自动处理用户投诉

RexUniNLU在电商场景实战&#xff1a;精准抽取订单信息&#xff0c;自动处理用户投诉 你有没有遇到过这种情况&#xff1f;作为电商客服&#xff0c;每天面对海量用户消息&#xff0c;其中夹杂着各种投诉&#xff1a;“我买的衣服尺码不对&#xff0c;订单号是20240515XXXX&am…...

EF Core 并发冲突实战:乐观锁、RowVersion 与 DbUpdateConcurrencyException 怎么处理

并发冲突是 EF Core 里最容易被忽视、出了事又最难排查的问题之一。这篇文章聊聊它的机制、怎么配置乐观锁、冲突异常怎么处理。 问题背景 真实场景&#xff1a;电商平台秒杀活动&#xff0c;同一件商品被多个请求并发扣减库存。业务日志里一切正常&#xff0c;但库存对不上——…...

用于工业监测、追踪与预测性维护的蓝牙 ® 技术

工业数字化与蓝牙技术 工业数字化正在制造、物流、建筑、医疗和农业等领域加速推进。传感器、工具和机器的互联程度日益提高,以实现监测、追踪和预测性维护 —— 但传统的有线部署往往限制了可扩展性、灵活性和成本效益。 无线连接消除了诸多此类障碍,不过工业环境对可靠性…...

Qwen3-ASR-1.7B与Git版本控制的协同开发实践

Qwen3-ASR-1.7B与Git版本控制的协同开发实践 语音识别项目如何高效协作&#xff1f;Git版本控制是关键 1. 项目背景与价值 语音识别项目开发往往需要多人协作&#xff0c;模型文件、代码、配置都需要有效管理。Qwen3-ASR-1.7B作为一个1.7B参数的语音识别模型&#xff0c;在团队…...

Anlogic FD工具深度体验:如何用eMCU软核在SF102开发板上实现高效调试

Anlogic FD工具实战&#xff1a;在SF102开发板上驾驭eMCU软核的调试艺术 对于习惯了在FPGA逻辑海洋中遨游的开发者而言&#xff0c;当RISC-V软核被嵌入那片可编程的硅基大陆时&#xff0c;整个开发范式就发生了有趣的转变。这不再是单纯的硬件描述语言&#xff08;HDL&#xff…...

Cadence16.6 CIS库配置疑难杂症:从ODBC到输入法的非典型排查

1. 当CIS库配置一切正常却突然卡死&#xff1a;我的排查血泪史 第一次遇到这个问题时&#xff0c;我差点把电脑砸了。明明按照官方文档一步步配置好了ODBC数据源&#xff0c;ini文件也反复检查了十几遍&#xff0c;可每次在Capture CIS里选中元器件时&#xff0c;鼠标就开始转…...

从零搭建 Express + Sequelize + MySQL 全栈 API 项目(含 Docker 部署)

本文将手把手带你使用 Express搭建一个支持 增删改查&#xff08;CRUD&#xff09;的后端 API 项目&#xff0c;集成 Sequelize ORM 操作 MySQL 数据库&#xff0c;并通过 Docker Desktop 容器化运行。涵盖项目初始化、热更新配置、数据库迁移、种子数据填充及完整 RESTful 接口…...

Qt LinuxFB 嵌入式界面旋转与触摸校准实战

1. 为什么需要自己动手修改Qt LinuxFB插件&#xff1f; 在嵌入式Linux项目里&#xff0c;尤其是工业控制面板、竖屏广告机或者一些特殊形态的智能终端上&#xff0c;我们经常会遇到一个很实际的需求&#xff1a;屏幕需要旋转显示。比如&#xff0c;一个7寸的屏幕被竖着安装&am…...

告别炉石日常繁琐:智能自动化工具的全场景应用指南

告别炉石日常繁琐&#xff1a;智能自动化工具的全场景应用指南 【免费下载链接】Hearthstone-Script Hearthstone script&#xff08;炉石传说脚本&#xff09;&#xff08;2024.01.25停更至国服回归&#xff09; 项目地址: https://gitcode.com/gh_mirrors/he/Hearthstone-S…...

NPYViewer:革新性NumPy数据可视化工具,让科学数据直观呈现

NPYViewer&#xff1a;革新性NumPy数据可视化工具&#xff0c;让科学数据直观呈现 【免费下载链接】NPYViewer Load and view .npy files containing 2D and 1D NumPy arrays. 项目地址: https://gitcode.com/gh_mirrors/np/NPYViewer 在数据驱动的科研与工程领域&#…...

为什么有的企业做成了主数据管理,有的企业越做越乱

先问大家一个问题&#xff1a;你们公司的数据&#xff0c;现在是个什么状态&#xff1f;我做数据咨询这么多年&#xff0c;跟各行各业的企业打过交道&#xff0c;遇到最多的情况是这样的&#xff1a;销售部说客户有5000个&#xff0c;市场部说才3200个&#xff0c;财务部报上来…...

Android Studio 中文界面配置指南:提升开发效率的完整方案

Android Studio 中文界面配置指南&#xff1a;提升开发效率的完整方案 【免费下载链接】AndroidStudioChineseLanguagePack AndroidStudio中文插件(官方修改版本&#xff09; 项目地址: https://gitcode.com/gh_mirrors/an/AndroidStudioChineseLanguagePack Android St…...

Horos:医疗影像处理的全流程开源解决方案

Horos&#xff1a;医疗影像处理的全流程开源解决方案 【免费下载链接】horos Horos™ is a free, open source medical image viewer. The goal of the Horos Project is to develop a fully functional, 64-bit medical image viewer for OS X. Horos is based upon OsiriX an…...

Qwen-Image-Layered实测效果:独立图层让后期编辑变得如此简单

Qwen-Image-Layered实测效果&#xff1a;独立图层让后期编辑变得如此简单 1. 引言 想象一下&#xff0c;你刚用AI生成了一张完美的设计图&#xff1a;一个宇航员站在月球上&#xff0c;背景是深邃的星空和地球。但客户突然说&#xff1a;“宇航员的头盔能不能换成金色&#x…...

Macro average 和 Weighted average【把每个类别的指标聚合成一个总体指标】

Macro average 和 Weighted average 是评价分类模型性能时常用的两种汇总方法&#xff0c;它们本质上都是把每个类别的指标聚合成一个总体指标&#xff0c;但对数据分布的敏感度不同。针对你的作物病害zero-shot分类项目&#xff0c;它们的作用差异尤其重要。下面详细说明&…...

RPC超时原因

RPC 超时&#xff0c;3个方向&#xff1a;上游问题 下游问题 中间链路问题 一、上游&#xff08;调用方&#xff09;原因超时时间设太短 业务本身要 500ms&#xff0c;你超时只设 200ms&#xff0c;必超时。上游线程池耗尽 上游线程不够用&#xff0c;请求发不出去&#xff0…...

硬性条件全达标,入职3天就崩盘?DeepSeek深度拆解招聘伪胜任力陷阱:90%企业忽略的底层能力评估模型

为什么很多候选人简历上硬性条件完全符合岗位要求&#xff0c;入职后却很快暴露底层能力不足的问题&#xff1f;如何有效避免这种招聘失误&#xff1f;答&#xff1a;招聘中最大的陷阱莫过于"伪胜任力"现象——候选人表面条件完美匹配&#xff0c;实则缺乏支撑岗位长…...

ARM内核A核、R核和M核的异同点和应用场景

一、ARM内核A核、R核和M核的基本概念和异同点 ARM内核架构包括A核、R核和M核&#xff0c;它们各自具有不同的特点和应用场景&#xff1a; ARM Cortex-A核&#xff1a; 特点&#xff1a;Cortex-A核是ARM架构中的应用处理器核。它通常用于高性能计算和通用操作系统的执行&#…...

n8n 严重漏洞可导致RCE和存储凭据暴露

聚焦源代码安全&#xff0c;网罗国内外最新资讯&#xff01;编译&#xff1a;代码卫士网络安全研究人员披露了位于n8n工作流自动化平台中的两个严重漏洞&#xff0c;它们可导致任意命令执行&#xff0c;现已修复。CVE-2026-27577&#xff08;CVSS评分&#xff1a;9.4&#xff0…...

立创开源:基于N32G430与MPU6050的自行车RGB呼吸灯状态指示器设计与实现

立创开源&#xff1a;基于N32G430与MPU6050的自行车RGB呼吸灯状态指示器设计与实现 大家好&#xff0c;最近我把自己用了四年的自行车改装了一下&#xff0c;给它装上了一双会“呼吸”的眼睛。这是一个基于国产MCU N32G430和MPU6050六轴传感器的小装置&#xff0c;能根据你骑行…...

基于ESP32与多传感器融合的立创空气质量检测净化器DIY全攻略

基于ESP32与多传感器融合的立创空气质量检测净化器DIY全攻略 最近想给工作室弄个能实时监测空气质量的设备&#xff0c;市面上成品要么功能单一&#xff0c;要么价格不菲。正好看到立创开源平台上有位大佬分享了一个完整的空气质量检测净化器项目&#xff0c;功能非常全面&…...

QT径向渐变完全指南:从参数解析到高级特效(QRadialGradient详解)

QT径向渐变完全指南&#xff1a;从参数解析到高级特效 在UI设计领域&#xff0c;渐变效果一直是提升视觉层次感的利器。而QT框架中的QRadialGradient&#xff0c;更是让开发者能够轻松创建出令人惊艳的环形渐变效果。不同于常见的线性渐变&#xff0c;径向渐变以圆心为中心向外…...