当前位置: 首页 > article >正文

播放器系列4——PCM重采样

FFmpeg重采样过程

swr_alloc创建重采样上下文
swr_alloc_set_opts设置重采样参数
swr_init初始化重采样器
swr_convert执行重采样
swr_free释放资源
swr_alloc_set_opts
struct SwrContext *swr_alloc_set_opts(struct SwrContext *s,int64_t out_ch_layout, enum AVSampleFormat out_sample_fmt, int out_sample_rate,int64_t  in_ch_layout, enum AVSampleFormat  in_sample_fmt, int  in_sample_rate,int log_offset, void *log_ctx);
  • 功能: 分配并设置重采样上下文
  • 参数:
    • s: 现有SwrContext指针,可为NULL
    • out_ch_layout: 输出声道布局
    • out_sample_fmt: 输出采样格式
    • out_sample_rate: 输出采样率
    • in_ch_layout: 输入声道布局
    • in_sample_fmt: 输入采样格式
    • in_sample_rate: 输入采样率
    • log_offset: 日志偏移量
    • log_ctx: 日志上下文
  • 返回值: 成功返回SwrContext指针,失败返回NULL
swr_init
int swr_init(struct SwrContext *s);
  • 功能: 初始化重采样上下文
  • 参数:
    • s: SwrContext指针
  • 返回值: 成功返回0,失败返回负值错误码
swr_convert
int swr_convert(struct SwrContext *s, uint8_t **out, int out_count,const uint8_t **in , int in_count);
  • 功能: 执行重采样
  • 参数:
    • s: SwrContext指针
    • out: 输出缓冲区
    • out_count: 输出采样数
    • in: 输入缓冲区
    • in_count: 输入采样数
  • 返回值: 成功返回输出采样数,失败返回负值错误码
swr_free
void swr_free(struct SwrContext **s);
  • 功能: 释放重采样上下文
  • 参数:
    • s: 指向SwrContext指针的指针
  • 返回值: 无

重采样介绍

在本项目中使用ffmpeg对pcm数据进行重采样,使其输出格式满足SDL的要求。
重采样主要改变了三部分内容

  • 采样率
  • 采样格式
  • 声道数

1.重采样的目的

1.匹配设备的采样率

在日常开发中会发现,采购的不同品牌的声卡可能支持的sample_rate不同,比如常见的有44100Hz、48000Hz等。这时候如果将不匹配的pcm数据输入到声卡中,会出现无声或者杂音的情况。因此需要在输入到声卡之前对pcm数据进行重采样,使其采样率与声卡支持的采样率一致。

2.优化存储和传输效率

降低采样率可以减少音频文件的大小,从而节省存储空间和带宽资源。例如,将高采样率(如48kHz)的音频降采样到更低的采样率(如16kHz),虽然会损失一定的音质,但显著减少了文件大小。
我们开发的电视扬声器只有左右声道,那么我们可以将解析出来的pcm数据重采样为2声道,然后在通过音效节点处理,这样可以减少计算量,提高效率。

3.解决混音需求

  • 在K歌软件中,话筒采集到的声音需要与伴奏混合然后通过输出设备输出,假如话筒采集到的pcm数据采样率为48000Hz,而扬声器播放的音频采样率为44100Hz,这时候就需要对麦克风采集到的pcm数据进行重采样,使其采样率与扬声器播放的音频采样率一致,这样才能做之后的MIX处理。
  • 有时候会有多个APP同时从扬声器播放出声音,如果每个app设置的sample_rate不同,那么也会出现无法mix的情况。因此也需要有模块对每个app的音轨resample成相同的sample_rate,然后再进行mix处理。

源码地址

https://github.com/OrangeKitten/VideoPlayer

相关文章:

播放器系列4——PCM重采样

FFmpeg重采样过程 #mermaid-svg-QydNPsDAlg9lTn6z {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-QydNPsDAlg9lTn6z .error-icon{fill:#552222;}#mermaid-svg-QydNPsDAlg9lTn6z .error-text{fill:#552222;stroke:#5…...

android接入rocketmq

一 前言 RocketMQ 作为一个功能强大的消息队列系统,不仅支持基本的消息发布与订阅,还提供了顺序消息、延时消息、事务消息等高级功能,适应了复杂的分布式系统需求。其高可用性架构、多副本机制、完善的运维管理工具,以及安全控制…...

《长文本处理新曙光:深入剖析多头隐式注意力机制显存优化奥秘》

在人工智能领域,Transformer架构无疑是璀璨的明星,为自然语言处理、计算机视觉等众多领域带来了革命性的变革。但Transformer架构在处理长文本时,其多头注意力机制(MHA)会产生显存占用呈几何级数增长的问题&#xff0c…...

Spring Boot面试问答

1. Spring Boot 基础知识 问题 1:什么是Spring Boot?它与Spring框架有何不同? 回答: Spring Boot是基于Spring框架的一个开源框架,旨在简化新Spring应用的初始化和开发过程。与传统的Spring框架相比,Spring Boot提供了以下优势: 自动配置:根据项目依赖自动配置Spring…...

前端数据模拟 Mock.js 学习笔记

mock.js介绍 Mock.js是一款前端开发中拦截Ajax请求再生成随机数据响应的工具,可以用来模拟服务器响应 优点是:非常方便简单,无侵入性,基本覆盖常用的接口数据类型支持生成随机的文本、数字、布尔值、日期、邮箱、链接、图片、颜…...

用DeepSeek-R1-Distill-data-110k蒸馏中文数据集 微调Qwen2.5-7B-Instruct!

下载模型与数据 模型下载: huggingface: Qwen/Qwen2.5-7B-Instruct HF MirrorWe’re on a journey to advance and democratize artificial intelligence through open source and open science.https://hf-mirror.com/Qwen/Qwen2.5-7B-Instruct 魔搭&a…...

DeepSeek大模型 —— 全维度技术解析

DeepSeek大模型 —— 全维度技术解析 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,可以分享一下给大家。点击跳转到网站。 https://www.captainbed.cn/ccc 文章目录 DeepSeek大模型 —— 全维度技术解析一、模型架构全景解析1…...

DeepSeek + 沉浸式翻译 打造智能翻译助手

本文详细介绍如何使用 DeepSeek API 沉浸式翻译插件打造个性化翻译助手。 一、DeepSeek API 配置 基础配置 API 基础地址:https://api.deepseek.com需要申请 API Key支持与 OpenAI SDK 兼容的调用方式 可用模型 deepseek-chat:已升级为 DeepSeek-V3&am…...

EasyRTC嵌入式音视频通话SDK:基于ICE与STUN/TURN的实时音视频通信解决方案

在当今数字化时代,实时音视频通信技术已成为人们生活和工作中不可或缺的一部分。无论是家庭中的远程看护、办公场景中的远程协作,还是工业领域的远程巡检和智能设备的互联互通,高效、稳定的通信技术都是实现这些功能的核心。 EasyRTC嵌入式音…...

React Native 0.76 升级后 APK 体积增大的原因及优化方案

在将 React Native 从 0.71 升级到 0.76 后,打包体积从 40 多 MB 增加到了 80 MB。经过一系列排查和优化,最终找到了解决方案,并将优化过程整理如下。 1. React Native 0.76 体积增大的可能原因 (1) 新架构默认启用 React Native 0.76 默认启用了 New Architecture(新架…...

qt open3dAlpha重建

qt open3dAlpha重建 效果展示二、流程三、代码效果展示 二、流程 创建动作,链接到槽函数,并把动作放置菜单栏 参照前文 三、代码 1、槽函数实现 void on_actionAlpha_triggered();//alpha重建 void MainWindow::...

PyQt高亮代码

PyQt高亮代码 安装 Pygments支持的格式支持的样式详解参考 Qt中使用 安装 Pygments Pygments 是Python中的一个高亮代码的包,挺好用的 pip install Pygments支持的格式 支持的格式比较多,不列出来了 # coding:utf-8 from pygments.lexers import get_all…...

《深入浅出数据索引》- 公司内部培训课程笔记

深入浅出数据索引 内容:索引理论,索引常见问题,索引最佳实践,sql优化实战,问答 哈希不支持范围查询 4层 几个亿 5层 几十亿上百亿 B树的分裂,50-50分裂 都是往上插一个元素(红黑树是左右旋转&a…...

PPT 技能:巧用 “节” 功能,让演示文稿更有序

在制作PPT时,你是否遇到过这样的情况:幻灯片越来越多,内容越来越杂,找某一页内容时翻得眼花缭乱?尤其是在处理大型PPT文件时,如果没有合理的结构,编辑和调整都会变得非常麻烦。这时候&#xff0…...

如何禁止电脑中某个应用联网

一、通过防火墙基础设置(快速操作) 打开控制面板 在任务栏搜索框输入“控制面板”并打开,将右上角“查看方式”切换为“大图标”。 进入防火墙设置 点击 Windows Defender防火墙 → 左侧选择 允许应用或功能通过Windows Defender防火墙。…...

Xss漏洞问题

https://bu1.github.io/2021/01/12/%E7%AC%AC%E5%8D%81%E4%BA%8C%E5%91%A8%EF%BC%9AXSS%E6%BC%8F%E6%B4%9E%E5%AD%A6%E4%B9%A0%E5%AE%9E%E6%88%98/ 后端绕开了前端&#xff0c;直接调用接口入库&#xff1a; <select οnchange“alert(1)”>12 前端拿到这个文本后&…...

Python MongoDB速成教程

一、基础 1. 安装pymongo库 pymongo 是 Python 操作 MongoDB 的官方驱动&#xff0c;你可以使用 pip 来安装它&#xff1a; pip install pymongo 2. 连接到 MongoDB 首先&#xff0c;你需要建立与 MongoDB 服务器的连接。以下是一个简单的示例&#xff1a; from pymongo …...

Docker概念与架构

文章目录 概念docker与虚拟机的差异docker的作用docker容器虚拟化 与 传统虚拟机比较 Docker 架构 概念 Docker 是一个开源的应用容器引擎。诞生于 2013 年初&#xff0c;基于 Go 语言实现。Docker 可以让开发者打包他们的应用以及依赖包到一个轻量级、可移植的容器中&#xf…...

基于opencv消除图片马赛克

以下是一个基于Python的图片马赛克消除函数实现&#xff0c;结合了图像处理和深度学习方法。由于马赛克消除涉及复杂的图像重建任务&#xff0c;建议根据实际需求选择合适的方法&#xff1a; import cv2 import numpy as np from PIL import Imagedef remove_mosaic(image_pat…...

3.使用ElementUI搭建侧边栏及顶部栏

1. 安装ElementUI ElementUI是基于 Vue 2.0 的桌面端组件库。使用之前&#xff0c;需要在项目文件夹中安装ElementUI&#xff0c;在终端中输入以下命令&#xff0c;进行安装。 npm i element-ui -S并在main.js中引入ElementUI 2. 使用elmentUI组件进行页面布局 2.1 清空原…...

golang将大接口传递给小接口以及场景

文章目录 golang将大接口传递给小接口背景什么是大接口传递给小接口使用场景 golang将大接口传递给小接口 背景 在 Go 语言中&#xff0c;接口是一种强大的工具&#xff0c;它允许我们定义对象的行为而不关心其具体实现。特别是在复杂的应用程序中&#xff0c;将一个实现了较…...

C# OPC DA获取DCS数据(提前配置DCOM)

OPC DA配置操作手册 配置完成后&#xff0c;访问远程ip&#xff0c;就能获取到服务 C#使用Interop.OPCAutomation采集OPC DA数据&#xff0c;支持订阅&#xff08;数据变化&#xff09;、单个读取、单个写入、断线重连...

不同开发语言之for循环的用法、区别总结

一、Objective-C &#xff08;1&#xff09;标准的c风格 for (int i 0; i < 5; i) {NSLog("i %d", i); } &#xff08;2&#xff09;for in循环。 NSArray *array ["apple", "banana", "orange"]; for (NSString *fruit in …...

MuBlE:为机器人操作任务规划提供了逼真的视觉观察和精确的物理建模

2025-03-05&#xff0c;由华为诺亚方舟实验室、捷克技术大学和帝国理工学院联合开发的MuBlE&#xff08;MuJoCo and Blender simulation Environment&#xff09;模拟环境和基准测试。通过结合MuJoCo物理引擎和Blender高质量渲染&#xff0c;为机器人操作任务规划提供了逼真的视…...

工具介绍《HACKBAR V2》

HackBar V2 是一款功能强大的浏览器渗透测试工具&#xff0c;主要用于测试 SQL 注入、XSS 漏洞、POST 传参等安全场景。以下是其核心功能、用法及实际案例操作的综合介绍&#xff1a; 一、核心功能与用法详解 1. 基础操作 Load URL 功能&#xff1a;将当前浏览器地址栏的 URL …...

ASP.NET Core 6 MVC 文件上传

概述 应用程序中的文件上传是一项功能&#xff0c;用户可以使用该功能将用户本地系统或网络上的文件上传到 Web 应用程序。Web 应用程序将处理该文件&#xff0c;然后根据需要对文件进行一些验证&#xff0c;最后根据要求将该文件存储在系统中配置的用于保存文件的存储中&#…...

2025年03月07日Github流行趋势

项目名称&#xff1a;ai-hedge-fund 项目地址url&#xff1a;https://github.com/virattt/ai-hedge-fund项目语言&#xff1a;Python历史star数&#xff1a;12788今日star数&#xff1a;975项目维护者&#xff1a;virattt, seungwonme, KittatamSaisaard, andorsk, arsaboo项目…...

JAVA入门——网络编程简介

自己学习时的笔记&#xff0c;可能有点水&#xff08; 以后可能还会补充&#xff08;大概率不会&#xff09; 一、基本概念 网络编程三要素&#xff1a; IP 设备在网络中的唯一标识 端口号 应用软件在设备中的唯一标识两个字节表示的整数&#xff0c;0~1023用于知名的网络…...

Cursor + IDEA 双开极速交互

相信很多开发者朋友应该和我一样吧&#xff0c;都是Cursor和IDEA双开的开发模式:在Cursor中快速编写和生成代码&#xff0c;然后在IDEA中进行调试和优化 在这个双开模式的开发过程中&#xff0c;我就遇到一个说大不大说小不小的问题&#xff1a; 得在两个编辑器之间来回切换查…...

3.3.2 用仿真图实现点灯效果

文章目录 文章介绍Keil生成.hex代码Proteus仿真图中导入.hex代码文件开始仿真 文章介绍 点灯之前需要准备好仿真图keil代码 仿真图参考前文&#xff1a;3.3.2 Proteus第一个仿真图 keil安装参考前文&#xff1a;3.1.2 Keil4安装教程 keil新建第一个项目参考前文&#xff1a;3.1…...