ffmpeg系列(三)—— 音频重采样
SwrContext
一、SwrContext 的重要字段
SwrContext 是音频重采样的核心配置对象,其关键字段决定了重采样的行为和性能。以下是常用字段及其作用:
| 字段名称 | 类型 | 作用 | 典型值示例 |
|---|---|---|---|
in_sample_rate | int | 输入音频的采样率(Hz)。 | 44100 |
out_sample_rate | int | 输出音频的采样率(Hz)。 | 48000 |
in_ch_layout | AVChannelLayout | 输入音频的声道布局(如立体声、单声道)。 | AV_CH_LAYOUT_STEREO |
out_ch_layout | AVChannelLayout | 输出音频的声道布局。 | AV_CH_LAYOUT_MONO |
in_sample_fmt | AVSampleFormat | 输入音频的样本格式(如 PCM、浮点)。 | AV_SAMPLE_FMT_S16 |
out_sample_fmt | AVSampleFormat | 输出音频的样本格式。 | AV_SAMPLE_FMT_FLTP |
filter | const char * | 重采样滤波器名称(如 Lanczos、Sinc)。 | SWR_FILTER_LANCZOS |
speed | double | 重采样速度倍数(1.0 = 实时,>1.0 加速)。 | 1.0 |
channel_map | const int * | 声道映射表(高级用法:自定义声道顺序)。 | NULL(默认布局) |
error_occurred | int | 错误标志(非零表示重采样过程中发生错误)。 | 0(成功)/-1(失败) |
buffer | uint8_t ** | 内部缓冲区指针(用于存储中间音频数据)。 | 由 libswresample 自动管理 |
buffer_len | int | 内部缓冲区长度(字节)。 | 自动调整 |
二、SwrContext 的重要函数
以下是使用 SwrContext 时最常用的函数及其作用:
1. swr_alloc()
SwrContext *swr_alloc(void);
- 作用:分配一个空的
SwrContext结构体(不初始化参数)。 - 返回值:指向新分配的
SwrContext,需检查是否为NULL(内存不足)。
• 典型用法:
2. swr_alloc_set_opts()
SwrContext *swr_alloc_set_opts(SwrContext **ctx,const AVChannelLayout *in_ch_layout,AVSampleFormat in_sample_fmt,int in_sample_rate,const AVChannelLayout *out_ch_layout,AVSampleFormat out_sample_fmt,int out_sample_rate,double speed,const char *filter,const char *filter_name
);
- 作用:一步到位分配并初始化
SwrContext,设置所有核心参数。 - 参数说明:
- 输入参数(前 3 个):输入音频的布局、格式、采样率。
- 输出参数(后 3 个):输出音频的布局、格式、采样率。
- speed:重采样速度(1.0 表示实时处理)。
- filter:滤波器类型(如
SWR_FILTER_LANCZOS)。 - 返回值:成功返回配置后的
SwrContext,失败返回NULL。
- 关键点:
- **替代
swr_alloc **:此函数内部已调用swr_alloc` 无需手动初始化。 - 参数顺序:必须严格区分输入和输出参数,否则可能导致逻辑错误。
- **替代
- 示例:
3. swr_free()
void swr_free(SwrContext *ctx);
• 作用:释放 SwrContext 占用的内存及内部缓冲区。
• 注意:无论初始化是否成功,最终必须调用此函数避免内存泄漏。
• 示例:
4. swr_convert()
int swr_convert(SwrContext *ctx,uint8_t **out_buf,int out_samples,const uint8_t *in_buf,int in_samples
);
• 作用:执行实际的重采样操作。
• 参数:
• in_buf:输入音频数据指针(需符合 in_sample_fmt 的格式)。
• in_samples:输入样本数量(以 in_sample_rate 为单位)。
• out_buf:输出缓冲区指针(需预分配,格式由 out_sample_fmt 决定)。
• out_samples:请求的输出样本数量(可能被调整)。
• 返回值:实际输出的样本数量,或负数表示错误。
• 关键点:
• 输入/输出缓冲区格式:必须与 SwrContext 中的 in_sample_fmt/out_sample_fmt 匹配。
• 缓冲区大小:需提前分配足够空间(参考 swr_get_out_samples())。
5. swr_get_sample_rate()
int swr_get_sample_rate(SwrContext *ctx);
• 作用:获取当前上下文的采样率(输入或输出,取决于调用时机)。
• 注意:在初始化后,输出采样率是固定的,输入采样率可能动态变化(如流式处理)。
6. swr_init()
swr_init 是 FFmpeg 中用于初始化音频重采样器(SwrContext)的函数。它的作用是根据 swr_alloc_set_opts 或 swr_alloc_set_opts2 设置的参数,完成重采样器的内部配置和准备工作。以下是关于 swr_init 的详细说明:
##### 1. 函数原型
#include <libswresample/swresample.h>int swr_init(SwrContext *s);
| 参数 | 类型 | 说明 |
|---|---|---|
s | SwrContext * | 音频重采样器上下文 |
| 返回值 | int | 成功返回 0,失败返回负的错误码 |
2. 功能说明
swr_init 的主要功能包括:
-
验证参数:
- 检查输入和输出的声道布局、采样格式、采样率等参数是否合法。
- 如果参数不合法,返回错误码(如
AVERROR(EINVAL))。
-
初始化内部状态:
- 根据输入和输出的参数,计算重采样器的内部状态(如滤波器系数、缓冲区大小等)。
- 如果输入和输出的采样率不同,初始化重采样滤波器。
-
分配内部资源:
- 分配重采样器所需的内存(如缓冲区、滤波器等)。
-
准备重采样:
- 完成所有准备工作,使重采样器可以开始处理音频数据。
3. 使用场景
swr_init 通常在以下步骤之后调用:
- 使用
swr_alloc()或swr_alloc_set_opts()/swr_alloc_set_opts2()创建并配置SwrContext。 - 调用
swr_init()初始化重采样器。 - 使用
swr_convert()进行音频重采样。
4. 返回值处理
swr_init 的返回值需要检查,如果返回值 < 0,说明初始化失败。
常见错误码
| 错误码 | 说明 |
|---|---|
AVERROR(EINVAL) | 参数不合法(如声道布局不支持) |
AVERROR(ENOMEM) | 内存分配失败 |
AVERROR(EOPNOTSUPP) | 不支持的采样格式或布局 |
四、完整使用示例
#include <libswresample/swresample.h>
#include <libavutil/channel_layout.h>void setup_resampler(AVCodecContext *ac) {// 创建 SwrContextSwrContext *actx = swr_alloc();if (!actx) {fprintf(stderr, "Failed to allocate SwrContext\n");return;}// 设置输入和输出的声道布局AVChannelLayout out_ch_layout;AVChannelLayout in_ch_layout;// 输出声道布局:立体声(2声道)av_channel_layout_default(&out_ch_layout, 2);// 输入声道布局:从 AVCodecContext 中获取av_channel_layout_copy(&in_ch_layout, &ac->ch_layout);// 配置 SwrContextint ret = swr_alloc_set_opts2(&actx,&out_ch_layout, // 输出声道布局AV_SAMPLE_FMT_S16, // 输出采样格式ac->sample_rate, // 输出采样率&in_ch_layout, // 输入声道布局ac->sample_fmt, // 输入采样格式ac->sample_rate, // 输入采样率0, // 日志偏移NULL // 日志上下文);if (ret < 0) {char errbuf[AV_ERROR_MAX_STRING_SIZE];av_strerror(ret, errbuf, sizeof(errbuf));LOGW("swr_alloc_set_opts2 failed: %s", errbuf);return;}// 初始化重采样器ret = swr_init(actx);if (ret < 0) {char errbuf[AV_ERROR_MAX_STRING_SIZE];av_strerror(ret, errbuf, sizeof(errbuf));LOGW("swr_init failed: %s", errbuf);return;}LOGW("SwrContext initialized successfully");// 使用 actx 进行重采样...// 释放资源swr_free(&actx);
}
相关文章:
ffmpeg系列(三)—— 音频重采样
SwrContext 一、SwrContext 的重要字段 SwrContext 是音频重采样的核心配置对象,其关键字段决定了重采样的行为和性能。以下是常用字段及其作用: 字段名称类型作用典型值示例in_sample_rateint输入音频的采样率(Hz)。44100out_…...
Android Gradle 插件(AGP)版本与 Gradle 版本需要严格对应
一、AGP 与 Gradle 版本对照表 Android Gradle 插件版本对应 Gradle 版本适用 Android Studio 版本8.1.x8.2Arctic Fox (2020.3.1+)8.0.x8.0Arctic Fox (2020.3.1+)7.4.x7.5.1IntelliJ IDEA 2022+7.3.x7.4IntelliJ IDEA 2022+7.2.x7.3.3IntelliJ IDEA 2021.3+7.1.x…...
Angular由一个bug说起之十五:自定义基于Overlay的Tooltip
背景 工具提示(tooltip)是一个常见的 UI 组件,用于在用户与页面元素交互时提供额外的信息。由于angular/material/tooltip的matTooltip只能显示纯文本,所以我们可以通过自定义Directive来实现一个灵活且功能丰富的tooltip Overlay…...
使用 Chromedp 监听网页请求和响应
使用 Chromedp 监听网页请求和响应 在进行网络爬虫的时候,有很多网站都有反爬机制,比如你想抓点数据,结果发现每次请求都带一堆奇奇怪怪的参数 —— 什么 timestamp 签名、AES 加密的字段,还有各种 Token 令牌,跟密码…...
Java中用Stream流取出分组后每组最大值对象的ID
取出分组后每组最大值对象的ID 如果只需要获取这些对象的ID(或其他特定字段),而不是整个对象,可以采用以下方法: 方法1:先获取对象再提取ID List<String> customerIds orders.stream().collect(Coll…...
GPT-SoVITS本地部署:低成本实现语音克隆远程生成音频全流程实战
文章目录 前言1.GPT-SoVITS V2下载2.本地运行GPT-SoVITS V23.简单使用演示4.安装内网穿透工具4.1 创建远程连接公网地址 5. 固定远程访问公网地址 前言 今天要给大家安利一个绝对能让你大呼过瘾的声音黑科技——GPT-SoVITS!这款由花儿不哭大佬精心打造的语音克隆神…...
使用HTTP提交git时,每次都要输入用户名和密码的解决方案
通过https提交的git项目,每次提交都需要输入用户名和密码 解决方案如下: 打开项目目录,通过终端输入: git config --global credential.helper store验证方式: 重启 scode修改or添加文件后使用git上传, 本次需要帐号密码再次修改or添加文件…...
Flutter视频播放优化
在Flutter中实现流畅视频播放,选择合适的播放器插件是关键。推荐使用以下两类插件: 跨平台低延迟方案 flutter_vlc_player:基于VLC引擎,支持RTSP/RTMP协议,通过hwAcc: HwAcc.full启用硬件加速,配合setOpti…...
嵌入式学习第二十八天--顺序栈
栈的基本代码 栈是限定仅在表尾进行插入和删除操作的线性表。 先进后出、后进先出 栈顶:允许操作的一端 栈底:不允许操作的一端 入栈,出栈。 顺序栈 链式栈 302\5 1.创建 CreateSeqStack 2.销毁 DestroySeqStack 3.判断是否为空栈 IsEmptySeqStack 4.判断是否为满…...
基于MCP协议的多模态模型优化在医疗3D打印精密人工关节制造中的研究
一、引言 1.1 研究背景与意义 在全球人口老龄化趋势愈发明显的当下,诸如骨关节炎、类风湿性关节炎这类关节疾病的发病率不断攀升,进而使得人工关节置换手术的需求呈现出激增态势。人工关节置换手术作为治疗终末期关节疾病的有效手段,能够显著缓解患者疼痛,提升关节功能与生…...
【Unity】 HTFramework框架(六十三)SerializableDictionary可序列化字典
更新日期:2025年3月26日。 Github 仓库:https://github.com/SaiTingHu/HTFramework Gitee 仓库:https://gitee.com/SaiTingHu/HTFramework 索引 一、SerializableDictionary可序列化字典1.使用SerializableDictionary2.实现思路 二、Serializ…...
MATLAB绘图配色包说明
本栏目将分享MATLAB数据分析图表,该贴讲述配色包的使用 将配色包colormap_nclCM文件夹添加到路径close all(尽量不要删),使用map colormap(nclCM(309))时会多出来一张空白图片。配色资源来自slandarer;找不到合适颜色…...
8路CXP相机采集系统介绍
8xCXP相机采集系统介绍 目录 1 系统概述 4 2 硬件架构 5 2.1 FPGA处理单元 5 2.2 CXP接口层 6 2.3 CXP相机说明与使用要求 7 2.4 SSI控制器板 8 3 FPGA方案 9 3.1 FPGA实现 9 3.2 Block Design说明 10 4 软件方案 14 4.1 嵌入式层 14 4.2 上位机软件(C…...
Stable Diffusion 基础模型结构超级详解!
1. Transformer 第一个只用 Attention 机制来解决序列到序列问题的模型,最早被 Google 用来解决翻译问题 对于中英翻译而言,需要解决三个具体的问题: 如何用数字表示中文和英文 如何让神经网络理解语义 如何让神经网络生成英文 1.1 Tok…...
【Linux网络(七)】数据链路层
目录 1、认识MAC地址 2、 mac帧格式 3、局域网的通信原理 4、ARP协议 浏览器输入url1后发生的事情:(面试题) 数据链路层解决的是:直接相连的主机(不仅仅包括电脑,还包括路由器)之间&#x…...
Nginx RTMP 处理模块 (ngx_rtmp_handler.c) 详细分析
ngx_rtmp_handler 是 Nginx RTMP 模块中的核心处理部分,主要负责处理 RTMP 流会话中的数据接收、发送、ping 操作以及分块大小的设置等。 1. 全局变量 ngx_rtmp_naccepted: 记录接受的 RTMP 连接数。 ngx_rtmp_bw_out 和 ngx_rtmp_bw_in: 分别表示输出带宽和输入带…...
2025年渗透测试面试题总结-某奇安信-Ateam(题目+回答)
网络安全领域各种资源,学习文档,以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具,欢迎关注。 目录 奇安信-Ateam 一、SQL注入攻防技术体系 1.1 SQL注入类型矩阵(基于利用方式) …...
前端工程化--gulp的使用
gulp 介绍 gulp 是一个基于 Nodejs 的自动化构建工具,中文主页能自动化地完成 javascript/coffee/sass/less/html/image/css 等文件的合并、压缩、检查、监听文件变化、浏览器自动刷新、测试等任务 使用步骤: 安装 nodejs 全局安装 gulp npm install…...
谈谈对spring IOC的理解,原理和实现
一、IoC 核心概念 1. 控制反转(Inversion of Control) 传统编程中对象自行管理依赖(主动创建),而IoC将控制权转移给容器,由容器负责对象的创建、装配和管理,实现依赖关系的反向控制。 2. 依赖…...
Windows 10 ARM64平台MFC串口程序开发
Windows 10 IoT ARM64平台除了支持新的UWP框架,也兼容支持老框架MFC。使得用户在Windows 10 IoT下可以对原MFC工程进行功能升级,不用在新框架下重写整个工程。熟悉MFC开发的工程师也可以在Windows 10 IoT平台下继续使用MFC进行开发。 本文展示MFC串口程序…...
31天Python入门——第16天:模块与库详解
你好,我是安然无虞。 文章目录 Python模块模块之间的调用 Python包库的概念Python标准库安装第三方库 \_\_name\_\_ \_\_main\_\_ Python模块 在 Python 中, 模块是一个包含函数、变量和类等代码定义的py文件. 所以也可以说, 普通的py文件就是一个模块. 模块可以…...
设计模式(创建型)- 原型模式
目录 定义 类图 角色 优缺点 优点 缺点 应用场景 案例展示 浅克隆 深克隆 定义 原型模式旨在创建重复的对象,同时确保良好的性能表现。它通过复制现有对象(原型)来创建新对象,而非使用传统的构造函数创建方式。这种设计…...
Redis + Caffeine多级缓存电商场景深度解析
Redis Caffeine多级缓存 Redis Caffeine多级缓存电商场景深度解析一、实施目的二、具体实施2.1 架构设计2.2 组件配置2.3 核心代码实现 三、实施效果3.1 性能指标对比3.2 业务指标改善3.3 系统稳定性 四、关键策略4.1 缓存预热4.2 一致性保障4.3 监控配置Prometheus监控指标 …...
spring-ai ollama小试牛刀
序 本文主要展示下spring-ai ollama的使用 示例 pom.xml <dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-ollama-spring-boot-starter</artifactId></dependency>这里以ollama示例 配置 spring:ai:olla…...
在 CentOS 系统中开机自动执行 Shell 脚本
在 CentOS 系统中,可以通过以下方法设置开机自动执行 Shell 脚本。推荐使用 systemd 服务(现代 Linux 系统的标准方式),也可以使用传统的 /etc/rc.local 方法。 方法 1:使用 Systemd 服务(推荐)…...
【Linux】应用层协议 HTTP
应用层协议 HTTP 一. HTTP 协议1. URL 地址2. urlencode 和 urldecode3. 请求与响应格式 二. HTTP 请求方法1. GET 和 POST (重点) 三. HTTP 状态码四. HTTP 常见报头五. 手写 HTTP 服务器 HTTP(超文本传输协议)是一种应用层协议,用于在万维网…...
Linux下的socket演示程序3(udp)
server.cpp #include <stdio.h> #include <string.h> #include <stdlib.h> #include <unistd.h> #include <arpa/inet.h> #include <sys/socket.h>#define SER_PORT 8888 //端口号 #define SER_IP "10.148.4.168" //服务器IP…...
数据可视化TensorboardX和tensorBoard安装及使用
tensorBoard 和TensorboardX 安装及使用指南 tensorBoard 和 TensorBoardX 是用于可视化机器学习实验和模型训练过程的工具。TensorBoard 是 TensorFlow 官方提供的可视化工具,而 TensorBoardX 是其社区驱动的替代品,支持 PyTorch 等其他框架。以下是它…...
【Hugging Face 开源库】Diffusers 库 —— 扩散模型
Diffusers 的三个主要组件1. DiffusionPipeline:端到端推理工具__call__ 函数callback_on_step_end 管道回调函数 2. 预训练模型架构和模块UNetVAE(Variational AutoEncoder)图像尺寸与 UNet 和 VAE 的关系EMA(Exponential Moving…...
AWTK-WEB 快速入门(6) - JS WebSocket 应用程序
WebSocket 可以实现双向通信,适合实时通信场景。本文介绍一下使用 Javacript 语言开发 AWTK-WEB 应用程序,并用 WebSocket 与服务器通讯。 用 AWTK Designer 新建一个应用程序 先安装 AWTK Designer: https://awtk.zlg.cn/web/index.html …...
