当前位置：首页 > news >正文

FFmpeg学习（五）-- libswresample使用说明及函数介绍

news 2026/2/9 21:50:26

libswresample Audio合成和重采样

libswresample库用来进行audio数据的合成和重采样操作。调用流程：

调用 swr_alloc 创建SwrContext结构体。
设置SwrContext参数，有两种方法：调用av_opt_set_xx函数逐项设置参数；swr_alloc_set_opts2同时设置多个参数（如果传入参数为null，swr_alloc_set_opts2中会调用swr_alloc创建SwrContext结构体）.
调用swr_init利用设置的参数初始化SwrContext结构体的内部参数。
调用 swr_convert 或 swr_convert_frame 转换audio数据。
数据转换完成后，调用 swr_free 释放资源。如果需要多次此结构体，可以调用 swr_close 清理当前上下文，然后重复步骤2.

如果基于AVFrame进行audio数据的合成和重采样操作。调用流程：

调用 swr_alloc 创建SwrContext结构体。
设置输入AVFrame中的channel_layout, sample_rate和format
调用swr_convert_frame进行数据转换。
数据转换完成后，调用 swr_free 释放资源。如果数据格式发生变化，可以swr_config_frame重新设置参数，然后重复步骤3.

函数

SwrContext结构体处理函数

struct SwrContext *swr_alloc(void)
- 创建SwrContext结构体，在swr_init调用之前必须要设置转换参数。
int swr_init(struct SwrContext *s)
- 设置完参数后，初始化上下文变量。
int swr_is_initialized(struct SwrContext *s)
- 检测是否已经初始化，0为没有初始化。正数为已经初始化。
int swr_alloc_set_opts2(struct SwrContext **ps, const AVChannelLayout *out_ch_layout, enum AVSampleFormat out_sample_fmt, int out_sample_rate, const AVChannelLayout *in_ch_layout, enum AVSampleFormat in_sample_fmt, int in_sample_rate, int log_offset, void *log_ctx)
- 使用AVChannelLayout直接创建SwrContext结构体，并设置输入、输出audio数据的参数。log_offset为转换时log level，log_ctx为log的上下文。
void swr_free(struct SwrContext **s)
- 释放SwrContext结构体。
void swr_close(struct SwrContext *s)
- 清理swr_init时设置的内部参数，没有清理用户设置的参数。调用此函数后，可以修改参数，然后重新调用swr_init。

转换函数

int swr_convert(struct SwrContext *s, uint8_t **out, int out_count,
const uint8_t **in , int in_count)
- 转换audio数据。当in 和 in_count 设置为0时，表示输入数据已结束，会将剩余的少量数据输出到out中。返回值为每个channel的采样数量。负数表示错误。
int64_t swr_next_pts(struct SwrContext *s, int64_t pts)
- 获取输入的pts对应的输出pts的值，单位：1/(in_sample_rate * out_sample_rate) 。
- swr_set_compensation 是swr_next_pts内部调用的函数，不建议在其他地方调用。

底层可选设置函数

int swr_set_channel_mapping(struct SwrContext *s, const int *channel_map)
- 设置一个输入channel的映射数组，不需要输出的channel设置为-1.
int swr_build_matrix2(const AVChannelLayout *in_layout, const AVChannelLayout *out_layout, double center_mix_level, double surround_mix_level, double lfe_mix_level, double maxval, double rematrix_volume, double *matrix, ptrdiff_t stride, enum AVMatrixEncoding matrix_encoding, void *log_context)
- 创建一个channel的合成矩阵。一般只是内部使用，也可用来创建自定义混合矩阵。
int swr_set_matrix(struct SwrContext *s, const double *matrix, int stride)
- 将swr_build_matrix2创建的合成矩阵设置到SwrContext中。

采样处理函数

int swr_drop_output(struct SwrContext *s, int count)
- 丢弃指定数量的输出数据，
int swr_inject_silence(struct SwrContext *s, int count)
- 注入指定数量的静音输出数据，
- 如果需要强制补偿，swr_next_pts 调用 swr_drop_output 或 swr_inject_silence 进行数据对齐。
int64_t swr_get_delay(struct SwrContext *s, int64_t base)
- 获取下一个输入采样数据相对于下一个输出采样数据将经历的延迟。延时单位根据base的值进行计算，为 1/base
int swr_get_out_samples(struct SwrContext *s, int in_samples)
- 根据输入的输入采样率in_samples计算输出采样率的上限，SwrContext的内部状态不同，即使in_samples的值相同，也有可能返回不同的值。

配置信息函数

unsigned swresample_version(void)
- 返回swresample的版本
const char *swresample_configuration(void)
- 返回编译时的配置信息
const char *swresample_license(void)
- 返回swresample的授权信息

基于AVFrame的处理函数

int swr_convert_frame(SwrContext *swr,AVFrame *output, const AVFrame *input);
- 转换输入AVFrame中的数据并将其写入输出AVFrame。输入和输出AVFrames必须有channel_layout, sample_rate和format。如果输出AVFrame没有分配nb_samples的数据指针，将使用av_frame_get_buffer()分配数据并设置字段。
- 输出AVFrame可以为NULL或分配的样本比所需的少。在这样的情况下，将添加未写入输出的所有剩余数据到内部FIFO缓冲区，在下次调用该函数或swr_convert时返回
- 如果转换采样率可能会有数据留在内部重采样延迟缓冲器。调用Swr_get_delay()可以获取剩余的数量。如果需要获取剩余数据，请调用此函数或将swr_convert的输入设置为NULL。
- 如果SwrContext配置不匹配输出和输入AVFrame设置，不会转换数据，并会报错。
- 如果SwrContext没有初始化，此函数会利用输入、输出AVFrame中的参数初始化SwrContext，并进行数据转换。
- 此函数不会创建SwrContext，也不会检测swr的值，调用之前必须通过确保swr的值为合法值
int swr_config_frame(SwrContext *swr, const AVFrame *out, const AVFrame *in);
- 使用输入的AVFrame重新配置SwrContext的用户参数。此函数调用后必须调用swr_init初始化SwrContext。

结构体

SwrContext定义在swresample_internel.h中，属于非公开结构体，因此不同版本的定义可能不同。
swr_alloc、swr_get_class及SwrContext结构体对应的AVClass在libswresample/options.c中定义，此类的option项较多，请自行参考此文件。

FFmpeg学习（五）-- libswresample使用说明及函数介绍

libswresample Audio合成和重采样 libswresample库用来进行audio数据的合成和重采样操作。调用流程： 调用 swr_alloc 创建SwrContext结构体。设置SwrContext参数，有两种方法： 调用av_opt_set_xx函数逐项设置参数；swr_alloc_set_…...

编程日记 2024/7/14 11:42:42

车载视频监控管理方案：无人驾驶出租车安全出行的保障

近日，无人驾驶出租车“萝卜快跑”在武汉开放载人测试成为热门话题。随着科技的飞速发展，无人驾驶技术已逐渐从概念走向现实，特别是在出租车行业中，无人驾驶出租车的推出将为公众提供更为安全、便捷、高效的出行服务。视频监控技…...

编程日记 2024/7/14 11:41:41

05STM32EXIT外部中断中断系统

STM32EXIT外部中断&中断系统中断系统中断触发条件：中断处理流程和用途： STM32中断NVIC嵌套中断向量控制器基本结构NVIC基本结构NVIC优先级分组EXTI简介EXTI基本结构AFIO复用IO口EXTI内部框图旋转编码器简介硬件电路外设手册里的介绍NVIC中断使能寄存…...

编程日记 2024/7/14 11:40:40

MetaGPT和LangGraph对比

MetaGPT和LangGraph是两个不同的AI Agent框架，各有其特点和优势:MetaGPT: MetaGPT是一个多Agent协作框架，模拟软件公司的运作方式。它包含多个角色如产品经理、架构师、项目经理和工程师，每个角色都有特定的职责。MetaGPT采用对话模式&#…...

编程日记 2024/7/14 11:38:38

基于SpringBoot+Hadoop+python的物品租赁系统(带1w+文档)

基于SpringBootHadooppython的物品租赁系统(带1w文档) 基于SpringBootHadooppython的物品租赁系统(带1w文档) 物品租赁系统是电子、信息技术相结合，是一种必然的发展趋势。以互联网为基础，以服务于广大用户为目的，发展整体优势，扩…...

编程日记 2024/7/14 11:35:35

关于 RK3588刷镜像升级镜像”没有发现设备“ 的解决方法

若该文为原创文章，转载请注明原文出处本文章博客地址：https://hpzwl.blog.csdn.net/article/details/140287339 长沙红胖子Qt（长沙创微智科）博文大全：开发技术集合（包含Qt实用技术、树莓派、三维、OpenCV…...

编程日记 2024/7/14 11:34:34

docker 上传镜像到hub仓库

要将 Docker 镜像上传到 Docker Hub，你需要按照以下步骤操作： 登录 Docker Hub 首先，你需要登录到 Docker Hub。打开终端并运行以下命令：docker login系统会提示你输入 Docker Hub 的用户名和密码。如果密码忘记可以token登录&a…...

编程日记 2024/7/14 11:33:33

查询(q_proj)、键(k_proj)和值(v_proj)投影具体含义

查询(q_proj)、键(k_proj)和值(v_proj)投影，这些投影是自注意力机制的核心组件，特别是在Transformer架构中。让我们通过一个简化的例子来说明： import numpy as np# 假设输入维度是4，注意力头数是2 input_dim 4 num_heads 2 …...

编程日记 2024/7/14 11:28:29

超详细版阿里云控制台环境配置+数据库配置

目录一、登录阿里云控制台二、xshell建立远程连接1.安装xshell2.查看公网IP3.新建会话重置密码三、搭建环境1.安装宝塔面板2.打开宝塔面板四、安装配置MySQL1.安装2.放行端口号3.新建数据库4.测试连接数据库一、登录阿里云控制台登录阿里云控制台，找到实例&am…...

编程日记 2024/7/14 11:26:27

Linux：Linux网络总结(附下载链接)

文章目录下载链接网络问题综合问题访问一个网页的全过程？WebSocket HTTPHTTP基本概念GET与POSTHTTP特性HTTP缓存技术HTTP的演变HTTP1.1 优化 HTTPSHTTP与HTTPS有哪些区别？HTTPS解决了HTTP的哪些问题？HTTPS如何解决的？HTTPS是如何…...

编程日记 2024/7/14 11:22:24

Cxx Primer-CP-2

开篇第一句话足见作者的高屋建瓴：类型决定程序中数据和操作的意义。随后列举了简单语句i i j;的意义取决于i和j的类型。若它们都是整形，则为通常的算术意义。若它们都为字符串型，则为进行拼接操作。若为用户自定义的class类型，则…...

编程日记 2024/7/14 11:18:20

OpenCV距离变换函数distanceTransform的使用

操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:Visual Studio Code编程语言：C11 功能描述 distanceTransform是OpenCV库中的一个非常有用的函数，主要用于计算图像中每个像素到最近的背景（通常是非零像素到零像素&…...

编程日记 2024/7/14 11:17:19

Service Mesh 是一种用于处理服务间通信的基础设施层

Service Mesh 是一种用于处理服务间通信的基础设施层，它通常与微服务架构一起使用，以提供诸如服务发现、负载均衡、熔断、监控、追踪和安全性等功能。Service Mesh 的一个流行实现是 Istio，它基于 Envoy 代理和 Kubernetes。然而&#xff0…...

编程日记 2024/7/14 11:15:17

QML界面控件加载与显示顺序

一、QML界面控件加载顺序 QML在界面加载时的顺序和我们认知的有很大的不同，有时候会对我们获取参数以及界面实现造成很大的困扰 1、加载顺序 import QtQuick 2.12 import QtQml 2.12 import QtQuick.Window 2.12 import QtQuick.VirtualKeyboard 2.4Window {id: …...

编程日记 2024/7/14 11:13:16

C++从入门到起飞之——缺省参数/函数重载/引用全方位剖析！

目录 1.缺省参数 2. 函数重载 3.引⽤ 3.1 引⽤的概念和定义 3.2 引⽤的特性 3.3 引⽤的使⽤ 3.4 const引⽤ 3.5 指针和引⽤的关系 4.完结散花个人主页：秋风起，再归来~ C从入门到起飞个人格言：悟已往之不谏…...

编程日记 2024/7/14 11:10:12

tkinter-TinUI-xml实战（12）pip可视化管理器

引言 pip命令行工具在平常使用方面确实足够简单，本项目只是作为TinUI多界面开发的示例。当然，总有人想用GUI版pip，实际上也有。不过现在，我们就来手搓一个基于python和TinUI（tkinter）的pip可视化管理器。…...

编程日记 2024/7/14 11:09:12

Java中标识符和关键字

1.标识符 public class HelloWorld{public static void main(String[] args){System.out.println("Hello,world");} }上述代码中在public class 后面的HelloWorld称为类名，main称为方法名，也可以将其称为标识符，即：在程…...

编程日记 2024/7/14 11:08:11

电子版pdf格式标书怎么加盖公章？

电子版PDF格式标书加盖公章的方法有多种，以下是一些常用的步骤和技巧： 一、手动插入图片法打开PDF文档：首先，确保你已经安装了支持PDF编辑的软件，如Adobe Acrobat Reader DC、Foxit PDF Editor等。选择插入图片&…...

编程日记 2024/7/14 11:07:09

【开放集目标检测】Grounding DINO

一、引言论文： Grounding DINO: Grounding DINO: Marrying DINO with Grounded Pre-Training for Open-Set Object Detection 作者： IDEA 代码： Grounding DINO 注意： 该算法是在Swin Transformer、Deformable DETR、DINO基础上…...

编程日记 2024/7/14 11:06:08

东莞酷得 PMS134应广8位OTP单片机

1、特性 通用 OTP 系列 不建议使用于 AC 阻容降压供电或有高 EFT 要求的应用。应广不对使用于此类应用而不达安规要求负责 工作温度范围:-20C~70C 1.2.系统特性 一个硬件 16位计数器 两个8位硬件 PWM生成器 三个11 位硬件 PWM生成器(PWMG0，PWMG1…...

编程日记 2024/7/14 11:05:07

1 方法一先用方法 keySet() 获取集合中的所有键。再通过 gey(key) 方法用对应键获取值 import java.util.HashMap; import java.util.Set;public class Test {public static void main(String[] args) {HashMap hashMap new HashMap();hashMap.put("语文",99);has…...

编程新知 2026/1/24 15:08:45

抖音增长新引擎：品融电商，一站式全案代运营领跑者

抖音增长新引擎：品融电商，一站式全案代运营领跑者在抖音这个日活超7亿的流量汪洋中，品牌如何破浪前行？自建团队成本高、效果难控；碎片化运营又难成合力——这正是许多企业面临的增长困局。品融电商以「抖音全案代运营…...

编程新知 2026/2/1 5:45:17

Typeerror: cannot read properties of undefined (reading ‘XXX‘)

最近需要在离线机器上运行软件，所以得把软件用docker打包起来，大部分功能都没问题，出了一个奇怪的事情。同样的代码，在本机上用vscode可以运行起来，但是打包之后在docker里出现了问题。使用的是dialog组件，…...

编程新知 2025/9/24 3:05:06

Java求职者面试指南：Spring、Spring Boot、MyBatis框架与计算机基础问题解析

Java求职者面试指南：Spring、Spring Boot、MyBatis框架与计算机基础问题解析一、第一轮提问（基础概念问题） 1. 请解释Spring框架的核心容器是什么？它在Spring中起到什么作用？ Spring框架的核心容器是IoC容器&#…...

编程新知 2025/10/4 21:24:40

push [特殊字符] present

push 🆚 present 前言present和dismiss特点代码演示 push和pop特点代码演示前言在 iOS 开发中，push 和 present 是两种不同的视图控制器切换方式，它们有着显著的区别。 present和dismiss 特点在当前控制器上方新建视图层级需要手动调用…...

编程新知 2026/1/31 4:26:17

PHP 8.5 即将发布：管道操作符、强力调试

前不久，PHP宣布了即将在 2025 年 11 月 20 日正式发布的 PHP 8.5！作为 PHP 语言的又一次重要迭代，PHP 8.5 承诺带来一系列旨在提升代码可读性、健壮性以及开发者效率的改进。而更令人兴奋的是，借助强大的本地开发环境 ServBay&am…...

编程新知 2026/1/31 8:53:50

嵌入式常见 CPU 架构

架构类型架构厂商芯片厂商典型芯片特点与应用场景PICRISC (8/16 位)MicrochipMicrochipPIC16F877A、PIC18F4550简化指令集，单周期执行；低功耗、CIP 独立外设；用于家电、小电机控制、安防面板等嵌入式场景8051CISC (8 位)Intel（原始…...

编程新知 2025/6/10 21:24:01

全面解析数据库：从基础概念到前沿应用

在数字化时代，数据已成为企业和社会发展的核心资产，而数据库作为存储、管理和处理数据的关键工具，在各个领域发挥着举足轻重的作用。从电商平台的商品信息管理，到社交网络的用户数据存储，再到金融行业的交易记录处理&a…...

编程新知 2025/9/19 11:48:17

C++--string的模拟实现

一,引言 string的模拟实现是只对string对象中给的主要功能经行模拟实现，其目的是加强对string的底层了解，以便于在以后的学习或者工作中更加熟练的使用string。本文中的代码仅供参考并不唯一。二,默认成员函数 string主要有三个成员变量，…...

编程新知 2026/1/26 19:02:17

Appium下载安装配置保姆教程（图文详解）

目录一、Appium软件介绍 1.特点 2.工作原理 3.应用场景二、环境准备安装 Node.js 安装 Appium 安装 JDK 安装 Android SDK 安装Python及依赖包三、安装教程 1.Node.js安装 1.1.下载Node 1.2.安装程序 1.3.配置npm仓储和缓存 1.4. 配置环境 1.5.测试Node.j…...

编程新知 2026/1/30 22:33:08