当前位置：首页 > article >正文

【音视频】AVIO输入模式

article 2026/2/7 18:03:17

内存IO模式

AVIOContext *avio_alloc_context(
unsigned char *buffer,
int buffer_size,
int write_flag,
void *opaque,
int (*read_packet)(void *opaque, uint8_t *buf, int buf_size),
int (*write_packet)(void *opaque, uint8_t *buf, int buf_size),
int64_t (*seek)(void *opaque, int64_t offset, int whence)
);

参数说明：

opaque是 read_packet / write_packet 的第⼀个参数，指向⽤户数据。
buffer和buffer_size是 read_packet / write_packet 的第⼆个和第三个参数，是供FFmpeg使⽤的数据区。
buffer ⽤作FFmpeg输⼊时，由⽤户负责向 buffer 中填充数据，FFmpeg取⾛数据。
buffer ⽤作FFmpeg输出时，由FFmpeg负责向 buffer 中填充数据，⽤户取⾛数据。
write_flag是缓冲区读写标志，读写的主语是指FFmpeg。
write_flag 为1时， buffer ⽤于写，即作为FFmpeg输出。
write_flag 为0时， buffer ⽤于读，即作为FFmpeg输⼊。
read_packet和write_packet是函数指针，指向⽤户编写的回调函数。
seek也是函数指针，需要⽀持seek时使⽤。可以类⽐fseek的机制

一、avio_alloc_context 的环形缓冲本质

avio_alloc_context 创建的 AVIOContext 结构体 内部维护了一个环形缓冲区，其核心特性包括：

循环存储机制
- 缓冲区逻辑上首尾相连，数据写入时自动回绕（Wrap-Around），避免频繁内存分配。
- 例如，当缓冲区写满后，新数据会覆盖最早写入的数据（取决于配置）。
双指针管理
- 读指针（buf_ptr）：指向当前读取位置。
- 写指针（buf_end）：指向当前写入位置。
- 通过模运算（%）实现指针的循环移动，例如：
  buf_ptr = (buf_ptr + size) % buffer_size。
缓冲与性能优化
- 预分配固定大小的内存（如 4KB、8KB），减少系统调用次数。
- 适用于网络流、内存数据流等需要连续读写的场景。

实现流程

准备文件

在build路径下准备相关mp3和aac文件

在这里插入图片描述

添加main函数参数，表示输入文件和输出文件

在这里插入图片描述

打开文件

使用FILE二进制打开输入文件和输出文件

const char *in_file_name = argv[1];
const char *out_file_name = argv[2];
FILE *in_file = NULL;
FILE *out_file = NULL;// 1. 打开参数文件
in_file = fopen(in_file_name, "rb");
if(!in_file) {printf("open file %s failed\n", in_file_name);return  -1;
}
out_file = fopen(out_file_name, "wb");
if(!out_file) {printf("open file %s failed\n", out_file_name);return  -1;
}

自定义`IO`读取

为AVFormatContex添加自定义读取规则，即自己实现一个AVIOContext，而不是使用默认的
AVIOContext使用的是环形缓冲区，即缓冲区满的时候覆盖前面的缓冲区
需要设置环形缓冲区的大小、文件指针、以及缓冲内存回调函数，在内存数据读完的时候触发回调函数，继续从文件读取数据到环形缓冲区

  uint8_t *io_buffer = av_malloc(BUF_SIZE);
AVIOContext *avio_ctx = avio_alloc_context(io_buffer, BUF_SIZE, 0, (void *)in_file,    \read_packet, NULL, NULL);
AVFormatContext *format_ctx = avformat_alloc_context();
format_ctx->pb = avio_ctx;
int ret = avformat_open_input(&format_ctx, NULL, NULL, NULL);
if(ret < 0) {printf("avformat_open_input failed:%s\n", av_err2str(ret));return -1;
}

read_packet回调函数

static int read_packet(void *opaque, uint8_t *buf, int buf_size)
{FILE *in_file = (FILE *)opaque;int read_size = fread(buf, 1, buf_size, in_file);// printf("read_packet read/*_*/size:%d, buf_size:%d\n", read_size, buf_size);if(read_size <=0) {return AVERROR_EOF;     // 数据读取完毕}return read_size;
}

查找解码器

根据ID查找解码器，这里直接查找AAC解码器
分配解码器上下文，将解码器绑定到上下文中

AVCodecContext *codec_ctx = avcodec_alloc_context3(codec);
if(!codec_ctx) {printf("avcodec_alloc_context3 failed\n");return -1;
}
ret = avcodec_open2(codec_ctx, codec, NULL);
if(ret < 0) {printf("avcodec_open2 failed:%s\n", av_err2str(ret));return -1;
}

解码并写入文件

将格式上下文信息拷贝到数据包（packet）中

AVPacket *packet = av_packet_alloc();
ret = av_read_frame(format_ctx, packet);

发送packet到解码器

ret = avcodec_send_packet(dec_ctx, packet);

使用帧（frame）接收解码后的裸流数据

ret = avcodec_receive_frame(dec_ctx, frame);

获取单个采样点的数据大小，左右声道依次写入数据

int data_size = av_get_bytes_per_sample(dec_ctx->sample_fmt);
for(int i = 0; i < frame->nb_samples; i++) {
for(int ch = 0; ch < dec_ctx->channels; ch++) {fwrite(frame->data[ch] + data_size *i, 1, data_size, outfile);}
}

操作代码如下

while (1) {ret = av_read_frame(format_ctx, packet);if(ret < 0) {printf("av_read_frame failed:%s\n", av_err2str(ret));break;}decode(codec_ctx, packet, frame, out_file);
}

decode函数

static void decode(AVCodecContext *dec_ctx, AVPacket *packet, AVFrame *frame,FILE *outfile)
{int ret = 0;ret = avcodec_send_packet(dec_ctx, packet);if(ret == AVERROR(EAGAIN)) {printf("Receive_frame and send_packet both returned EAGAIN, which is an API violation.\n");} else if(ret < 0) {printf("Error submitting the packet to the decoder, err:%s\n",av_get_err(ret));return;}while (ret >= 0) {ret = avcodec_receive_frame(dec_ctx, frame);if (ret == AVERROR(EAGAIN) || ret == AVERROR_EOF) {return;} else if (ret < 0)  {printf("Error during decoding\n");exit(1);}if(!packet) {printf("get flush frame\n");}int data_size = av_get_bytes_per_sample(dec_ctx->sample_fmt);//        print_sample_format(frame);/**P表示Planar（平面），其数据格式排列方式为 :LLLLLLRRRRRRLLLLLLRRRRRRLLLLLLRRRRRRL...（每个LLLLLLRRRRRR为一个音频帧）而不带P的数据格式（即交错排列）排列方式为：LRLRLRLRLRLRLRLRLRLRLRLRLRLRLRLRLRLRL...（每个LR为一个音频样本）播放范例：   ffplay -ar 48000 -ac 2 -f f32le believe.pcm并不是每一种都是这样的格式*/// 这里的写法不是通用，通用要调用重采样的函数去实现// 这里只是针对解码出来是planar格式的转换for(int i = 0; i < frame->nb_samples; i++) {for(int ch = 0; ch < dec_ctx->channels; ch++) {fwrite(frame->data[ch] + data_size *i, 1, data_size, outfile);}}}
}

冲刷解码器

解码结束后要冲刷解码器，刷新解码器数据

decode(codec_ctx, NULL, frame, out_file);

结束操作

退出之前要释放内存、关闭文件

fclose(in_file);
fclose(out_file);av_free(io_buffer);
av_frame_free(frame);
av_packet_free(packet);avformat_close_input(&format_ctx);
avcodec_free_context(&codec_ctx);

更多资料：https://github.com/0voice

【音视频】AVIO输入模式

内存IO模式 AVIOContext *avio_alloc_context( unsigned char *buffer, int buffer_size, int write_flag, void *opaque, int (*read_packet)(void *opaque, uint8_t *buf, int buf_size), int (*write_packet)(void *opaque, uint8_t *buf, int buf_size), int64_t (*seek)(…...

编程日记 2026/1/20 1:45:45

AI与思维模型【76】——SWOT思维模型

一、定义 SWOT思维模型是一种用于分析事物内部和外部因素的战略规划工具。其中，S代表优势（Strengths），是指事物自身所具备的独特能力、资源或特点，这些因素有助于其在竞争中取得优势；W代表劣势&#xff08…...

编程日记 2025/12/12 17:47:49

大模型提示词如何编写

一、提示词的核心三要素明确目标（What） 告诉 AI「你要它做什么」，越具体越好。 ❌ 模糊：写一篇文章 ✅ 清晰：写一篇 800 字的高考作文，主题 “坚持与创新”，结构分引言、三个论点（…...

编程日记 2025/12/14 1:45:54

python如何取消word中的缩进

在python-docx中，取消缩进可以通过将相应的缩进属性设置为None或0来实现。以下是取消不同类型缩进的方法： 取消左缩进 from docx import Documentdoc Document(existing_document.docx)for paragraph in doc.paragraphs:# 取消左缩进paragraph.paragr…...

编程日记 2025/9/19 5:39:13

DDL小练习

1.创建一张t_user表要求属性有id(INT),name(VARCHAR),sex(VARCHAR),birthday(DATE) 其中id和name不能为空，添加数据并测试。创建数据库 create database spt2503; 创建数据库中的t_user表 create table t_user (id int not null, name varchar(20) not…...

编程日记 2025/10/17 10:59:31

Uniapp：scroll-view(区域滑动视图)

目录一、基本概述二、属性说明三、基本使用3.1 纵向滚动3.2 横向滚动一、基本概述 scroll-view，可滚动视图区域。用于区域滚动。二、属性说明属性名类型默认值说明平台差异说明scroll-xBooleanfalse允许横向滚动scroll-yBooleanfalse允许纵向滚动三、基本使用 3.1 纵向滚…...

编程日记 2026/1/20 17:57:34

【前端】【面试】在前端开发中，如何实现图片的渐进式加载，以及这样做的好处是什么？

题目：在前端开发中，如何实现图片的渐进式加载，以及这样做的好处是什么？ 在浏览器端实现图片的“渐进式加载”（Progressive Image Loading）常用的三种方式方法思路典型实现要点适用场景优缺点简述1. 使…...

编程日记 2026/1/27 2:11:42

单精度浮点运算/定点运算下 MATLAB (VS) VIVADO

VIVADO中单精度浮点数IP核计算结果与MATLAB单精度浮点数计算结果的对比 MATLAB定点运算仿真，对比VIVADO计算的结果目录前言一、VIVADO与MATLAB单精度浮点数运算结果对比二、MATLAB定点运算仿真总结前言本文介绍了怎么在MATLAB中使用单精度浮点数进行运算…...

编程日记 2026/2/1 2:56:44

基于大模型对先天性巨结肠全流程预测及医疗方案研究报告

目录一、引言 1.1 研究背景与意义 1.2 研究目的与创新点二、大模型在先天性巨结肠预测中的理论基础 2.1 大模型概述 2.2 大模型预测先天性巨结肠的可行性分析三、术前预测与准备方案 3.1 大模型对术前病情的预测 3.1.1 疾病确诊预测 3.1.2 病情严重程度评估 3.2 …...

编程日记 2026/1/5 14:22:22

【AI插件开发】Notepad++ AI插件开发1.0发布和使用说明

一、产品简介 AiCoder是一款为Notepad设计的轻量级AI辅助插件，提供以下核心功能： 嵌入式提问：对选中的文本内容进行AI分析，通过侧边栏聊天界面与AI交互，实现多轮对话、问题解答或代码生成。对话式提问：独…...

编程日记 2026/1/21 12:51:59

【MySQL数据库入门到精通-07 函数-字符串函数、数值函数、日期函数和流程函数】

文章目录一、字符串函数1. MySQL中的函数主要分为以下四类： 字符串函数、数值函数、日期函数、流程函数。下面是字符串函数常见的函数，见下表。2.具体代码实现3.结果二、数值函数1.知识点2.具体代码实现3.结果三、日期函数1.知识点2.具体代码实现3.结…...

编程日记 2026/1/26 11:14:35

Python图像处理——基于Retinex算法的低光照图像增强系统

1.项目内容 （1）算法介绍 ①MSRCR (Multi-Scale Retinex with Color Restoration) MSRCR 是多尺度 Retinex 算法（MSR）的扩展版，引入了色彩恢复机制以进一步提升图像增强质量。MSR 能有效地压缩图像动态范围&#xff…...

编程日记 2026/2/5 6:10:46

如何在JDK17项目中改成1.8

1.调整 Spring Boot 版本由于 Spring Boot 3.x 最低要求 JDK 17，所以如果要使用 JDK 8，需要把 spring-boot-starter-parent 的版本降低到 2.7.x 系列，这个系列是支持 JDK 8 的。示例如下： <parent><groupId>org.sp…...

编程日记 2026/1/30 12:41:28

【不同名字的yolo的yaml文件名是什么意思】

以下是这些 YOLO 系列配置文件的详细解析，按版本和功能分类说明： 一、YOLOv3 系列文件名核心特性适用场景yolov3.yaml原始 YOLOv3 结构，3 尺度预测（13x13,26x26,52x52）通用目标检测yolov3-spp.yaml增加 SPP&#xff…...

编程日记 2026/2/3 23:31:31

Zephyr kernel Build System (CMake)介绍

目录概述 1. 结构介绍 2 构建和配置阶段 2.1 配置阶段 2.2 Cmake编译 3 Zephy项目目录结构 3.1 文件架构 3.2 文件content 概述本文主要介绍Zephyr kernel Build System CMake的功能，以及使用该工具构建项目，并详细介绍了每个目录以及目录下文…...

编程日记 2026/1/30 12:41:23

相对论大师-记录型正负性质BFS/图论-链表/数据结构

看到这一题我的第一个思路就是双向bfs 起点是a，终点还是a，但是flag是相反的（“越”的方向） tip1.可以用字典vis来存储flag 刚开始初始化时vissta,visend一个对应0、1 要求两个队列相…...

编程日记 2026/1/30 12:41:21

研发内控新规下的合规之道：维拉工时助力企业穿越IPO审查雷区

📌 背景 | 全面注册制下，研发内控成“必修课” 在全面注册制背景下，证监会发布的《监管规则适用指引——发行类第9号：研发人员及研发投入》（简称“发行类9号”），对企业的研发费用归集、研发工时…...

编程日记 2026/1/1 15:10:55

Jenkins流水线管理工具

文章目录前言： DevOps时代的自动化核心 —Jenkins一、Jenkins是什么？二、Linux安装Jenkinswar包方式安装依赖环境下载 Jenkins WAR 包启动 Jenkins 服务启动日志验证配置插件镜像源 docker镜像方式安装依赖环境拉取 Jenkins 镜像运行 Jenkins 容器获取初…...

编程日记 2026/1/30 12:41:19

嵌入式开发：基础知识介绍

一、嵌入式系统 1、介绍以提高对象体系智能性、控制力和人机交互能力为目的，通过相互作用和内在指标评价的，嵌入到对象体系中的专用计算机系统。 2、分类按其形态的差异，一般可将嵌入式系统分为：芯片级（MCU、SoC&am…...

编程日记 2026/2/6 20:23:17

el-table中el-input的autofocus无法自动聚焦的解决方案

需求有一个表格展示了一些进度信息，进度信息可以修改，需要点击进度信息旁边的编辑按钮时，把进度变为输入框且自动聚焦，当鼠标失去焦点时自动请求更新接口。注：本例以vue2 element UI为例分析这个需求看着挺简单…...

编程日记 2026/1/30 12:41:14

一文了解智慧教育顶刊TLT的研究热点

本文聚焦于IEEE Transactions on Learning Technologies（TLT）期刊，通过图文结合的方式，梳理了2025年第18卷的研究热点，帮助读者把握教育技术与人工智能交叉领域的研究进展，深入了解智能学习系统、自适应学习…...

编程日记 2026/1/20 9:38:47

统计术语学习

基期、现期作为对比参照的时期称为基期，而相对于基期的称为现期。描述具体数值时我们称之为基期量和现期量。【例 1】2017 年比 2016 年第三产业 GDP 增长 6.8%， （2016）为基期，（2017） 为现…...

编程日记 2026/1/20 7:44:09

NEGATIVE LABEL GUIDED OOD DETECTION WITH PRETRAINED VISION-LANGUAGE MODELS

1. 介绍：这篇论文也是基于CLIP通过后处理的方法实现的OOD的检测，但是设计点在于，之前的方法是使用的ID的类别，这篇工作是通过添加一些在语义上非常不同于ID的类别的外分布类来做的OOD检测。 CLIP做OOD检测的这个系列里面我看的以及记录的第一篇就是MCM的方法，这也是确实是…...

编程日记 2025/12/28 7:05:06

飞机会员日

各航空公司会员日日期主要航空公司会员日整理如下（数据截至2025年3月最新信息）：‌ 1 2 ‌中国国际航空（国航）‌ 每月"同月同日"（如1月1日、2月2日类推） ‌中国南方航空&#xff08…...

编程日记 2026/1/29 9:12:36

解读《数据资产质量评估实施规则》：企业数据资产认证落地的关键指南

随着“数据要素市场”建设加速，数据资产逐步成为企业核心资产之一。2024年4月，由中国质量认证中心（CQC）发布的《数据资产质量评估实施规则》（编号：CQC96-831160-2024）正式实施，为企业…...

编程日记 2025/6/11 23:39:59

常用第三方库：flutter_boost混合开发

常用第三方库：flutter_boost混合开发前言在移动应用开发中，混合开发是一个非常重要的话题。特别是对于已有原生应用想要引入Flutter的团队来说，如何实现Flutter页面和原生页面的无缝整合就显得尤为关键。本文将深入介绍flutter_boost这个…...

编程日记 2025/9/15 6:01:05

论分布式事务及其解决方案架构师论文范文（考试笔记）

请围绕“论分布式事务及其解决方案”论题，依次从以下三个方面进行论述。 1、概要叙述你参与分析设计的软件项目以及你在其中所承担的主要工作。 2、请介绍4种分布式事务的解决方案及简单说明。 3、具体阐述你参与的软件项目是如何做到分布式事务的，过程中…...

编程日记 2026/1/28 5:02:53

ROS 快速入门教程04

12.激光雷达工作原理激光雷达的作用是探照周围障碍物的距离，按照测量维度可以分为单线雷达和多线雷达。按照测量原理可以分为三角测距雷达和TOF雷达。按照工作方式可以分为固态雷达和机械旋转雷达。本次讲解以TOF雷达为例，雷达发射器发射激光遇到障碍…...

编程日记 2026/2/2 12:18:15

2025 年导游证报考条件新政策解读与应对策略

2025 年导游证报考政策有了不少新变化，这些变化会对报考者产生哪些影响？我们又该如何应对？下面就为大家详细解读新政策，并提供实用的应对策略。最引人注目的变化当属中职旅游类专业学生的报考政策。以往，中专学历报考…...

编程日记 2026/1/26 19:48:01

vscode切换Python环境

跑深度学习项目通常需要切换python环境，下面介绍如何在vscode切换python环境： 1.点击vscode界面左上角 2.在弹出框选择对应kernel...

编程日记 2026/1/30 22:22:55