当前位置：首页 > news >正文

Qt+FFmpeg开发视频播放器笔记(三)：音视频流解析封装

news 2026/2/9 14:45:19

音频解析

音频解码是指将压缩的音频数据转换为可以再生的PCM（脉冲编码调制）数据的过程。

FFmpeg音频解码的基本步骤如下：

初始化FFmpeg解码器(4.0版本后可省略):
调用av_register_all()初始化编解码器。
调用avcodec_register_all()注册所有编解码器。
打开输入的音频流:
使用avformat_open_input()函数来读取和打开音频文件。
使用avformat_find_stream_info()函数获取流信息。
查找音频流:
检索音频流的索AVMEDIA_TYPE_AUDIO。
使用av_find_best_stream()找到第一个音频流并记下它的index。
打开对应的解码器:
查找音频流对应的解解码器avcodec_find_decoder()。
使用avcodec_open2()函数来打开解码器。
读取音频包解码:
遍历音频数据，读取音频包（AVPacket）。
使用av_read_frame()来读取。
检查包是否属于所需的音频流。
将音频包送入解码器:
使用avcodec_send_packet()将包送入解码器准备解码。
从解码器读取解码后的音频帧:
使用avcodec_receive_frame()获取解码后的帧（AVFrame）。
继续从解码器获取所有解码后的帧直到返回EAGAIN或错误。
转换音频格式 (可选):
如果需要，将音频数据转换成不同的格式或采样率，可以使用’libswresample’或者’libavresample’。
后处理 (可选):
对解码的音频进行必要的后处理，比如音量调整、混音等。
清理和资源释放:
关闭解码器。
关闭音频文件。
释放所有使用过的AVFrame和AVPacket。
释放编解码上下文等。

视频解析

视频解码的流程目的是将压缩的视频数据流转换成解码后的原始视频帧（通常是YUV或RGB格式）。

FFmpeg视频解码的基本步骤如下：

初始化FFmpeg解码器(4.0版本后可省略):
调用av_register_all()初始化编解码器。
调用avcodec_register_all()注册所有编解码器。
打开输入的视频流:
使用avformat_open_input()函数来读取和打开音频文件。
使用avformat_find_stream_info()函数获取流信息。
查找视频流:
检索视频流的索AVMEDIA_TYPE_VIDEO。
使用av_find_best_stream()找到第一个视频流并记下它的index。
打开对应的解码器:
查找视频流对应的解解码器avcodec_find_decoder()。
使用avcodec_open2()函数来打开解码器。
读取视频流包解码:
通过av_read_frame()从媒体文件中读取视频数据（AVPacket）。
考虑只处理我们之前记下的视频流索引对应的包。
发送数据到解码器:
使用avcodec_send_packet()将数据包送入解码器准备解码。
从解码器读取解码后的视频帧:
使用avcodec_receive_frame()从解码器中获取解码后的视频帧（AVFrame）。
需要循环重复此过程以获取所有解码后的帧。
视频帧处理 (可选):
将解码的视频帧转换成需要的格式或进行处理，可以使用libswscale来进行格式转换或调整尺寸。
帧率控制 (可选):
根据视频的PTS（Presentation Time Stamp）来处理帧率，确保视频按正确的速率播放。
清理和资源释放:
释放已分配的AVCodecContext和AVFormatContext。
释放使用过的AVFrame和AVPacket。
关闭视频流和网络库（如果初始化了）。

视频流解析代码

decoder.h

#ifndef DECODER_H
#define DECODER_H#include <QThread>
#include <QImage>extern "C"
{
//#include "libavfilter/avfiltergraph.h"
#include "libavfilter/buffersink.h"
#include "libavfilter/buffersrc.h"
#include "libswscale/swscale.h"
#include "libavdevice/avdevice.h"
#include "libavutil/pixfmt.h"
#include "libavutil/opt.h"
#include "libavcodec/avfft.h"
#include "libavutil/imgutils.h"
}#include "audiodecoder.h"class Decoder : public QThread
{Q_OBJECTpublic:enum PlayState {STOP,PAUSE,PLAYING,FINISH};explicit Decoder();~Decoder();double getCurrentTime();void seekProgress(qint64 pos);int getVolume();void setVolume(int volume);private:void run();void clearData();void setPlayState(Decoder::PlayState state);void displayVideo(QImage image);static int videoThread(void *arg);double synchronize(AVFrame *frame, double pts);bool isRealtime(AVFormatContext *pFormatCtx);int initFilter();int fileType;int videoIndex;int audioIndex;int subtitleIndex;QString currentFile;QString currentType;qint64 timeTotal;AVPacket seekPacket;qint64 seekPos;double seekTime;PlayState playState;bool isStop;bool gotStop;bool isPause;bool isSeek;bool isReadFinished;bool isDecodeFinished;AVFormatContext *pFormatCtx;AVCodecContext *pCodecCtx;          // video codec contextAvPacketQueue videoQueue;AvPacketQueue subtitleQueue;AVStream *videoStream;double videoClk;    // video frame timestampAudioDecoder *audioDecoder;AVFilterGraph   *filterGraph;AVFilterContext *filterSinkCxt;AVFilterContext *filterSrcCxt;public slots:void decoderFile(QString file, QString type);void stopVideo();void pauseVideo();void audioFinished();signals:void readFinished();void gotVideo(QImage image);void gotVideoTime(qint64 time);void playStateChanged(Decoder::PlayState state);};#endif // DECODER_H

decoder.cpp

#include <QDebug>#include "decoder.h"Decoder::Decoder() :timeTotal(0),playState(STOP),isStop(false),isPause(false),isSeek(false),isReadFinished(false),audioDecoder(new AudioDecoder),filterGraph(NULL)
{av_init_packet(&seekPacket);seekPacket.data = (uint8_t *)"FLUSH";connect(audioDecoder, SIGNAL(playFinished()), this, SLOT(audioFinished()));connect(this, SIGNAL(readFinished()), audioDecoder, SLOT(readFileFinished()));
}Decoder::~Decoder()
{}void Decoder::displayVideo(QImage image)
{emit gotVideo(image);
}void Decoder::clearData()
{videoIndex = -1,audioIndex = -1,subtitleIndex = -1,timeTotal = 0;isStop  = false;isPause = false;isSeek  = false;isReadFinished      = false;isDecodeFinished    = false;videoQueue.empty();audioDecoder->emptyAudioData();videoClk = 0;
}void Decoder::setPlayState(Decoder::PlayState state)
{
//    qDebug() << "Set state: " << state;emit playStateChanged(state);playState = state;
}bool Decoder::isRealtime(AVFormatContext *pFormatCtx)
{if (!strcmp(pFormatCtx->iformat->name, "rtp")|| !strcmp(pFormatCtx->iformat->name, "rtsp")|| !strcmp(pFormatCtx->iformat->name, "sdp")) {return true;}// if(pFormatCtx->pb && (!strncmp(pFormatCtx->filename, "rtp:", 4)//     || !strncmp(pFormatCtx->filename, "udp:", 4)//     )) {//     return true;// }return false;
}int Decoder::initFilter()
{int ret;AVFilterInOut *out = avfilter_inout_alloc();AVFilterInOut *in = avfilter_inout_alloc();/* output format */enum AVPixelFormat pixFmts[] = {AV_PIX_FMT_RGB32, AV_PIX_FMT_NONE};/* free last graph */if (filterGraph) {avfilter_graph_free(&filterGraph);}filterGraph = avfilter_graph_alloc();/* just add filter ouptut format rgb32,* use for function avfilter_graph_parse_ptr()*/QString filter("pp=hb/vb/dr/al");QString args = QString("video_size=%1x%2:pix_fmt=%3:time_base=%4/%5:pixel_aspect=%6/%7").arg(pCodecCtx->width).arg(pCodecCtx->height).arg(pCodecCtx->pix_fmt).arg(videoStream->time_base.num).arg(videoStream->time_base.den).arg(pCodecCtx->sample_aspect_ratio.num).arg(pCodecCtx->sample_aspect_ratio.den);/* create source filter */ret = avfilter_graph_create_filter(&filterSrcCxt, avfilter_get_by_name("buffer"), "in", args.toLocal8Bit().data(), NULL, filterGraph);if (ret < 0) {qDebug() << "avfilter graph create filter failed, ret:" << ret;avfilter_graph_free(&filterGraph);goto out;}/* create sink filter */ret = avfilter_graph_create_filter(&filterSinkCxt, avfilter_get_by_name("buffersink"), "out", NULL, NULL, filterGraph);if (ret < 0) {qDebug() << "avfilter graph create filter failed, ret:" << ret;avfilter_graph_free(&filterGraph);goto out;}/* set sink filter ouput format */ret = av_opt_set_int_list(filterSinkCxt, "pix_fmts", pixFmts, AV_PIX_FMT_NONE, AV_OPT_SEARCH_CHILDREN);if (ret < 0) {qDebug() << "av opt set int list failed, ret:" << ret;avfilter_graph_free(&filterGraph);goto out;}out->name       = av_strdup("in");out->filter_ctx = filterSrcCxt;out->pad_idx    = 0;out->next       = NULL;in->name       = av_strdup("out");in->filter_ctx = filterSinkCxt;in->pad_idx    = 0;in->next       = NULL;if (filter.isEmpty() || filter.isNull()) {/* if no filter to add, just link source & sink */ret = avfilter_link(filterSrcCxt, 0, filterSinkCxt, 0);if (ret < 0) {qDebug() << "avfilter link failed, ret:" << ret;avfilter_graph_free(&filterGraph);goto out;}} else {/* add filter to graph */ret = avfilter_graph_parse_ptr(filterGraph, filter.toLatin1().data(), &in, &out, NULL);if (ret < 0) {qDebug() << "avfilter graph parse ptr failed, ret:" << ret;avfilter_graph_free(&filterGraph);goto out;}}/* check validity and configure all the links and formats in the graph */if ((ret = avfilter_graph_config(filterGraph, NULL)) < 0) {qDebug() << "avfilter graph config failed, ret:" << ret;avfilter_graph_free(&filterGraph);}out:avfilter_inout_free(&out);avfilter_inout_free(&in);return ret;
}void Decoder::decoderFile(QString file, QString type)
{
//    qDebug() << "Current state:" << playState;qDebug() << "File name:" << file << ", type:" << type;if (playState != STOP) {isStop = true;while (playState != STOP) {SDL_Delay(10);}SDL_Delay(100);}clearData();SDL_Delay(100);currentFile = file;currentType = type;this->start();
}void Decoder::audioFinished()
{isStop = true;if (currentType == "music") {SDL_Delay(100);emit playStateChanged(Decoder::FINISH);}
}void Decoder::stopVideo()
{if (playState == STOP) {setPlayState(Decoder::STOP);return;}gotStop = true;isStop  = true;audioDecoder->stopAudio();if (currentType == "video") {/* wait for decoding & reading stop */while (!isReadFinished || !isDecodeFinished) {SDL_Delay(10);}} else {while (!isReadFinished) {SDL_Delay(10);}}
}void Decoder::pauseVideo()
{if (playState == STOP) {return;}isPause = !isPause;audioDecoder->pauseAudio(isPause);if (isPause) {av_read_pause(pFormatCtx);setPlayState(PAUSE);} else {av_read_play(pFormatCtx);setPlayState(PLAYING);}
}int Decoder::getVolume()
{return audioDecoder->getVolume();
}void Decoder::setVolume(int volume)
{audioDecoder->setVolume(volume);
}double Decoder::getCurrentTime()
{if (audioIndex >= 0) {return audioDecoder->getAudioClock();}return 0;
}void Decoder::seekProgress(qint64 pos)
{if (!isSeek) {seekPos = pos;isSeek = true;}
}double Decoder::synchronize(AVFrame *frame, double pts)
{double delay;if (pts != 0) {videoClk = pts; // Get pts,then set video clock to it} else {pts = vi

Qt+FFmpeg开发视频播放器笔记(三)：音视频流解析封装

音频解析音频解码是指将压缩的音频数据转换为可以再生的PCM（脉冲编码调制）数据的过程。 FFmpeg音频解码的基本步骤如下：初始化FFmpeg解码器(4.0版本后可省略): 调用av_register_all()初始化编解码器。调用avcodec_register_all()注册所有编解码器。打开输入的音频流:…...

编程日记 2024/9/20 12:42:05

从黎巴嫩电子通信设备爆炸看如何防范网络电子袭击

引言： 在当今数字化时代，电子通信设备已成为我们日常生活中不可或缺的一部分。然而，近期黎巴嫩发生的电子设备爆炸事件提醒我们，这些设备也可能成为危险的武器。本文将深入探讨电子袭击的原理、防范措施，以及网络智能…...

编程日记 2024/9/20 12:41:04

【Verilog学习日常】—牛客网刷题—Verilog快速入门—VL16

使用8线-3线优先编码器Ⅰ实现16线-4线优先编码器描述 ②请使用2片该优先编码器Ⅰ及必要的逻辑电路实现16线-4线优先编码器。优先编码器Ⅰ的真值表和代码已给出。可将优先编码器Ⅰ的代码添加到本题答案中，并例化。优先编码器Ⅰ的代码如下： module…...

编程日记 2024/9/20 12:40:03

12 - TCPServer实验

在上一章节中，我们学习了TCPClient通信测试的相关知识。接下来，本章节将以此为基础，构建一个基础性的TCPServer连接机制，该机制将利用之前所建立的WIFI网络连接。为方便演示，我们将借助网络调试助手工具进行数据的发送…...

编程日记 2024/9/20 12:39:03

Explain执行计划

Explain执行计划 explain可以帮助开发人员分析SQL问题，explain用于显示MySQL如何使用SQL执行计划，可以帮助开发人员写出更优化的查询语句。使用方法就是在查询语句前加上explain关键字。执行添加上explain关键字的语句可以看到一个列表： 其…...

编程日记 2024/9/20 12:37:00

ARM/Linux嵌入式面经（三六）：中科曙光

文章目录 1.AD转换，怎么在项目中运用2.项目中的通信网络介绍一下通信网络介绍1. 通信网络类型2. 通信网络特点3. 应用场景4. 关键技术5. 项目中的具体应用和实现方式模拟面试官追问3.socketSocket介绍深度拓展与追问深度拓展可能的追问4.进程间通信方式进程间通信方式介绍总结…...

编程日记 2024/9/20 12:34:59

Python和C++气候模型算法模型气候学模拟和统计学数据可视化及指标评估

🎯要点贝叶斯推理气候模型辐射对流及干湿能量平衡模型时间空间气象变化预测模型评估统计指标气象预测数据变换天气和气象变化长短期影响预估降低气候信息尺度评估算法气象行为模拟：碳循环、辐射强迫和温度响应温室气体排放碳循环温室诱导气候变化评估气…...

编程日记 2024/9/20 12:33:58

鸿蒙开发城市联动选择弹框

鸿蒙开发城市联动选择弹框城市联动选择弹框不容易，在Android那边也是不容易。选择某个省份时，城市要对得上，切换得及时一、思路： 关键用Provide和Consume互相监听对方的变化二、效果图： 三、视频效果&#xff1…...

编程日记 2024/9/20 12:29:55

文章目录 css效果 css <div style"width: 100%; height: 1px;background-image: linear-gradient(to right, #545454 0%, #545454 80%, transparent 5%);background-size: 15px 10px;background-repeat: repeat-x; margin: 0 auto;"></div>效果...

编程日记 2024/9/20 12:27:53

NLP三天入门大模型，我领先你好几个版本了

大模型时代下，nlp初学者需要怎么入门? 入门姿势简单粗暴:打一些必要的基础就跑步进入Transformera 大模型时代，传统的算法，像分词、词性标注，被替代得非常厉害，在入门阶段没必要花费太多精力在传统算法上面。数学和…...

编程日记 2024/9/20 12:25:51

专题六_模拟_算法详细总结

目录模拟算法 1.模拟算法流程（一定要在草稿纸上演算一遍流程） 2.把流程转换成代码 1. 替换所有的问号（easy） 解析： 1.暴力： 2.优化：（找规律） 总结： …...

编程日记 2024/9/20 12:23:49

ArrayList的扩容机制

ArrayList的扩容机制 ArrayList中的成员变量：1.不带参数的构造方法让elementDate 引用指向 DEFAULTCAPACITY_EMPTY_ELEMENTDATA所指向的对象 > 当我们调用不带参数的构造方法的时候第一次进行add元素的时候，会为底层的数组进行内存的分配&…...

编程日记 2024/9/20 12:22:48

一、编译原理（引论）

目录【一】、引论一、编译器 1、编译器 2、编译器与解释器 3、编译器结构【一】、引论一、编译器 1、编译器 （1）编译器：将人类易懂的高级语言翻译成硬件可执行的目标机器语言 （2） 高级语言 ⚫ 直接面…...

编程日记 2024/9/20 12:21:47

【Javascript修炼篇】JS中的函数式编程

介绍： 函数式编程（FP）是一种编程范式，这意味着一种基于一些原则来思考软件构建的方法，比如纯函数、不可变性、一等与高阶函数、函数组合、闭包、声明式编程、递归、引用透明性、柯里化和部分应用。当这些原则有效…...

编程日记 2024/9/20 12:19:46

spring cxf 常用注解

在Spring框架中，特别是当与Apache CXF（一个流行的SOAP和RESTful Web服务框架）结合使用时，我们会遇到一系列的注解。以下是一些在Spring和CXF中常用的注解： Spring相关注解： Component：用于定义一…...

编程日记 2024/9/20 12:18:45

python | x-y 网格切片

写在前面通常， 我们处理的毕竟完善的nc产品，一般呈现未timexlatxlon的维度，且lon和lat都是规则的网格，我们可以方便的使用xarray.sel()选择合适的区域进行切片。但是，部分nc产品比如卫星轨道或者模式输出的数据&…...

编程日记 2024/9/20 12:15:42

【C#】vs2022 .net8

Visual Studio 2022 IDE - 适用于软件开发人员的编程工具 (microsoft.com) 更新就会出现...

编程日记 2024/9/20 12:13:40

【华为杯】第二十一届中国研究生数学建模竞赛

“华为杯”第二十一届中国研究生数学建模竞赛即将开始，梦想科研社给大家整理一些比赛信息，在正式开赛后，我们也会持续分享一些课题的分析以及代码，有需要的可以联系我们获取资料信息哦一、时间节点 1.加密赛题开始下载时间&…...

编程日记 2024/9/20 12:12:39

首次开机android.intent.action.BOOT_COMPLETED开机广播发送慢的问题

1. 背景做过android开发的同学相信一定做个这种逻辑:app接收BOOT_COMPLETED开机广播，自启动，或者收到广播做一些事情。目前在我们的项目上遇到首次开机，BOOT_COMPLETED开机广播发送慢的问题。接下来分享记录下如何定位这类问题。 2. 分析过…...

编程日记 2024/9/20 12:09:48

通信工程学习：什么是OLT光线路终端

OLT：光线路终端 OLT（Optical Line Terminal，光线路终端）是光纤通信系统中的核心局端设备，特别是在无源光网络（Passive Optical Network, PON）架构中扮演着至关重要的角色。以下是关于OLT光线路终…...

编程日记 2024/9/20 12:07:43

业务系统对接大模型的基础方案：架构设计与关键步骤

业务系统对接大模型：架构设计与关键步骤在当今数字化转型的浪潮中，大语言模型（LLM）已成为企业提升业务效率和创新能力的关键技术之一。将大模型集成到业务系统中，不仅可以优化用户体验，还能为业务决策提供…...

编程新知 2026/2/8 4:53:03

Linux 文件类型，目录与路径，文件与目录管理

文件类型后面的字符表示文件类型标志普通文件：-（纯文本文件，二进制文件，数据格式文件） 如文本文件、图片、程序文件等。目录文件：d（directory） 用来存放其他文件或子目录。设备…...

编程新知 2026/2/8 20:42:46

Spring Boot 实现流式响应（兼容 2.7.x）

在实际开发中，我们可能会遇到一些流式数据处理的场景，比如接收来自上游接口的 Server-Sent Events（SSE） 或流式 JSON 内容，并将其原样中转给前端页面或客户端。这种情况下，传统的 RestTemplate 缓存机制会…...

编程新知 2025/8/11 8:18:44

2025年能源电力系统与流体力学国际会议 (EPSFD 2025)

2025年能源电力系统与流体力学国际会议（EPSFD 2025）将于本年度在美丽的杭州盛大召开。作为全球能源、电力系统以及流体力学领域的顶级盛会，EPSFD 2025旨在为来自世界各地的科学家、工程师和研究人员提供一个展示最新研究成果、分享实践经验及…...

编程新知 2026/2/1 21:17:19

阿里云ACP云计算备考笔记 (5)——弹性伸缩

目录第一章概述第二章弹性伸缩简介 1、弹性伸缩 2、垂直伸缩 3、优势 4、应用场景 ① 无规律的业务量波动 ② 有规律的业务量波动 ③ 无明显业务量波动 ④ 混合型业务 ⑤ 消息通知 ⑥ 生命周期挂钩 ⑦ 自定义方式 ⑧ 滚的升级 5、使用限制第三章主要定义 …...

编程新知 2026/1/22 6:07:24

vue3 字体颜色设置的多种方式

在Vue 3中设置字体颜色可以通过多种方式实现，这取决于你是想在组件内部直接设置，还是在CSS/SCSS/LESS等样式文件中定义。以下是几种常见的方法： 1. 内联样式你可以直接在模板中使用style绑定来设置字体颜色。 <template><div :s…...

编程新知 2026/2/4 20:47:44

微信小程序 - 手机震动

一、界面 <button type"primary" bindtap"shortVibrate">短震动</button> <button type"primary" bindtap"longVibrate">长震动</button> 二、js逻辑代码注：文档 https://developers.weixin.qq…...

编程新知 2026/1/29 8:41:55

Spring AI 入门：Java 开发者的生成式 AI 实践之路

一、Spring AI 简介在人工智能技术快速迭代的今天，Spring AI 作为 Spring 生态系统的新生力量，正在成为 Java 开发者拥抱生成式 AI 的最佳选择。该框架通过模块化设计实现了与主流 AI 服务（如 OpenAI、Anthropic）的无缝对接&…...

编程新知 2025/12/25 18:03:56

深入解析C++中的extern关键字：跨文件共享变量与函数的终极指南

🚀 C extern 关键字深度解析：跨文件编程的终极指南 📅 更新时间：2025年6月5日 🏷️ 标签：C | extern关键字 | 多文件编程 | 链接与声明 | 现代C 文章目录前言🔥一、extern 是什么？&…...

编程新知 2026/2/1 6:50:07

使用LangGraph和LangSmith构建多智能体人工智能系统

现在，通过组合几个较小的子智能体来创建一个强大的人工智能智能体正成为一种趋势。但这也带来了一些挑战，比如减少幻觉、管理对话流程、在测试期间留意智能体的工作方式、允许人工介入以及评估其性能。你需要进行大量的反复试验。在这篇博客〔原作者&a…...

编程新知 2026/1/26 13:48:59

Qt+FFmpeg开发视频播放器笔记(三)：音视频流解析封装

音频解析

视频解析

视频流解析代码

相关文章：

Qt+FFmpeg开发视频播放器笔记(三)：音视频流解析封装

从黎巴嫩电子通信设备爆炸看如何防范网络电子袭击

【Verilog学习日常】—牛客网刷题—Verilog快速入门—VL16

12 - TCPServer实验

Explain执行计划

ARM/Linux嵌入式面经（三六）：中科曙光

Python和C++气候模型算法模型气候学模拟和统计学数据可视化及指标评估

鸿蒙开发城市联动选择弹框

css 控制虚线刻度尺寸

NLP三天入门大模型，我领先你好几个版本了

专题六_模拟_算法详细总结

ArrayList的扩容机制

一、编译原理（引论）

【Javascript修炼篇】JS中的函数式编程

spring cxf 常用注解

python | x-y 网格切片

【C#】vs2022 .net8

【华为杯】第二十一届中国研究生数学建模竞赛

首次开机android.intent.action.BOOT_COMPLETED开机广播发送慢的问题

通信工程学习：什么是OLT光线路终端

业务系统对接大模型的基础方案：架构设计与关键步骤

Linux 文件类型，目录与路径，文件与目录管理

Spring Boot 实现流式响应（兼容 2.7.x）

2025年能源电力系统与流体力学国际会议 (EPSFD 2025)

阿里云ACP云计算备考笔记 (5)——弹性伸缩

vue3 字体颜色设置的多种方式

微信小程序 - 手机震动

Spring AI 入门：Java 开发者的生成式 AI 实践之路

深入解析C++中的extern关键字：跨文件共享变量与函数的终极指南

使用LangGraph和LangSmith构建多智能体人工智能系统