FFmpeg-chapter3-读取视频流(原理篇)
ffmpeg网站:About FFmpeg
1 库介绍
(1)libavutil是一个包含简化编程函数的库,包括随机数生成器、数据结构、数学例程、核心多媒体实用程序等等。
(2)libavcodec是一个包含音频/视频编解码器的解码器和编码器的库。
(3)libavformat是一个包含多媒体容器格式的拆装器和拆装器的库。
(4)libavdevice是一个包含输入和输出设备的库,用于抓取和呈现许多常见的多媒体输入/输出软件框架,包括Video4Linux、Video4Linux2、VfW和ALSA。
(5)libavfilter是一个包含媒体过滤器的库。 libswscale是一个执行高度优化的图像缩放和色彩空间/像素格式转换操作的库。
(6)libswresample是一个执行高度优化的音频重采样,重矩阵和样本格式转换操作的库。
2 实现步骤

上面是主要用到的函数
(1)av_register_all(): 注册 FFmpeg 支持的所有解码器、编码器、格式等;
(2)avformat_network_init(): 初始化网络支持(如果需要从网络流中读取数据);
调用一次即可
(3)avformat_alloc_context(): 分配一个 AVFormatContext,它是 FFmpeg 中用于管理多媒体文件或流的核心结构。返回值是一个指向 AVFormatContext 的指针。
(4)avformat_open_input(): 打开一个输入文件或流,并将其信息加载到 AVFormatContext 中。这一步会解析文件格式(如 MP4、AVI 等),并为后续的流处理做准备。
(5)avformat_find_stream_info(): 获取输入文件或流的详细信息,包括音视频流的编码格式、帧率、分辨率等。这一步会填充 AVFormatContext 中的 AVStream 信息。
(6)av_read_frame(): 从输入文件或流中读取一帧数据。每次调用 av_read_frame() 会返回一个 AVPacket,它包含了一帧的编码数据。如果读取成功,继续处理帧数据;如果读取失败或到达文件末尾,则停止。
(7)AVPacket: 包含编码的帧数据(如压缩的视频或音频数据)。AVFrame: 包含解码后的帧数据(如解压缩后的视频或音频数据)。AVPacket 需要通过解码器(如 avcodec_send_packet() 和 avcodec_receive_frame())解码为 AVFrame。
(8)avformat_close_input(): 关闭输入文件或流,并释放相关资源。这一步会释放 AVFormatContext 中的所有流信息。
(9)avformat_free_context(): 释放 AVFormatContext 及其占用的内存。
总结:
(1)初始化 FFmpeg 环境。
(2)创建并初始化 AVFormatContext。
(3)打开输入文件或流,获取流信息。
(4)循环读取帧数据(AVPacket),并通过解码器解码为 AVFrame。
(5)处理解码后的帧数据(如播放、保存等)。
(6)关闭输入流并释放资源。
3 代码
使用VS新建cmake工程实现上述步骤。
参考:
ffmpeg 4.22库文件:GitCode - 全球开发者的开源社区,开源代码托管平台
详细参考:MMAVPlayer/chapter3 at main · StudyWinter/MMAVPlayer · GitHub
相关文章:
FFmpeg-chapter3-读取视频流(原理篇)
ffmpeg网站:About FFmpeg 1 库介绍 (1)libavutil是一个包含简化编程函数的库,包括随机数生成器、数据结构、数学例程、核心多媒体实用程序等等。 (2)libavcodec是一个包含音频/视频编解码器的解码器和编…...
机器视觉线阵相机分时频闪选型/机器视觉线阵相机分时频闪选型
在机器视觉系统中,线阵相机的分时频闪技术通过单次扫描切换不同光源或亮度,实现在一幅图像中捕捉多角度光照效果,从而提升缺陷检测效率并降低成本。以下是分时频闪线阵相机的选型要点及关键考量因素: 一、分时频闪技术的核心需求 多光源同步控制 分时频闪需相机支持多路光源…...
「Selenium+Python自动化从0到1②|2025浏览器操控7大核心API实战(附高效避坑模板))」
Python 自动化操作浏览器基础方法 在进行 Web 自动化测试时,操作浏览器是必不可少的环节。Python 结合 Selenium 提供了强大的浏览器操作功能,让我们能够轻松地控制浏览器执行各种任务。本文将详细介绍如何使用 Python 和 Selenium 操作浏览器的基本方法…...
矩阵系列 题解
1.洛谷 P1962 斐波那契数列 题意 大家都知道,斐波那契数列是满足如下性质的一个数列: F n { 1 ( n ≤ 2 ) F n − 1 F n − 2 ( n ≥ 3 ) F_n \left\{\begin{aligned} 1 \space (n \le 2) \\ F_{n-1}F_{n-2} \space (n\ge 3) \end{aligned}\right. …...
活动报名:Voice Agent 技术现状及应用展望丨 3.8 北京
「人人发言,所有人向所有人学习!」——Z 沙龙 「一起探索下一代语音驱动的人机交互界面。」——RTE 开发者社区 3 月 8 日周六下午,北京,「智谱 Z 计划&Z Fund」和「RTE 开发者社区」将合办一场 Voice Agent 主题的线下活动…...
【卡牌——二分】
题目 分析 发现答案具有二分性,果断二分答案 代码 #include <bits/stdc.h> using namespace std; using ll long long;const int N 2e510;int n, a[N], li[N]; ll m;bool check(int x) {ll t m;for(int i 1; i < n; i){if(a[i] > x) continue; //…...
《第十五部分》STM32之FLASH闪存(终结篇)
本章是江科大自学STM32的最后一章节,历经2个月的断断续续时间,终于学到了最后,总结,这次的学习历程,相对于学习51还是略出一些难度,也就是若你是非科班,学习起来还是有一定的难度的,…...
属性的设置
笔记 class Student:def __init__(self, name, gender):self.name nameself.__gender gender # self.__gender 是私有的实例属性# 使用property 修改方法,将方法转成属性使用propertydef gender(self):return self.__gender# 将我们的gender这个属性设置为可写属…...
本地部署Deepseek+Cherry Studio
为啥要本地部署deepseek? 因为给deepseek发送指令得到服务器繁忙的回馈,本地部署会运行的更快 1.Ollama安装与部署 Ollama是一个开源框架,专为在本地机器上便捷部署和运行大型语言模型(LLM)而设计 winR——cmd——ol…...
CMU15445(2023fall) Project #2 - Extendible Hash Index 匠心分析
胡未灭,鬓已秋,泪空流 此生谁料 心在天山 身老沧州 ——诉衷情 完整代码见: SnowLegend-star/CMU15445-2023fall: Having Conquered the Loftiest Peak, We Stand But a Step Away from Victory in This Stage. With unwavering determinati…...
【VSCode】VSCode下载安装与配置极简描述
VSCode 参考网址:[Visual Studio Code Guide | GZTime’s Blog]. 下载安装 下载地址:Download Visual Studio Code - Mac, Linux, Windows. 注:推荐不更改安装位置,并且在附加任务中“其他”中的四项全部勾选,即将用…...
【前端基础】Day 5 CSS浮动
目录 1. 浮动 1.1 标准流(普通流/文档流) 1.2 浮动 1.2.1 浮动的特性 1.2.2 浮动元素常和标准流父级搭配使用 1.2.3 案例 2. 常见网页布局 2.1 常见网页布局 2.2 浮动布局注意点 3. 清除浮动 3.1 原因 3.2 清除浮动的本质 3.3 清除浮动的方…...
处理DeepSeek返回的markdown文本
处理DeepSeek返回的markdown文本 markdown预览组件,支持公式显示,支持uniapp。 相关依赖 markdown-itmarkdown-it-mathjaxmarkdown-it-katexmarkdown-it-latexkatexgithub-markdown-css 组件源码 <!--* Description: markdown显示组件* Author: wa…...
互联网+房产中介+装修设计+物料市场+智能家居一体化平台需求书
一、项目概述 1.1 项目背景 随着互联网技术的飞速发展以及人们生活品质的显著提升,传统房产交易、装修设计、家居购物等领域暴露出诸多问题。信息不对称使得用户难以获取全面准确的信息,在房产交易中可能高价买入或低价卖出,装修时可能遭遇…...
Node.js定义以及性能优化
Node.js Node.js 是一个基于 Chrome V8 引擎的 JavaScript 运行时,广泛用于构建高性能的网络应用。以下是一些常见的 Node.js 面试题及其解答,帮助你准备面试: 1. 什么是 Node.js? Node.js 是一个基于 Chrome V8 引擎的 JavaSc…...
浅谈流媒体协议以及视频编解码
流媒体协议介绍 流媒体协议用于传输视频、音频等多媒体数据,确保数据流畅地传输到用户设备。常见的流媒体协议包括 RTMP、HLS、DASH、WebRTC 等,每种协议具有不同的特点和适用场景。 1. RTMP (Real-Time Messaging Protocol) 定义:由 Adob…...
在 Windows 上配置 Ollama 服务并开放局域网访问
为了在局域网内共享 Ollama 服务,我们需要完成以下两步: 1、设置 Ollama 的环境变量 OLLAMA_HOST,使其监听局域网的 IP 地址。 (1) 配置 Ollama 服务的监听地址 Ollama 服务使用环境变量 OLLAMA_HOST 来指定监听的地…...
【六祎 - Note】消息队列的演变,架构图;备忘录; IBM MQ,RabbitMQ,Kafka,Pulsar
IBM MQ 于 1993 年推出。它最初称为 MQSeries,2002 年更名为 WebSphere MQ。2014 年更名为 IBM MQ。IBM MQ 是一款非常成功的产品,广泛应用于金融领域。其收入在 2020 年仍达到 10 亿美元。 RabbitMQ 架构与 IBM MQ 不同,更类似于 Kafka 的…...
常见AI写作工具介绍(ChatGPT 4o、DeepClaude、Claude 3.5 Sonnet 、DeepSeek R1等)
AI写作工具介绍 1. ChatGPT-4o ChatGPT-4o是OpenAI于2024年5月发布的最新旗舰模型,相比之前的版本,它在多模态支持和实时推理能力上有了显著提升。它能够处理和理解音频、图像和文本数据,适用于复杂的图像分析、语音识别等应用场景[1]。 2…...
WPF中对滚动条进行平滑滚动
有时候我们在动态添加内容时,需要将滚动条滚动到指定内容处。 一般我们会调用ScrollViewer的ScrollToVerticalOffset(垂直方向)函数和ScrollToHorizontalOffset(水平方向)函数来控制滚动条滚动到指定位置。 正常滚动效…...
GLM-OCR模型长短期记忆(LSTM)解码器技术剖析
GLM-OCR模型长短期记忆(LSTM)解码器技术剖析 你是不是觉得现在的OCR(光学字符识别)技术特别神奇?一张图片拍下去,里面的文字瞬间就被识别出来了,又快又准。这背后,除了强大的视觉模…...
EagleEye DAMO-YOLO TinyNAS实战:基于YOLOv8的高效目标检测部署
EagleEye DAMO-YOLO TinyNAS实战:基于YOLOv8的高效目标检测部署 1. 引言 目标检测在实际应用中经常遇到一个难题:既要检测准确,又要运行速度快。传统的解决方案往往需要在精度和速度之间做出妥协,要么选择复杂的模型导致推理缓慢…...
Leather Dress Collection开源镜像实操手册:236MB轻量LoRA集合快速上手
Leather Dress Collection开源镜像实操手册:236MB轻量LoRA集合快速上手 1. 项目介绍 Leather Dress Collection 是一个基于Stable Diffusion 1.5的轻量级LoRA模型集合,专门用于生成各种时尚皮革服装风格的图像。这个集合包含了12个精心训练的LoRA模型&…...
【标准差 | 平方差 | 均方差】
标准差 标准差差方差针对数据时总体数据的样本数时 标准差 标准差(Standard Deviation),又称均方差,但不同于均方误差(mean squared error) 标准差是数值分散的测量。 标准差的符号是 σ (希腊语…...
pix2pix-tensorflow超参数调优终极指南:学习率与损失权重优化技巧
pix2pix-tensorflow超参数调优终极指南:学习率与损失权重优化技巧 【免费下载链接】pix2pix-tensorflow Tensorflow port of Image-to-Image Translation with Conditional Adversarial Nets https://phillipi.github.io/pix2pix/ 项目地址: https://gitcode.com/…...
算法——bfs/dfs
Find The Multiple 给定一个正整数 n,编写一个程序找出 n 的一个非零倍数 m,其十进制表示只包含数字 0 和 1。可以假设 n 不大于 200,并且存在一个 m,其十进制表示不超过 100 位。 输入 输入文件可能包含多个测试用例。每一行包含…...
Python MCP接入卡在“handshake timeout”?资深协议工程师教你用Wireshark+自研debug中间件3分钟定位根源
第一章:Python MCP 服务器开发模板 如何实现快速接入Python MCP(Model Control Protocol)服务器是构建可插拔、标准化模型服务接口的核心组件。为降低接入门槛,我们提供一套轻量级、生产就绪的开发模板,基于 FastAPI 构…...
从“蛮力训练“到“精准学习“:AFSS让YOLO训练效率爆炸式提升
从"蛮力训练"到"精准学习":AFSS让YOLO训练效率爆炸式提升做目标检测的朋友都知道,YOLO系列推理是真的快,毫秒级响应,工业场景的首选。但训练效率低这个问题,一直是痛点。 先看数据:YOL…...
营销短信接口接入指引:新手开发者如何快速掌握营销短信API的调用技巧
在电商促销、会员运营、活动推送等业务场景中,营销短信接口接入是实现批量用户触达的关键技术环节。很多新手开发者在对接时,常因签名规则不清、参数格式错误、请求结构不规范导致调试效率低下。本文将从原理拆解、实战编码、错误排查三个维度࿰…...
Flutter鸿蒙应用开发:数据分享功能实现
🔥Flutter鸿蒙应用开发:数据分享功能实现(macOSDevEco Studio) 欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.csdn.net 📄 文章摘要 本文为Flutter for OpenHarmony跨平台应用开发系列实…...
