当前位置：首页 > news >正文

【音视频】音视频录制、播放原理

news 2026/2/9 15:12:45

一、音视频录制原理

通常，音视频录制的步骤如下图所示：
在这里插入图片描述

我们分别从音频和视频开始采样，通过麦克风和摄像头来接受我们的音频信息和图像信息，这通常是同时进行的，不过，通常视频的采集会比音频的采集慢，因此我们需要对采样后的数据进行同步，也就是对相应的音频帧和视频帧进行同步。通常我们会引入一个时钟作为同步标志，可以是视频作为主时钟，也可以是音频，或者是使用系统时钟作为同步等等，不过在实际中，使用音频作为主时钟比较常见，因为人对音频的感受更为明显。
采集到音频帧和视频帧之后，通常会根据需要对它们做一层处理，比如对音频进行降噪、增益调整等操作，而对于视频帧，可以进行例如饱和度调整、锐化等操作。
处理好的音频帧和视频帧会放入分别放入一个队列中，这个队列用于存储临时的帧，以便后续的编码操作。同时队列也有着缓冲区的作用，可以避免采样和编码速度不匹配等情况。
队列中的帧会被取出，用于相应的音频、视频编码，这一步是为了使用特定的格式，如音频的MP3、AAC，视频的H264、H265。经过压缩后的音视频体积将大大减小，方便后续的传输和存储。
编码后的音视频将放入音频包和视频包队列，等待进一步处理。
接着，从包队列中取出音视频数据，通过复用器对音视频进行封装，也就是使用各种容器包装音视频，如MP4、TS、AVI等
最后，这些特定格式的容器就可以作为文件保存了，也就是我们平常创建的视频文件。

复用器是一个音视频封装的工具，可以将经过编码后的音视频数据包，使用特定的容器格式，如MP4、AVI等，合成一个完整的音视频文件

二、音视频播放原理

音视频播放的步骤通常与录制相反，二者可以看做是各自的逆操作，通常，步骤如下图所示：
在这里插入图片描述

首先我们从系统中读取媒体文件，如（MP4、AVI等），文件中通常包含着编码好的音频流和视频流，有时还有字幕流等，那么我们就需要将文件中的这些对应流进行分离，才能进行下一步处理。
我们利用解复用器就可以将媒体文件中的音频和视频数据还原出来，这一步称为音视频解封装。
解封装出来的音视频数据将被存放在音频包、视频包队列中，等待后续的解码操作。
从对应的队列中取出数据包，就需要对相应的数据包进行解码，如音频的AAC、MP3、视频的H264、H264等，通常，解码的难度通常比编码的难度小。解码后的数据包变成了录制时的帧数据，存储在帧队列中，等待后续的渲染操作。
从视频帧和音频队列取出帧之后，如果无需进行特殊处理，我们可以对其进行同步，而同步策略通常以音频作为主时钟。有时，我们还可以将同步策略放在处理帧之后。
最终，处理好的音频和视频帧结果处理和调整，将同步渲染到外部设备中，如扬声器和显示器等，此时的视频才真正被播放出来，经过我们的眼睛和耳朵接收到。

解复用器与录制时的复用器相反，它主要是把封装在一起的音频和视频数据包分离出来，变成独立的音频数据和视频数据

【音视频】音视频录制、播放原理

一、音视频录制原理通常，音视频录制的步骤如下图所示： 我们分别从音频和视频开始采样，通过麦克风和摄像头来接受我们的音频信息和图像信息，这通常是同时进行的，不过，通常视频的采集会比音频的采集慢&…...

编程日记 2025/2/26 19:05:57

前端Sass面试题及参考答案

目录什么是 Sass？ Sass 和 CSS 的主要区别是什么？ Sass 中如何处理列表？ Sass 中如何处理映射（map）？ Sass 中如何使用函数？ Sass 中如何使用内置函数？ Sass 中如何设置默认值？ Sass 中的 @function 和 @mixin 有什么区别？ Sass 中如何实现模块化？ Sass 中…...

编程日记 2025/2/26 19:01:52

Web自动化之Selenium控制已经打开的浏览器(Chrome,Edge)

在使用selenium进行web自动化或爬虫的时候,经常会面临登录的情况,对于这种情况,我们可以利用Selenium控制已经打开的浏览器，从而避免每次都需要重新打开浏览器并进行登录的繁琐步骤。目录说明启动浏览器注意 --user-data-dir说明代码设定代码改进代…...

编程日记 2025/2/26 18:59:48

AF3 unify_template_features 函数解读

AlphaFold3 data_pipeline 模块的 unify_template_features 函数用于将多条链的模板特征整合为一个统一的 FeatureDict，以适应对多链复合物的处理。每条链的模板特征经过索引偏移处理后，拼接为一个完整的模板特征矩阵。该方法的核心在于：序列对齐：根据每条链的长度，将模…...

编程日记 2025/2/26 18:56:44

FFmpeg.NET：.NET 平台上的音视频处理利器

FFmpeg.NET 是一个封装了 FFmpeg 功能的 .NET 库，能够方便地在 C# 项目中处理音视频文件。它支持多种操作，包括转码、剪辑、合并、分离音频等。功能解析元数据从视频生成缩略图使用以下参数将音频和视频转码为其他格式： 码率（…...

编程日记 2025/2/26 18:48:32

解决 Git 合并冲突：当本地修改与远程提交冲突时

目录错误原因分析解决方法 1. 暂存本地修改并合并（保留更改） 2. 丢弃本地修改（强制覆盖） 3. 暂存修改后合并（推荐：使用 git stash） 4. 选择性合并（手动处理冲突文件&#xf…...

编程日记 2025/2/26 18:47:31

SOME/IP-SD -- 协议英文原文讲解5

前言 SOME/IP协议越来越多的用于汽车电子行业中，关于协议详细完全的中文资料却没有，所以我将结合工作经验并对照英文原版协议做一系列的文章。基本分三大块： 1. SOME/IP协议讲解 2. SOME/IP-SD协议讲解 3. python/C举例调试讲解 5.1.2.5 S…...

编程日记 2025/2/26 18:46:30

spark的一些指令

一，复制和移动 1、复制文件格式：cp 源文件目标文件示例：把file1.txt 复制一份得到file2.txt 。那么对应的命令就是：cp file1.txt file2.txt 2、复制目录格式：cp -r 源文件目标文件夹示例：把目…...

编程日记 2025/2/26 18:45:26

Redis常用数据类型及其应用案例

文章目录 Redis常用数据类型及其应用案例1. 字符串（String）1.1 简介1.2 应用案例1.2.1 缓存1.2.2 计数器 2. 哈希（Hash）2.1 简介2.2 应用案例2.2.1 存储用户信息2.2.2 购物车 3. 列表（List）3.1 简介3.2 应用…...

编程日记 2025/2/26 18:41:21

kafka数据拉取和发送

文章目录一、原生 KafkaConsumer1、pom文件引入kafka2、拉取数据3、发送数据二、在spring boot中使用@KafkaListener1、添加依赖2、application.yml3、消息拉取：consumer4、自定义ListenerContainerFactory5、消息发送：producer6、kafka通过clientId鉴权时的鉴权失败问题一、…...

编程日记 2025/2/26 18:37:17

LLM全栈框架完整分类清单（预训练+微调+工具链）

一、预训练框架 1. 大规模分布式训练框架框架名称核心能力GitHub地址Megatron-LM3D并行训练、FlashAttention支持、Transformer架构优化（NVIDIA生态）NVIDIA/Megatron-LMDeepSpeedZeRO优化系列、3D并行、RLHF全流程支持（微软生态&#xff09…...

编程日记 2025/2/26 18:36:14

蓝桥杯备考：贪心算法之矩阵消除游戏

这道题是牛客上的一道题，它呢和我们之前的排座位游戏非常之相似，但是，排座位问题选择行和列是不会改变元素的值的，这道题呢每每选一行都会把这行或者这列清零，所以我们的策略就是先用二进制把选择所有行的情况全部枚举…...

编程日记 2025/2/26 18:35:12

【Matlab仿真】Matlab Function中如何使用静态变量？

背景根据Simulink的运行机制，每个采样点会调用一次MATLAB Function的函数，两次调用之间，同一个变量的前次计算的终值如何传递到当前计算周期来？其实可以使用persistent变量实现函数退出和进入时内部变量值的保持。 persistent变…...

编程日记 2025/2/26 18:26:02

DeepSeek 提示词：高效的提示词设计

🧑 博主简介：CSDN博客专家，历代文学网（PC端可以访问：https://literature.sinhy.com/#/?__c1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，精通Java编…...

编程日记 2025/2/26 18:24:59

深入学习Java中的Lambda表达式

深入学习Java中的Lambda表达式自Java 8引入以来，Lambda表达式彻底改变了Java的编程风格，让代码变得更加简洁、易读，尤其是在函数式编程的场景中。接下来，我们将深入探讨Lambda表达式的语法、原理以及实际应用，帮助你…...

编程日记 2025/2/26 18:22:57

1.2 AI 量化炒股的起源与发展

**定性价值**：AI量化炒股通过算法模型实现投资决策自动化，显著提升交易效率与风险控制能力，打破传统人工交易的主观性与延迟性，推动金融科技向智能化、数据驱动方向迭代，具有颠覆传统投资模式的战略意义。 **定量价值…...

编程日记 2025/2/26 18:21:56

计算机单位之详解——存储单位Byte 网络传输单位bps 视频码率单位bps

前言： 计算机里面单位有点复杂，容易混淆，很多时候混起来就容易概念不理解，包括一些小问题，比如说：为什么我买了1T硬盘，实际存在虚标。为什么所谓的千兆宽带，下载起来没有1G每秒&…...

编程日记 2025/2/26 18:20:53

IDEA关闭SpringBoot程序后仍然占用端口的排查与解决

IDEA关闭SpringBoot程序后仍然占用端口的排查与解决问题描述在使用 IntelliJ IDEA 开发 Spring Boot 应用时，有时即使关闭了应用，程序仍然占用端口（例如：4001 端口）。这会导致重新启动应用时出现端口被占用的错误&a…...

编程日记 2025/2/26 18:19:52

deepseek清华大学第二版如何获取 DeepSeek如何赋能职场应用 PDF文档电子档(附下载)

deepseek清华大学第二版 DeepSeek如何赋能职场 pdf文件完整版下载 https://pan.baidu.com/s/1aQcNS8UleMldcoH0Jc6C6A?pwd1234 提取码: 1234 或 https://pan.quark.cn/s/3ee62050a2ac...

编程日记 2025/2/26 18:18:50

【python随手记】——读取文本文件内容转换为json格式

文章目录前言一、TXT文件转换为JSON数组1.txt文件内容2.python代码3.输出结果二、TXT文件转换为JSON对象1.txt文件2.python代码3.输出结果前言场景：用于读取包含空格分隔数据的TXT文件，并将其转换为结构化JSON文件一、TXT文件转换为JSON数组 1.tx…...

编程日记 2025/2/26 18:15:42

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …...

编程新知 2026/2/8 4:37:20

树莓派超全系列教程文档--(62)使用rpicam-app通过网络流式传输视频

使用rpicam-app通过网络流式传输视频使用 rpicam-app 通过网络流式传输视频UDPTCPRTSPlibavGStreamerRTPlibcamerasrc GStreamer 元素文章来源： http://raspberry.dns8844.cn/documentation 原文网址使用 rpicam-app 通过网络流式传输视频本节介绍来自 rpica…...

编程新知 2025/11/5 13:03:58

django filter 统计数量按属性去重

在Django中，如果你想要根据某个属性对查询集进行去重并统计数量，你可以使用values()方法配合annotate()方法来实现。这里有两种常见的方法来完成这个需求： 方法1：使用annotate()和Count 假设你有一个模型Item，并且你想…...

编程新知 2026/1/11 2:37:51

基于数字孪生的水厂可视化平台建设：架构与实践

分享大纲： 1、数字孪生水厂可视化平台建设背景 2、数字孪生水厂可视化平台建设架构 3、数字孪生水厂可视化平台建设成效近几年，数字孪生水厂的建设开展的如火如荼。作为提升水厂管理效率、优化资源的调度手段，基于数字孪生的水厂可视化平台的…...

编程新知 2025/12/23 17:14:55

Qt Http Server模块功能及架构

Qt Http Server 是 Qt 6.0 中引入的一个新模块，它提供了一个轻量级的 HTTP 服务器实现，主要用于构建基于 HTTP 的应用程序和服务。功能介绍： 主要功能 HTTP服务器功能： 支持 HTTP/1.1 协议简单的请求/响应处理模型支持 GET…...

编程新知 2025/10/17 21:16:57

Neo4j 集群管理：原理、技术与最佳实践深度解析

Neo4j 的集群技术是其企业级高可用性、可扩展性和容错能力的核心。通过深入分析官方文档，本文将系统阐述其集群管理的核心原理、关键技术、实用技巧和行业最佳实践。 Neo4j 的 Causal Clustering 架构提供了一个强大而灵活的基石，用于构建高可用、可扩展且一致的图数据库服务…...

编程新知 2025/12/27 16:43:24

【AI学习】三、AI算法中的向量

在人工智能（AI）算法中，向量（Vector）是一种将现实世界中的数据（如图像、文本、音频等）转化为计算机可处理的数值型特征表示的工具。它是连接人类认知（如语义、视觉特征）与…...

编程新知 2026/1/1 14:01:45

Spring Boot面试题精选汇总

🤟致敬读者 🟩感谢阅读🟦笑口常开🟪生日快乐⬛早点睡觉 📘博主相关 🟧博主信息🟨博客首页🟫专栏推荐🟥活动信息文章目录 Spring Boot面试题精选汇总⚙️ **一、核心概…...

编程新知 2025/9/24 23:08:17

Robots.txt 文件

什么是robots.txt？ robots.txt 是一个位于网站根目录下的文本文件（如：https://example.com/robots.txt），它用于指导网络爬虫（如搜索引擎的蜘蛛程序）如何抓取该网站的内容。这个文件遵循 Robots…...

编程新知 2025/9/9 5:38:23

令牌桶滑动窗口-＞限流分布式信号量-＞限并发的原理 lua脚本分析介绍

文章目录前言限流限制并发的实际理解限流令牌桶代码实现结果分析令牌桶lua的模拟实现原理总结： 滑动窗口代码实现结果分析lua脚本原理解析限并发分布式信号量代码实现结果分析lua脚本实现原理双注解去实现限流并发结果分析： 实际业务去理解体会统一注…...

编程新知 2026/1/29 16:36:27

一、音视频录制原理

二、音视频播放原理

相关文章：