当前位置：首页 > news >正文

RTSP场景下RTP协议详解及音视频打包全流程

news 2026/2/8 22:21:26

RTSP场景下RTP协议详解及音视频打包全流程

一、RTSP与RTP的关系

RTSP：负责媒体会话控制（DESCRIBE、SETUP、PLAY、PAUSE），通过SDP协商传输参数（端口、编码格式、封装模式）。
RTP：实际传输音视频数据，基于UDP/TCP，与RTCP配合实现同步和网络状态反馈。

二、RTP头字段详解（RFC 3550）

RTP头固定12字节，字段含义及填写规则如下：

字段名	位宽	取值说明
Version (V)	2 bits	固定为2（0x80），表示RTP版本。
Padding §	1 bit	载荷末尾是否有填充字节（如加密对齐）。RTSP场景通常为0。
Extension (X)	1 bit	是否启用头部扩展（如RFC 5285定义）。默认0，启用时需在SDP中声明。
CSRC Count (CC)	4 bits	贡献源（CSRC）数量。单路流通常为0。
Marker (M)	1 bit	关键帧结束标记：视频的最后一个分片包设为1；音频包通常为0。
Payload Type (PT)	7 bits	载荷类型，SDP中动态映射（如96=H.264, 97=H.265, 8=PCMA, 14=MPEG Audio）。
Sequence Number	16 bits	包序列号，每发送一个RTP包自增1（用于检测丢包和乱序）。
Timestamp	32 bits	时间戳，基于编码时钟频率：<br>- 视频：90000 Hz（每帧增量=90000/fps）<br>- 音频：按采样率（如AAC=44100 Hz）。
SSRC	32 bits	同步源标识符，随机生成，同一流中唯一。

示例：H.264视频包头（时间戳增量=3000，30fps）：

80 60 00 01   // V=2, P=0, X=0, CC=0, M=0, PT=96 (H.264)
00 01          // Sequence Number = 1
00 00 0B B8    // Timestamp = 3000
DE AD BE EF    // SSRC=0xDEADBEEF

三、视频打包实现

1. H.264视频打包（RFC 6184）

NALU结构：

  +---------------+---------------+|F|NRI| Type    | Payload Data  |+---------------+---------------+

封装模式：由SDP参数packetization-mode定义。
- Mode 0（单NALU） ：直接封装小NALU（如SPS/PPS）。

    RTP头 | NALU头（1B） | 数据

Mode 1（FU-A分片） ：大NALU分片传输，添加FU头和标记位。

    RTP头 | FU Indicator（1B） | FU Header（1B） | 分片数据

FU Indicator：F|NRI|Type=28（0x7C）。
FU Header：S|E|R|Type（S/E标志分片起止，Type为原始NALU类型）。
- Mode 2（STAP-A组合） ：聚合多个小NALU。

    RTP头 | STAP头（1B） | NALU1长度（2B） | NALU1数据 | NALU2长度（2B） | NALU2数据

关键帧分片示例：

  // 第一个分片RTP头(M=0) | 0x7C | 0x85（S=1, Type=5） | 分片数据// 最后一个分片RTP头(M=1) | 0x7C | 0x45（E=1, Type=5） | 分片数据

2. H.265视频打包（RFC 7798）

NALU头扩展：2字节，包含层次标识（LayerID）和时域层级（TID）。

  +---------------+---------------+---------------+|F| Type（6b） | LayerID（6b） | TID（3b）     |+---------------+---------------+---------------+

分片模式（FU-A）：

  RTP头 | FU Indicator（2B） | FU Header（1B） | 分片数据

FU Indicator：Type=49（0x62）。
FU Header：同H.264的S/E标志，Type为原始NALU类型（如32=IDR）。
示例：

  // 第一个分片RTP头 | 0x62 0x80（LayerID=0, TID=1） | 0x80（S=1, Type=32） | 分片数据

3. SDP配置示例

m=video 0 RTP/AVP 96
a=rtpmap:96 H264/90000
a=fmtp:96 packetization-mode=1; sprop-parameter-sets=Z0LAH9kAUAW6EAAAAwAQAAADA8PFRQ=,aM48gA==

四、音频打包实现

1. G.711（PCMU/PCMA）

静态PT：0（PCMU）、8（PCMA）。
封装：直接填充裸数据，时间戳按样本数递增。

  RTP头（PT=0/8） | 音频样本（每样本1字节）

2. AAC（RFC 3640）

动态PT：通过SDP协商（如96）。
封装：添加AU头声明数据长度。

  RTP头 | AU头长度（2b） | AU头（16b长度） | AAC数据

3. Opus（RFC 7587）

封装：直接填充Opus帧，支持分片。

  RTP头 | TOC字段（配置参数） | Opus数据

五、音视频同步机制

时间戳对齐：
- 音频时间戳增量 = 采样数（如AAC每帧1024样本 → 增量=1024）。
- 视频时间戳增量 = 90000 / 帧率（如30fps → 增量=3000）。
RTCP同步：
- 发送端通过SR包传递NTP时间与RTP时间戳的映射。
- 接收端计算播放时序偏差，动态调整缓冲区。

RTSP场景下RTP协议详解及音视频打包全流程

RTSP场景下RTP协议详解及音视频打包全流程一、RTSP与RTP的关系 RTSP：负责媒体会话控制（DESCRIBE、SETUP、PLAY、PAUSE），通过SDP协商传输参数（端口、编码格式、封装模式）。RTP：实际传输音视频数…...

编程日记 2025/2/22 23:13:41

使用API有效率地管理Dynadot域名，为域名部署DNS安全拓展（DNSSEC）

关于Dynadot Dynadot是通过ICANN认证的域名注册商，自2002年成立以来，服务于全球108个国家和地区的客户，为数以万计的客户提供简洁，优惠，安全的域名注册以及管理服务。 Dynadot平台操作教程索引（包括域名邮…...

编程日记 2025/2/22 23:09:35

如何基于transformers库通过训练Qwen/DeepSeek模型的传统分类能力实现文本分类任务

文章目录模型与环境准备文档分析源码解读模型训练及推理方式进阶：CPU与显存的切换进阶：多卡数据并行训练🔑 DDP 训练过程核心步骤🚫 DDP 不适用于模型并行⚖️ DDP vs. Model Parallelism⚙️ 解决大模型训练的推荐方法🎉进入大模型应用与实战专栏 | 🚀查看更多专栏…...

编程日记 2025/2/22 23:07:30

开源一款I2C电机驱动扩展板-FreakStudio多米诺系列

总线直流电机扩展板原文链接： FreakStudio的博客摘要设计了一个I2C电机驱动板，通过I2C接口控制多个电机的转速和方向，支持刹车和减速功能。可连接16个扩展板，具有PWM输出、过流过热保护和可更换电机驱动芯片。支持按键控制…...

编程日记 2025/2/22 23:06:28

FFmpeg+WebSocket+JsMpeg实时视频流实现方案

之前写的使用FFmpeg Nginx HLS流媒体播放方案，适合对实时性要求不高的需求，存在延迟，FFmpeg需要将视频流存储到本地文件，而本次方案FFmpeg不需要将视频流存储到本地文件，而是直接将转换后的视频流（如MJPE…...

编程日记 2025/2/22 23:05:26

【Linux】Linux 文件系统—— 探讨软链接(symbolic link)

ℹ️大家好，我是练小杰，周五又到了，明天应该就是牛马的休息日了吧！！😆 前天我们详细介绍了硬链接的特点，现在继续探讨软链接的特点，并且后续将添加更多相关知识噢，谢谢…...

编程日记 2025/2/22 23:04:24

排序与算法：插入排序

执行效果插入排序的执行效果是这样的： 呃……看不懂吗？没关系，接着往下看介绍算法介绍插入排序（Insertion Sort）是一种简单直观的排序算法。它的工作原理是通过构建有序序列，对于未排序数据&#xff0c…...

编程日记 2025/2/22 22:53:11

HashMap 详解

一、核心特性 HashMap集合的key是无序不可重复的。 ①无序：插入顺序和取出顺序不一定相同。 ②不可重复：key具有唯一性。向HashMap集合中put时，key如果重复的话，value会覆盖。二、HashMap集合的key具有唯一性，向ke…...

编程日记 2025/2/22 22:47:05

DAY07 Collection、Iterator、泛型、数据结构

学习目标能够说出集合与数组的区别数组:1.是引用数据类型的一种2.可以存储多个元素3.数组的长度是固定的 int[] arr1 new int[10]; int[] arr2 {1,2,3};4.数组即可以存储基本类型的数据,又可以存储引用数据类型的数据int[],double[],String[],Student[]集合:1.是引用数据类…...

编程日记 2025/2/22 22:46:02

计算机网络之物理层——基于《计算机网络》谢希仁第八版

(꒪ꇴ꒪ )，Hello我是祐言QAQ我的博客主页：C/C语言，数据结构，Linux基础，ARM开发板，网络编程等领域UP🌍快上🚘，一起学习，让我们成为一个强大的攻城狮&#xff0…...

编程日记 2025/2/22 22:45:01

简讯：Rust 2024 edition and v1.85.0 已发布

详见 https://blog.rust-lang.org/2025/02/20/Rust-1.85.0.html 升级方法：rustup update stable...

编程日记 2025/2/22 22:43:59

DeepSeek写俄罗斯方块手机小游戏

DeepSeek写俄罗斯方块手机小游戏提问根据提的要求，让DeepSeek整理的需求，进行提问，内容如下： 请生成一个包含以下功能的可运行移动端俄罗斯方块H5文件： 核心功能要求原生JavaScript实现，适配手机屏幕 …...

编程日记 2025/2/22 22:37:52

uniapp中引入Vant Weapp的保姆级教学（包含错误处理）

废话不多说，直接上方法，网上的教学好多都是错误的 1.安装vant weapp 在Hbuilder的终端，输入以下代码 npm install vant/weapp -S --production 2.新建wxcomponents文件夹在项目的跟目录新建一个“wxcomponents’文件夹，与app.…...

编程日记 2025/2/22 22:36:51

【Python爬虫(20)】解锁Python爬虫数据存储秘籍：文件存储全攻略

【Python爬虫】专栏简介：本专栏是 Python 爬虫领域的集大成之作，共 100 章节。从 Python 基础语法、爬虫入门知识讲起，深入探讨反爬虫、多线程、分布式等进阶技术。以大量实例为支撑，覆盖网页、图片、音频等各类数据爬取&#xff…...

编程日记 2025/2/22 22:32:43

关于Unity的一些基础知识点汇总

1.Prefab实例化后，哪些资源是共用的？哪些资源是拷贝的？ 共用资源脚本组件：实例化后的 Prefab 共享脚本组件的代码。若脚本中无状态数据，多个实例对脚本方法的调用会有相同逻辑。比如一个控制物体移动的脚本&#xff0…...

编程日记 2025/2/22 22:31:40

SpringCould+vue3项目的后台用户管理的CURD【Taurus教育平台】

文章目录一.SpringCouldvue3项目的后台用户管理的CURD【Taurus教育平台】 1.1 背景二.用户列表（分页查询） 2.1 前端Vue3 （Vue3-Element-Admin）2.2 后端SpringCould 处理三. 用户信息删除 3.1 前端Vue3 （Vue3-Eleme…...

编程日记 2025/2/22 22:29:29

功能说明并准备静态结构

功能说明并准备静态结构 <template><div class"card-container"><div class"search-container"><span class"search-label">车牌号码：</span><el-input clearable placeho…...

编程日记 2025/2/22 22:23:14

solidity之Foundry安装配置(一)

一门面向合约的高级编程语言，主要用来编写以太坊只能合约。 Solidity受C语言，Python和js影响，但为编译成为以太坊虚拟机字节码在EVM上执行，很多特性和限制都和EVM相关。 Solidity 是静态类型语言，支持继承、库、自定义…...

编程日记 2025/2/22 22:15:05

请解释 Vue 中的生命周期钩子，不同阶段触发的钩子函数及其用途是什么？

vue生命周期钩子详解（Vue 3版本） 一、生命周期阶段划分 Vue组件的生命周期可分为四大阶段，每个阶段对应特定钩子函数： 创建阶段：初始化实例并准备数据挂载阶段：将虚拟DOM渲染为真实DOM更新阶段&#xff…...

编程日记 2025/2/22 22:13:03

C#上位机--选择语句（switch）

在 C# 上位机开发的广阔领域中，流程控制语句如同程序的 “交通枢纽”，精准地引导着程序的执行路径。继深入探讨if语句后，我们将目光聚焦于另一个重要的流程控制语句 ——switch语句。switch语句以其独特的多路分支结构，为处理多条…...

编程日记 2025/2/22 22:04:49

工业安全零事故的智能守护者：一体化AI智能安防平台

前言： 通过AI视觉技术，为船厂提供全面的安全监控解决方案，涵盖交通违规检测、起重机轨道安全、非法入侵检测、盗窃防范、安全规范执行监控等多个方面，能够实现对应负责人反馈机制，并最终实现数据的统计报表。提升船厂…...

编程新知 2026/1/21 9:20:07

循环冗余码校验CRC码算法步骤+详细实例计算

通信过程：（白话解释） 我们将原始待发送的消息称为 M M M，依据发送接收消息双方约定的生成多项式 G ( x ) G(x) G(x)（意思就是 G （ x ) G（x) G（x) 是已知的）&#xff0…...

编程新知 2026/2/8 8:16:14

零基础设计模式——行为型模式 - 责任链模式

第四部分：行为型模式 - 责任链模式 (Chain of Responsibility Pattern) 欢迎来到行为型模式的学习！行为型模式关注对象之间的职责分配、算法封装和对象间的交互。我们将学习的第一个行为型模式是责任链模式。核心思想：使多个对象都有机会处…...

编程新知 2026/1/31 9:33:18

Unit 1 深度强化学习简介

Deep RL Course ——Unit 1 Introduction 从理论和实践层面深入学习深度强化学习。学会使用知名的深度强化学习库，例如 Stable Baselines3、RL Baselines3 Zoo、Sample Factory 和 CleanRL。在独特的环境中训练智能体，比如 SnowballFight、Huggy the Do…...

编程新知 2026/2/8 12:54:53

多种风格导航菜单 HTML 实现（附源码）

下面我将为您展示 6 种不同风格的导航菜单实现，每种都包含完整 HTML、CSS 和 JavaScript 代码。 1. 简约水平导航栏 <!DOCTYPE html> <html lang"zh-CN"> <head><meta charset"UTF-8"><meta name"viewport&qu…...

编程新知 2026/2/2 2:49:11

springboot整合VUE之在线教育管理系统简介

可以学习到的技能学会常用技术栈的使用独立开发项目学会前端的开发流程学会后端的开发流程学会数据库的设计学会前后端接口调用方式学会多模块之间的关联学会数据的处理适用人群在校学生，小白用户，想学习知识的有点基础，想要通过项…...

编程新知 2026/1/26 9:30:45

人机融合智能 | “人智交互”跨学科新领域

本文系统地提出基于“以人为中心AI(HCAI)”理念的人-人工智能交互(人智交互)这一跨学科新领域及框架,定义人智交互领域的理念、基本理论和关键问题、方法、开发流程和参与团队等,阐述提出人智交互新领域的意义。然后,提出人智交互研究的三种新范式取向以及它们的意义。最后,总结…...

编程新知 2026/1/25 13:33:35

基于IDIG-GAN的小样本电机轴承故障诊断

目录 🔍 核心问题一、IDIG-GAN模型原理 1. 整体架构 2. 核心创新点 (1) 梯度归一化（Gradient Normalization） (2) 判别器梯度间隙正则化（Discriminator Gradient Gap Regularization） (3) 自注意力机制（Self-Attention） 3. 完整损失函数二…...

编程新知 2026/1/31 10:58:46