当前位置: 首页 > article >正文

常见音视频编码二进制分析笔记(H264,H265,AAC,OPUS,G711A,G711U)

常见音视频编码二进制分析笔记文章目录常见音视频编码二进制分析笔记视频H.264 (AVC)说明nal_unit_type:nal_ref_idcH.265 (HEVC)音频AAC (Advanced Audio Coding)G.711A (PCMA)G.711U (PCMU)OPUS视频H.264 (AVC)标准来源ITU-T H.264 | ISO/IEC 14496-10起始码0x00000001NALU 分隔符标准 7.3.1 节定义用于区分网络抽象层单元NALU 类型核心标识0x67SPS序列参数集存储分辨率、帧率等核心解码参数标准 7.3.2.1 节0x68PPS图像参数集存储切片、量化参数等解码配置标准 7.3.2.2 节0x65关键帧即时解码刷新帧独立解码、刷新参考帧标准 7.3.2.6 节关键帧核心类型0x41非关键帧前向预测帧依赖前序帧解码标准 7.3.2.5 节说明ITU-T H.264 参考下载地址https://www.itu.int/rec/T-REC-H.264-202408-I/en7.3.1章节nal_unit_type:0x1 non IDR 非关键帧 0x2 slice A 0x3 slice B 0x4 slice C 0x5 IDR 关键帧 0x6 SEI 0x7 SPS 0x8 PPS 0x9 AUD 0xa EOS 0xb EOB 0xc FILLnal_ref_idc必须为0的单元 nal_ref_idc 0 [0b00] 表示非参考 NALU必须用于SEI (6)、AUD (9)、EOS (10)、EOB (11)、FILL (12)SEI: 0x06 AUD: 0x09 EOS: 0x0a EOB: 0x0b FILL: 0x0c必须非0的单元 nal_ref_idc 1 [0b01], 2 [0b10], 3 [0b11] 表示参考 NALU必须用于SPS (7)、PPS (8)、IDR (5)SPS: 0x67 | 0x47 | 0x27 PPS: 0x68 | 0x48 | 0x28 IDC: 0x65 | 0x45 | 0x25不限制nal_ref_idc slice(1-4) 非关键帧都可用slice1: 0x61 | 0x41 | 0x21 | 0x01 slice2: 0x62 | 0x42 | 0x22 | 0x02 slice3: 0x63 | 0x43 | 0x23 | 0x03 slice4: 0x64 | 0x44 | 0x24 | 0x04H.265 (HEVC)标准来源ITU-T H.265 | ISO/IEC 23008-2起始码0x00000001NALU 分隔符标准 7.4.1 节定义与 H.264 兼容基础格式NALU 类型2 字节标识核心标识0x4001VPS视频参数集HEVC 独有管理多图层、3D 视频参数标准 7.4.2.1 节0x4201SPS序列参数集存储分辨率、编码等级等核心参数标准 7.4.2.2 节0x4401PPS图像参数集存储切片解码相关配置标准 7.4.2.3 节0x2601关键帧即时解码刷新帧HEVC 标准定义的关键帧类型独立解码标准 7.4.3.3 节0x0201非关键帧清洁随机接入帧非 IDR I 帧支持随机接入标准 7.4.3.5 节音频AAC (Advanced Audio Coding)标准来源ISO/IEC 13818-7通用音频标准 | ISO/IEC 14496-3音频对象编码标准核心标识ADTS 格式标准 1.A.3.1 节定义0xFFF12 位同步头用于快速定位 AAC 帧起始位置同步字字段ADTS音频数据传输流包含采样率、声道数、帧长度等 7 字节固定帧头结构G.711A (PCMA)标准来源ITU-T G.711脉冲编码调制标准核心特征核心参数标准 A.1 节定义8kHz 采样率、8bit A 律量化、64kbps 固定码率关键标识静音值0xD5标准 A.1.2 节定义A 律量化零电平对应编码值G.711U (PCMU)标准来源ITU-T G.711脉冲编码调制标准核心特征核心参数标准 B.1 节定义8kHz 采样率、8bit μ 律量化、64kbps 固定码率关键标识静音值0xFF标准 B.1.2 节定义μ 律量化零电平对应编码值OPUS标准来源IETF RFC 6716实时音频编码标准核心标识TOC 字节Table Of Contents帧首第 1 个字节标准 5.1 节定义用于标识帧类型、声道数、编码模式、带宽参数无固定同步头依赖 RTP 协议载荷或帧长度字段定位帧边界

相关文章:

常见音视频编码二进制分析笔记(H264,H265,AAC,OPUS,G711A,G711U)

常见音视频编码二进制分析笔记 文章目录常见音视频编码二进制分析笔记视频H.264 (AVC)说明nal_unit_type:nal_ref_idcH.265 (HEVC)音频AAC (Advanced Audio Coding)G.711A (PCMA)G.711U (PCMU)OPUS视频 H.264 (AVC) 标准来源:ITU-T H.264 | ISO/IEC 14496-10 起始…...

2024 CKA备考环境搭建实战 | 从零构建VMware Ubuntu虚拟化平台

1. 为什么选择VMware搭建CKA备考环境 备考CKA认证时,一个稳定、可复现的实验环境至关重要。我在过去三年帮助过上百名学员搭建环境,发现VMware Workstation有三大不可替代的优势: 首先是硬件兼容性。我的旧笔记本只有8GB内存,通过…...

计算机组成原理视角:深度估计模型推理的硬件加速优化

计算机组成原理视角:深度估计模型推理的硬件加速优化 最近在项目里用到了Lingbot-Depth-Pretrain-ViTL-14这个深度估计模型,效果确实不错,但跑起来总觉得有点“慢”。不是模型本身的问题,而是感觉硬件资源没被“喂饱”。这让我想…...

2026奇点智能技术大会深度复盘:为什么92%的AI初创公司已在Q2切换至AI-Native开源栈?(附迁移成本测算表)

第一章:2026奇点智能技术大会:AI原生开源生态 2026奇点智能技术大会(https://ml-summit.org) AI原生范式的演进本质 AI原生(AI-Native)不再仅指“用AI增强已有系统”,而是从底层基础设施、开发范式到应用交付全栈重构…...

HTML是Web开发的基石,掌握HTML是构建网页的第一步

HTML是Web开发的基石,掌握HTML是构建网页的第一步。 HTML简介 HTML(HyperText Markup Language)超文本标记语言: 不是编程语言,是标记语言 使用标签描述网页结构 浏览器解析HTML显示网页 基本结构 <!DOCTYPE html> <html> <head><...

Steam DLC解锁工具终极指南:5分钟快速上手SmokeAPI游戏DLC模拟器

Steam DLC解锁工具终极指南&#xff1a;5分钟快速上手SmokeAPI游戏DLC模拟器 【免费下载链接】SmokeAPI Legit DLC Unlocker for Steamworks 项目地址: https://gitcode.com/gh_mirrors/smo/SmokeAPI 想要体验心仪游戏的所有DLC内容却受限于预算&#xff1f;作为开发者需…...

Qwen3.5-9B-AWQ-4bit企业应用案例:电商商品图智能标签生成实操

Qwen3.5-9B-AWQ-4bit企业应用案例&#xff1a;电商商品图智能标签生成实操 1. 电商商品标签的痛点与解决方案 在电商运营中&#xff0c;商品图片标签是影响搜索排名和转化率的关键因素。传统的人工打标方式面临三大挑战&#xff1a; 效率瓶颈&#xff1a;一个运营人员每天最…...

从大模型 API 生态到 Spring AI:接口、平台与框架三层怎么串起来

一、开始之前&#xff1a;五个真实困惑在正式展开之前&#xff0c;先问你五个问题——这是开发者在接触大模型应用时最常卡住的地方。读完这篇文章&#xff0c;希望每一个你都能自己回答出来。困惑一&#xff1a;「ChatGPT」「GPT-4o」「OpenAI」是同一个东西吗&#xff1f;不是…...

深入浅出:IgH EtherCAT主站的实时性优化技巧(从内核配置到线程调度)

深入浅出&#xff1a;IgH EtherCAT主站的实时性优化技巧&#xff08;从内核配置到线程调度&#xff09; 在工业自动化领域&#xff0c;毫秒级的延迟可能导致生产线停摆&#xff0c;微秒级的抖动可能引发机器人轨迹偏差。作为开源EtherCAT主站的标杆&#xff0c;IgH的性能直接决…...

AI入门必看|零基础搞懂人工智能核心定义,避开入门误区

摘要&#xff1a;本文专为AI零基础小白打造&#xff0c;用大白话拆解人工智能的核心定义、发展脉络&#xff0c;厘清新手最易混淆的概念&#xff0c;帮你快速建立对AI的正确认知&#xff0c;迈出入门第一步&#xff0c;拒绝被专业术语劝退。关键词&#xff1a;人工智能入门&…...

如何快速安装Jasminum插件:中文文献管理终极解决方案

如何快速安装Jasminum插件&#xff1a;中文文献管理终极解决方案 【免费下载链接】jasminum A Zotero add-on to retrive CNKI meta data. 一个简单的Zotero 插件&#xff0c;用于识别中文元数据 项目地址: https://gitcode.com/gh_mirrors/ja/jasminum 还在为中文文献管…...

关于ACT模型使用时的注意点和部署调试方法

目录 1.模型训练的输入图像必须是RGB格式 2.训练数据中需要处理action的数据 3.通过输入训练数据中的qpos和image来验证推理的代码是否正确 4.通过提前录入一组未在训练集中的数据作为模型输入,观察输入的action和预测的action曲线 5.模型推理后根据情况执行多少步,而不是全部…...

揭秘Informer:如何通过ProbSparse注意力机制革新长序列预测

1. 长序列预测的困境与Transformer的瓶颈 想象一下你正在管理一个大型电网系统&#xff0c;需要预测未来30天的电力消耗。面对长达720小时的历史数据&#xff08;每小时一个数据点&#xff09;&#xff0c;传统的LSTM模型在预测超过48小时后的结果就开始出现明显偏差&#xff0…...

MySql(基础操作符--查找学校是北大的学生信息)

9.现在运营想要筛选出所有北京大学的学生进行用户调研&#xff0c;请你从用户信息表中取出满足条件的数据&#xff0c;结果返回设备id和学校。示例&#xff1a;user_profileiddevice_idgenderageuniversityprovince12138male21北京大学Beijing23214male复旦大学Shanghai36543fe…...

日立电梯05版规格表智能计算工具(升级版)|WPS宏支持|适配WPS2024+Win10 64位

温馨提示&#xff1a;文末有联系方式日立电梯05规格表工具升级版正式发布 全新优化的日立电梯05规格表计算软件现已上线&#xff0c;专为电梯设计、安装与维保工程师打造&#xff0c;大幅提升参数录入与校验效率。功能标识更直观&#xff0c;操作一目了然 所有计算模块、输入项…...

用Python爬拼多多数据,我帮朋友省了3万块选品费(附完整代码和避坑指南)

用Python爬取拼多多商品数据的实战指南&#xff1a;从技术实现到商业决策 去年夏天&#xff0c;我的好友小林准备开一家网店卖手机配件。作为电商新手&#xff0c;他最头疼的就是选品——市场上同类商品太多&#xff0c;价格差异大&#xff0c;根本不知道从哪里入手。看着他每天…...

CK3M+驱动器(模拟量控制+力矩模式)CompDac前馈补偿:原理与实现方法(1)

在高精度运动控制场景中&#xff0c;CK3M控制器搭配力矩模式驱动器时&#xff0c;CompDac-前馈补偿是提升动态响应速度、减小跟踪误差的核心技术。其核心逻辑是通过“预测性补偿”提前抵消已知扰动与系统非线性影响&#xff0c;弥补传统反馈控制的滞后缺陷&#xff0c;尤其适用…...

AI导出word排版

AI导出Word排版&#xff1a;从“生成内容”到“结构化交付”的最后一公里 在AIGC应用逐步进入生产环境后&#xff0c;一个被反复讨论的问题逐渐浮现&#xff1a; AI生成内容容易&#xff0c;但导出为可用的Word文档却很难。 这一问题不仅存在于个人创作者&#xff0c;也在企业文…...

数据的基本操作——去重

duplicated() DataFrame的duplicated方法返回一个布尔型Series&#xff0c;表示各行是否是重复行。具体用法如下&#xff1a;In[1]: df DataFrame({k1:[one]*3 [two]*4, k2:[1,1,2,3,3,4,4]}) In[2]: df Out[2]: k1 k2 0 one 1 1 one 1 2 one 2 3 two 3 4 two …...

通信失败?MicroROS网络配置全攻略,90%的人都踩过这个坑!

机器人开发必看&#xff01;让MCU和电脑成功"对话"&#x1f4cc; 为什么网络配置这么重要&#xff1f; 很多小伙伴在玩MicroROS时&#xff0c;遇到最多的问题就是&#xff1a;❌ 节点收不到消息 ❌ Agent一直连接不上 ❌ 单片机明明烧录了程序&#xff0c;却毫无反应…...

ArcGIS新手必看:用‘镶嵌至新栅格’搞定不同分辨率DEM的无缝拼接(附像素类型避坑点)

ArcGIS DEM融合实战&#xff1a;从参数原理到完美拼接的完整指南 当你第一次尝试将不同分辨率的DEM数据拼接在一起时&#xff0c;那种"平地起高楼"的突兀感可能让你抓狂——低分辨率区域像模糊的马赛克&#xff0c;而高精度部分则像孤岛般突兀隆起。这不是你操作的问…...

linux驱动调试方法整理

一般我喜欢把linux驱动的调试按矛盾分为几大类&#xff1a;1.驱动工程师和内核/自己的 2.应用工程师和驱动工程师的。其中我们需要掌握linux众多的调试控件才能灵活运用。驱动工程师和内核/自己的1.驱动加载和驱动调试信息使用printk&#xff08;per_log&#xff09;打印需求使…...

2279 上市公司跨国供应链【存续力】(Sustainability) 指标(2004.07-2026.02)

数据简介测度微观合作黏性与“沉没成本”的度量衡 存续力&#xff08;Sustainability&#xff09;衡量了一段供需关系在走向彻底“死亡”之前&#xff0c;曾经拥有过的生命长度。在国际贸易网络中&#xff0c;存续时间的长短反映了中外企业间的合作黏性、技术锁定效应和信任深度…...

第15届省赛蓝桥杯大赛C/C++大学B组

目录 一.握手问题 1.题目讲解 2.代码实现 二.小球反弹 1.题目讲解 2.代码实现 三.好数 1.题目讲解 2.代码实现 四.R 格式 1.题目讲解 2.代码实现 五.宝石组合 1.题目讲解 2.代码实现 六.数字接龙 1.题目讲解 2.代码实现 七.拔河 1.题目讲解 2.代码实现 一…...

《算法题讲解指南:动态规划算法--回文串问题》--35.回文子串,36. 最长回文子串,37.分割回文串 IV,38.分割回文串 II,39.最长回文子序列,40.让字符串成为回文串的最少插入次数

&#x1f525;小叶-duck&#xff1a;个人主页 ❄️个人专栏&#xff1a;《Data-Structure-Learning》《C入门到进阶&自我学习过程记录》 《算法题讲解指南》--优选算法 《算法题讲解指南》--递归、搜索与回溯算法 《算法题讲解指南》--动态规划算法 ✨未择之路&#xff0…...

低空救援先锋:一文读懂应急救援无人机的现在与未来

低空救援先锋&#xff1a;一文读懂应急救援无人机的现在与未来 引言 当灾害突发、通信中断、道路损毁&#xff0c;救援的“黄金时间”分秒必争。传统救援力量受制于地形与时间&#xff0c;往往望“灾”兴叹。如今&#xff0c;随着低空经济浪潮奔涌&#xff0c;应急救援无人机正…...

【医疗数据挖掘黄金流程】:20年临床统计专家亲授R语言6步标准化建模法(附NIH验证模板)

第一章&#xff1a;医疗数据挖掘的临床价值与R语言选型依据医疗数据挖掘正深刻重塑临床决策范式。从电子健康档案&#xff08;EHR&#xff09;中提取隐含模式&#xff0c;可辅助早期疾病预警、个性化治疗路径推荐及药物不良反应监测。例如&#xff0c;在糖尿病管理中&#xff0…...

Java程序设计(第3版)第二章——java的数据类型:字符 char

字符 char 关键字:char 字节数:2B 编码:Unicode字符集(万国码) 字面值方式&#xff1a; ①字符赋值&#xff1a;用单引号(&#xff07;&#xff07;&#xff09;引起来的一个字符&#xff0c; char c&#xff1d;’A’; char c1&#xff1d;&#xff07;中&#xff07;; ②数值…...

六:(实习无忧)

##开头数据结构与算法##学习了算法复杂度与空间复杂度&#xff0c;并未遇到难点。打算同步开始一天两道算法题...

AI agent 学习笔记

最近在自学AI agent&#xff0c;突然感觉自己像是断网了两年&#xff0c;AI咋发展这么快啊我去&#xff0c;2年前还不兴这个啊&#xff0c;神了&#xff0c;真就两年一个风口啊。 提示工程&#xff08;Prompt Engineering&#xff09; 学习资料&#xff1a;ChatGPT Prompt En…...