音视频入门基础:AAC专题(12)——FFmpeg源码中,解码AudioSpecificConfig的实现
=================================================================
音视频入门基础:AAC专题系列文章:
音视频入门基础:AAC专题(1)——AAC官方文档下载
音视频入门基础:AAC专题(2)——使用FFmpeg命令生成AAC裸流文件
音视频入门基础:AAC专题(3)——AAC的ADTS格式简介
音视频入门基础:AAC专题(4)——ADTS格式的AAC裸流实例分析
音视频入门基础:AAC专题(5)——FFmpeg源码中,判断某文件是否为AAC裸流文件的实现
音视频入门基础:AAC专题(6)——FFmpeg源码中解码ADTS格式的AAC的Header的实现
音视频入门基础:AAC专题(7)——FFmpeg源码中计算AAC裸流每个packet的size值的实现
音视频入门基础:AAC专题(8)——FFmpeg源码中计算AAC裸流AVStream的time_base的实现
音视频入门基础:AAC专题(9)——FFmpeg源码中计算AAC裸流每个packet的duration和duration_time的实现
音视频入门基础:AAC专题(10)——FFmpeg源码中计算AAC裸流每个packet的pts、dts、pts_time、dts_time的实现
音视频入门基础:AAC专题(11)——AudioSpecificConfig简介
音视频入门基础:AAC专题(12)——FFmpeg源码中,解码AudioSpecificConfig的实现
=================================================================
一、引言
在《音视频入门基础:AAC专题(11)——AudioSpecificConfig简介》中对AudioSpecificConfig进行了简介,本文讲述FFmpeg源码中是怎样解码AudioSpecificConfig,拿到里面的信息。
二、decode_audio_specific_config_gb函数的定义
FFmpeg源码中使用decode_audio_specific_config_gb函数来读取AudioSpecificConfig的信息。该函数定义在FFmpeg源码(本文演示用的FFmpeg源码版本为7.0.1)的源文件libavcodec/aacdec_template.c中:
/*** Decode audio specific configuration; reference: table 1.13.** @param ac pointer to AACDecContext, may be null* @param avctx pointer to AVCCodecContext, used for logging* @param m4ac pointer to MPEG4AudioConfig, used for parsing* @param gb buffer holding an audio specific config* @param get_bit_alignment relative alignment for byte align operations* @param sync_extension look for an appended sync extension** @return Returns error status or number of consumed bits. <0 - error*/
static int decode_audio_specific_config_gb(AACDecContext *ac,AVCodecContext *avctx,MPEG4AudioConfig *m4ac,GetBitContext *gb,int get_bit_alignment,int sync_extension)
{int i, ret;GetBitContext gbc = *gb;MPEG4AudioConfig m4ac_bak = *m4ac;if ((i = ff_mpeg4audio_get_config_gb(m4ac, &gbc, sync_extension, avctx)) < 0) {*m4ac = m4ac_bak;return AVERROR_INVALIDDATA;}if (m4ac->sampling_index > 12) {av_log(avctx, AV_LOG_ERROR,"invalid sampling rate index %d\n",m4ac->sampling_index);*m4ac = m4ac_bak;return AVERROR_INVALIDDATA;}if (m4ac->object_type == AOT_ER_AAC_LD &&(m4ac->sampling_index < 3 || m4ac->sampling_index > 7)) {av_log(avctx, AV_LOG_ERROR,"invalid low delay sampling rate index %d\n",m4ac->sampling_index);*m4ac = m4ac_bak;return AVERROR_INVALIDDATA;}skip_bits_long(gb, i);switch (m4ac->object_type) {case AOT_AAC_MAIN:case AOT_AAC_LC:case AOT_AAC_SSR:case AOT_AAC_LTP:case AOT_ER_AAC_LC:case AOT_ER_AAC_LD:if ((ret = decode_ga_specific_config(ac, avctx, gb, get_bit_alignment,m4ac, m4ac->chan_config)) < 0)return ret;break;case AOT_ER_AAC_ELD:if ((ret = decode_eld_specific_config(ac, avctx, gb,m4ac, m4ac->chan_config)) < 0)return ret;break;default:avpriv_report_missing_feature(avctx,"Audio object type %s%d",m4ac->sbr == 1 ? "SBR+" : "",m4ac->object_type);return AVERROR(ENOSYS);}ff_dlog(avctx,"AOT %d chan config %d sampling index %d (%d) SBR %d PS %d\n",m4ac->object_type, m4ac->chan_config, m4ac->sampling_index,m4ac->sample_rate, m4ac->sbr,m4ac->ps);return get_bits_count(gb);
}
形参ac:既是输入型参数也是输出型参数。指向一个AACDecContext类型变量。
形参avctx:输入型参数。用来输出日志,可忽略。
形参m4ac:输出型参数,指向一个MPEG4AudioConfig类型变量,执行decode_audio_specific_config_gb函数后,m4ac指向的变量会得到从AudioSpecificConfig中解码出来的属性。MPEG4AudioConfig结构体声明如下:
typedef struct MPEG4AudioConfig {int object_type;int sampling_index;int sample_rate;int chan_config;int sbr; ///< -1 implicit, 1 presenceint ext_object_type;int ext_sampling_index;int ext_sample_rate;int ext_chan_config;int channels;int ps; ///< -1 implicit, 1 presenceint frame_length_short;
} MPEG4AudioConfig;
形参gb:既是输入型参数也是输出型参数,为GetBitContext类型,用来对“位”进行操作(具体可以参考:《FFmpeg中位操作相关的源码:GetBitContext结构体,init_get_bits函数、get_bits1函数和get_bits函数分析》)。
执行decode_audio_specific_config_gb函数前,gb->buffer为指向某个缓冲区的指针。该缓冲区存放AudioSpecificConfig的二进制数据。
形参get_bit_alignment:输入型参数。字节对齐操作的相对对齐。
形参sync_extension:输入型参数。寻找附加的同步扩展。
三、decode_audio_specific_config_gb函数的内部实现分析
decode_audio_specific_config_gb函数中,首先调用ff_mpeg4audio_get_config_gb函数:
if ((i = ff_mpeg4audio_get_config_gb(m4ac, &gbc, sync_extension, avctx)) < 0) {*m4ac = m4ac_bak;return AVERROR_INVALIDDATA;}
(一)ff_mpeg4audio_get_config_gb函数
ff_mpeg4audio_get_config_gb函数定义在libavcodec/mpeg4audio.c中:
int ff_mpeg4audio_get_config_gb(MPEG4AudioConfig *c, GetBitContext *gb,int sync_extension, void *logctx)
{int specific_config_bitindex, ret;int start_bit_index = get_bits_count(gb);c->object_type = get_object_type(gb);c->sample_rate = get_sample_rate(gb, &c->sampling_index);c->chan_config = get_bits(gb, 4);if (c->chan_config < FF_ARRAY_ELEMS(ff_mpeg4audio_channels))c->channels = ff_mpeg4audio_channels[c->chan_config];else {av_log(logctx, AV_LOG_ERROR, "Invalid chan_config %d\n", c->chan_config);return AVERROR_INVALIDDATA;}c->sbr = -1;c->ps = -1;if (c->object_type == AOT_SBR || (c->object_type == AOT_PS &&// check for W6132 Annex YYYY draft MP3onMP4!(show_bits(gb, 3) & 0x03 && !(show_bits(gb, 9) & 0x3F)))) {if (c->object_type == AOT_PS)c->ps = 1;c->ext_object_type = AOT_SBR;c->sbr = 1;c->ext_sample_rate = get_sample_rate(gb, &c->ext_sampling_index);c->object_type = get_object_type(gb);if (c->object_type == AOT_ER_BSAC)c->ext_chan_config = get_bits(gb, 4);} else {c->ext_object_type = AOT_NULL;c->ext_sample_rate = 0;}specific_config_bitindex = get_bits_count(gb);if (c->object_type == AOT_ALS) {skip_bits(gb, 5);if (show_bits(gb, 24) != MKBETAG('\0','A','L','S'))skip_bits(gb, 24);specific_config_bitindex = get_bits_count(gb);ret = parse_config_ALS(gb, c, logctx);if (ret < 0)return ret;}if (c->ext_object_type != AOT_SBR && sync_extension) {while (get_bits_left(gb) > 15) {if (show_bits(gb, 11) == 0x2b7) { // sync extensionget_bits(gb, 11);c->ext_object_type = get_object_type(gb);if (c->ext_object_type == AOT_SBR && (c->sbr = get_bits1(gb)) == 1) {c->ext_sample_rate = get_sample_rate(gb, &c->ext_sampling_index);if (c->ext_sample_rate == c->sample_rate)c->sbr = -1;}if (get_bits_left(gb) > 11 && get_bits(gb, 11) == 0x548)c->ps = get_bits1(gb);break;} elseget_bits1(gb); // skip 1 bit}}//PS requires SBRif (!c->sbr)c->ps = 0;//Limit implicit PS to the HE-AACv2 Profileif ((c->ps == -1 && c->object_type != AOT_AAC_LC) || c->channels & ~0x01)c->ps = 0;return specific_config_bitindex - start_bit_index;
}
1.获取audioObjectType属性
ff_mpeg4audio_get_config_gb函数中,首先通过语句:c->object_type = get_object_type(gb) 获取AudioSpecificConfig的audioObjectType属性。get_object_type函数定义如下。关于get_bits函数的用法可以参考:《FFmpeg中位操作相关的源码:GetBitContext结构体,init_get_bits函数、get_bits1函数和get_bits函数分析》:
static inline int get_object_type(GetBitContext *gb)
{int object_type = get_bits(gb, 5);if (object_type == AOT_ESCAPE)object_type = 32 + get_bits(gb, 6);return object_type;
}
2.获取samplingFrequencyIndex属性
获取完audioObjectType属性后,ff_mpeg4audio_get_config_gb函数中,通过语句:c->sample_rate = get_sample_rate(gb, &c->sampling_index)获取AudioSpecificConfig的samplingFrequencyIndex属性。get_sample_rate定义如下:
static inline int get_sample_rate(GetBitContext *gb, int *index)
{*index = get_bits(gb, 4);return *index == 0x0f ? get_bits(gb, 24) :ff_mpeg4audio_sample_rates[*index];
}
全局数组ff_mpeg4audio_sample_rates定义如下:
const int ff_mpeg4audio_sample_rates[16] = {96000, 88200, 64000, 48000, 44100, 32000,24000, 22050, 16000, 12000, 11025, 8000, 7350
};
3.获取channelConfiguration属性
ff_mpeg4audio_get_config_gb函数中,通过语句:c->chan_config = get_bits(gb, 4)获取AudioSpecificConfig的channelConfiguration属性。
——————————————————分隔符——————————————————
回到decode_audio_specific_config_gb函数,所以执行下面代码块后,m4ac指向的变量会得到从AudioSpecificConfig中解析出来的audioObjectType、samplingFrequencyIndex、channelConfiguration属性:
if ((i = ff_mpeg4audio_get_config_gb(m4ac, &gbc, sync_extension, avctx)) < 0) {*m4ac = m4ac_bak;return AVERROR_INVALIDDATA;}
然后decode_audio_specific_config_gb函数通过下面代码块解析AudioSpecificConfig中的GASpecificConfig:
switch (m4ac->object_type) {case AOT_AAC_MAIN:case AOT_AAC_LC:case AOT_AAC_SSR:case AOT_AAC_LTP:case AOT_ER_AAC_LC:case AOT_ER_AAC_LD:if ((ret = decode_ga_specific_config(ac, avctx, gb, get_bit_alignment,m4ac, m4ac->chan_config)) < 0)return ret;break;
通过下面代码块解析AudioSpecificConfig中的ELDSpecificConfig(channelConfiguration):
case AOT_ER_AAC_ELD:if ((ret = decode_eld_specific_config(ac, avctx, gb,m4ac, m4ac->chan_config)) < 0)return ret;break;
相关文章:
音视频入门基础:AAC专题(12)——FFmpeg源码中,解码AudioSpecificConfig的实现
音视频入门基础:AAC专题系列文章: 音视频入门基础:AAC专题(1)——AAC官方文档下载 音视频入门基础:AAC专题(2)——使用FFmpeg命令生成AAC裸流文件 音视频入门基础:AAC…...
UDP组播测试
支持组播的接口: ip a | grep MULTICAST 环回接口虽然显示不支持组播,实际也可以用于本地测试。 添加路由(非必须?): ip route add 239.0.0.0/24 via 10.10.10.206 dev eth0 开放防火墙: 查…...
【Nas】X-Doc:jellyfin“该客户端与媒体不兼容,服务器未发送兼容的媒体格式”问题解决方案
【Nas】X-Doc:jellyfin“该客户端与媒体不兼容,服务器未发送兼容的媒体格式”问题解决方案 当使用Jellyfin播放视频时出现“该客户端与媒体不兼容,服务器未发送兼容的媒体格式”,这是与硬件解码和ffmpeg设置有关系,具体…...
504 Gateway Time-outopenresty
504 Gateway Time-out openresty 问题背景: 当自己点开知乎页面以后,发现官网没有出现任何问题,点击官网以后开始出现各种各样的报错! 一下是来源ai的介绍:(通过搜索这种形式帮助自己进行记忆)…...
SpringBoot篇(自动装配原理)
目录 一、自动装配机制 1. 简介 2. 自动装配主要依靠三个核心的关键技术 3. run()方法加载启动类 4. 注解SpringBootApplication包含了多个注解 4.1 SpringBootConfiguration 4.2 ComponentScan 4.3 EnableAutoConfiguration 5. SpringBootApplication一共做了三件事 …...
《Web性能权威指南》-WebRTC-读书笔记
本文是《Web性能权威指南》第四部分——WebRTC的读书笔记。 第一部分——网络技术概览,请参考网络技术概览; 第二部分——无线网络性能,请参考无线网络性能; 第三部分——HTTP,请参考HTTP; 第四部分——浏览…...
跨境电商独立站:打造你的全球品牌
什么是跨境电商独立站? 跨境电商独立站是指一个独立的电子商务网站,企业可以通过这个网站直接向全球消费者销售产品。与入驻亚马逊、eBay等第三方平台不同,独立站拥有完全自主权,可以自由定制店铺风格、营销策略,并直…...
基于uniapp微信小程序的旅游系统
作者:计算机学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等,“文末源码”。 专栏推荐:前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码、微信小程序源码 精品专栏:…...
怿星科技薛春宇丨智能汽车软件研发工具链国产化的挑战和探索
2024年7月25日,由上海良益企业管理咨询有限公司主办的“2024域控制器技术论坛“在上海成功举办,十位嘉宾做了精彩分享。“整零有道”将陆续刊出部分演讲的文字实录,以飨读者。 本期刊出怿星科技副总经理薛春宇的演讲实录:智能汽车…...
Flutter动画渐变
User experience is everything. One way to improve it is by making transitions between different UI elements smoother and more visually appealing. This is where the AnimatedCrossFade widget comes in handy. 用户体验就是一切。改善用户体验的方法之一就是让不同…...
Python毕业设计选题:基于Web学生会网站的设计与实现-django
开发语言:Python框架:djangoPython版本:python3.7.7数据库:mysql 5.7数据库工具:Navicat11开发软件:PyCharm 系统展示 系统首页界面 用户注册界面 用户登录界面 校内报道界面 品牌活动界面 个人中心界面 …...
如何选购高性价比百元头戴式耳机?六大选购技巧加性价比耳机推荐
在日益繁忙的生活中,头戴式耳机已成为许多人享受音乐、放松心情的重要工具。然而,市面上的头戴式耳机种类繁多,价格各异,如何选购高性价比百元头戴式耳机?成为了许多消费者的难题。为了帮助大家更好地做出选择…...
Java爬虫的京东“寻宝记”:揭秘商品类目信息
开篇:Java特工的神秘任务 在这个数据驱动的时代,我们就像一群特工,穿梭在数字的海洋中,寻找着隐藏的宝藏——商品类目信息。今天,我们将带领你一起,用Java这把精密的瑞士军刀,深入京东的神秘领…...
React前端框架
React 是一个用于构建用户界面的 JavaScript 库,由 Facebook 开发和维护。React 采用组件化的开发方式,使得开发者可以构建可复用的 UI 组件,从而提高开发效率和代码的可维护性。 React 的基本概念 组件:React 的核心概念是组件…...
React-query vs. 神秘新工具:前端开发的新较量
流畅的分页体验:AlovaJS的分页请求策略 在现代web应用中,分页是一个常见的功能需求。无论是浏览商品列表、查看文章集合,还是管理后台的数据表格,用户都需要一种高效且流畅的方式来浏览大量数据。然而,实现一个流畅且…...
TensorFlow面试整理-分布式
在深度学习的训练过程中,随着数据量和模型的复杂性增加,单个 GPU 或 CPU 无法满足高效训练的需求。TensorFlow 提供了强大的 分布式训练 功能,通过并行处理加速训练过程。分布式训练可以在多个 GPU、多个机器甚至是 TPU 上运行。以下是分布式训练的关键概念及其使用方法。 1…...
OceanBase 回收站机制详解
OceanBase 回收站机制详解 在 OceanBase 数据库中,回收站机制用于在执行 DROP 或 TRUNCATE 等操作后,临时保存被删除的对象,以便在需要时进行恢复。以下是对回收站机制的详细说明: 1. 不同租户对回收站的访问权限 SYS 租户 权…...
Java特工队:潜入京东,高效获取商品详情的绝密行动
在这个由代码和逻辑编织的电商世界里,京东商品详情就像是被锁在高塔中的神秘卷轴,等待着勇敢的Java特工队成员去解救。今天,我们要讲述的是如何装备你的Java代码装备,化身为一名编程界的特工,潜入京东的API网络&#x…...
车易泊相机 —— 智能车位管理的得力助手
在当今社会,停车问题日益成为城市管理和人们日常生活中的一大难题。寻找车位耗费时间、车位被非法占用、停车管理效率低下等问题层出不穷。然而,车易泊相机的出现,为车位管理带来了全新的解决方案。 一、车易泊相机的强大功能 车易泊相机是一…...
C++初阶(七)--类和对象(4)
目录 编辑 一、再谈构造函数 1.构造函数体赋值 2.初始化列表 二、类型转换 1.隐式类型转换 2.explicit关键字 3.类类型之间的对象隐式转换 三、static成员函数 1.概念 2.特性 3.面试题: 四、友元函数 1.基本介绍 2.回顾: 3.友元类&am…...
接口测试中缓存处理策略
在接口测试中,缓存处理策略是一个关键环节,直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性,避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明: 一、缓存处理的核…...
MongoDB学习和应用(高效的非关系型数据库)
一丶 MongoDB简介 对于社交类软件的功能,我们需要对它的功能特点进行分析: 数据量会随着用户数增大而增大读多写少价值较低非好友看不到其动态信息地理位置的查询… 针对以上特点进行分析各大存储工具: mysql:关系型数据库&am…...
云启出海,智联未来|阿里云网络「企业出海」系列客户沙龙上海站圆满落地
借阿里云中企出海大会的东风,以**「云启出海,智联未来|打造安全可靠的出海云网络引擎」为主题的阿里云企业出海客户沙龙云网络&安全专场于5.28日下午在上海顺利举办,现场吸引了来自携程、小红书、米哈游、哔哩哔哩、波克城市、…...
23-Oracle 23 ai 区块链表(Blockchain Table)
小伙伴有没有在金融强合规的领域中遇见,必须要保持数据不可变,管理员都无法修改和留痕的要求。比如医疗的电子病历中,影像检查检验结果不可篡改行的,药品追溯过程中数据只可插入无法删除的特性需求;登录日志、修改日志…...
循环冗余码校验CRC码 算法步骤+详细实例计算
通信过程:(白话解释) 我们将原始待发送的消息称为 M M M,依据发送接收消息双方约定的生成多项式 G ( x ) G(x) G(x)(意思就是 G ( x ) G(x) G(x) 是已知的)࿰…...
【快手拥抱开源】通过快手团队开源的 KwaiCoder-AutoThink-preview 解锁大语言模型的潜力
引言: 在人工智能快速发展的浪潮中,快手Kwaipilot团队推出的 KwaiCoder-AutoThink-preview 具有里程碑意义——这是首个公开的AutoThink大语言模型(LLM)。该模型代表着该领域的重大突破,通过独特方式融合思考与非思考…...
python爬虫:Newspaper3k 的详细使用(好用的新闻网站文章抓取和解析的Python库)
更多内容请见: 爬虫和逆向教程-专栏介绍和目录 文章目录 一、Newspaper3k 概述1.1 Newspaper3k 介绍1.2 主要功能1.3 典型应用场景1.4 安装二、基本用法2.2 提取单篇文章的内容2.2 处理多篇文档三、高级选项3.1 自定义配置3.2 分析文章情感四、实战案例4.1 构建新闻摘要聚合器…...
【Web 进阶篇】优雅的接口设计:统一响应、全局异常处理与参数校验
系列回顾: 在上一篇中,我们成功地为应用集成了数据库,并使用 Spring Data JPA 实现了基本的 CRUD API。我们的应用现在能“记忆”数据了!但是,如果你仔细审视那些 API,会发现它们还很“粗糙”:有…...
OpenPrompt 和直接对提示词的嵌入向量进行训练有什么区别
OpenPrompt 和直接对提示词的嵌入向量进行训练有什么区别 直接训练提示词嵌入向量的核心区别 您提到的代码: prompt_embedding = initial_embedding.clone().requires_grad_(True) optimizer = torch.optim.Adam([prompt_embedding...
elementUI点击浏览table所选行数据查看文档
项目场景: table按照要求特定的数据变成按钮可以点击 解决方案: <el-table-columnprop"mlname"label"名称"align"center"width"180"><template slot-scope"scope"><el-buttonv-if&qu…...
