当前位置：首页 > news >正文

音视频入门基础：FLV专题（22）——FFmpeg源码中，获取FLV文件音频信息的实现（中）

news 2026/2/9 10:50:23

本文接着《音视频入门基础：FLV专题（21）——FFmpeg源码中，获取FLV文件音频信息的实现（上）》，继续讲解FFmpeg获取FLV文件的音频信息到底是从哪个地方获取的。本文的一级标题从“四”开始。

四、音频采样率

（一）FFmpeg源码中，获取FLV文件音频采样率的实现

FLV文件中名称为“onMetadata”的Script Tag、每个Audio Tag的AudioTagHeader、AudioSpecificConfig都包含音频采样率信息。但是FFmpeg获取FLV文件的音频采样率，是从AudioSpecificConfig的samplingFrequencyIndex属性中获取的、而忽略另外两个地方的音频采样率信息。

由《音视频入门基础：AAC专题（11）——AudioSpecificConfig简介》可以知道，FLV文件中的音频为AAC时，正常情况下它必定存在一个Audio Tag包含Audio Specific Config，而Audio Specific Config中存在一个占4位的samplingFrequencyIndex属性，表示音频的采样频率：

由《音视频入门基础：AAC专题（12）——FFmpeg源码中，解码AudioSpecificConfig的实现》可以知道，ff_mpeg4audio_get_config_gb函数中，通过语句：c->sample_rate = get_sample_rate(gb, &c->sampling_index)获取AudioSpecificConfig的samplingFrequencyIndex属性。执行decode_audio_specific_config_gb函数后，m4ac指向的变量会得到从AudioSpecificConfig中解码出来的属性：

static inline int get_sample_rate(GetBitContext *gb, int *index)
{*index = get_bits(gb, 4);return *index == 0x0f ? get_bits(gb, 24) :ff_mpeg4audio_sample_rates[*index];
}

然后在decode_audio_specific_config_gb函数外部，通过aac_decode_frame_int函数将上一步得到的samplingFrequencyIndex属性赋值给AVCodecContext的sample_rate：

static int aac_decode_frame_int(AVCodecContext *avctx, AVFrame *frame,int *got_frame_ptr, GetBitContext *gb,const AVPacket *avpkt)
{
//...if (ac->oc[1].status && audio_found) {avctx->sample_rate = ac->oc[1].m4ac.sample_rate << multiplier;avctx->frame_size = samples;ac->oc[1].status = OC_LOCKED;}
//...
}

然后在dump_stream_format函数中，通过avcodec_string函数中的语句：av_bprintf(&bprint, "%d Hz, ", enc->sample_rate)拿到上一步中得到的AVCodecContext的sample_rate。最后再在dump_stream_format函数中将profile打印出来：

void avcodec_string(char *buf, int buf_size, AVCodecContext *enc, int encode)
{
//...switch (enc->codec_type) {case AVMEDIA_TYPE_AUDIO:av_bprintf(&bprint, "%s", separator);if (enc->sample_rate) {av_bprintf(&bprint, "%d Hz, ", enc->sample_rate);}
//...}
//...
}

（二）修改Audio Specific Config中的samplingFrequencyIndex属性验证

下面我们做一个验证：

FLV文件video1.flv的Audio Specific Config中的samplingFrequencyIndex属性的值为4，对应的音频采样频率为44100Hz：

用ffmpeg -i video1.flv命令可以查看到video1.flv文件的音频采样频率为44100Hz：

我们用Notepad++修改video1.flv文件的Audio Specific Config中的samplingFrequencyIndex属性，把它的值从4改为0。修改完成后把文件名称改为“video1_AudioSpecificConfig.flv”：

用flvAnalyser工具打开修改后的FLV文件video1_AudioSpecificConfig.flv，可以看到Audio Specific Config中的samplingFrequencyIndex属性的值确实被修改为了0，对应音频采样频率变为了96000Hz：

用“ffmpeg -i video1_AudioSpecificConfig.flv”命令可以查看到FLV文件的音频采样频率确实变为96000Hz了：

用ffplay播放video1_AudioSpecificConfig.flv会发现没有声音，从而证明FFmpeg获取FLV文件的音频采样率，是从AudioSpecificConfig的samplingFrequencyIndex属性中获取的。由于video1_AudioSpecificConfig.flv文件的samplingFrequencyIndex属性被修改了，所以它的音频采样频率信息不正确，导致用ffplay播放不出来：

但是要注意的是：每种音视频SDK和音视频播放器获取音频采样率的位置都不同，比如FFmpeg是从AudioSpecificConfig的samplingFrequencyIndex属性中获取的，但是VLC是从Audio Tag的AudioTagHeader中获取的。

用VLC播放video1_AudioSpecificConfig.flv，会发现其显示的音频采样频率还是修改前的44100Hz，可以正常播放声音。因为VLC获取FLV文件的音频采样频率是从Audio Tag的AudioTagHeader中获取：

五、音频声道数

（一）FFmpeg源码中，获取FLV文件音频声道数的实现

FLV文件中名称为“onMetadata”的Script Tag、每个Audio Tag的AudioTagHeader、AudioSpecificConfig都包含音频声道数信息。FFmpeg获取FLV文件的音频声道数，主要是从Audio Tag的AudioTagHeader中的SoundType属性获取的。

由《音视频入门基础：FLV专题（18）——Audio Tag简介》可以知道，Audio Tag的AudioTagHeader中存在一个占1位的SoundType属性，表示音频声道数：

0：单声道

1：立体声

由《音视频入门基础：FLV专题（19）——FFmpeg源码中，解码Audio Tag的AudioTagHeader，并提取AUDIODATA的实现》可以知道，FFmpeg源码中使用flv_read_packet函数来读取每个Tag的信息。如果判断出该Tag为Audio Tag，flv_read_packet函数中会通过下面代码块将AudioTagHeader的SoundType属性提取出来，转换得到音频音频声道数。将音频声道数目存贮到局部变量channels中：

        channels = (flags & FLV_AUDIO_CHANNEL_MASK) == FLV_STEREO ? 2 : 1;

将上述得到的音频声道数目赋值给st->codecpar->ch_layout。st->codecpar为指向一个AVCodecParameters类型变量的指针：

        if (!av_channel_layout_check(&st->codecpar->ch_layout) ||!st->codecpar->sample_rate ||!st->codecpar->bits_per_coded_sample) {av_channel_layout_default(&st->codecpar->ch_layout, channels);//...}

然后在flv_read_packet函数外部，通过avcodec_parameters_to_context函数将AVCodecParameters的ch_layout赋值给AVCodecContext的ch_layout：

int avcodec_parameters_to_context(AVCodecContext *codec,const AVCodecParameters *par)
{
//...switch (par->codec_type) {case AVMEDIA_TYPE_AUDIO:ret = av_channel_layout_copy(&codec->ch_layout, &par->ch_layout);//....break;}
//...
}

然后在dump_stream_format函数中，通过avcodec_string函数中的语句:av_channel_layout_describe_bprint(&enc->ch_layout, &bprint)拿到AVCodecContext的ch_layout对应的音频声道数目。最后再在dump_stream_format函数中将音频声道数目打印出来：

void avcodec_string(char *buf, int buf_size, AVCodecContext *enc, int encode)
{
//...switch (enc->codec_type) {case AVMEDIA_TYPE_AUDIO:av_channel_layout_describe_bprint(&enc->ch_layout, &bprint);//...break;}
//...
}

（二）修改Audio Specific Config中的channelConfiguration属性验证

下面我们做一个验证：

FLV文件video1.flv的Audio Tag的AudioTagHeader中的SoundType属性值为1，对应的音频声道数为立体声（双声道）。这里由于flvAnalyser工具的局限性没办法直接看到AudioTagHeader中的SoundType属性，但是按照《音视频入门基础：FLV专题（18）——Audio Tag简介》中讲述的格式，自己换算一下SoundType的值就出来了。0xAF等于二进制的0b10101111，SoundFormat占4位，SoundRate占2位，SoundSize占1位，所以这里SoundType的值就是1：

该文件的Audio Specific Config中的channelConfiguration属性的值为2，对应的音频声道数也为双声道：

用ffmpeg -i video1.flv命令可以查看到video1.flv文件的音频声道数为双声道：

我们用Notepad++修改video1.flv文件的Audio Specific Config中的channelConfiguration属性，把它的值从2改为1。修改完成后把文件名称改为“video1_AudioSpecificConfig1.flv”。用flvAnalyser工具打开修改后的FLV文件video1_AudioSpecificConfig1.flv，可以看到Audio Specific Config中的channelConfiguration属性的值确实被修改为了1，对应音频声道数为单声道：

但是用“ffmpeg -i video1_AudioSpecificConfig1.flv”命令查看到FLV文件，发现其音频声道数还是为双声道。因为FFmpeg获取FLV文件的音频声道数，主要是从Audio Tag的AudioTagHeader中的SoundType属性获取，所以修改Audio Specific Config中的channelConfiguration属性对音频声道数没有影响：

但是这并不意味着对FFmpeg源码来讲，Audio Specific Config中的channelConfiguration属性没有意义，相反FFmpeg同样会参考channelConfiguration属性。比如，把Audio Specific Config中的channelConfiguration属性修改为4，重新使用“ffmpeg -i video1_AudioSpecificConfig1.flv”命令，会发现报错：“channel element 1.0 is not allocated”：

把Audio Specific Config中的channelConfiguration属性修改为0，重新使用“ffmpeg -i video1_AudioSpecificConfig1.flv”命令，会发现报错：“ Could not find codec parameters for stream 1 (Audio: aac, 44100 Hz, 0 channels, fltp, 136 kb/s): unspecified number of channels
”：

所以FFmpeg获取FLV文件的音频声道数，主要是从Audio Tag的AudioTagHeader中的SoundType属性获取，但是它也会参考Audio Specific Config中的channelConfiguration属性。

六、FFmpeg获取FLV文件音频采样率和音频声道数总结

从上面我们可以知道，FLV文件中名称为“onMetadata”的Script Tag、每个Audio Tag的AudioTagHeader、AudioSpecificConfig都会包含音频信息，每种音视频SDK或者音视频播放器获取音频信息时获取的位置和策略可能都不一样。所以很多时候我们播放FLV文件音频的时候，会发现用ffplay能播，但用vlc无法播放；或者反过来用vlc能播，但是用ffplay无法播放。当FLV文件中某些地方的音频信息不正确，但是其它地方音频信息正确时，就会发生某些播放器能正常播放，其它播放器无法播放的情况。所以一定要搞清楚我们使用的音视频SDK和播放器到底获取的是哪个位置的音频信息。

音视频入门基础：FLV专题（22）——FFmpeg源码中，获取FLV文件音频信息的实现（中）

四、音频采样率

（一）FFmpeg源码中，获取FLV文件音频采样率的实现

（二）修改Audio Specific Config中的samplingFrequencyIndex属性验证

五、音频声道数

（一）FFmpeg源码中，获取FLV文件音频声道数的实现

（二）修改Audio Specific Config中的channelConfiguration属性验证

六、FFmpeg获取FLV文件音频采样率和音频声道数总结

相关文章：

音视频入门基础：FLV专题（22）——FFmpeg源码中，获取FLV文件音频信息的实现（中）

Chrome与火狐哪个浏览器的性能表现更好

uniapp在js方法中，获取当前用户的uid(uni-id-user)表中的用户id

影响神经网络速度的因素- FLOPs、MAC、并行度以及计算平台

【万字详解】如何在微信小程序的 Taro 框架中设置静态图片 assets/image 的 Base64 转换上限值

复合选择器,CSS特性,背景属性,显示模式(HTML)

加密货币行业与2024年美国大选

Hive SQL中判断内容包含情况的全面指南

匿名管道 Linux

苍穹外卖WebSocket无法建立连接 (修改前端代码)

音频内容理解

MQTT实用示例集：Air201版

Day23 opencv图像预处理

优化模型训练过程中的显存使用率、GPU使用率

RocketMQ学习笔记

Linux第三讲：环境基础开发工具使用

日本TikTok直播的未来：专线网络助力创作者突破极限

如何在家庭网络中设置静态IP地址：一份实用指南

qt QFile详解

ESP8266 自定义固件烧录-Tcpsocket固件

uniapp 对接腾讯云IM群组成员管理（增删改查）

Chapter03-Authentication vulnerabilities

微软PowerBI考试 PL300-选择 Power BI 模型框架【附练习数据】

鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个医院挂号小程序

质量体系的重要

UR 协作机器人「三剑客」：精密轻量担当（UR7e）、全能协作主力（UR12e）、重型任务专家（UR15）

HashMap中的put方法执行流程（流程图）

Go 语言并发编程基础：无缓冲与有缓冲通道

ZYNQ学习记录FPGA(一)ZYNQ简介

轻量级Docker管理工具Docker Switchboard