当前位置：首页 > news >正文

FFmpeg音视频开发知识点（二）

news 2025/12/16 0:14:34

系列文章目录

FFmpeg音视频开发知识点（一）

文章目录

系列文章目录
前言
一、AAC音频编码
- 1. ffmpeg编译第三方的libfdk_aac
- 2. S16重采样FLTP
二、AAC音频解码
总结

前言

该篇讲解一下，音频编解码中的难点，以及开发过程中遇到问题，有不对的地方，欢迎大佬指正

一、AAC音频编码

在开发音频编解码AAC，我使用QAudioInput进行采样，但是采样格式只有S16（有符号16位）最接近AAC的采样，我看了下安卓采样的样本长度也是16（PS：需要和安卓终端通话），于是查找并打开编码器

	AVCodec* pCodec = avcodec_find_encoder(AV_CODEC_ID_AAC);if (pCodec == nullptr){//...省略return;}AVCodecContext* pCodecCtx = avcodec_alloc_context3(pCodec);if(pCodecCtx == NULL){//...省略return;}pCodecCtx->codec_id = pCodec->id;pCodecCtx->codec_type = AVMEDIA_TYPE_AUDIO;//...省略int iRet = avcodec_open2(pCodecCtx, pCodec, NULL);if (iRet < 0){//...省略return;}

但是会报错（忘了是查找还是打开编码器报错了🤣），后面一查，ffmpeg本身自带的aac并不支持AV_SAMPLE_FMT_S16的，有两种方式可以编码S16音频采样

1. ffmpeg编译第三方的libfdk_aac

编译libfdk_aac可以参考我这篇文章：Linux部分开源库编译，附上我的ffmepg编译的configure配置命令，具体如下：

sudo ./configure \
--prefix=/home/lzy/Project/new_project/libH323Stack_src_1.2.0/bin4 \
--extra-cflags="-I/home/lzy/Project/bin/include -Wall -fPIC" \	#第三方库的头文件路径
--extra-ldflags="-L/home/lzy/Project/bin/lib -ldl" \			#第三方库的所在路径
--disable-static \
--enable-shared \
--disable-debug \
--disable-doc \
--disable-ffplay \
--disable-ffprobe \
--disable-symver \
--enable-small \
--enable-gpl \
--enable-nonfree \
--enable-libfdk-aac \
--enable-libx264 \
--enable-libx265 \
--enable-openssl \
--enable-hardcoded-tables \
--enable-avresample \
--enable-decoder=h264 \
--enable-decoder=hevc \
--enable-decoder=mjpeg \
--enable-decoder=aac \
--enable-encoder=libx264 \
--enable-encoder=libx265 \
--enable-encoder=libfdk_aac \
--enable-encoder=mjpeg \
--enable-encoder=pcm_s16le \
--enable-decoder=pcm_s16le \
--enable-protocol=file \
--enable-protocol=rtp \
--enable-protocol=tcp \
--enable-protocol=udp \
--enable-demuxer=mp3 \
--enable-demuxer=wav \
--enable-demuxer=mpegts \
--enable-demuxer=mov \
--enable-demuxer=flv \
--enable-bsf=h264_mp4toannexb \
--enable-bsf=hevc_mp4toannexb \
--enable-bsf=aac_adtstoasc

编译之后，就可以打开AV_SAMPLE_FMT_S16采样格式的编码器了，具体如下：

    AVCodec* pCodec = avcodec_find_encoder_by_name("libfdk_aac");if (pCodec == nullptr){//...省略return;}//...省略

最后，附上一个比较关键的部分，就是将S16的音频采样数据，赋值给AVFrame，之前参数不对也折腾了很久

	// 创建输入帧AVFrame* pS16AudioFrame = av_frame_alloc();if (pS16AudioFrame == nullptr){//...省略return;}// frame缓冲区中的样本帧数量（由ctx->frame_size决定）pS16AudioFrame->nb_samples = pCodecCtx->frame_size;// 音频采样格式pS16AudioFrame->format = pCodecCtx->sample_fmt;// 声道布局pS16AudioFrame->channel_layout = pCodecCtx->channel_layout;pS16AudioFrame->channels = pCodecCtx->channels;// 采样率pS16AudioFrame->sample_rate = pCodecCtx->sample_rate;// 利用nb_samples、format、channel_layout创建frame的数据缓冲区int iRet = av_frame_get_buffer(pS16AudioFrame, 0);if (iRet < 0){//...省略return;}//...省略// 将读取到的PCM数据填充到frame去，但要注意格式的匹配, 是planar还是packed都要区分清楚iRet = av_samples_fill_arrays(pS16AudioFrame->data, pS16AudioFrame->linesize,stFrame.pFrame, pS16AudioFrame->channels,pCodecCtx->frame_size, pCodecCtx->sample_fmt, 0);if (iRet < 0){//...省略return;}

2. S16重采样FLTP

	// 创建音频转换上下文SwrContext* pSwrCtx = swr_alloc_set_opts(NULL, pCodecCtx->channel_layout, AV_SAMPLE_FMT_FLTP, pCodecCtx->sample_rate,pCodecCtx->channel_layout, AV_SAMPLE_FMT_S16, pCodecCtx->sample_rate, 0, NULL);if (pSwrCtx == nullptr){printf("无法分配音频转换上下文\n");return;}// 初始化音频转换上下文if (swr_init(pSwrCtx) < 0){printf("音频转换上下文初始化失败\n");return;}// 进行音频转换AVFrame* pFltpAudioFrame = av_frame_alloc();if (pCodec == nullptr){//...省略return;}pFltpAudioFrame->format = pCodecCtx->sample_fmt;pFltpAudioFrame->channel_layout = AV_CH_LAYOUT_STEREO;pFltpAudioFrame->sample_rate = pCodecCtx->sample_rate;pFltpAudioFrame->nb_samples = 1024; //一帧音频一通道的采样数量int iRet = av_frame_get_buffer(pFltpAudioFrame, 0); //给pcm分配存储空间if (iRet < 0){//...省略return;}//...省略PCM复制给AVFrame// 执行音频转换iRet = swr_convert_frame(pSwrCtx, pFltpAudioFrame, pS16AudioFrame);if(iRet < 0){//...省略return;}

二、AAC音频解码

音频编码完成后，发送给安卓端，能够正常播放音频；现在开始解码安卓发过来的AAC音频，原本以为很快就能解决，结果发现调用avcodec_receive_frame函数一直返回-11，也就是说没有能获取到解码后的完整的一帧数据，我打印了一下返回值，发现一次都没成功；由于我发送S16的编码数据给安卓能够正常播放，且安卓采样也是S16（但是走的硬编解码）；让我一度认为，安卓发过来的音频编码数据的采样格式是S16，直到我一次偶然的尝试，将

AVCodec* pCodec = avcodec_find_decoder_by_name("libfdk_aac");
// ...省略
AVCodecContext* pCodecCtx = avcodec_alloc_context3(pCodec);
// ...省略
pCodecCtx->request_sample_fmt = AV_SAMPLE_FMT_S16;

改为

AVCodec* pCodec = avcodec_find_decoder(AV_CODEC_ID_AAC);
// ...省略
AVCodecContext* pCodecCtx = avcodec_alloc_context3(pCodec);
// ...省略
pCodecCtx->request_sample_fmt = AV_SAMPLE_FMT_FLTP;

结果发现解码成功了，…，附上FLTP重采样S16代码，其实和S16重采样FLTP差不多

// 创建音频转换上下文SwrContext* pSwrCtx = swr_alloc_set_opts(NULL, pCodecCtx->channel_layout, AV_SAMPLE_FMT_S16, pCodecCtx->sample_rate,pCodecCtx->channel_layout, AV_SAMPLE_FMT_FLTP, pCodecCtx->sample_rate, 0, NULL);if (pSwrCtx == nullptr){printf("无法分配音频转换上下文\n");return;}// 初始化音频转换上下文if (swr_init(pSwrCtx) < 0){printf("音频转换上下文初始化失败\n");return;}// 进行音频转换AVFrame* pS16AudioFrame = av_frame_alloc();if (NULL == pS16AudioFrame ){printf("av_frame_alloc failed!\n");return ;}pS16AudioFrame->format = AV_SAMPLE_FMT_S16;pS16AudioFrame->channel_layout = AV_CH_LAYOUT_STEREO;pS16AudioFrame->sample_rate = pCodecCtx->sample_rate;pS16AudioFrame->nb_samples = 1024; //一帧音频一通道的采样数量iRet = av_frame_get_buffer(pS16AudioFrame, 0); //给pcm分配存储空间if(iRet < 0){//...省略return;}// 分配一帧空间，存放解码后的一帧数据AVFrame* pAudioFrame = av_frame_alloc();//...省略// 执行音频转换iRet = swr_convert_frame(pSwrCtx, pS16AudioFrame, pAudioFrame);//...省略

总结

音频编解码相对来说比较简单，就AAC稍微复杂一点，如果编解码失败，大概分两种情况：
1）编解码上下文参数不对
2）传给编解码器的数据不对
另外，每个函数的返回值也要判断一下，这样出现异常，也能迅速定位所在位置

FFmpeg音视频开发知识点（二）

系列文章目录

文章目录

前言

一、AAC音频编码

1. ffmpeg编译第三方的libfdk_aac

2. S16重采样FLTP

二、AAC音频解码

总结

相关文章：

FFmpeg音视频开发知识点（二）

【Java可执行命令】（十）JAR文件签名工具 jarsigner：通过数字签名及验证保证代码信任与安全，深入解析 Java的 jarsigner命令~

c#调用c++ dll，Release版本内存访问错误

内网安全：Cobalt Strike 与 MSF 联动（会话相互转移）

性能测试讲解超详细Jmeter

微服务 – Spring Cloud – Nacos 配置中心

超细，设计一个“完美“的测试用例，用户登录模块实例...

【C#】文件拖拽，获取文件路径

SAP PI/PO初步了解 2023.07.03

Java中生产者消费者模型

测试Hyperledger Fabric环境

ClickHouse查询sql长度超超过最大限制

【Axure教程】拖动调整行高列宽的表格

中间件-netty(1)

【方法】想把PDF文档转换成PPT，如何操作？

Linux--设置目录或文件的默认权限：umask权限掩码

C++实现websocket单server单client全双工通信(基于boost！！！)

好用的网址5

做项目去实习到底做的什么？

VSC++：验证身份证

web vue 项目 Docker化部署

第25节 Node.js 断言测试

Psychopy音频的使用

WordPress插件：AI多语言写作与智能配图、免费AI模型、SEO文章生成

LLM基础1_语言模型如何处理文本

UR 协作机器人「三剑客」：精密轻量担当（UR7e）、全能协作主力（UR12e）、重型任务专家（UR15）

Java线上CPU飙高问题排查全指南

以光量子为例，详解量子获取方式

快刀集(1): 一刀斩断视频片头广告

宇树科技，改名了！