当前位置：首页 > news >正文

ffmpeg7.0 aac转pcm

news 2026/2/10 14:13:34


#pragma once
#define __STDC_CONSTANT_MACROS
#define _CRT_SECURE_NO_WARNINGSextern "C"
{
#include "libavcodec/avcodec.h"
}//缓冲区大小（缓存5帧数据）
#define AUDIO_INBUF_SIZE 40960  
/*name   depthu8        8s16      16s32      32flt      32dbl      64u8p       8s16p     16s32p     32fltp     32dblp     64s64      64s64p     64//此代码解码的音频文件格式如下://AAC文件(一帧1024字节)，双声道（2），FLTP（32位，4字节）//AAC文件 frame_size 和 nb_samples 大小均为1024//一帧音频所占字节大小//1024*2*4=8192字节
*/
#define AUDIO_REFILL_THRESH 8192using namespace std;#define INPUT_FILE_NAME "d:\\123.aac"
#define OUTPUT_FILE_NAME "d:\\1111.pcm"static int get_format_from_sample_fmt(const char** fmt,	enum AVSampleFormat sample_fmt)
{struct sample_fmt_entry {enum AVSampleFormat sample_fmt; const char* fmt_be, * fmt_le;} sample_fmt_entries[] = {{ AV_SAMPLE_FMT_U8,  "u8",    "u8"    },{ AV_SAMPLE_FMT_S16, "s16be", "s16le" },{ AV_SAMPLE_FMT_S32, "s32be", "s32le" },{ AV_SAMPLE_FMT_FLT, "f32be", "f32le" },{ AV_SAMPLE_FMT_DBL, "f64be", "f64le" },};*fmt = NULL;for (int i = 0; i < FF_ARRAY_ELEMS(sample_fmt_entries); i++) {struct sample_fmt_entry* entry = &sample_fmt_entries[i];if (sample_fmt == entry->sample_fmt) {*fmt = AV_NE(entry->fmt_be, entry->fmt_le);return 0;}}av_log(NULL, AV_LOG_ERROR, "sample format %s is not supported as output format\n", av_get_sample_fmt_name(sample_fmt));return -1;
}static void decode(AVCodecContext* pCodecContext, AVFrame* pFrame, AVPacket* pPacket, FILE* pFile)
{int ret = avcodec_send_packet(pCodecContext, pPacket);if (ret < 0) {av_log(NULL, AV_LOG_ERROR, "发送数据包到解码器出错。\n");exit(1);}while (ret >= 0) {ret = avcodec_receive_frame(pCodecContext, pFrame);if (ret == AVERROR(EAGAIN) || ret == AVERROR_EOF) {return;}else if (ret < 0) {av_log(NULL, AV_LOG_ERROR, "Error sending a packet for decoding.\n");exit(1);}//获取每个采样点当中每个声道的大小int nDataSize = av_get_bytes_per_sample(pCodecContext->sample_fmt);if (nDataSize < 0) {av_log(NULL, AV_LOG_ERROR, "Failed to calculate data size.\n");exit(1);}//遍历采样点for (int i = 0; i < pFrame->nb_samples; i++) {//遍历声道for (int ch = 0; ch < pCodecContext->ch_layout.nb_channels; ch++) {fwrite(pFrame->data[ch] + nDataSize * i, 1, nDataSize, pFile);}}}
}int main(int argc, char* argv[])
{//初始化inbuf数字默认值uint8_t inbuf[AUDIO_INBUF_SIZE + AV_INPUT_BUFFER_PADDING_SIZE] = {0};//获取解码器（此处需要读取的文件是AAC，故）const AVCodec* pCodecOfAAC = avcodec_find_decoder(AV_CODEC_ID_AAC);if (!pCodecOfAAC) {av_log(NULL, AV_LOG_ERROR, "Codec not found.\n");exit(1);}//注册解析器AVCodecParserContext* pCodecParserParser = av_parser_init(pCodecOfAAC->id);if (!pCodecParserParser) {av_log(NULL, AV_LOG_ERROR, "parser not found.\n");exit(1);}//分配解析器上下文AVCodecContext* pCodecContextOfAAC = avcodec_alloc_context3(pCodecOfAAC);if (!pCodecContextOfAAC) {av_log(NULL, AV_LOG_ERROR, "Could not allocate video codec context.\n");exit(1);}//打开解码器if (avcodec_open2(pCodecContextOfAAC, pCodecOfAAC, NULL) < 0) {av_log(NULL, AV_LOG_ERROR, "Could not open codec.\n");exit(1);}//分配AVPacketAVPacket* pPacket = av_packet_alloc();if (!pPacket) {exit(1);}//分配AVFrameAVFrame* pFrame = av_frame_alloc();if (!pFrame) {exit(1);}//打开输入文件FILE* ifile = fopen(INPUT_FILE_NAME, "rb");if (!ifile) {av_log(NULL, AV_LOG_ERROR, "Could not open \s.\n", INPUT_FILE_NAME);exit(1);}//打开输入文件FILE* ofile = fopen(OUTPUT_FILE_NAME, "wb+");if (!ofile) {av_log(NULL, AV_LOG_ERROR, "Could not open \s.\n", OUTPUT_FILE_NAME);exit(1);}//从输入流 ifile 读取数据到 inbuf 所指向的数组中uint8_t* data = inbuf;size_t nDataSize = fread(inbuf, 1, AUDIO_INBUF_SIZE, ifile);while (nDataSize > 0) {//使用注册的解析器 parser 把数据分割成帧int nRet = av_parser_parse2(pCodecParserParser, pCodecContextOfAAC, &pPacket->data, &pPacket->size, data, nDataSize, AV_NOPTS_VALUE, AV_NOPTS_VALUE, 0);if (nRet < 0) {fprintf(stderr, "Error while parsing\n");exit(1);}//根据使用情况重置数据位置data += nRet;nDataSize -= nRet;//送往解码if (pPacket->size) {decode(pCodecContextOfAAC, pFrame, pPacket, ofile);}//判断缓存区剩余数据是否小于一帧音频大小//小于的话从文件继续读取，之后在送往解码if (nDataSize < AUDIO_REFILL_THRESH) {memmove(inbuf, data, nDataSize);data = inbuf;int nLen = fread(data + nDataSize, 1, AUDIO_INBUF_SIZE - nDataSize, ifile);if (nLen > 0) {nDataSize += nLen;}}}//flush 解码器decode(pCodecContextOfAAC, pFrame, NULL, ofile);//此时就已经解码完了，我们稍后使用ffplay播放下音频//解码出来的pcm数据是没有这些基础数据的，我们需要从元数据获取//打印下基本信息//声道数printf("channels: %d \n", pCodecContextOfAAC->ch_layout.nb_channels);//采样率printf("sample_rate: %d  \n", pCodecContextOfAAC->sample_rate);//一帧音频所占字节代销printf("buffer: %d  \n", av_samples_get_buffer_size(NULL, pCodecContextOfAAC->ch_layout.nb_channels, pCodecContextOfAAC->frame_size, pCodecContextOfAAC->sample_fmt, 1));//采样格式enum AVSampleFormat sfmt = pCodecContextOfAAC->sample_fmt;printf("sample_fmt: %s  \n", av_get_sample_fmt_name(sfmt));//如果为planar，转换为packed格式if (av_sample_fmt_is_planar(sfmt)) {const char* packed = av_get_sample_fmt_name(sfmt);sfmt = av_get_packed_sample_fmt(sfmt);}const char* fmt = NULL;if (get_format_from_sample_fmt(&fmt, sfmt) < 0) {av_log(NULL, AV_LOG_ERROR, "Could not get forma \s.\n", av_get_sample_fmt_name(sfmt));exit(1);}//资源释放fclose(ifile);fclose(ofile);av_parser_close(pCodecParserParser);avcodec_free_context(&pCodecContextOfAAC);av_frame_free(&pFrame);av_packet_free(&pPacket);return 0;
}

ffmpeg7.0 aac转pcm

#pragma once #define __STDC_CONSTANT_MACROS #define _CRT_SECURE_NO_WARNINGSextern "C" { #include "libavcodec/avcodec.h" }//缓冲区大小（缓存5帧数据） #define AUDIO_INBUF_SIZE 40960 /*name depthu8 8s16 …...

编程日记 2025/1/12 12:14:10

【Pandas】pandas Series rdiv

Pandas2.2 Series Binary operator functions 方法描述Series.add()用于对两个 Series 进行逐元素加法运算Series.sub()用于对两个 Series 进行逐元素减法运算Series.mul()用于对两个 Series 进行逐元素乘法运算Series.div()用于对两个 Series 进行逐元素除法运算Series.true…...

编程日记 2025/1/12 12:11:05

线程安全问题介绍

文章目录 **什么是线程安全？****为什么会出现线程安全问题？****线程安全问题的常见场景****如何解决线程安全问题？**1. **使用锁**2. **使用线程安全的数据结构**3. **原子操作**4. **使用volatile关键字**5. **线程本地存储**6. **避免死锁*…...

编程日记 2025/1/12 12:07:00

为AI聊天工具添加一个知识系统之27 支持边缘计算设备的资源存储库及管理器

本文问题现在我们回到 ONE/TWO/TREE 的资源存储库的设计--用来指导足以支持本项目（为AI聊天工具增加一套知识系统）的核心能力 “语言处理” 中最高难度系数的“自然语言处理” 中最具挑战性的“含糊性” 问题的解决。--因为足以解决自然语言中最…...

编程日记 2025/1/12 12:04:57

初识verilog HDL

为什么选择用Verilog HDL开发FPGA？？？ 硬件描述语言（Hardware Descriptipon Lagnuage，HDL）通过硬件的方式来产生与之对应的真实的硬件电路，最终实现所设计的预期功能，其设计方法与软件…...

编程日记 2025/1/12 12:01:39

VS2015 + OpenCV + OnnxRuntime-Cpp + YOLOv8 部署

近期有个工作需求是进行 YOLOv8 模型的 C 部署，部署环境如下系统：WindowsIDE：VS2015语言：COpenCV 4.5.0OnnxRuntime 1.15.1 0. 预训练模型保存为 .onnx 格式假设已经有使用 ultralytics 库训练并保存为 .pt 格式的 YOLOv8 模型…...

编程日记 2025/1/12 12:00:37

Notepad++上NppFTP插件的安装和使用教程

一、NppFTP插件下载图示是已经安装好了插件。在搜索框里面搜NppFTP，一般情况下，自带的下载地址容易下载失败。这里准备了一个下载连接：Release v0.29.10 ashkulz/NppFTP GitHub 这里我下载的是x86版本下载好后在nodepad的插件里面选择打…...

编程日记 2025/1/12 11:59:34

Kotlin | Android Provider 的实现案例

目标使用 Android Room 实现持久化库。代码 Kotlin 代码编写 DemoDatabase，在build生成 DemoDatabase_Impl 疑问 Provider的数据会存在设备吗？ 内部存储: 当使用 Room 创建数据库（如 DemoDatabase），数据库文件通常…...

编程日记 2025/1/12 11:58:33

频域自适应空洞卷积FADC详解

定义与原理在探讨FADC的核心策略之前，我们需要深入了解其定义和工作原理。FADC是一种创新性的卷积技术，旨在克服传统空洞卷积的局限性。其核心思想是从频谱分析的角度改进空洞卷积，通过动态调整膨胀率来平衡有效带宽和感受野大小。 FADC的工作原理可以从以下几个方面…...

编程日记 2025/1/12 11:55:29

Edge浏览器内置的截长图功能

Edge浏览器内置截图功能近年来，Edge浏览器不断更新和完善，也提供了长截图功能。在Edge中，只需点击右上角的“...”，然后选择“网页捕获”->“捕获整页”，即可实现长截图。这一功能的简单易用，使其成为…...

编程日记 2025/1/12 11:54:28

GAN的应用

5、GAN的应用 GANs是一个强大的生成模型，它可以使用随机向量生成逼真的样本。我们既不需要知道明确的真实数据分布，也不需要任何数学假设。这些优点使得GANs被广泛应用于图像处理、计算机视觉、序列数据等领域。上图是基于GANs的实际应用场景对不同G…...

编程日记 2025/1/12 11:53:27

Math Reference Notes: 希腊字母表

希腊字母（Greek alphabet）是古希腊语使用的字母系统，也是西方字母系统的先驱之一，广泛应用于现代数学、物理学、工程学以及各种科学领域。希腊字母有24个字母，它们分为大写和小写两种形式。 1. Alpha (Α, α) 发音&a…...

编程日记 2025/1/12 11:49:21

高通，联发科（MTK）等手机平台调优汇总

一、常见手机型号介绍： ISP除了用在安防行业，还有手机市场，以及目前新型的A/VR眼睛，机器3D视觉机器人，医疗内窥镜这些行业。下面是一些最近几年发布的,,,旗舰SOC型号： 1.联发科：天玑92…...

编程日记 2025/1/12 11:47:18

Rust语言使用iced实现简单GUI页面

使用cargo新建一个rust项目 cargo new gui_demo cd gui_demo 编辑Cargo.toml文件 ,添加iced依赖 [package] name "gui_demo" version "0.1.0" edition "2021"[dependencies] iced "0.4.2" 编辑src/main.rs文件： u…...

编程日记 2025/1/12 11:45:16

使用wav2vec 2.0进行音位分类任务的研究总结

使用wav2vec 2.0进行音位分类任务的研究总结原文名称： Using wav2vec 2.0 for phonetic classification tasks: methodological aspects 研究背景自监督学习在语音中的应用自监督学习在自动语音识别任务中表现出色，例如说话人识别和验证。变换器模型…...

编程日记 2025/1/12 11:42:12

用Arduino平台，学习了点亮led灯。 //定义LED引脚 int led_pin 12；void setup() {//设定引脚为输出模式pinMode(led_pin,OUTPUT):}void loop() {// 点亮LED:digitalWrite(led_pin,HIGH);//延时1sdelay(1000);//熄灭LEDdigitalWrite(led_pin,LOW)://延时…...

编程日记 2025/1/12 11:41:11

基于SMT32U575RIT单片机-中断练习

任务查看手册对所有的拓展板上和相对应的底板的引脚对应的端口找到以下结论通过STM32MX软件对各个引脚进行相应的配置 1.第一种切换模式电脑发送 #include "main.h" #include "icache.h" #include "usart.h" #include "gpio.h"/*…...

编程日记 2025/1/12 11:40:10

在Django的Serializer的列表数据中剔除指定元素

【Python工作随笔】提问如何在List序列化方法中剔除不要的元素，例如在成绩中剔除0 class BasicDescriptionSubjectBoxPlotSerializer(serializers.Serializer):语文 serializers.ListField(sourcescore_chinese)数学 serializers.ListField(sourcescore_math…...

编程日记 2025/1/12 11:36:06

我喜欢的数学题

偏向抖机灵性质的，考察理解的，而不是比拼计算量的，可能跟现在岁数大了算不明白了多少有点关系吧。高高手，别太重计算，给普通孩子留条路。就算将来真的理工治国，也没必要都往人形计算机方面引导。毕竟你未来…...

编程日记 2025/1/12 11:28:59

Redis解决热key问题

当Redis遇到热key问题时，即某个或某些key被频繁访问，可能导致单个Redis节点负载过高，影响整个系统性能。以下是一些常见的解决方案： 1. 缓存预热与复制缓存预热：在系统启动阶段，将热key对应的value预先加…...

编程日记 2025/1/12 11:22:53

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章传送阵>> 点我查看说明：假设每台服务器已…...

编程新知 2026/2/10 11:45:58

python/java环境配置

环境变量放一起 python： 1.首先下载Python Python下载地址：Download Python | Python.org downloads ---windows -- 64 2.安装Python 下面两个，然后自定义，全选可以把前4个选上 3.环境配置 1）搜高级系统设置 2…...

编程新知 2026/2/9 15:41:39

【Redis技术进阶之路】「原理分析系列开篇」分析客户端和服务端网络诵信交互实现（服务端执行命令请求的过程 - 初始化服务器）

服务端执行命令请求的过程【专栏简介】【技术大纲】【专栏目标】【目标人群】1. Redis爱好者与社区成员2. 后端开发和系统架构师3. 计算机专业的本科生及研究生初始化服务器1. 初始化服务器状态结构初始化RedisServer变量 2. 加载相关系统配置和用户配置参数定制化配置参数案…...

编程新知 2026/2/2 0:45:02

Python爬虫（二）：爬虫完整流程

爬虫完整流程详解（7大核心步骤实战技巧） 一、爬虫完整工作流程以下是爬虫开发的完整流程，我将结合具体技术点和实战经验展开说明： 1. 目标分析与前期准备网站技术分析： 使用浏览器开发者工具（F12&…...

编程新知 2025/10/19 5:48:51

Java-41 深入浅出 Spring - 声明式事务的支持事务配置 XML模式 XML+注解模式

点一下关注吧！！！非常感谢！！持续更新！！！ 🚀 AI篇持续更新中！（长期更新） 目前2025年06月05日更新到： AI炼丹日志-28 - Aud…...

编程新知 2026/2/6 11:05:22

【Zephyr 系列 10】实战项目：打造一个蓝牙传感器终端 + 网关系统（完整架构与全栈实现）

🧠关键词：Zephyr、BLE、终端、网关、广播、连接、传感器、数据采集、低功耗、系统集成 📌目标读者：希望基于 Zephyr 构建 BLE 系统架构、实现终端与网关协作、具备产品交付能力的开发者 📊篇幅字数：约 5200 字 ✨ 项目总览在物联网实际项目中，**“终端 + 网关”**是…...

编程新知 2026/1/31 6:12:22

GitHub 趋势日报 (2025年06月08日)

📊 由 TrendForge 系统生成 | 🌐 https://trendforge.devlive.org/ 🌐 本日报中的项目描述已自动翻译为中文 📈 今日获星趋势图今日获星趋势图 884 cognee 566 dify 414 HumanSystemOptimization 414 omni-tools 321 note-gen …...

编程新知 2025/12/13 1:32:15

如何在最短时间内提升打ctf（web)的水平？

刚刚刷完2遍 bugku 的 web 题，前来答题。每个人对刷题理解是不同，有的人是看了writeup就等于刷了，有的人是收藏了writeup就等于刷了，有的人是跟着writeup做了一遍就等于刷了，还有的人是独立思考做了一遍就等于刷了。…...

编程新知 2026/1/28 5:55:15

让回归模型不再被异常值“带跑偏“，MSE和Cauchy损失函数在噪声数据环境下的实战对比

在机器学习的回归分析中，损失函数的选择对模型性能具有决定性影响。均方误差（MSE）作为经典的损失函数，在处理干净数据时表现优异，但在面对包含异常值的噪声数据时，其对大误差的二次惩罚机制往往导致模型参数…...

编程新知 2026/1/28 2:18:46

脑机新手指南（七）：OpenBCI_GUI：从环境搭建到数据可视化（上）

一、OpenBCI_GUI 项目概述 （一）项目背景与目标 OpenBCI 是一个开源的脑电信号采集硬件平台，其配套的 OpenBCI_GUI 则是专为该硬件设计的图形化界面工具。对于研究人员、开发者和学生而言，首次接触 OpenBCI 设备时，往…...

编程新知 2026/2/3 4:26:32

ffmpeg7.0 aac转pcm

相关文章：

ffmpeg7.0 aac转pcm

【Pandas】pandas Series rdiv

线程安全问题介绍

为AI聊天工具添加一个知识系统之27 支持边缘计算设备的资源存储库及管理器

初识verilog HDL

VS2015 + OpenCV + OnnxRuntime-Cpp + YOLOv8 部署

Notepad++上NppFTP插件的安装和使用教程

Kotlin | Android Provider 的实现案例

频域自适应空洞卷积FADC详解

Edge浏览器内置的截长图功能

GAN的应用

Math Reference Notes: 希腊字母表

高通，联发科（MTK）等手机平台调优汇总

Rust语言使用iced实现简单GUI页面

使用wav2vec 2.0进行音位分类任务的研究总结

25/1/11 嵌入式笔记＜esp32＞初入esp32

基于SMT32U575RIT单片机-中断练习

在Django的Serializer的列表数据中剔除指定元素

我喜欢的数学题

Redis解决热key问题

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

python/java环境配置

【Redis技术进阶之路】「原理分析系列开篇」分析客户端和服务端网络诵信交互实现（服务端执行命令请求的过程 - 初始化服务器）

Python爬虫（二）：爬虫完整流程

Java-41 深入浅出 Spring - 声明式事务的支持事务配置 XML模式 XML+注解模式

【Zephyr 系列 10】实战项目：打造一个蓝牙传感器终端 + 网关系统（完整架构与全栈实现）

GitHub 趋势日报 (2025年06月08日)

如何在最短时间内提升打ctf（web)的水平？

让回归模型不再被异常值“带跑偏“，MSE和Cauchy损失函数在噪声数据环境下的实战对比

脑机新手指南（七）：OpenBCI_GUI：从环境搭建到数据可视化（上）