当前位置：首页 > news >正文

ffmpeg取rtsp流音频数据保存声音为wav文件

news 2025/12/15 22:54:36

本来不是什么难搞的问题，代码写完了，音频流信息中的详细信息，具体代码表现为

format_ctx->streams[audio_stream_index]->codecpar是空指针。

这个查了一圈也没人给出正确答案，实际上是由于我自己编译的ffmpeg时候，开启的选项的导致的。把音频解码器相关的给禁掉了。重新开启相关编译选项，编译ffmpeg后，一切正常。

具体的选项为：

ffmpeg 交叉编译./configure --prefix=../arm-ffmpegbuild \
--enable-shared \
--enable-libmp3lame \--enable-libx264 \--enable-gpl \--disable-asm \--enable-version3 \--enable-libmp3lame \--enable-libx264 \--enable-libvpx \--enable-nonfree \--cross-prefix=aarch64-linux- \--target-os=linux \--extra-cflags="-I /opt/ffmpeg_test_make/lame-3.100/lamebuild/include" \--extra-ldflags="-L /opt/ffmpeg_test_make/lame-3.100/lamebuild/lib" \--enable-cross-compile \--enable-small \--arch=arm64 \--enable-decoder=h264 \--enable-parser=h264 \--enable-demuxer=rtsp \--extra-ldflags="-L ../x264build/lib" \--extra-cflags="-I ../x264build/include"lame交叉编译./configure \--host=aarch64-linux \--prefix=/opt/ffmpeg_test_make/lame-3.100/lamebuild \cc=aarch64-linux-gcc

话不多说上代码：


bool FfpDecoderWav::dump_wav(std::string rtsp_url, std::string file_path) {AVDictionary *format_options = NULL;av_dict_set(&format_options, "rtsp_transport", "tcp", 0); // 以tcp的方式打开,av_register_all();avformat_network_init();// 打开 RTSP 流int reconnect_times = 3;AVFormatContext *format_ctx = NULL;bool online = false;while (reconnect_times-- > 0) {if (format_ctx != NULL) {avformat_close_input(&format_ctx);format_ctx = NULL;}format_ctx = avformat_alloc_context();if (avformat_open_input(&format_ctx, rtsp_url.c_str(), NULL, &format_options) != 0) {Logger::error("open rtsp url:{} faile", rtsp_url);// std::this_thread::sleep_for(std::chrono::milliseconds(500));usleep(100000);} else {online = true;break;}}av_dict_free(&format_options); // 释放 format_optionsif (!online) {return false;}Logger::info("open rtsp url:{} for wav success", rtsp_url);// 查找音频流int audio_stream_index = -1;if (avformat_find_stream_info(format_ctx, NULL) < 0) {Logger::info("can not avformat_find_stream_info url:{}", rtsp_url);return false;}AVCodec *codec = NULL;audio_stream_index = av_find_best_stream(format_ctx, AVMEDIA_TYPE_AUDIO, -1, -1, &codec, 0);std::cout << "codec name :" << codec->name << std::endl;std::cout << "codec long_name :" << codec->long_name << std::endl;std::cout << "codec AVMediaType :" << (int)codec->type << std::endl;std::cout << "codec AVCodecID :" << (int)codec->id << std::endl;if (audio_stream_index < 0 || codec == NULL) {Logger::info("can not find sound stream rtsp url:{}", rtsp_url);return false;}Logger::info("find sound stream success index:{}", audio_stream_index);av_dump_format(format_ctx, 0, rtsp_url.c_str(), 0);bool had_audio_code = true;SwrContext *swr_ctx = NULL;AVCodecContext *codec_ctx = avcodec_alloc_context3(codec);if (format_ctx->streams[audio_stream_index]->codecpar) {Logger::info("avcodec_alloc_context3 success channels={}", codec_ctx->channels);Logger::info("avcodec_alloc_context3 success sample_rate={}", codec_ctx->sample_rate);// std::cout << "had codecpar inf" << std::endl;// printf("had codecpar inf\n");avcodec_parameters_to_context(codec_ctx, format_ctx->streams[audio_stream_index]->codecpar);if (avcodec_open2(codec_ctx, codec, NULL) < 0) {Logger::info("avcodec_open2 error rtsp url:{}", rtsp_url);return false;}Logger::info("avcodec_open2 success channels={}", codec_ctx->channels);Logger::info("avcodec_open2 success sample_rate={}", codec_ctx->sample_rate);// 创建重采样上下文swr_ctx = swr_alloc_set_opts(NULL, NUM_CHANNELS, AV_SAMPLE_FMT_S16, SAMPLE_RATE, codec_ctx->channels,codec_ctx->sample_fmt, codec_ctx->sample_rate, 0, NULL);Logger::info("swr_alloc_set_opts success");if (!swr_ctx || swr_init(swr_ctx) < 0) {// Logger::info("swr_init error rtsp url:{}", rtsp_url);return false;}} else {printf("cdecpar is nullodecpar is nullodecpar is nullodecpar is null\n");std::cout << "codecpar is null" << std::endl;had_audio_code = false;}// 创建输出 WAV 文件std::ofstream wav_file(file_path.c_str(), std::ios::binary);if (!wav_file) {// Logger::info("fopen local_path save wav failed path:{}", file_path);return false;}// Logger::info("open wav_file success");//  写入 WAV 文件头WAVHeader wav_header;unsigned int file_size = sizeof(wav_header);// Logger::info("wav_header size:{}", file_size);wav_file.write((const char *)&wav_header, file_size);time_t start_time = time(NULL);AVPacket packet;int ret = 0;int count = 1000;while (true) {if (ret = av_read_frame(format_ctx, &packet) < 0) {// Logger::info("av_read_frame failed: {}", ret);break;}time_t current_time = time(NULL);time_t duration = current_time - start_time;if (duration > 60) {// Logger::info("save sound end by 20 s time");break;}if (packet.stream_index == audio_stream_index) {if (!had_audio_code) {wav_file.write((char *)packet.data, packet.size);std::cout << "write sws data codecpar inf insfsjfjaslkjfas" << std::endl;printf(" wav_file.write((char *)packet.data, packet.size);\n");continue;}AVFrame *frame = av_frame_alloc();if (avcodec_send_packet(codec_ctx, &packet) >= 0 && avcodec_receive_frame(codec_ctx, frame) >= 0) {uint8_t *out_buffer[NUM_CHANNELS];int out_samples = 0;int out_size = 0;for (int i = 0; i < NUM_CHANNELS; i++) {out_buffer[i] = (uint8_t *)malloc(frame->nb_samples * 2 * sizeof(uint8_t));}out_samples = swr_convert(swr_ctx, out_buffer, frame->nb_samples, (const uint8_t **)frame->data,frame->nb_samples);out_size = out_samples * NUM_CHANNELS * 2;wav_file.write(reinterpret_cast<char *>(out_buffer[0]), out_size);// std::cout << "write sws data codecpar inf" << std::endl;// printf(" wav_file.write(reinterpret_cast<char *>(out_buffer[0]), out_siz22;\n");for (int i = 0; i < NUM_CHANNELS; i++) {free(out_buffer[i]);}}av_frame_free(&frame);}av_packet_unref(&packet);}// 更新 WAV 文件头中的数据大小uint32_t subchunk2Size = static_cast<unsigned int>(wav_file.tellp()) - 44;uint32_t chunkSize = subchunk2Size + 36;wav_file.seekp(4, std::ios::beg);wav_file.write(reinterpret_cast<char *>(&chunkSize), 4);wav_file.seekp(40, std::ios::beg);wav_file.write(reinterpret_cast<char *>(&subchunk2Size), 4);// 关闭文件wav_file.close();// 释放资源avcodec_close(codec_ctx);avcodec_free_context(&codec_ctx);avformat_close_input(&format_ctx);swr_free(&swr_ctx);// Logger::info("save local_path  wav success path:{}", file_path);return true;
}

wav格式的数据头文件：

struct WAVHeader {char chunkID[4] = {'R', 'I', 'F', 'F'};uint32_t chunkSize = 0;char format[4] = {'W', 'A', 'V', 'E'};char subchunk1ID[4] = {'f', 'm', 't', ' '};uint32_t subchunk1Size = 16;uint16_t audioFormat = 1;uint16_t numChannels = NUM_CHANNELS;uint32_t sampleRate = SAMPLE_RATE;uint32_t byteRate = SAMPLE_RATE * NUM_CHANNELS * 16 / 8;uint16_t blockAlign = 4;uint16_t bitsPerSample = 16;char subchunk2ID[4] = {'d', 'a', 't', 'a'};uint32_t subchunk2Size = 4;
};

最后，就是wav注意的地方，一共是两个值：

chunkSize 和subchunk2Size

// 更新 WAV 文件头中的数据大小

也就是说：subchunk2Size是出去wav文件头部数据意外的数据长度。

即文件总长度减去头部长度44个字节。

chunkSize=subchunk2Size+36

具体为什么，可以查看wav格式的说明。

ffmpeg取rtsp流音频数据保存声音为wav文件

本来不是什么难搞的问题，代码写完了，音频流信息中的详细信息，具体代码表现为 format_ctx->streams[audio_stream_index]->codecpar是空指针。这个查了一圈也没人给出正确答案，实际上是由于我自己编译的ffmpeg时候&#x…...

编程日记 2024/10/7 18:32:05

《数字图像处理基础》学习01-数字图像处理的相关基础知识

这篇文章只是对数字图像处理的相关基础知识有个大概的了解，之后的文章会接着补充和扩展。目录一，图像的基本概念 1，图像 2，图像的分类 1）物理图像 2）虚拟图像二，数字图像处理三&…...

编程日记 2024/10/7 18:30:03

C#-泛型学习笔记

C#泛型——约束|协变|逆变 1、泛型使用在生命时可以使用<>，可以写一个标识符代替一些数据类型，在声明时给出明确定义。非常强大，因此需要约束。 2、泛型约束 where T: struct//值类型约束，要求泛型必须为基本数据类型…...

编程日记 2024/10/7 18:29:02

Java第二阶段---11封装---第四节 static 修饰符

1.static 修饰符应用范围 static修饰符只能用来修饰类中定义的成员变量、成员方法、代码块以及内部类(内部类有专门章节进行讲解)。 2.static 修饰成员变量 static 修饰的成员变量称之为类变量。属于该类所有成员共享。示例 package cn.lyxq.test04;public class Chinese…...

编程日记 2024/10/7 18:26:00

【C/C++】错题记录（五）

题目一题目二在 16 位机器上，通常以 2 字节为边界对齐。首先看 char a，它占用 1 个字节。接着是 int b，占用 2 个字节。由于要满足边界对齐，在 char a后面会填充 1 个字节，使得 int b从 2 字节边界开始存储。最后是…...

编程日记 2024/10/7 18:23:57

关系数据库标准语言SQL（11,12）

目录带有EXISTS谓词的子查询 exists谓词例子 not exists谓词例子不同形式的查询间的替换用EXISTS/NOT EXISTS实现全称量词用EXISTS/NOT EXISTS:实现逻辑蕴涵集合查询并操作UNION 交操作INTERSECT 差操作EXCEPT 基于派生表的查询 select语句的基本格式带有…...

编程日记 2024/10/7 18:22:56

Oracle 11g RAC 节点异常重启问题分析

一、背景在国庆期间巡检的时候，发现数据库alert日志中出现了异常重启的信息，当即对该报错进行分析处理。二、处理过程 （1）数据库告警日志分析 node1 alert： Sat Oct 05 13:05:14 2024 Thread 1 advanced to log …...

编程日记 2024/10/7 18:17:50

vscode 中显示 pnpm : 无法加载文件 C:\Users\AppData\Roaming\npm\pnpm.ps1，因为在此系统上禁止运行脚本

vscode中运行pnpm报错 pnpm : 无法加载文件 C:\Users\AppData\Roaming\npm\pnpm.ps1，因为在此系统上禁止运行脚本解决办法如下 1、用 get-ExecutionPolicy 命令在vscode终端查询状态如果返回的是 Restricted ，则说明是禁止的 2、用 set-ExecutionPolic…...

编程日记 2024/10/7 18:16:49

C嘎嘎入门篇：类和对象番外（时间类）

前文： 小编在前文讲述了类和对象的一部分内容，其中小编讲述过运算符重载这个概念以及一个时间类，当时小编讲的没有那么细致，下面小编将会讲述时间类来帮助各位读者朋友更好的去理解运算符重载，那么，代码时刻…...

编程日记 2024/10/7 18:14:47

Spring Boot项目实战教程：快速构建Web应用与RESTful API

目录一、Spring Boot简介1、Spring Boot的定义2、Spring Boot的优势（1）快速开发（2）自动配置（3）微服务支持（4）无代码生成和XML配置（5）独立运行（6&…...

编程日记 2024/10/7 18:13:47

OpenAI 开发者大会！实时语音功能有API了，GPT-4o支持多模态微调，上下文cache功能上线

家人们！十一假期第1天， OpenAI一年一度的开发者大会又来了惹！今年的开发者大会分成三部分分别在美国、英国、新加坡三个地点举办，刚刚结束的是第一场。去年的OpenAI开发者大会公布了GPT-4 Turbo和GPTs，今年没有大更新…...

编程日记 2024/10/7 18:12:46

解决ros2 rviz Fixed Frame No TF data问题

新建一个终端，然后输入 ：map后的数字可以任意，100也可以。注意map与框架名称一致。 rosrun tf2_ros static_transform_publisher 0.0 0.0 0.0 0.0 0.0 0.0 map 5...

编程日记 2024/10/7 18:11:45

Python数据分析篇--NumPy--进阶

人有一种天生的、难以遏制的欲望，那就是在理解之前就评判。 -- 米兰昆德拉多维数组 1. 一维数组只有行，二维数组相比一维数组多了列这个维度，而三维数组则类似多个二维数组堆叠在一起，形如一个立方体。二维数组的创建 1. 二…...

编程日记 2024/10/7 18:10:44

基于Arduino的宠物食物分配器

创作本文的初衷是本人的一个养宠物的梦想（因为家里人对宠物过敏，因此养宠物的action一直没有落实），但是梦想总是要有的哈哈哈哈哈。上周正好是和一个很好的朋友见面，聊到了养宠物的事情，她大概是讲到了喂宠…...

编程日记 2024/10/7 18:00:34

make和Makefile

make是一个命令工具，用于读取并执行名为Makefile（makefile）的文件中定义的规则。 Makefile是一个文本文件，它告诉make哪些文件依赖于其他文件，以及如何从这些依赖项生成最终的目标文件。我们先简单看一下使用make的…...

编程日记 2024/10/7 17:56:30

4. 微分 4.4 复合函数求导法则及其应用【例4.4.3】 y e 1 cos ⁡ x ye^{\sqrt{1\cos x}} ye1cosx ，求 y ′ y y′ 【解】 y ′ e 1 cos ⁡ x ⋅ 1 2 1 cos ⁡ x ⋅ ( − sin ⁡ x ) − sin ⁡ x 2 1 cos ⁡ x e 1 cos ⁡ x ye^{\sqrt{1\cos x}}\cdot\f…...

编程日记 2024/10/7 17:53:27

【预备理论知识——2】深度学习：线性代数概述

简单地说，机器学习就是做出预测。线性代数线性代数是数学的一个分支，主要研究向量空间、线性方程组、矩阵理论、线性变换、特征值和特征向量、内积空间等概念。它是现代数学的基础之一，并且在物理学、工程学、计算机科学、经济学等领域有着…...

编程日记 2024/10/7 17:52:26

【目标检测】yolo的三种数据集格式

目标检测中数据集格式之间的相互转换--coco、voc、yolohttps://zhuanlan.zhihu.com/p/461488682?utm_mediumsocial&utm_psn1825483604463071232&utm_sourcewechat_session【目标检测】yolo的三种数据集格式https://zhuanlan.zhihu.com/p/525950939?utm_mediumsocial&…...

编程日记 2024/10/7 17:49:23

数据分析案例-机器学习工程师薪资数据可视化分析

🤵‍♂️ 个人主页：艾派森的个人主页 ✍🏻作者简介：Python学习者 🐋 希望大家多多支持，我们一起进步！😄 如果文章对你有帮助的话， 欢迎评论 💬点赞&#x1f4…...

编程日记 2024/10/7 17:44:17

Django连接Dify、ChatGPT4o并计算tokens数量方法

通过Dify可以连接很多模型国内、国外的都可以进行选择可以到Dify里创建一个空白应用，然后点击进入就可以看到API了api_url "http://192.168.15.131/v1/chat-messages" api_key "app-UtzTpVNwpTLUcGvRNnnK9QNY" headers {"Authorization…...

编程日记 2024/10/7 17:41:14

k8s从入门到放弃之Ingress七层负载

k8s从入门到放弃之Ingress七层负载在Kubernetes（简称K8s）中，Ingress是一个API对象，它允许你定义如何从集群外部访问集群内部的服务。Ingress可以提供负载均衡、SSL终结和基于名称的虚拟主机等功能。通过Ingress，你可…...

编程新知 2025/9/7 0:12:53

vue3 定时器-定义全局方法 vue+ts

1.创建ts文件路径：src/utils/timer.ts 完整代码： import { onUnmounted } from vuetype TimerCallback (...args: any[]) > voidexport function useGlobalTimer() {const timers: Map<number, NodeJS.Timeout> new Map()// 创建定时器con…...

编程新知 2025/8/9 0:31:20

从零实现STL哈希容器：unordered_map/unordered_set封装详解

本篇文章是对C学习的STL哈希容器自主实现部分的学习分享希望也能为你带来些帮助~ 那咱们废话不多说，直接开始吧！ 一、源码结构分析 1. SGISTL30实现剖析 // hash_set核心结构 template <class Value, class HashFcn, ...> class hash_set {ty…...

编程新知 2025/12/9 4:34:34

Spring数据访问模块设计

前面我们已经完成了IoC和web模块的设计，聪明的码友立马就知道了，该到数据访问模块了，要不就这俩玩个6啊，查库势在必行，至此，它来了。一、核心设计理念 1、痛点在哪应用离不开数据（数据库、No…...

编程新知 2025/12/3 23:08:18

RNN避坑指南：从数学推导到LSTM/GRU工业级部署实战流程

本文较长，建议点赞收藏，以免遗失。更多AI大模型应用开发学习视频及资料，尽在聚客AI学院。本文全面剖析RNN核心原理，深入讲解梯度消失/爆炸问题，并通过LSTM/GRU结构实现解决方案，提供时间序列预测和文本生成…...

编程新知 2025/12/15 20:52:13

是否存在路径（FIFOBB算法）

题目描述一个具有 n 个顶点e条边的无向图，该图顶点的编号依次为0到n-1且不存在顶点与自身相连的边。请使用FIFOBB算法编写程序，确定是否存在从顶点 source到顶点 destination的路径。输入第一行两个整数，分别表示n 和 e 的值（1…...

编程新知 2025/10/1 6:09:21

Docker 本地安装 mysql 数据库

Docker: Accelerated Container Application Development 下载对应操作系统版本的 docker ；并安装。基础操作不再赘述。打开 macOS 终端，开始 docker 安装mysql之旅第一步 docker search mysql 》〉docker search mysql NAME DE…...

编程新知 2025/12/15 1:34:44

Java数值运算常见陷阱与规避方法

整数除法中的舍入问题问题现象当开发者预期进行浮点除法却误用整数除法时，会出现小数部分被截断的情况。典型错误模式如下： void process(int value) {double half = value / 2; // 整数除法导致截断// 使用half变量 }此时...

编程新知 2025/9/29 10:54:34

TSN交换机正在重构工业网络，PROFINET和EtherCAT会被取代吗？

在工业自动化持续演进的今天，通信网络的角色正变得愈发关键。 2025年6月6日，为期三天的华南国际工业博览会在深圳国际会展中心（宝安）圆满落幕。作为国内工业通信领域的技术型企业，光路科技（Fiberroad&…...

编程新知 2025/12/14 23:52:18

高分辨率图像合成归一化流扩展

大家读完觉得有帮助记得关注和点赞！！！ 1 摘要我们提出了STARFlow，一种基于归一化流的可扩展生成模型，它在高分辨率图像合成方面取得了强大的性能。STARFlow的主要构建块是Transformer自回归流（TARFlow&am…...

编程新知 2025/12/12 0:29:05

ffmpeg取rtsp流音频数据保存声音为wav文件

相关文章：

ffmpeg取rtsp流音频数据保存声音为wav文件

《数字图像处理基础》学习01-数字图像处理的相关基础知识

C#-泛型学习笔记

Java第二阶段---11封装---第四节 static 修饰符

【C/C++】错题记录（五）

关系数据库标准语言SQL（11,12）

Oracle 11g RAC 节点异常重启问题分析

vscode 中显示 pnpm : 无法加载文件 C:\Users\AppData\Roaming\npm\pnpm.ps1，因为在此系统上禁止运行脚本

C嘎嘎入门篇：类和对象番外（时间类）

Spring Boot项目实战教程：快速构建Web应用与RESTful API

OpenAI 开发者大会！实时语音功能有API了，GPT-4o支持多模态微调，上下文cache功能上线

解决ros2 rviz Fixed Frame No TF data问题

Python数据分析篇--NumPy--进阶

基于Arduino的宠物食物分配器

make和Makefile

【数学分析笔记】第4章第4节复合函数求导法则及其应用（2）

【预备理论知识——2】深度学习：线性代数概述

【目标检测】yolo的三种数据集格式

数据分析案例-机器学习工程师薪资数据可视化分析

Django连接Dify、ChatGPT4o并计算tokens数量方法

k8s从入门到放弃之Ingress七层负载

vue3 定时器-定义全局方法 vue+ts

从零实现STL哈希容器：unordered_map/unordered_set封装详解

Spring数据访问模块设计

RNN避坑指南：从数学推导到LSTM/GRU工业级部署实战流程

是否存在路径（FIFOBB算法）

Docker 本地安装 mysql 数据库

Java数值运算常见陷阱与规避方法

TSN交换机正在重构工业网络，PROFINET和EtherCAT会被取代吗？

高分辨率图像合成归一化流扩展