h264 视频流中添加目标检测的位置、类型信息到SEI帧
在 H.264 视频编码中,SEI(Supplemental Enhancement Information)消息用于传输额外的、非编码的数据,例如目标检测的信息。SEI 数据可以嵌入到 H.264 流中,以在解码过程中传递这些附加信息。
一、步骤
-
确定 SEI 类型:定义用于传递目标检测信息的 SEI 类型。H.264 标准允许用户定义自定义 SEI 消息类型。你可以选择一个未被标准使用的 SEI 类型(例如,
0x1F是一个预留的 SEI 类型)或自定义类型。 -
创建 SEI 消息:
- 帧级 SEI:SEI 消息可以附加到视频帧中。需要在编码过程中生成 SEI 消息,并将其插入到 NAL 单元中。
- SEI 结构:SEI 消息通常包含一个类型字段和一个负载字段。你可以在负载字段中存储目标检测信息。
-
SEI 负载格式:目标检测信息可能包括目标的位置、类型等。可以使用以下格式之一(或设计自己的格式)来表示这些信息:
- 位置:可以使用目标的边界框(bounding box)来表示,如
(x, y, width, height)。 - 类型:用整数或字符串表示目标类型。
- 位置:可以使用目标的边界框(bounding box)来表示,如
-
插入 SEI 消息:将创建的 SEI 消息插入到 H.264 流中,通常是在 IDR 帧之前。SEI 消息是通过特定的 NAL 单元类型插入的,如
NAL_UNIT_SEI。
二、SEI 消息格式
假设 SEI 类型为 0x1F,并且负载格式为:
0x1F(SEI 类型)目标数量(1 字节)目标数据:目标类型(1 字节)位置(4 字节:x、y、width、height)
三、代码
#include <vector>// 定义 SEI 消息类型
const uint8_t SEI_TYPE_OBJECT_DETECTION = 0x1F;// 创建 SEI 消息
std::vector<uint8_t> create_object_detection_sei(const std::vector<std::tuple<int, int, int, int, uint8_t>>& detections) {std::vector<uint8_t> sei_message;sei_message.push_back(SEI_TYPE_OBJECT_DETECTION); // SEI 类型// 目标数量sei_message.push_back(static_cast<uint8_t>(detections.size()));// 目标数据for (const auto& detection : detections) {auto [x, y, width, height, type] = detection;sei_message.push_back(type); // 目标类型sei_message.push_back(static_cast<uint8_t>(x)); // xsei_message.push_back(static_cast<uint8_t>(y)); // ysei_message.push_back(static_cast<uint8_t>(width)); // widthsei_message.push_back(static_cast<uint8_t>(height)); // height}return sei_message;
}
相关文章:
h264 视频流中添加目标检测的位置、类型信息到SEI帧
在 H.264 视频编码中,SEI(Supplemental Enhancement Information)消息用于传输额外的、非编码的数据,例如目标检测的信息。SEI 数据可以嵌入到 H.264 流中,以在解码过程中传递这些附加信息。 一、步骤 确定 SEI 类型&…...
大模型api谁家更便宜
1 openai 可点此链接查询价格:https://openai.com/api/pricing/ 2 百度 可点此链接查询价格:https://console.bce.baidu.com/qianfan/chargemanage/list 需要注意,百度千帆平台上还提供其他家的模型调用服务, 如llama, yi-34b等…...
代码随想录算法训练营第二十三天| 455. 分发饼干、376. 摆动序列、53. 最大子序和
今日内容 贪心理论基础Leetcode. 455 分发饼干Leetcode. 376 摆动序列Leetcode. 53 最大子序和 贪心理论基础 贪心算法的本质就是选择每一阶段的最优,达到全局上的最优。 贪心算法和之前学到的所有方法相比,它没有固定的使用套路,也没有固…...
react js 路由 Router
完整的项目,我已经上传了 资料链接 起因, 目的: 路由, 这部分很难。 原因是, 多个组件,进行交互,复杂度比较高。 我看的视频教程 1. 初步使用 安装: npm install react-router-dom 修改 index.js/ 或是 main.js 把 App, 用 BrowserRouter 包裹起来 2. Navigate 点击…...
AplPost使用
请求get 方法 1,添加token 2,填写get 的参数 2,post方法 把对象的形式直接复制到row里面 3,delete方法 可以直接后面拼接参数...
【Qt】Qt与Html网页进行数据交互
前言:此项目使用达梦数据库,以Qt制作服务器,Html制作网页客户端界面,可以通过任意浏览器访问。 1、Qt与网页进行数据交互 1.1、第一步:准备qwebchannel.js文件 直接在qt的安装路径里复制即可 1.2、第二步…...
教师节特辑:AI绘制的卡通人物,致敬最可爱的人
【编号:9】教师节到了,今天我要分享一组由AI绘制的教师节主题卡通人物插画,每一幅都充满了对老师的敬意和爱戴。让我们一起用这些可爱的卡通形象,向辛勤的园丁们致敬! 🎓【教师形象】 这…...
SprinBoot+Vue智慧农业专家远程指导系统的设计与实现
目录 1 项目介绍2 项目截图3 核心代码3.1 Controller3.2 Service3.3 Dao3.4 application.yml3.5 SpringbootApplication3.5 Vue 4 数据库表设计5 文档参考6 计算机毕设选题推荐7 源码获取 1 项目介绍 博主个人介绍:CSDN认证博客专家,CSDN平台Java领域优质…...
AI大模型行业专题报告:大模型发展迈入爆发期,开启AI新纪元
大规模语言模型(Large Language Models,LLM)泛指具有超大规模参数或者经过超大规模数据训练所得到的语言模型。与传统语言模型相比,大语言模型的构建过程涉及到更为复杂的训练方法,进而展现出了强大的自然语言理解能力…...
FLV 格式详解资料整理,关键帧格式解析写入库等等
FLV 是一种比较简单的视频封装格式。大致可以分为 FLV 文件头,Metadata元数据,然后一系列的音视频数据。 资料够多: FLV格式解析图 知乎用户 Linux服务器研究 画了一张格式解析图,比较全,但默认背景是白色ÿ…...
《深度学习》OpenCV 高阶 图像直方图、掩码图像 参数解析及案例实现
目录 一、图像直方图 1、什么是图像直方图 2、作用 1)分析图像的亮度分布 2)判断图像的对比度 3)检测图像的亮度和色彩偏移 4)图像增强和调整 5)阈值分割 3、举例 二、直方图用法 1、函数用法 2、参数解析…...
coredump-N: stack 消耗完之后,用户自定义信号处理有些问题 sigaltstack
https://mzhan017.blog.csdn.net/article/details/129401531 在上面一篇是关于stack耗尽的一个小程序例子。 https://www.man7.org/linux/man-pages/man2/sigaltstack.2.html 这里提到一个问题,就是如果栈被用光了,这个时候SIGSEGV的用户自定义的handler处理可能就没有空间进…...
数据库有关c语言
数据库的概念 SQL(Structured Query Language)是一种专门用来与数据库进行交互的编程语言,它允许用户查询、更新和管理关系型数据库中的数据。关系型数据库是基于表(Table)的数据库,其中表由行(…...
【网页播放器】播放自己喜欢的音乐
// 错误处理 window.onerror function(message, source, lineno, colno, error) {console.error("An error occurred:", message, "at", source, ":", lineno);return true; };// 检查 particlesJS 是否已定义 if (typeof particlesJS ! undefi…...
【第27章】Spring Cloud之适配Sentinel
文章目录 前言一、准备1. 引入依赖2. 配置控制台信息 二、定义资源1. Controller2. Service3. ServiceImpl 三、访问控制台1. 发起请求2. 访问控制台 总结 前言 Spring Cloud Alibaba 默认为 Sentinel 整合了 Servlet、RestTemplate、FeignClient 和 Spring WebFlux。Sentinel…...
怎么debug python
1、打开pycharm,新建一个python程序,命名为excel.py。 2、编写代码。 3、点击菜单栏中的“Run”,在下拉菜单中选择“debug excel.py”或者“Debug...”,这两个功能是一样的,都是调试功能。 4、调试快捷键:C…...
Java 递归
目录 1.A方法调用B方法,很容易理解! 2.递归:A方法调用A方法,就是自己调用自己! 3. 递归的优点: 4. 递归结构包括两个部分: 5. 递归的三个阶段 6. 递归的缺点&#…...
获取业务库的schema信息导出成数据字典
获取业务库的schema信息导出成数据字典 场景:需要获取业务库的schema信息导出成数据字典,以下为获取oracle与mysql数据库的schema信息语句 --获取oracle库schema信息 selecttt1.owner as t_owner,tt1.table_name,tt1.column_name,tt1.data_type,tt1.dat…...
力扣: 快乐数
文章目录 需求分析代码结尾 需求 编写一个算法来判断一个数 n 是不是快乐数。 「快乐数」 定义为: 对于一个正整数,每一次将该数替换为它每个位置上的数字的平方和。 然后重复这个过程直到这个数变为 1,也可能是 无限循环 但始终变不到 1。 …...
一般位置下的3D齐次旋转矩阵
下面的矩阵虽然复杂,但它的逆矩阵求起来非常简单,只需要在 sin θ \sin\theta sinθ 前面加个负号就是原来矩阵的逆矩阵。 如果编程序是可以直接拿来用的,相比其它获取一般旋转轴不经过原点的三维旋转矩阵的途径或算法,应该能…...
告别百度云!手把手教你从Keil官网下载安装STM32全系列芯片支持包(附离线包备份技巧)
从Keil官网高效获取STM32芯片支持包的完整指南 为什么需要直接从Keil官网获取芯片支持包 在嵌入式开发领域,STM32系列微控制器因其出色的性能和丰富的生态系统而广受欢迎。然而,许多开发者在搭建开发环境时,往往习惯于从第三方网盘获取Keil M…...
HY-Motion 1.0从安装到出片:3步完成3D动画生成,小白友好教程
HY-Motion 1.0从安装到出片:3步完成3D动画生成,小白友好教程 想不想用几句话就让3D角色动起来?现在通过HY-Motion 1.0,你只需要输入文字描述,就能自动生成专业的3D骨骼动画。这篇文章将带你从零开始,用最简…...
从零搭建AI应用前端:微信小程序调用Qwen1.5-1.8B GPTQ模型API
从零搭建AI应用前端:微信小程序调用Qwen1.5-1.8B GPTQ模型API 最近在折腾一个挺有意思的项目,想给朋友做个能聊天的AI小程序。后端我选了个轻量但能力不错的模型——Qwen1.5-1.8B GPTQ,部署在星图GPU平台上,API接口已经调通了。接…...
清华大学LaTeX论文模板完整路线图:未来发展与功能规划指南
清华大学LaTeX论文模板完整路线图:未来发展与功能规划指南 【免费下载链接】thuthesis LaTeX Thesis Template for Tsinghua University 项目地址: https://gitcode.com/gh_mirrors/th/thuthesis 清华大学LaTeX论文模板(thuthesis)是清…...
别再用multiprocessing了!:用subinterpreter + shared_memory构建单进程10万QPS无锁API网关(附压测对比图)
第一章:Python 无锁 GIL 环境下的并发模型实战案例Python 的全局解释器锁(GIL)长期被视为 CPU 密集型并发的瓶颈,但现代 Python 生态已通过多进程、协程、外部 C 扩展及子解释器等机制,在特定场景下实现真正意义上的“…...
4个步骤掌握res-downloader HTTPS资源嗅探:从入门到精通
4个步骤掌握res-downloader HTTPS资源嗅探:从入门到精通 【免费下载链接】res-downloader 资源下载器、网络资源嗅探,支持微信视频号下载、网页抖音无水印下载、网页快手无水印视频下载、酷狗音乐下载等网络资源拦截下载! 项目地址: https://gitcode.c…...
文脉定序在Milvus向量库中的应用:Hybrid Search后重排序增强方案
文脉定序在Milvus向量库中的应用:Hybrid Search后重排序增强方案 在构建智能检索系统时,我们常常遇到一个尴尬的局面:系统能“搜得到”一堆结果,但最相关、最准确的答案却不一定排在最前面。这就像在图书馆里找到了正确的书架&am…...
抖音无水印下载工具:高效批量下载解决方案
抖音无水印下载工具:高效批量下载解决方案 【免费下载链接】douyin-downloader 项目地址: https://gitcode.com/GitHub_Trending/do/douyin-downloader 在短视频内容创作与数字资产管理领域,抖音平台的海量内容为创作者提供了丰富的素材来源。然…...
Mamba模型实战:如何用S6替代Transformer处理长文本(附代码示例)
Mamba模型实战:如何用S6替代Transformer处理长文本(附代码示例) 在自然语言处理领域,Transformer架构因其强大的注意力机制而长期占据主导地位。然而,当面对长文本处理任务时,Transformer的二次方计算复杂度…...
WeKnora在客服场景的应用:让新员工秒变产品专家
WeKnora在客服场景的应用:让新员工秒变产品专家 1. 客服行业的痛点与挑战 客服团队每天面临的核心挑战是如何快速准确地回答客户问题。特别是在以下场景中: 新产品上线:产品功能复杂,客服人员需要快速掌握数十页技术文档季节性…...
