当前位置: 首页 > article >正文

3D CNN 网络结构

在8.4节内容中我们详细介绍了一种用于对时空数据进行特征提取的ConvLSTM模型其有效地结合了RNN和CNN各自的优点对输入数据在时间和空间两个维度进行建模。在接下来的这节内容中将会介绍另外一种拓展自传统卷积网络的3D卷积模型来对时空数据进行特征提取。在传统的卷积神经网络中卷积操作可以直接用于对二维图像数据进行特征提取但是对于类似视频这样的时空数据却不能对其时间维度上的信息进行建模。在时空数据中原始数据是由一系列连续的帧二维图像组成每一帧内部包含了空间信息而帧与帧之间还存在时间关系因此传统的二维CNN只能对单独的帧进行处理而无法捕捉到帧与帧之间的时序特征。基于这样的动机姬水旺[1]等人在2014年提出了一种同时能够考虑时序信息的卷积模型3D Convolutional Neural Network, 3DCNN。3DCNN的基本结构与传统的CNN类似由多个卷积层、池化层和全连接层组成但是3DCNN在卷积操作中使用了3D卷积核同时在池化操作中同时考虑了时间和空间维度这使得3DCNN能够捕捉数据中的时空特征并在处理时间序列或空间序列数据时更加有效。8.5.2 3DCNN结构1. 卷积层在3DCNN中其核心部分便是其中的三维卷积操作。根据8.4.2节内容可知时空数据一共包含有4个维度即长度、宽度、通道数和时序长度。因此在3DCNN中卷积层对输入数据进行卷积操作时除了像二维卷积一样需要在长度和宽上进行滑动还需要以固定深度在时序长度这个维度上进行滑动并在每个位置上与输入数据进行逐元素相乘求和从而生成输出特征图。如图8-7所示从上到下依次为2D卷积对单帧数据、2D卷积对多帧数据和3D卷积对多帧数据的特征提取过程。图 8-7 2D卷积与3D卷积对比图[2]在图8-7(a)中使用卷积核通道数为单个数据帧帧通道数的2D维卷积对单帧数据进行特征提取后得到的仍旧只是一个数据帧在图8-7(b)中使用卷积核通道数为单帧通道数乘以数据帧数的2D卷积后得到的也只是一个数据帧在图8-7(c)中使用卷积核通道数为$d(d图8-8 3D卷积计算示例图如图8-8所示左侧为原始的输入数据和卷积核对于输入数据来说一共包含有5帧其中每一帧中有2个特征通道右侧为3D卷积计算结果后的结果一共包含有4帧每一帧有3个特征通道。由此可知对于3D卷积来说卷积核可通过长度、宽度、通道数、深度和卷积核个数这个5个维度来进行表示。例如对于图8-8中的示例来说该卷积核的长度和宽度均为、通道数和深度均为2、卷积核的个数为3对应的便是输出的3个通道。2. 计算示例在清楚3D卷积的计算原理后我们再通过一个实际的计算示例来体会整个计算过程。现在假定原始输入数据有3帧其中每一帧有2个特征通道长宽均为5即形状为[in_channels, frame_len, height, width]卷积核个数为2长宽均为3深度为2即形状为[out_channels, in_channels, depth, height, width]。整体相关信息如图8-9所示。图8-9 3D卷积输入和卷积核示意图如图8-9所示左侧便是原始的输入数据帧其形状为[2,3,5,5]右侧有为卷积核与偏置其中卷积核的形状为[2,2,2,3,3]。由此可知在不进行填充的情况下3D卷积最终计算完成后特征图一共包含有2帧每一帧的长宽均为3特征通道数为2。进一步3D卷积的计算过程可以通过图8-10来进行表示。图8-10 3D卷积计算示意图如图8-10所示对于第1个卷积核来说第1帧的第1个值3的计算过程如式(8-2)所示。可以发现其计算过程同2D卷积类似即卷积核每个位置上与输入数据进行逐元素相乘求和。同理第2帧的最后一个值36的计算过程如式(8-3)所示。在完成第1个卷积核的计算过程后可以根据同样的做法再次完成第2个卷积核的计算过程最终得到的计算结果如图8-11所示。图8-11 3D卷积计算结果图如图8-11所示便是最后计算得到的结果其形状为[out_channels, frame_len_out, h_out, w_out]即[2,2,3,3]。以上完成计算示例代码可参见Code/Chapter08/C06_3DCNN/main.py文件。

相关文章:

3D CNN 网络结构

在8.4节内容中,我们详细介绍了一种用于对时空数据进行特征提取的ConvLSTM模型,其有效地结合了RNN和CNN各自的优点对输入数据在时间和空间两个维度进行建模。在接下来的这节内容中将会介绍另外一种拓展自传统卷积网络的3D卷积模型来对时空数据进行特征提取…...

17.3【保姆级教程】宏和函数的选择:时间与空间的权衡,新手不踩坑指南

📢 专栏持续更新中!关注博主不迷路,跟着专栏系统学C语言底层开发,从语法入门到工程实战,逐章拆解,保姆级讲解,刚入门的同学跟着学,全程零压力~ 上一节我们详细掌握了 #de…...

别再让el-input-number坑你了!手把手教你处理Vue+ElementUI表单中的‘空值’与‘零值’

深度解析VueElementUI表单中空值与零值的工程化处理方案 在VueElementUI构建的企业级表单应用中,数字输入框el-input-number的默认行为常常让开发者陷入业务逻辑的陷阱。当用户未填写时显示为0,这种看似合理的默认处理,却可能引发数据语义的…...

在RK3588开发板上,用TVM调用Mali-G610 GPU跑ONNX模型,实测性能提升多少?

在RK3588开发板上用TVM调用Mali-G610 GPU跑ONNX模型的性能实测 RK3588作为一款高性能嵌入式处理器,其集成的Mali-G610 GPU为AI推理提供了硬件加速能力。本文将带您完成从环境搭建到性能对比的全流程实测,用数据揭示GPU加速的真实效果。 1. 测试环境搭建…...

告别按键抖动!用三行C语言代码实现单片机按键扫描(附STM32移植教程)

三行代码重构按键检测:嵌入式开发中的高效消抖方案 在嵌入式系统开发中,按键处理看似简单却暗藏玄机。许多开发者都经历过这样的困境:明明代码逻辑正确,按键响应却时而灵敏时而迟钝,甚至出现"一次按下多次触发&qu…...

【花雕动手做】行空板K10 mimiclaw开源项目调试全记录:从崩溃报错到全功能可用的踩坑复盘

今日核心任务:调试 行空板K10 上的 mimiclaw 开源项目(项目名:k10_mimiclaw),该项目基于行空板K10搭载的 ESP32-S3 芯片开发,属于AI智能体开源项目,核心目标是解决项目启动崩溃、串口无响应、WiFi 配网及多功能配置问题,最终实现 WiFi、LLM、博查(Tavily)、飞书机器人…...

专业级Windows风扇控制方案:FanControl模块化配置指南

专业级Windows风扇控制方案:FanControl模块化配置指南 【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Trending/fa…...

传统代工企业转型跨境,月销72万刀!

当跨境电商风口正劲时,在国际市场需求的拉动下,很多传统外贸工厂寻求新的转型路径。随着传统工厂转型跨境电商的风潮一阵强过一阵,近来布局独立站也成为他们转型的重要选择之一。此前,工厂是做出产品再给到外贸公司、采购商去销售…...

LDBlockShow:快速高效的连锁不平衡热图绘制终极指南

LDBlockShow:快速高效的连锁不平衡热图绘制终极指南 【免费下载链接】LDBlockShow LDBlockShow: a fast and convenient tool for visualizing linkage disequilibrium and haplotype blocks based on VCF files 项目地址: https://gitcode.com/gh_mirrors/ld/LDB…...

SpringBoot定时任务踩坑记:ThreadPoolTaskScheduler默认线程池只有1个,你的任务还在排队吗?

SpringBoot定时任务线程池陷阱:从单线程阻塞到高性能调优实战 凌晨三点,服务器监控突然告警——核心业务报表生成任务延迟了47分钟。排查日志发现,原本应该每小时执行的数据同步任务和报表生成任务竟然串行执行。这一切的罪魁祸首&#xff0c…...

网络诊断工具怎么选:从看到异常到真正定位根因的实战方法

网络诊断工具怎么选:从看到异常到真正定位根因的实战方法 很多团队买了监控、也做了告警,但一到“网页能打开、系统却很慢”“丢包不高、业务却卡顿”“链路看起来正常、用户却持续投诉”这种场景,还是容易陷入同一个困局:看到了异…...

指挥多个 AI 编程助手同时干活的工具

👉 这是一个或许对你有用的社群 🐱 一对一交流/面试小册/简历优化/求职解惑,欢迎加入「芋道快速开发平台」知识星球。下面是星球提供的部分资料: 《项目实战(视频)》:从书中学,往事…...

XGBoost决策树可视化:Python实战与原理详解

1. 项目概述:XGBoost决策树可视化实战指南在机器学习的实战领域,梯度提升决策树(GBDT)因其卓越的预测性能而广受欢迎,而XGBoost作为其优化实现更是成为数据科学竞赛中的常胜将军。但模型的可解释性一直是复杂集成算法的…...

保姆级教程:在VMware 17 Pro上绕过TPM 2.0,顺利安装Windows 11专业版

虚拟机玩家必备:VMware 17 Pro安装Win11全攻略与TPM绕过技巧 每次Windows重大版本更新,总有一批技术爱好者迫不及待想尝鲜。Windows 11带来的全新界面和功能确实诱人,但那个恼人的TPM 2.0要求却把不少用户挡在了门外。别担心,今天…...

百度网盘macOS终极提速指南:免费解锁SVIP高速下载的完整方案

百度网盘macOS终极提速指南:免费解锁SVIP高速下载的完整方案 【免费下载链接】BaiduNetdiskPlugin-macOS For macOS.百度网盘 破解SVIP、下载速度限制~ 项目地址: https://gitcode.com/gh_mirrors/ba/BaiduNetdiskPlugin-macOS 还在为百度网盘的龟速下载而烦…...

050、综合项目实战二:基于FreeRTOS的实时数据采集与控制系统

050、综合项目实战二:基于FreeRTOS的实时数据采集与控制系统 从一次诡异的采样丢帧说起 上周在产线调试,发现采集到的温度数据偶尔会跳变到零值。逻辑分析仪抓了半天,发现是ADC任务被某个不知名的任务抢占了,采样窗口错过了一个周期。这种问题在裸机轮询里很难出现,但在…...

3个常见GPS轨迹问题,GPX Studio如何帮你轻松解决?

3个常见GPS轨迹问题,GPX Studio如何帮你轻松解决? 【免费下载链接】gpxstudio.github.io The online GPX file editor 项目地址: https://gitcode.com/gh_mirrors/gp/gpxstudio.github.io 你是否曾经花费数小时整理户外活动的GPS轨迹数据&#xf…...

2026年大模型选购指南:免费与性价比篇

2026年大模型选购指南:免费与性价比篇从免费开源到付费旗舰,一次性讲清楚2026年大模型选择逻辑前言 2026年的大模型市场,已经从“哪家最强”转向“哪家最值”。本文基于Artificial Analysis最新排行榜数据,结合实际使用体验&#…...

Web基础(四):HttpServletRequest对象

一、常用方法1. getRequestURL() //获取请求时的完整路径(从http开始,到?前结束)2. getRequestURI() //获取请求时的部分路径(从站点名开始,到?前结束)3. getContextPath() //获取站…...

C语言内存漏洞TOP5正在被AI自动利用!2026规范新增3层防御机制(含编译器插桩+运行时沙箱)

更多请点击: https://intelliparadigm.com 第一章:现代 C 语言内存安全编码规范 2026 报错解决方法 随着 C23 标准落地及静态分析工具(如 Clang Static Analyzer、GCC 14 -fanalyzer 和 Microsoft SAL2)对内存安全的强化校验&…...

终极Redis可视化指南:告别命令行恐惧,拥抱高效数据管理新时代

终极Redis可视化指南:告别命令行恐惧,拥抱高效数据管理新时代 【免费下载链接】AnotherRedisDesktopManager 🚀🚀🚀A faster, better and more stable Redis desktop manager [GUI client], compatible with Linux, Wi…...

别再被‘No module named torch’坑了!手把手教你用conda搞定flash_attn 1.0.7安装

深度学习环境配置实战:用conda优雅解决flash_attn依赖冲突 在深度学习项目开发中,依赖管理就像走钢丝——稍有不慎就会陷入"ModuleNotFoundError"的泥潭。最近一位同事在安装flash_attn 1.0.7时遇到的No module named torch错误,表…...

食品喷码检测实战:Java+YOLOv11准确率99.2%,延迟不到30ms

做工业视觉落地快6年了,食品包装喷码识别是我做过最多的项目之一。几乎所有食品厂都有这个需求,但90%的项目都做得不好:传统OCR对模糊、变形、倾斜的喷码识别准确率只有60%-70%,每天需要安排大量人工复检,漏检的产品流到市场就是巨额的召回损失。 去年我帮某知名乳制品厂…...

歌词制作终极指南:5分钟掌握LRC Maker高效制作同步歌词

歌词制作终极指南:5分钟掌握LRC Maker高效制作同步歌词 【免费下载链接】lrc-maker 歌词滚动姬|可能是你所能见到的最好用的歌词制作工具 项目地址: https://gitcode.com/gh_mirrors/lr/lrc-maker 你是否曾经为了给心爱的歌曲制作同步歌词而烦恼&…...

JetBrains IDE 试用期重置完全指南:30天无限续期的终极方案

JetBrains IDE 试用期重置完全指南:30天无限续期的终极方案 【免费下载链接】ide-eval-resetter 项目地址: https://gitcode.com/gh_mirrors/id/ide-eval-resetter 还在为JetBrains IDE的30天试用期到期而烦恼吗?ide-eval-resetter 是一款专为开…...

西安财经大学MPAcc复试真汇总(2015-2025)Word高清版|备考专用资料包

温馨提示:文末有联系方式一、资料权威性说明 本套真合集由上岸学长学姐一手搜集并系统梳理,覆盖西安财经大学会计专业硕士(MPAcc)近十年复试核心考(2015—2025届),来源真实可靠,非网…...

408复试通关指南:从协议栈到内存管理的核心脉络

1. 计算机网络核心脉络梳理 计算机网络是408复试中的重点考察模块,尤其对于跨考生来说,这部分内容往往成为面试中的"拦路虎"。我在辅导考生的过程中发现,掌握协议栈的纵向逻辑比死记硬背协议细节更重要。让我们用"快递寄件&qu…...

AzurLaneAutoScript完整指南:碧蓝航线终极自动化脚本快速上手

AzurLaneAutoScript完整指南:碧蓝航线终极自动化脚本快速上手 【免费下载链接】AzurLaneAutoScript Azur Lane bot (CN/EN/JP/TW) 碧蓝航线脚本 | 无缝委托科研,全自动大世界 项目地址: https://gitcode.com/gh_mirrors/az/AzurLaneAutoScript 你…...

Word 自动保存失效、文档异常卡顿怎么办?一文解决 Cobra DocGuard 加载项干扰问题

🔥个人主页:杨利杰YJlio❄️个人专栏:《Sysinternals实战教程》《Windows PowerShell 实战》《WINDOWS教程》《IOS教程》《微信助手》《锤子助手》 《Python》 《Kali Linux》 《那些年未解决的Windows疑难杂症》🌟 让复杂的事情更…...

从光电效应实验到Python数据可视化:用Matplotlib复现普朗克常量测量全过程

从光电效应实验到Python数据可视化:用Matplotlib复现普朗克常量测量全过程 当金属板在特定频率的光照射下突然逸出电子时,这个被称为"光电效应"的现象不仅颠覆了经典物理学的认知,更为量子理论奠定了基础。如今,我们不仅…...