当前位置: 首页 > article >正文

ResNet50V2学习笔记

本文为365天深度学习训练营 中的学习记录博客 原作者K同学啊一、前期准备importtorchimporttorch.nnasnnimporttorch.optimasoptim二、定义残差块classResidualBlockV2(nn.Module):expansion4def__init__(self,in_channels,out_channels,stride1):super(ResidualBlockV2,self).__init__()# 预激活Pre-activationself.bn1nn.BatchNorm2d(in_channels)self.relunn.ReLU(inplaceTrue)# 主干道三层卷积self.conv1nn.Conv2d(in_channels,out_channels,kernel_size1,stridestride,biasFalse)self.bn2nn.BatchNorm2d(out_channels)self.conv2nn.Conv2d(out_channels,out_channels,kernel_size3,padding1,biasFalse)self.bn3nn.BatchNorm2d(out_channels)self.conv3nn.Conv2d(out_channels,out_channels*self.expansion,kernel_size1,biasFalse)# 捷径如果形状对不上就用1x1卷积修一下self.shortcutnn.Sequential()ifstride!1orin_channels!out_channels*self.expansion:self.shortcutnn.Conv2d(in_channels,out_channels*self.expansion,kernel_size1,stridestride,biasFalse)defforward(self,x):# 先激活再分叉pre_actself.relu(self.bn1(x))shortcutself.shortcut(pre_act)outself.conv1(pre_act)outself.conv2(self.relu(self.bn2(out)))outself.conv3(self.relu(self.bn3(out)))# 直接相加后面没有激活函数这就是V2returnoutshortcut三、组装完整的ResNet-50V2模型classResNet50V2(nn.Module):def__init__(self,num_classes2):super(ResNet50V2,self).__init__()self.in_channels64# 开头的特征提取层self.conv1nn.Conv2d(3,64,kernel_size7,stride2,padding3,biasFalse)self.bn1nn.BatchNorm2d(64)self.relunn.ReLU(inplaceTrue)self.maxpoolnn.MaxPool2d(kernel_size3,stride2,padding1)# 堆叠50层的四个阶段self.layer1self._make_layer(64,3,stride1)self.layer2self._make_layer(128,4,stride2)self.layer3self._make_layer(256,6,stride2)self.layer4self._make_layer(512,3,stride2)# 最后的输出层self.bnnn.BatchNorm2d(2048)self.avgpoolnn.AdaptiveAvgPool2d((1,1))self.fcnn.Linear(2048,num_classes)def_make_layer(self,out_channels,blocks,stride):layers[ResidualBlockV2(self.in_channels,out_channels,stride)]self.in_channelsout_channels*4for_inrange(1,blocks):layers.append(ResidualBlockV2(self.in_channels,out_channels))returnnn.Sequential(*layers)defforward(self,x):xself.maxpool(self.relu(self.bn1(self.conv1(x))))xself.layer4(self.layer3(self.layer2(self.layer1(x))))xself.fc(torch.flatten(self.avgpool(self.relu(self.bn(x))),1))returnx四、测试模型if__name____main__:print(正在组装 ResNet-50 V2)modelResNet50V2(num_classes2)print(正在生成一张虚拟的医学 X 光片送入模型...)dummy_inputtorch.randn(2,3,224,224)outputmodel(dummy_input)print(PyTorch 代码翻译成功模型结构正确)print(f模型的输出形状为:{output.shape}(预期看到的是 torch.Size([2, 2])))五、总结本周我们完成了两大任务理论升级理解ResNet-V2架构为何优于 V1。框架迁移将模型代码从TensorFlow翻译成PyTorch风格。一、 理论篇ResNet-V1 vs ResNet-V2 的区别这两代网络的核心区别在于激活函数ReLU和归一化Batch Normalization, BN放置的位置。对比维度ResNet-V1 (后激活 Post-activation)ResNet-V2 (预激活 Pre-activation)操作顺序卷积(Conv) - 归一化(BN) - 激活(ReLU)归一化(BN) - 激活(ReLU) - 卷积(Conv)合并点后捷径(Shortcut)与主路相加后还要经过一次 ReLU。捷径(Shortcut)与主路相加后直接输出无 ReLU。反向传播梯度Gradient回传时容易被最后的 ReLU 阻挡导致梯度消失。梯度可以通过捷径无损回传畅通无阻。最终效果网络深度通常局限在 100-200 层左右。彻底打破深度限制可以训练1000 层以上的超深网络。V2 的精髓就是“预激活Pre-activation”把处理数据的操作提前。它的终极目的就是为了保持“捷径Shortcut/Skip Connection”的绝对纯净。只要捷径上没有激活函数拦路模型犯错后的“纠错信号梯度”就能完美传回前面的层。二、 代码篇PyTorch 的“造车逻辑”从 TensorFlow 换到 PyTorch最大的感受是代码变得更加“面向对象基于 Class 类”。写一个 PyTorch 模型的标准动作分为两步__init__(初始化函数) —— 准备零件库在这里我们把所有要用到的层卷积层Conv2d、归一化层BatchNorm2d、激活函数ReLU、全连接层Linear全部定义好。注意这里只是把零件买回来还没有组装。forward(前向传播函数) —— 流水线组装在这里我们规定数据x进入模型后先经过哪个零件再经过哪个零件最后如何输出。这也是为什么捷径的加法out shortcut是写在forward里面的。三、 工程篇工业级架构测试技巧虚拟输入Dummy Input在工程实践中刚写完一个庞大的模型如 50 层的 ResNet我们不会立刻用真实数据集去训练Training。结构验证Architecture Validation我们会生成一个形状一致的随机张量例如torch.randn(2, 3, 224, 224)代表 2 张 224x224 的 3 通道图片将其送入模型进行一次前向传播Forward Pass。结论如果代码能在 1 秒钟内跑通并且输出的张量形状Tensor Shape符合预期如[2, 2]代表 2 张图2 个分类概率这就证明我们的网络架构在逻辑上 100% 正确没有维度不匹配的 Bug。四、 拓展资料V2 思想的跨领域迁移ResNet-V2 的“预激活Pre-activation”思想其本质是为了防止深度网络退化必须清除恒等映射路径主通道上的阻碍。这个思想不仅在图像识别CV界称王还跨界统治了自然语言处理NLP界当今最火的大语言模型如 GPT、BERT 内部的Transformer架构早期使用的是Post-LN后置层归一化网络很难加深。后来全面改用Pre-LN前置层归一化这与 ResNet-V2 的预激活思想如出一辙从而造就了今天几百上千层、参数量千亿级别的超级 AI。

相关文章:

ResNet50V2学习笔记

🍨 本文为🔗365天深度学习训练营 中的学习记录博客🍖 原作者:K同学啊 一、前期准备 import torch import torch.nn as nn import torch.optim as optim二、定义残差块 class ResidualBlockV2(nn.Module):expansion 4def __ini…...

【嵌入式IDE迁移避坑白皮书】:告别Keil/IAR!用VSCode实现同等专业级调试能力——含反汇编窗口同步、RTOS线程视图、硬件断点精准控制

更多请点击: https://intelliparadigm.com 第一章:嵌入式开发环境迁移的战略价值与技术全景 嵌入式开发环境迁移已从单纯工具链升级演进为系统性工程能力重构。随着芯片架构多元化(ARM Cortex-M/R/A、RISC-V、Xtensa)、RTOS生态分…...

仅限首批200家三甲医院技术科获取的VSCode医疗校验配置包(含NMPA审评要点映射表)

更多请点击: https://intelliparadigm.com 第一章:VSCode医疗校验配置包的权威性与临床合规价值 VSCode医疗校验配置包并非通用开发插件,而是由国家药品监督管理局(NMPA)认证医疗器械软件质量评估机构联合HL7 China工…...

N_m3u8DL-RE:跨平台流媒体下载工具的完整技术解析与实战指南

N_m3u8DL-RE:跨平台流媒体下载工具的完整技术解析与实战指南 【免费下载链接】N_m3u8DL-RE Cross-Platform, modern and powerful stream downloader for MPD/M3U8/ISM. English/简体中文/繁體中文. 项目地址: https://gitcode.com/GitHub_Trending/nm3/N_m3u8DL…...

claude code高级使用手册

1. shift tab 切换模式,包括accept edits on、plan mode on和默认模式三种2. 在claude code中输入 ! 能够进入bash模式,可以输入终端命令执行,比如ls,如果要打开文件可以使用start 文件名,mac用户请使用open 文件名…...

Docker容器内VSCode Server启动失败?手把手复现并修复OCI runtime error(含strace日志溯源全过程)

更多请点击: https://intelliparadigm.com 第一章:Docker容器内VSCode Server启动失败?手把手复现并修复OCI runtime error(含strace日志溯源全过程) 当在 Alpine 或最小化镜像中运行 VSCode Server(如 co…...

C语言goto语句label标签用法详解,新手必看

在Visual Studio 2015发布之际,与之相关的学习资源呈现出不够充足的状况。本文会对在这个平台上学习C语言的系列教程经验做系统的介绍。鉴于视频制作以及修改所需要的周期比较长,当下先推出文字版的内容,这样方便能够及时地进行更新以及完善。…...

基于Simulink的拓展卡尔曼滤波:估计路面附着系数并使用EKF算法基于Matlab,包含道...

基于simulink的拓展卡尔曼滤波的估计路面附着系数估算,ekf算法基于matlab 内含道夫轮胎模型,七自由度车辆模型,非carsim联合仿真,运行结果如下各个输出收敛,效果不错直接上干货!这次咱们聊聊怎么用Simulink…...

VSCode编辑卡顿到想砸键盘?立即执行这7步诊断流程,95%问题3分钟闭环

更多请点击: https://intelliparadigm.com 第一章:VSCode编辑卡顿到想砸键盘?立即执行这7步诊断流程,95%问题3分钟闭环 VSCode 卡顿往往不是单一原因导致,而是扩展、配置、系统资源与工作区状态交织作用的结果。以下…...

【西里网】遇到的 Missing config 错误是因为 OpenClaw 找不到配置文件

你遇到的 **Missing config** 错误是因为 OpenClaw 找不到配置文件。你之前检查的 Docker 卷 openclaw-workspace 是空的,所以没有配置可用。## 解决方法### 1️⃣ 快速绕过(适合测试) 直接让 OpenClaw 运行在非受控模式: bash op…...

别再只用布尔了!3Dmax里给模型开圆孔的7种实用方法,从新手到高手都能用

别再只用布尔了!3Dmax里给模型开圆孔的7种实用方法,从新手到高手都能用 在3D建模的世界里,给模型开孔是最基础却也是最考验技巧的操作之一。很多初学者会习惯性地依赖布尔运算,但往往在复杂模型上遭遇破面、布线混乱等问题。实际上…...

基于YOLOv26深度学习算法的社区路灯故障检测系统研究与实现

文章目录 基于YOLOv26深度学习算法的社区路灯故障检测系统研究与实现 一、研究背景和意义 二、相关技术介绍 2.1 路灯管理现状 2.2 YOLOv26目标检测算法 2.3 路灯状态识别技术 三、基于YOLOv26的社区路灯故障检测算法研究实现方法 3.1 系统架构设计 3.2 数据集构建 3.3 路灯检测…...

vue2 和 vue3 的核心区别

vue2 和 vue3 的核心区别 Vue3 是 Vue2 的重构升级版本,基于全新的架构设计,在性能、开发体验、语法规范、工程化等方面都有质的提升,以下是两者最核心的区别: 一、核心架构与设计理念维度Vue2Vue3源码实现基于 Options API&#…...

Qianfan-OCR企业实操:合同文档表格Markdown识别+条款抽取落地案例

Qianfan-OCR企业实操:合同文档表格Markdown识别条款抽取落地案例 1. 项目背景与价值 在企业的日常运营中,合同文档处理是一项耗时且容易出错的工作。传统OCR技术通常只能实现简单的文字识别,对于复杂的合同文档结构(如表格、条款…...

如何永久保存微信聊天记录并生成个性化年度报告

如何永久保存微信聊天记录并生成个性化年度报告 【免费下载链接】WeChatMsg 提取微信聊天记录,将其导出成HTML、Word、CSV文档永久保存,对聊天记录进行分析生成年度聊天报告 项目地址: https://gitcode.com/GitHub_Trending/we/WeChatMsg 你是否曾…...

Jetson Xavier NX开机慢?试试调整UEFI这3个设置,启动速度立竿见影

Jetson Xavier NX开机优化实战:3个UEFI设置让启动速度提升200% 每次按下Jetson Xavier NX的电源键,看着屏幕上缓慢滚动的启动日志,你是否也经历过那种等待的煎熬?作为一款定位边缘计算的高性能模组,NX的启动速度与其强…...

从混淆矩阵到决策曲线:用Matplotlib一步步拆解DCA背后的净获益计算

从混淆矩阵到决策曲线:用Matplotlib拆解DCA的净获益计算 在医疗诊断和风险评估领域,我们常常需要判断一个预测模型是否真正具有临床价值。传统指标如准确率、AUC值虽然能反映模型性能,却无法回答一个关键问题:**使用这个模型做决策…...

Mixly编译ESP32程序头文件缺失:bits/c++config.h的根源分析与修复

1. 当Mixly遇上ESP32:头文件缺失的典型症状 第一次在Mixly里编译ESP32程序时看到bits/cconfig.h报错,我差点以为电脑中毒了。这个错误通常出现在你刚安装完Mixly,兴冲冲准备点亮第一个LED的时候。编译窗口突然弹出一堆红色错误,最…...

AI SoC全芯片DFT实战

01景芯DFT实战课景芯团队DFT专家老师授课,一对一辅导,主打文档服务器实战,通过3个系列课程依次完成HD6850各个关键子系统的DFT设计实战后,再完成下图全芯片TOP DFT实战,让您快速超越同龄人!我们不卖视频&am…...

3步轻松配置TTS-Vue桌面语音合成工具完整指南

3步轻松配置TTS-Vue桌面语音合成工具完整指南 【免费下载链接】tts-vue 🎤 微软语音合成工具,使用 Electron Vue ElementPlus Vite 构建。 项目地址: https://gitcode.com/gh_mirrors/tt/tts-vue TTS-Vue是一款基于微软语音合成技术构建的开源…...

Nucleus Co-Op技术解密:单机游戏分屏多人的创新突破与完整实现指南

Nucleus Co-Op技术解密:单机游戏分屏多人的创新突破与完整实现指南 【免费下载链接】nucleuscoop Starts multiple instances of a game for split-screen multiplayer gaming! 项目地址: https://gitcode.com/gh_mirrors/nu/nucleuscoop Nucleus Co-Op是一款…...

LinkSwift:八大主流网盘直链下载解决方案的技术实践指南

LinkSwift:八大主流网盘直链下载解决方案的技术实践指南 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 / 中国移动云盘 / 天…...

从‘彩虹’到‘拖影’:给网络工程师讲明白光纤色散与高速网络故障排查

从‘彩虹’到‘拖影’:光纤色散对高速网络的实战影响与排查指南 凌晨三点,数据中心告警灯突然亮起——一条承载金融交易数据的400G链路误码率飙升到10^-5,而你的值班手机开始疯狂震动。这不是科幻场景,而是某跨国银行深圳分部的真…...

从实战复盘到技巧精讲:一次DASCTF解题的深度剖析与通用Writeup方法论

1. 赛题复盘与解题思路拆解 参加CTF比赛最让人头疼的往往不是题目本身,而是如何在有限时间内快速分析问题并找到突破口。去年参加DASCTF时,我就深刻体会到了这一点。比赛时间只有3小时,却要完成15道题目,最后还要赶在截止前提交Wr…...

3步快速教程:免费在Windows 11上运行Android应用的完整方案

3步快速教程:免费在Windows 11上运行Android应用的完整方案 【免费下载链接】WSA Developer-related issues and feature requests for Windows Subsystem for Android 项目地址: https://gitcode.com/gh_mirrors/ws/WSA 想在Windows电脑上体验完整的Android…...

C++函数重载和缺省参数:告别‘iAdd’和‘dAdd’,写出更优雅的代码

C函数重载与缺省参数:从C语言到现代编程的优雅进化 1. 告别iAdd与dAdd:C的函数命名革命 还记得那些年我们被迫写下的iAdd、dAdd、fAdd吗?在C语言的世界里,每个函数名都必须独一无二,即使它们实现的是完全相同的逻辑。这…...

芯片设计中的“普通话”和“方言”:LEF/DEF文件在物理实现中的角色与避坑指南

芯片设计中的“普通话”和“方言”:LEF/DEF文件在物理实现中的角色与避坑指南 在芯片设计的复杂生态中,团队协作的效率往往取决于信息传递的准确性。想象一下,当逻辑综合团队完成电路网表后,物理设计团队如何准确理解每个标准单元…...

面试官最爱问的C++服务器项目:TinyWebServer中Epoll与Reactor模式如何协同工作?

C服务器开发实战:TinyWebServer中Epoll与Reactor模式的深度协同 在当今互联网服务架构中,高性能服务器开发始终是后端工程师的核心竞争力之一。TinyWebServer作为一个经典的C轻量级服务器实现,其设计思想和技术选型常常成为面试官考察候选人底…...

PyTorch报错ImportError: libtorch_cpu.so?别慌,一个conda命令解决MKL版本冲突

PyTorch报错ImportError: libtorch_cpu.so?三步根治MKL版本冲突 刚配好Isaac Gym环境,满心欢喜运行第一个RL训练脚本,突然终端弹出ImportError: libtorch_cpu.so的红色报错——这场景每个深度学习开发者都似曾相识。别急着重装系统&#xff0…...

IFCNN:一个基于卷积神经网络的通用图像融合框架深度解析

1. IFCNN框架的核心设计理念 IFCNN(通用图像融合框架)之所以能在多聚焦、多曝光、多模态医学图像融合任务中表现出色,关键在于其**"轻量级架构预训练知识迁移"**的设计哲学。我在复现这个框架时发现,作者刻意避开了传统…...