当前位置: 首页 > article >正文

CNN在卷什么:五大组件详解,一文讲透卷积神经网络,从LeNet到ResNet,为什么这5个组件是CNN的标配

CNN在卷什么:五大组件详解,一文讲透卷积神经网络副标题: 从LeNet到ResNet,为什么这5个组件是CNN的标配痛点:CNN的五大组件是什么?学CNN的时候,你是不是分不清这些概念?卷积层vs池化层:都是"滑动",有什么区别?BatchNorm到底在做什么?为什么需要它?Dropout随机丢弃神经元,不会破坏网络吗?激活函数:ReLU vs Sigmoid vs Tanh,该用哪个?更关键的是:这五个组件为什么总是成对出现?今天这篇文章,就是要把CNN的五大组件讲透。一、卷积层(Conv Layer):信息的抽象化1.1 卷积层在做什么?核心功能:提取特征classConvLayer(nn.Module):def__init__(self,in_channels,out_channels,kernel_size=3):super().__init__()self.conv=nn.Conv2d(in_channels,out_channels,kernel_size=kernel_size,padding=kernel_size//2# 保持尺寸)self.activation=nn.ReLU()defforward(self,x):returnself.activation(self.conv(x))输入:原始像素 / 低级特征输出:高级特征1.2 逐通道分析:卷积层学什么?importtorchimporttorchvision.modelsasmodelsimportmatplotlib.pyplotasplt# 加载ResNet18预训练模型model=models.resnet18(pretrained=True)# 获取第一层卷积核conv1_weights=model.conv1.weight.data# [64, 3, 7, 7]# 可视化前12个卷积核fig,axes=plt.subplots(3,4,figsize=(12,9))fori,axinenumerate(axes.flat):ifi12:# 前3个通道的RGB可视化kernel=conv1_weights[i].cpu().numpy()# [3, 7, 7]# 归一化到0-1kernel=(kernel-kernel.min())/(kernel.max()-kernel.min()+1e-8)ax.imshow(kernel.transpose(1,2,0))ax.set_title(f'Filter{i+1}')ax.axis('off')观察:前几个卷积核类似边缘检测器(黑白条纹)中间层卷积核开始出现纹理检测器最后层卷积核是复杂的模式检测器1.3 感受野:卷积核的"视野"为什么需要深层网络:defcompute_receptive_field(layers_info):""" 计算每一层的感受野 layers_info: [{'kernel': 7, 'stride': 2}, ...] """rf=1forinfoinlayers_info:kernel=info['kernel']stride=info['stride']rf=rf*stride+(kernel-stride)returnrf# ResNet18的感受野计算resnet18_layers=[{'kernel':7,'stride':2},# conv1{'kernel':3,'stride':2},# maxpool{'kernel':3,'stride':1},# layer1 (大部分是stride=1){'kernel':3,'stride':2},# layer2{'kernel':3,'stride':2},# layer3{'kernel':3,'stride':2},# layer4]foriinrange(len(resnet18_layers)):print(f"Layer{i}: RF ={compute_receptive_field(resnet18_layers[:i+1])}")输出:Layer 0: RF = 7 Layer 1: RF = 10 Layer 2: RF = 12 Layer 3: RF = 16 Layer 4: RF = 24 Layer 5: RF = 321.4 通道数设计:深度网络的宽度为什么ResNet通道数是64→128→256→512?# 经典CNN通道数设计classCNNDesign(nn.Module):def__init__(self):super().__init__()# 逐层翻倍通道数self.conv1=nn.Conv2d(3,64,7,stride=2)# 64self.conv2=nn.Conv2d(64,128,3,stride=2)# 128 (×2)self.conv3=nn.Conv2d(128,256,3,stride=2)# 256 (×2)self.conv4=nn.Conv2d(256,512,3,stride=2)# 512 (×2)设计原则:通道数翻倍:保持计算量合理空间尺寸减半:补偿通道数增加FLOPs近似:每一层计算量接近二、池化层(Pooling Layer):信息的压缩2.1 池化层的类型最大池化 vs 平均池化:classPoolingComparison(nn.Module):def__init__(self):super().__init__()self.max_pool=nn.MaxPool2d(2,stride=2)self.avg_pool=nn.AvgPool2d(2,stride=2)defforward(self,x):returnself.avg_pool(self.max_pool(x))数值对比:输入MaxPool输出AvgPool输出[[1,5,3],[4,2,6]][[5,6]][[3,4]]特征最显著特征平滑特征2.2 池化层的数学本质最大池化:max⁡(xi,j)=max⁡m,nxi+m,j+n\max(x_{i,j}) = \max_{m,n} x_{i+m,j+n}max(xi,j​)=

相关文章:

CNN在卷什么:五大组件详解,一文讲透卷积神经网络,从LeNet到ResNet,为什么这5个组件是CNN的标配

CNN在卷什么:五大组件详解,一文讲透卷积神经网络 副标题: 从LeNet到ResNet,为什么这5个组件是CNN的标配 痛点:CNN的五大组件是什么? 学CNN的时候,你是不是分不清这些概念? 卷积层 vs 池化层:都是"滑动",有什么区别? BatchNorm 到底在做什么?为什么需要它…...

Golang怎么实现HTTP请求取消_Golang如何用context取消正在进行的HTTP请求【实战】

HTTP客户端默认不取消请求是设计选择,需显式通过context.Context传递取消信号;必须用NewRequestWithContext、禁用Client.Timeout、确保Transport组件响应同一ctx。为什么 http.Client 默认不取消请求?Go 的 http.Client 本身不自动响应外部中…...

ECU软件刷写核心:拆解UDS的34/36/37服务,如何像拷贝文件一样传输数据?

ECU软件刷写核心:拆解UDS的34/36/37服务,如何像拷贝文件一样传输数据? 想象一下,你需要将一部高清电影从电脑传输到手机——这个过程需要稳定的连接、合理的分块大小和可靠的数据校验。在汽车电子领域,ECU软件刷写同样…...

FanControl终极指南:告别噪音,掌控你的PC风扇控制

FanControl终极指南:告别噪音,掌控你的PC风扇控制 【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Tren…...

STAR-CCM+物理场全览:从基础流动到前沿多物理场耦合

1. 流体与传热:STAR-CCM的仿真基石 流动与传热仿真是工程模拟中最基础也最常用的功能。在STAR-CCM中,这两个物理场就像盖房子的地基,后续所有高级功能都建立在这个基础之上。我刚开始接触CFD时,花了整整三个月时间专门研究这两个模…...

BOX工控机在无人机机载系统中有什么优势?这 3 点是普通工控机比不了的

现在的无人机机载系统,越来越多的人选择用 BOX工控机。很多人问我,BOX工控机到底是什么?它和普通的工控机有什么区别?为什么大家都在用它?今天我就跟大家好好聊聊这个话题。我会从一个 17 年工控人的角度,给大家讲透 BOX工控机在无人机机载…...

终极免费音频智能分割工具:快速解放你的音频处理工作流

终极免费音频智能分割工具:快速解放你的音频处理工作流 【免费下载链接】audio-slicer A simple GUI application that slices audio with silence detection 项目地址: https://gitcode.com/gh_mirrors/aud/audio-slicer 还在为处理长音频文件而烦恼吗&…...

2025年Mac菜单栏革命:Ice如何重塑你的桌面工作流

2025年Mac菜单栏革命:Ice如何重塑你的桌面工作流 【免费下载链接】Ice Powerful menu bar manager for macOS 项目地址: https://gitcode.com/GitHub_Trending/ice/Ice 你是否曾因Mac菜单栏上的图标拥挤不堪而感到困扰?Wi-Fi、电池、时间等关键信…...

Hyper-V DDA图形工具:5分钟完成GPU直通的终极指南

Hyper-V DDA图形工具:5分钟完成GPU直通的终极指南 【免费下载链接】DDA 实现Hyper-V离散设备分配功能的图形界面工具。A GUI Tool For Hyper-Vs Discrete Device Assignment(DDA). 项目地址: https://gitcode.com/gh_mirrors/dd/DDA 还在为复杂的Hyper-V离散…...

基于Arduino与GPS的物联网数据采集器:从硬件搭建到地图可视化

1. 项目概述:一个硬件极客的万圣节“寻宝图” 又到万圣节了,除了琢磨穿什么奇装异服,你是不是也在头疼怎么规划“不给糖就捣蛋”的路线?每年都像开盲盒,有的门口堆满南瓜灯的人家只给了一根棒棒糖,而某个其…...

3个高级功能解锁NIPAP企业级IP地址管理潜力

3个高级功能解锁NIPAP企业级IP地址管理潜力 【免费下载链接】NIPAP Neat IP Address Planner - NIPAP is the best open source IPAM in the known universe, challenging classical IP address management (IPAM) systems in many areas. 项目地址: https://gitcode.com/gh_…...

如何5分钟搭建个人离线小说库:番茄小说下载器终极指南

如何5分钟搭建个人离线小说库:番茄小说下载器终极指南 【免费下载链接】fanqienovel-downloader 下载番茄小说 项目地址: https://gitcode.com/gh_mirrors/fa/fanqienovel-downloader 你是否曾经遇到过这样的情况:在通勤路上网络突然中断&#xf…...

终极KMS激活指南:如何免费激活Windows和Office的完整教程

终极KMS激活指南:如何免费激活Windows和Office的完整教程 【免费下载链接】KMS_VL_ALL_AIO Smart Activation Script 项目地址: https://gitcode.com/gh_mirrors/km/KMS_VL_ALL_AIO 还在为Windows和Office的激活问题烦恼吗?KMS_VL_ALL_AIO是一款开…...

企业内网应用安全调用外部大模型的Taotoken接入方案

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 企业内网应用安全调用外部大模型的Taotoken接入方案 应用场景类,探讨具有安全合规要求的企业如何安全地引入AI能力&…...

云原生技能图谱:构建开发者能力模型与学习路径

1. 项目概述:一个面向云原生时代的技能图谱仓库最近在整理团队内部的技术分享材料时,我偶然发现了一个在开发者社区里讨论度颇高的开源项目:prevu-cloud/skills。乍一看这个名字,你可能会觉得它只是一个普通的“技能列表”或者“学…...

基于CircuitPython与NeoPixel的桌面俄罗斯方块游戏机DIY全攻略

1. 项目概述与核心思路几年前,我在麻省理工学院(MIT)的校园里第一次看到那座著名的“绿楼”(Green Building)外墙上的巨型俄罗斯方块游戏时,就被深深震撼了。那不仅仅是一个游戏,更是一种将冰冷…...

构建企业级金融数据采集系统:AKShare进阶实战指南

构建企业级金融数据采集系统:AKShare进阶实战指南 【免费下载链接】akshare AKShare is an elegant and simple financial data interface library for Python, built for human beings! 开源财经数据接口库 项目地址: https://gitcode.com/gh_mirrors/aks/akshar…...

独立可托管的 listmonk:新闻通讯与邮件列表管理的高效工具

【导语:listmonk 作为一款独立且可自行托管的新闻通讯和邮件列表管理工具,以其速度快、功能丰富等特点受到关注。本文将介绍其安装方式、开发者相关信息及许可证等内容。】功能特性鲜明的 listmonklistmonk 是一款独立的、可自行托管的新闻通讯和邮件列表…...

LiveSplit速通计时器:5个核心功能提升你的游戏计时效率

LiveSplit速通计时器:5个核心功能提升你的游戏计时效率 【免费下载链接】LiveSplit A sleek, highly customizable timer for speedrunners. 项目地址: https://gitcode.com/gh_mirrors/li/LiveSplit LiveSplit是一款专为游戏速通玩家设计的专业计时器软件&a…...

2026年同一机器两服务偶发`ECONNRESET`错误:实验室复现、场景分析与后续解决思路

突发!偶发 ECONNRESET 错误背后:实验室复现、场景分析与后续解决思路2026年5月5日,同一台机器上运行的两个服务出现问题,发起连接的服务读取数据时偶发 ECONNRESET 错误,且日志无其他错误信息、无崩溃情况。下面我们来…...

初创公司如何借助Taotoken统一管理多个AI模型的API密钥

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 初创公司如何借助Taotoken统一管理多个AI模型的API密钥 对于技术资源有限的初创公司而言,在业务开发中引入多种大模型能…...

开源智能激活方案:KMS_VL_ALL_AIO如何彻底解决Windows和Office激活难题

开源智能激活方案:KMS_VL_ALL_AIO如何彻底解决Windows和Office激活难题 【免费下载链接】KMS_VL_ALL_AIO Smart Activation Script 项目地址: https://gitcode.com/gh_mirrors/km/KMS_VL_ALL_AIO 你是否曾为Windows系统或Office办公软件未激活而烦恼&#xf…...

基于Circuit Playground Express与NeoPixel打造交互式太空头盔全流程指南

1. 项目概述:打造你的专属太空头盔如果你和我一样,是个对太空探索和创客DIY都充满热情的“技术宅”,那么把科幻电影里的装备搬到现实世界,绝对是一件让人肾上腺素飙升的事。今天要聊的,就是一个能让你过足“宇航员瘾”…...

低碳环境下新型电气能源系统优化配置与运行仿真研究

摘要:在“双碳”目标和新能源快速发展的背景下,传统电气能源系统面临碳排放高、新能源消纳能力不足以及运行调度灵活性较弱等问题。为提高系统低碳运行水平,本文以风电、光伏、储能、可控负荷和智慧电网为主要研究对象,开展低碳环…...

[2026实战] 工程图纸气泡图 (balloon drawing) 标注规范与数字化检验计划生成…

在 2026 年的精密制造与质量管理领域,高效处理气泡图 (balloon drawing) 已成为提升 FAI(首件检查)和 PPAP(生产件批准程序)效率的核心课题。面对日益复杂的工程图纸,传统的机械式手动标注已难以满足智能制…...

手把手教你学Simulink——基于 PWM 加相移混合控制的双向 DC-DC 变换器仿真

目录 手把手教你学Simulink——基于 PWM 加相移混合控制的双向 DC-DC 变换器仿真 摘要 Abstract 1. 引言 1.1 研究背景 1.2 本文目标 2. 混合控制机理 2.1 拓扑选择:双有源桥(DAB) 2.2 混合控制自由度 3. Simulink 主电路建模 3.1…...

长期使用 Taotoken Token Plan 套餐的成本控制感受

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 长期使用 Taotoken Token Plan 套餐的成本控制感受 在团队或个人项目中持续调用大模型 API,成本管理往往是一个容易被忽…...

CSS移动端如何实现平滑滚动效果_设置scroll-behavior smooth属性

...

终极免费桌面分区工具:NoFences让你的Windows桌面告别杂乱

终极免费桌面分区工具:NoFences让你的Windows桌面告别杂乱 【免费下载链接】NoFences 🚧 Open Source Stardock Fences alternative 项目地址: https://gitcode.com/gh_mirrors/no/NoFences 还在为Windows桌面上杂乱无章的图标而烦恼吗&#xff1…...

半导体测试数据可视化终极指南:STDF-Viewer从入门到精通

半导体测试数据可视化终极指南:STDF-Viewer从入门到精通 【免费下载链接】STDF-Viewer A free GUI tool to visualize STDF (semiconductor Standard Test Data Format) data files. 项目地址: https://gitcode.com/gh_mirrors/st/STDF-Viewer STDF-Viewer是…...