当前位置：首页 > news >正文

卷积神经网络经典backbone

news 2026/2/9 0:50:41

特征提取是数据分析和机器学习中的基本概念，是将原始数据转换为更适合分析或建模的格式过程中的关键步骤。特征，也称为变量或属性，是我们用来进行预测、对对象进行分类或从数据中获取见解的数据点的特定特征或属性。

1.AlexNet

paper：https://dl.acm.org/doi/pdf/10.1145/3065386

作者： Alex Krizhevsky, Ilya Sutskever, and Geoffrey E. Hinton

显然该网络是按照作者名字命名的,但是现在这个bacbone比较老了，性能欠佳

框架：

整体结构主要由五个卷积层、三个全连接层构成，中间穿插着最大池化、ReLU、Dropout

使用ReLu非线性激活函数

code_Pytorch

class AlexNet(nn.Module):"""Neural network model consisting of layers propsed by AlexNet paper."""def __init__(self, num_classes=1000):"""Define and allocate layers for this neural net.Args:num_classes (int): number of classes to predict with this model"""super().__init__()# input size should be : (b x 3 x 227 x 227)# The image in the original paper states that width and height are 224 pixels, but# the dimensions after first convolution layer do not lead to 55 x 55.self.net = nn.Sequential(nn.Conv2d(in_channels=3, out_channels=96, kernel_size=11, stride=4),  # (b x 96 x 55 x 55)nn.ReLU(),nn.LocalResponseNorm(size=5, alpha=0.0001, beta=0.75, k=2),  # section 3.3nn.MaxPool2d(kernel_size=3, stride=2),  # (b x 96 x 27 x 27)nn.Conv2d(96, 256, 5, padding=2),  # (b x 256 x 27 x 27)nn.ReLU(),nn.LocalResponseNorm(size=5, alpha=0.0001, beta=0.75, k=2),nn.MaxPool2d(kernel_size=3, stride=2),  # (b x 256 x 13 x 13)nn.Conv2d(256, 384, 3, padding=1),  # (b x 384 x 13 x 13)nn.ReLU(),nn.Conv2d(384, 384, 3, padding=1),  # (b x 384 x 13 x 13)nn.ReLU(),nn.Conv2d(384, 256, 3, padding=1),  # (b x 256 x 13 x 13)nn.ReLU(),nn.MaxPool2d(kernel_size=3, stride=2),  # (b x 256 x 6 x 6))# classifier is just a name for linear layersself.classifier = nn.Sequential(nn.Dropout(p=0.5, inplace=True),nn.Linear(in_features=(256 * 6 * 6), out_features=4096),nn.ReLU(),nn.Dropout(p=0.5, inplace=True),nn.Linear(in_features=4096, out_features=4096),nn.ReLU(),nn.Linear(in_features=4096, out_features=num_classes),)self.init_bias()  # initialize biasdef init_bias(self):for layer in self.net:if isinstance(layer, nn.Conv2d):nn.init.normal_(layer.weight, mean=0, std=0.01)nn.init.constant_(layer.bias, 0)# original paper = 1 for Conv2d layers 2nd, 4th, and 5th conv layersnn.init.constant_(self.net[4].bias, 1)nn.init.constant_(self.net[10].bias, 1)nn.init.constant_(self.net[12].bias, 1)def forward(self, x):"""Pass the input through the net.Args:x (Tensor): input tensorReturns:output (Tensor): output tensor"""x = self.net(x)x = x.view(-1, 256 * 6 * 6)  # reduce the dimensions for linear layer inputreturn self.classifier(x)

2.VGG

paper:https://arxiv.org/abs/1409.1556

作者：Karen Simonyan, Andrew Zisserman

超级超级经典的网络，从14年到现在还是广泛使用

框架：

相比AlexNet而言加深了网络的深度，VGG16（13层conv+3层FC）和VGG19（16层conv+3层FC）是指表中的D、E两个模型。

code_vgg_Pytorch

'''
Modified from https://github.com/pytorch/vision.git
'''
import mathimport torch.nn as nn
import torch.nn.init as init__all__ = ['VGG', 'vgg11', 'vgg11_bn', 'vgg13', 'vgg13_bn', 'vgg16', 'vgg16_bn','vgg19_bn', 'vgg19',
]class VGG(nn.Module):'''VGG model '''def __init__(self, features):super(VGG, self).__init__()self.features = featuresself.classifier = nn.Sequential(nn.Dropout(),nn.Linear(512, 512),nn.ReLU(True),nn.Dropout(),nn.Linear(512, 512),nn.ReLU(True),nn.Linear(512, 10),)# Initialize weightsfor m in self.modules():if isinstance(m, nn.Conv2d):n = m.kernel_size[0] * m.kernel_size[1] * m.out_channelsm.weight.data.normal_(0, math.sqrt(2. / n))m.bias.data.zero_()def forward(self, x):x = self.features(x)x = x.view(x.size(0), -1)x = self.classifier(x)return xdef make_layers(cfg, batch_norm=False):layers = []in_channels = 3for v in cfg:if v == 'M':layers += [nn.MaxPool2d(kernel_size=2, stride=2)]else:conv2d = nn.Conv2d(in_channels, v, kernel_size=3, padding=1)if batch_norm:layers += [conv2d, nn.BatchNorm2d(v), nn.ReLU(inplace=True)]else:layers += [conv2d, nn.ReLU(inplace=True)]in_channels = vreturn nn.Sequential(*layers)cfg = {'A': [64, 'M', 128, 'M', 256, 256, 'M', 512, 512, 'M', 512, 512, 'M'],'B': [64, 64, 'M', 128, 128, 'M', 256, 256, 'M', 512, 512, 'M', 512, 512, 'M'],'D': [64, 64, 'M', 128, 128, 'M', 256, 256, 256, 'M', 512, 512, 512, 'M', 512, 512, 512, 'M'],'E': [64, 64, 'M', 128, 128, 'M', 256, 256, 256, 256, 'M', 512, 512, 512, 512, 'M', 512, 512, 512, 512, 'M'],
}def vgg11():"""VGG 11-layer model (configuration "A")"""return VGG(make_layers(cfg['A']))def vgg11_bn():"""VGG 11-layer model (configuration "A") with batch normalization"""return VGG(make_layers(cfg['A'], batch_norm=True))def vgg13():"""VGG 13-layer model (configuration "B")"""return VGG(make_layers(cfg['B']))def vgg13_bn():"""VGG 13-layer model (configuration "B") with batch normalization"""return VGG(make_layers(cfg['B'], batch_norm=True))def vgg16():"""VGG 16-layer model (configuration "D")"""return VGG(make_layers(cfg['D']))def vgg16_bn():"""VGG 16-layer model (configuration "D") with batch normalization"""return VGG(make_layers(cfg['D'], batch_norm=True))def vgg19():"""VGG 19-layer model (configuration "E")"""return VGG(make_layers(cfg['E']))def vgg19_bn():"""VGG 19-layer model (configuration 'E') with batch normalization"""return VGG(make_layers(cfg['E'], batch_norm=True))

3.ResNet

paper:https://arxiv.org/abs/1512.03385

作者：Kaiming He、Xiangyu Zhang、Shaoqing Ren；Microsoft Research；

使用残差网络避免模型变深带来的梯度爆炸和梯度消失的问题，使得网络层数可以达到很深。

框架：

残差连接：

（1）完成恒等映射：浅层特征可以直接的传递到深层特征中。

（2）梯度回传：深层的梯度可以通过残差的结构直接传递到浅层的网络中。

基于上面的分析提出残差连接结构，构建了不同的网络，有18、34、50、101、152等。

code_ResNet_Pytorch

import torch
import torch.nn as nn
import torchvision.models.resnet
from torchvision.models.resnet import BasicBlock, Bottleneckclass ResNet(torchvision.models.resnet.ResNet):def __init__(self, block, layers, num_classes=1000, group_norm=False):if group_norm:norm_layer = lambda x: nn.GroupNorm(32, x)else:norm_layer = Nonesuper(ResNet, self).__init__(block, layers, num_classes, norm_layer=norm_layer)if not group_norm:self.maxpool = nn.MaxPool2d(kernel_size=3, stride=2, padding=0, ceil_mode=True) # changefor i in range(2, 5):getattr(self, 'layer%d'%i)[0].conv1.stride = (2,2)getattr(self, 'layer%d'%i)[0].conv2.stride = (1,1)def resnet18(pretrained=False):"""Constructs a ResNet-18 model.Args:pretrained (bool): If True, returns a model pre-trained on ImageNet"""model = ResNet(BasicBlock, [2, 2, 2, 2])if pretrained:model.load_state_dict(model_zoo.load_url(model_urls['resnet18']))return modeldef resnet34(pretrained=False):"""Constructs a ResNet-34 model.Args:pretrained (bool): If True, returns a model pre-trained on ImageNet"""model = ResNet(BasicBlock, [3, 4, 6, 3])if pretrained:model.load_state_dict(model_zoo.load_url(model_urls['resnet34']))return modeldef resnet50(pretrained=False):"""Constructs a ResNet-50 model.Args:pretrained (bool): If True, returns a model pre-trained on ImageNet"""model = ResNet(Bottleneck, [3, 4, 6, 3])if pretrained:model.load_state_dict(model_zoo.load_url(model_urls['resnet50']))return modeldef resnet50_gn(pretrained=False):"""Constructs a ResNet-50 model.Args:pretrained (bool): If True, returns a model pre-trained on ImageNet"""model = ResNet(Bottleneck, [3, 4, 6, 3], group_norm=True)if pretrained:model.load_state_dict(model_zoo.load_url(model_urls['resnet50']))return modeldef resnet101(pretrained=False):"""Constructs a ResNet-101 model.Args:pretrained (bool): If True, returns a model pre-trained on ImageNet"""model = ResNet(Bottleneck, [3, 4, 23, 3])if pretrained:model.load_state_dict(model_zoo.load_url(model_urls['resnet101']))return modeldef resnet101_gn(pretrained=False):"""Constructs a ResNet-101 model.Args:pretrained (bool): If True, returns a model pre-trained on ImageNet"""model = ResNet(Bottleneck, [3, 4, 23, 3], group_norm=True)return modeldef resnet152(pretrained=False):"""Constructs a ResNet-152 model.Args:pretrained (bool): If True, returns a model pre-trained on ImageNet"""model = ResNet(Bottleneck, [3, 8, 36, 3])if pretrained:model.load_state_dict(model_zoo.load_url(model_urls['resnet152']))return model

卷积神经网络经典backbone

特征提取是数据分析和机器学习中的基本概念，是将原始数据转换为更适合分析或建模的格式过程中的关键步骤。特征，也称为变量或属性，是我们用来进行预测、对对象进行分类或从数据中获取见解的数据点的特定特征或属性。 1.AlexNet paper&#…...

编程日记 2023/11/27 5:52:45

【2023 年终盘点】今年用的最多的 10 款浏览器插件

分享顺哥今年用的最多的 10 款浏览器插件。排名不分先后，涉及各个方面的应用。大家有好用的插件也欢迎在评论区留言分享！视频 YouTube：https://youtu.be/ZpTydUSBwCA 顺哥博客浏览器扩展篇注意： 1、以下介绍的均为在 Google Chrome 浏览器适用的小插件，部分插件…...

编程日记 2023/11/27 5:51:43

GWAS：plink进行meta分析

之前教程提到过Metal是可以做Meta分析，除了Metal，PLINK也可以进行Meta分析。命令如下所示： plink --meta-analysis gwas1.plink gwas2.plink gwas3.plink logscale qt --meta-analysis-snp-field SNP --meta-analysis-chr-field CHR --me…...

编程日记 2023/11/27 5:50:42

题目点开页面显示如下页面显示了一行报错：Cannot modify header information - headers already sent by (output started at /var/www/html/index.php:3) in /var/www/html/index.php on line 4 意思为不能修改报头信息-报头已经发送(输出开始于/var/www/html/i…...

编程日记 2023/11/27 5:48:40

云原生安全工具汇总（docker、k8s、Kubernetes、Git仓库）

目录 Metarget：云原生靶机环境 CDK：容器环境定制的渗透测试工具 container-escape-check：容器逃逸检测...

编程日记 2023/11/27 5:47:38

基于51单片机超声波测距汽车避障系统

**单片机设计介绍， 基于51单片机超声波测距汽车避障系统文章目录一概要二、功能设计设计思路三、软件设计原理图五、程序六、文章目录一概要基于51单片机的超声波测距汽车避障系统是一种用于帮助汽车避免碰撞和发生事故的设备，以下是一个基本…...

编程日记 2023/11/27 5:46:37

git的使用：本地git下载、sshkey的添加、github仓库创建及文件上传

一、github创建账号即github注册账号，登录github官网，根据提示注册即可 github官网二、git客户端下载安装已有很多git下载安装的博文了，在此就不赘述三、sshkey的生成与添加 1、sshkey的生成以及查看 // sshkey的生成命令&#xff…...

编程日记 2023/11/27 5:45:36

增量有余、后劲不足，星途汽车10月份销量环比下降3.9%

撰稿|行星来源|贝多财经近日，奇瑞集团发布了10月销量月报。报告显示，奇瑞集团于2023年10月销售汽车20.03万辆，同比增长50.8%，单月销量首次突破20万辆；2023年前10个月的累计销量为145.36辆，同比增长41.6…...

编程日记 2023/11/27 5:44:34

只考数据结构，计算机评级C+，成都信息工程大学考情分析

成都信息工程大学(C) 考研难度（☆☆） 内容：23考情概况（拟录取和复试分析）、院校概况、24专业目录、23复试详情、各专业考情分析、各科目考情分析。正文1715字，预计阅读：3分钟 2023考情概况 …...

编程日记 2023/11/27 5:43:32

Screen操作

detach：detach是指将当前运行的Screen会话从终端分离（detach），使其在后台继续运行而不受当前终端窗口的影响。这样，你可以在一个终端窗口中启动一个Screen会话，然后在需要的时候将其分离，使其在…...

编程日记 2023/11/27 5:41:29

js基础知识

1. beforeCreate 初始化界面前 : 在当前阶段data、methods、computed以及watch上的数据和方法都不能被访问。 2. created 初始化界面后 : 在实例创建完成后发生，当前阶段已经完成了数据观测，也就是可以使用数据，更改数据，在这里更…...

编程日记 2023/11/27 5:40:28

Vue常见的实现tab切换的两种方法

目录方法一：事件绑定属性绑定效果图完整代码方法二：属性绑定动态组件 component标签效果图完整代码方法一：事件绑定属性绑定效果图完整代码 <!DOCTYPE html> <html lang"en"> <head><meta c…...

编程日记 2023/11/27 5:39:28

React16中打印事件对象取不到值的现象及其原因分析

React16中打印事件对象取不到值的现象及其原因分析一、背景在最近的开发过程中，遇到了一个看起来匪夷所思的问题❓： <Inputplaceholder"请输入"onChange{(e) > {console.log(e:, e)}}onKeyDown{handleKeyDown} />此时按理来说我…...

编程日记 2023/11/27 5:38:25

绝对干货-讲讲设计模式之创建型设计模式的本质

创建型模式（Creational Patterns）：创建型模式关注对象的创建机制，包括了如何实例化一个对象或者一组对象的方法。Java中的创建型模式有：单例模式（Singleton Pattern）、工厂模式（简单…...

编程日记 2023/11/27 5:36:23

机器人规划算法——movebase导航框架源码分析

这里对MoveBase类的类成员进行了声明，以下为比较重要的几个类成员函数。构造函数 MoveBase::MoveBase | 初始化Action 控制主体 MoveBase::executeCb收到目标，触发全局规划线程，循环执行局部规划全局规划线程 void MoveBase::planThread |…...

编程日记 2023/11/27 5:35:23

Android：Google三方库之Firebase集成详细步骤（三）

Cloud Messaging 1、清单文件配置 a、（可选）一项扩展 FirebaseMessagingService 的服务。除了接收通知外，如果您还希望在后台应用中进行消息处理，则必须添加此服务。例如，您需要在前台应用中接收通知、接收数据载荷以及…...

编程日记 2023/11/27 5:34:21

2023年中国边缘计算网关现状及发展趋势分析[图]

边缘计算网关是一种可以在设备上运行本地计算、消息通信、数据缓存等功能的工业智能网关，可以在无需联网的情况下实现设备的本地联动以及数据处理分析。边缘计算网关是一种连接物联网设备和云端服务的关键技术，它可以在设备和云端之间建立一个安全、高效…...

编程日记 2023/11/27 5:33:21

LeetCode78.子集

这道题如果用暴力法几乎是不可能解出来的，因为情况太复杂了，但是一旦用上递归回溯就会轻松很多，先上代码： class Solution {List<List<Integer>> result new ArrayList<List<Integer>>();List<Integ…...

编程日记 2023/11/27 5:32:20

不是默认进入Linux|总是自动进入windows系统

问题描述不是默认进入Linux系统无法主动出现boot引导自动进入windows系统尝试无效修复引导无效重装Grub无效重装系统无效环境 Ubuntu 22.04 LST微星主板解决方案修改引导顺序： 开机狂按Del键，进入BIOS系统，左侧Settings 设置&…...

编程日记 2023/11/27 5:31:18

【面经八股】搜广推方向：常见面试题（二）

【面经&八股】搜广推方向：常见面试题（二）文章目录【面经&八股】搜广推方向：常见面试题（二）1. FTRL 是什么？(Follow The Regularized Leader)2. 梯度下降方法3. 推荐系统中常见的Embedding方法有哪些？4. Embedding与推荐系统有哪些结合5. FM 和 FFM6. FNN7. 深…...

编程日记 2023/11/27 5:30:17

java_网络服务相关_gateway_nacos_feign区别联系

1. spring-cloud-starter-gateway 作用：作为微服务架构的网关，统一入口，处理所有外部请求。核心能力： 路由转发（基于路径、服务名等）过滤器（鉴权、限流、日志、Header 处理）支持负…...

编程新知 2025/11/28 2:51:33

【OSG学习笔记】Day 18: 碰撞检测与物理交互

物理引擎（Physics Engine） 物理引擎是一种通过计算机模拟物理规律（如力学、碰撞、重力、流体动力学等）的软件工具或库。它的核心目标是在虚拟环境中逼真地模拟物体的运动和交互，广泛应用于游戏开发、动画制作、虚…...

编程新知 2026/2/4 2:08:30

在HarmonyOS ArkTS ArkUI-X 5.0及以上版本中，手势开发全攻略：

在 HarmonyOS 应用开发中，手势交互是连接用户与设备的核心纽带。ArkTS 框架提供了丰富的手势处理能力，既支持点击、长按、拖拽等基础单一手势的精细控制，也能通过多种绑定策略解决父子组件的手势竞争问题。本文将结合官方开发文档&#xff0c…...

编程新知 2025/9/19 4:31:58

MMaDA: Multimodal Large Diffusion Language Models

CODE ： https://github.com/Gen-Verse/MMaDA Abstract 我们介绍了一种新型的多模态扩散基础模型MMaDA，它被设计用于在文本推理、多模态理解和文本到图像生成等不同领域实现卓越的性能。该方法的特点是三个关键创新:(i) MMaDA采用统一的扩散架构&#xf…...

编程新知 2026/2/3 15:24:36

【算法训练营Day07】字符串part1

文章目录反转字符串反转字符串II替换数字反转字符串题目链接：344. 反转字符串双指针法，两个指针的元素直接调转即可 class Solution {public void reverseString(char[] s) {int head 0;int end s.length - 1;while(head < end) {char temp …...

编程新知 2025/8/27 14:38:58