当前位置：首页 > news >正文

实现pytorch版的mobileNetV1

news 2026/2/9 19:14:21

mobileNet具体细节，在前面已做了分析记录：轻量化网络-MobileNet系列-CSDN博客

这里是根据网络结构，搭建模型，用于图像分类任务。

1. 网络结构和基本组件

2. 搭建组件

（1）普通的卷积组件：CBL = Conv2d + BN + ReLU6;

（2）深度可分离卷积：DwCBL = Conv dw+ Conv dp；

Conv dw+ Conv dp = {Conv2d(3x3) + BN + ReLU6 } + {Conv2d(1x1) + BN + ReLU6};

Conv dw是3x3的深度卷积，通过步长控制是否进行下采样；

Conv dp是1x1的逐点卷积，通过控制输出通道数，控制通道维度的变化；

# 普通卷积
class CBN(nn.Module):def __init__(self, in_c, out_c, stride=1):super(CBN, self).__init__()self.conv = nn.Conv2d(in_c, out_c, 3, stride, padding=1, bias=False)self.bn = nn.BatchNorm2d(out_c)self.relu = nn.ReLU6(inplace=True)def forward(self, x):x = self.conv(x)x = self.bn(x)x = self.relu(x)return x

# 深度可分离卷积: 深度卷积(3x3x1) + 逐点卷积（1x1xc卷积)
class DwCBN(nn.Module):def __init__(self, in_c, out_c, stride=1):super(DwCBN, self).__init__()# conv3x3x1, 深度卷积，通过步长，只控制是否缩小特征hwself.conv3x3 = nn.Conv2d(in_c, in_c, 3, stride, padding=1, groups=in_c, bias=False)self.bn1 = nn.BatchNorm2d(in_c)self.relu1 = nn.ReLU6(inplace=True)# conv1x1xc, 逐点卷积，通过控制输出通道数，控制通道维度的变化self.conv1x1 = nn.Conv2d(in_c, out_c, 1, stride=1, padding=0, bias=False)self.bn2 = nn.BatchNorm2d(out_c)self.relu2 = nn.ReLU6(inplace=True)def forward(self, x):x = self.conv3x3(x)x = self.bn1(x)x = self.relu1(x)x = self.conv1x1(x)x = self.bn2(x)x = self.relu2(x)return x

3. 搭建网络

class MobileNetV1(nn.Module):def __init__(self, class_num=1000):super(MobileNetV1, self).__init__()self.stage1 = torch.nn.Sequential(CBN(3, 32, 2),  # 下采样/2DwCBN(32, 64, 1))self.stage2 = torch.nn.Sequential(DwCBN(64, 128, 2),  # 下采样/4DwCBN(128, 128, 1))self.stage3 = torch.nn.Sequential(DwCBN(128, 256, 2),  # 下采样/8DwCBN(256, 256, 1))self.stage4 = torch.nn.Sequential(DwCBN(256, 512, 2),  # 下采样/16DwCBN(512, 512, 1),  # 5个DwCBN(512, 512, 1),DwCBN(512, 512, 1),DwCBN(512, 512, 1),DwCBN(512, 512, 1),)self.stage5 = torch.nn.Sequential(DwCBN(512, 1024, 2),  # 下采样/32DwCBN(1024, 1024, 1))# classifierself.avg_pooling = torch.nn.AdaptiveAvgPool2d((1, 1))self.fc = torch.nn.Linear(1024, class_num, bias=True)# self.classifier = torch.nn.Softmax()  # 原始的softmax值# torch.log_softmax 首先计算 softmax 然后再取对数，因此在数值上更加稳定。# 在分类网络在训练过程中，通常使用交叉熵损失函数（Cross-Entropy Loss）。# torch.nn.CrossEntropyLoss 会在内部进行 softmax 操作，因此在网络的最后一层不需要手动加上 softmax 操作。def forward(self, x):scale1 = self.stage1(x)  # /2scale2 = self.stage2(scale1)scale3 = self.stage3(scale2)scale4 = self.stage4(scale3)scale5 = self.stage5(scale4)  # /32. 7x7x = self.avg_pooling(scale5)  # (b,1024,7,7)->(b,1024,1,1)x = torch.flatten(x, 1)  # (b,1024,1,1)->(b,1024,)x = self.fc(x)  # (b,1024,)  -> (b,1000,)return xif __name__ == '__main__':m1 = MobileNetV1(class_num=1000)input_data = torch.randn(64, 3, 224, 224)output = m1.forward(input_data)print(output.shape)

4. 训练验证

import torch
import torchvision
import torchvision.transforms as transforms
from torch import nn, optimfrom mobilenetv1 import MobileNetV1def validate(model, val_loader, criterion, device):model.eval()  # Set the model to evaluation modetotal_correct = 0total_samples = 0with torch.no_grad():for val_inputs, val_labels in val_loader:val_inputs, val_labels = val_inputs.to(device), val_labels.to(device)val_outputs = model(val_inputs)_, predicted = torch.max(val_outputs, 1)total_samples += val_labels.size(0)total_correct += (predicted == val_labels).sum().item()accuracy = total_correct / total_samplesmodel.train()  # Set the model back to training modereturn accuracyif __name__ == '__main__':# 下载并准备数据集# Define image transformations (adjust as needed)transform = transforms.Compose([transforms.Resize((224, 224)),  # Resize images to a consistent sizetransforms.ToTensor(),  # converts to PIL Image to a Pytorch Tensor and scales values to the range [0, 1]transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5)),  # Adjust normalization values. val = (val - mean) / std.])# Create ImageFolder datasetdata_folder = r"D:\zxq\data\car_or_dog"dataset = torchvision.datasets.ImageFolder(root=data_folder, transform=transform)# Optionally, split the dataset into training and validation sets# Adjust the `split_ratio` as neededsplit_ratio = 0.8train_size = int(split_ratio * len(dataset))val_size = len(dataset) - train_sizetrain_dataset, val_dataset = torch.utils.data.random_split(dataset, [train_size, val_size])# Create DataLoader for training and validationtrain_loader = torch.utils.data.DataLoader(train_dataset, batch_size=4, shuffle=True, num_workers=4)val_loader = torch.utils.data.DataLoader(val_dataset, batch_size=4, shuffle=False, num_workers=4)# 初始化模型、损失函数和优化器net = MobileNetV1(class_num=2)criterion = nn.CrossEntropyLoss()optimizer = optim.SGD(net.parameters(), lr=0.01, momentum=0.9)# 训练模型device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")print(device)net.to(device)for epoch in range(20):  # 例如，训练 20 个周期for i, data in enumerate(train_loader, 0):inputs, labels = datainputs, labels = inputs.to(device), labels.to(device)  # 将数据移动到GPUoptimizer.zero_grad()outputs = net(inputs)loss = criterion(outputs, labels)loss.backward()optimizer.step()if i % 100 == 0:print("epoch/step: {}/{}: loss: {}".format(epoch, i, loss.item()))# Validation after each epochval_accuracy = validate(net, val_loader, criterion, device)print("Epoch {} - Validation Accuracy: {:.2%}".format(epoch, val_accuracy))print('Finished Training')

待续。。。

实现pytorch版的mobileNetV1

mobileNet具体细节，在前面已做了分析记录：轻量化网络-MobileNet系列-CSDN博客这里是根据网络结构，搭建模型，用于图像分类任务。 1. 网络结构和基本组件 2. 搭建组件 （1）普通的卷积组件：CBL …...

编程日记 2024/1/10 3:54:00

vue多tab页面全部关闭后自动退出登录

业务场景：主项目是用vue写的单页面应用，但是有多开页面的需求，现在需要在用户关闭了所有的浏览器标签页面后，自动退出登录。思路：因为是不同的tab页面，我只能用localStorage来通信，新打开一个…...

编程日记 2024/1/10 3:53:00

记一个集群环境部署不完整导致的BUG

一背景产品有三个环境：开发测试环境、验收环境、生产环境。开发测试环境，保持最新的更新； 验收环境，阶段待发布内容； 生产环境，部署稳定内容。产品为BS架构，后端采用微服务&#xf…...

编程日记 2024/1/10 3:50:57

Go zero copy，复制文件

这里使用零拷贝技术复制文件，从内核态操作源文件和目标文件。避免了在用户态开辟缓冲区，然后从内核态复制文件到用户态的问题。由内核态完成文件复制操作。调用的是syscall.Sendfile系统调用函数。 //go:build linuxpackage zero_copyimport ("f…...

编程日记 2024/1/10 3:45:50

http协议九种请求方法介绍及常见状态码

http1.0定义了三种： GET: 向服务器获取资源，比如常见的查询请求POST: 向服务器提交数据而发送的请求Head: 和get类似，返回的响应中没有具体的内容，用于获取报头 http1.1定义了六种 PUT：一般是用于更新请求，…...

编程日记 2024/1/10 3:44:50

详解flink exactly-once和两阶段提交

以下是我们常见的三种 flink 处理语义： 最多一次（At-most-Once）：用户的数据只会被处理一次，不管成功还是失败，不会重试也不会重发。至少一次（At-least-Once）：系统会保…...

编程日记 2024/1/10 3:38:43

Qt/QML编程学习之心得：QDbus实现service接口调用（28）

D-Bus协议用于进程间通讯的。 QString value = retrieveValue();QDBusPendingCall pcall = interface->asyncCall(QLatin1String("Process"), value);QDBusPendingCallWatcher *watcher = new QDBusPendingCallWatcher(pcall, this);QObject::connect(watcher, SI…...

编程日记 2024/1/10 3:37:42

前端nginx配置指南

前端项目发布后，有些接口需要在服务器配置反向代理，资源配置gzip压缩，配置跨域允许访问等配置文件模块概览配置示例反向代理反向代理是Nginx的核心功能之一，是指客户端发送请求到代理服务器，代理服务器再将请求…...

编程日记 2024/1/10 3:35:40

接口测试到底怎么做，5分钟时间看完这篇文章彻底搞清楚

01、通用的项目架构 02、什么是接口接口：服务端程序对外提供的一种统一的访问方式，通常采用HTTP协议，通过不同的url，不同的请求类型（GET、POST），不同的参数，来执行不同的业务逻辑。…...

编程日记 2024/1/10 3:34:39

显示管理磁盘分区 fdisk

显示管理磁盘分区 fdisk fdisk是用于检查一个磁盘上分区信息最通用的命令。 fdisk可以显示分区信息及一些细节信息，比如文件系统类型等。设备的名称通常是/dev/sda、/dev/sdb 等。对于以前的设备有可能还存在设备名为 /dev/hd* (IDE)的设备，这个设…...

编程日记 2024/1/10 3:33:37

Hyperledger Fabric 管理链码 peer lifecycle chaincode 指令使用

链上代码（Chaincode）简称链码，包括系统链码和用户链码。系统链码（System Chaincode）指的是 Fabric Peer 中负责系统配置、查询、背书、验证等平台功能的代码逻辑，运行在 Peer 进程内，将在第 14 …...

编程日记 2024/1/10 3:29:31

L1-011 A-B(Java)

题目本题要求你计算A−B。不过麻烦的是，A和B都是字符串 —— 即从字符串A中把字符串B所包含的字符全删掉，剩下的字符组成的就是字符串A−B。输入格式： 输入在2行中先后给出字符串A和B。两字符串的长度都不超过10的四次方，并且…...

编程日记 2024/1/10 3:27:28

系列七、Ribbon

一、Ribbon 1.1、概述 Ribbon是基于Netflix Ribbon实现的一套客户端负载均衡的工具，是Netflix发布的一款开源项目，其主要功能是提供客户端的软件负载均衡算法和服务调用，Ribbon客户端组件提供一系列完善的配置项，例如&#xff1a…...

编程日记 2024/1/10 3:26:26

山东名岳轩印刷包装携专业包装袋盛装亮相2024济南生物发酵展

山东名岳轩印刷包装有限公司盛装亮相2024第12届国际生物发酵展，3月5-7日山东国际会展中心与您相约！ 展位号：1号馆F17 山东名岳轩印刷包装有限公司是一家拥有南北两个生产厂区，设计、制版、印刷，营销策划为一体的专业…...

编程日记 2024/1/10 3:25:25

BGP公认必遵属性——Next-hop（一）

BGP公认必遵属性共有三个，分别是：Next-hop、Origin、As-path，本期介绍Next-hop 点赞关注，持续更新！！！ Next-hop 华为BGP路由下一跳特点： 默认情况下传给EBGP邻居的BGP路由的下一跳…...

编程日记 2024/1/10 3:22:21

增强Wi-Fi信号的10种方法，值得去尝试

Wi-Fi信号丢失，无线盲区。在一个对一些人来说，上网和呼吸一样必要的世界里，这些问题中的每一个都令人抓狂。如果你觉得你的Wi-Fi变得迟钝，有很多工具可以用来测试你的互联网速度。你还可以尝试一些技巧来解决网络问题。然而，如果你能获得良好接收的唯一方法是站在无线路…...

编程日记 2024/1/10 3:21:19

第十五章 ECMAScript6新增的常用语法

文章目录一、声明关键字二、箭头函数三、解构赋值四、展开运算符五、对字符的补充六、Symbol七、对象的简写语法八、Set和Map九、for-of 一、声明关键字 ES6新增的声明关键字： let，const：声明变量class：声明类import&#xff0c…...

编程日记 2024/1/10 3:20:18

vulhub中的Apache SSI 远程命令执行漏洞

Apache SSI 远程命令执行漏洞 1.cd到ssi-rce cd /opt/vulhub/httpd/ssi-rce/ 2.执行docker-compose up -d docker-compose up -d 3.查看靶场是否开启成功 dooker ps 拉取成功了 4.访问url 这里已经执行成功了，注意这里需要加入/upload.php 5.写入一句话木马 &…...

编程日记 2024/1/10 3:19:17

MSB20M-ASEMI迷你贴片整流桥MSB20M

编辑：ll MSB20M-ASEMI迷你贴片整流桥MSB20M 型号：MSB20M 品牌：ASEMI 封装：UMSB-4 特性：贴片、整流桥最大平均正向电流：2A 最大重复峰值反向电压：1000V 恢复时间：&#xff1…...

编程日记 2024/1/10 3:18:15

工程管理系统功能设计与实践：实现高效、透明的工程管理

在现代化的工程项目管理中，一套功能全面、操作便捷的系统至关重要。本文将介绍一个基于Spring Cloud和Spring Boot技术的Java版工程项目管理系统，结合Vue和ElementUI实现前后端分离。该系统涵盖了项目管理、合同管理、预警管理、竣工管理、质量管理等多个…...

编程日记 2024/1/10 3:17:14

零门槛NAS搭建：WinNAS如何让普通电脑秒变私有云？

一、核心优势：专为Windows用户设计的极简NAS WinNAS由深圳耘想存储科技开发，是一款收费低廉但功能全面的Windows NAS工具，主打“无学习成本部署” 。与其他NAS软件相比，其优势在于： 无需硬件改造：将任意W…...

编程新知 2026/1/2 23:01:24

springboot 百货中心供应链管理系统小程序

一、前言随着我国经济迅速发展，人们对手机的需求越来越大，各种手机软件也都在被广泛应用，但是对于手机进行数据信息管理，对于手机的各种软件也是备受用户的喜爱，百货中心供应链管理系统被用户普遍使用，为方…...

编程新知 2026/2/8 20:41:49

（十）学生端搭建

本次旨在将之前的已完成的部分功能进行拼装到学生端，同时完善学生端的构建。本次工作主要包括： 1.学生端整体界面布局 2.模拟考场与部分个人画像流程的串联 3.整体学生端逻辑一、学生端在主界面可以选择自己的用户角色选择学生则进入学生登录界面…...

编程新知 2026/2/5 4:23:32

Appium+python自动化（十六）- ADB命令

简介 Android 调试桥(adb)是多种用途的工具，该工具可以帮助你你管理设备或模拟器的状态。 adb ( Android Debug Bridge)是一个通用命令行工具，其允许您与模拟器实例或连接的 Android 设备进行通信。它可为各种设备操作提供便利，如安装和调试…...

编程新知 2026/1/21 18:20:51

Oracle查询表空间大小

1 查询数据库中所有的表空间以及表空间所占空间的大小 SELECTtablespace_name,sum( bytes ) / 1024 / 1024 FROMdba_data_files GROUP BYtablespace_name; 2 Oracle查询表空间大小及每个表所占空间的大小 SELECTtablespace_name,file_id,file_name,round( bytes / ( 1024 …...

编程新知 2025/11/8 0:24:13

Mybatis逆向工程，动态创建实体类、条件扩展类、Mapper接口、Mapper.xml映射文件

今天呢，博主的学习进度也是步入了Java Mybatis 框架，目前正在逐步杨帆旗航。那么接下来就给大家出一期有关 Mybatis 逆向工程的教学，希望能对大家有所帮助，也特别欢迎大家指点不足之处，小生很乐意接受正确的建议&…...

编程新知 2026/1/31 15:00:15

C++ 基础特性深度解析

目录引言一、命名空间（namespace） C 中的命名空间与 C 语言的对比二、缺省参数 C 中的缺省参数与 C 语言的对比三、引用（reference） C 中的引用与 C 语言的对比四、inline（内联函数…...

编程新知 2026/1/15 4:25:16

ardupilot 开发环境eclipse 中import 缺少C++

目录文章目录目录摘要1.修复过程摘要本节主要解决ardupilot 开发环境eclipse 中import 缺少C++，无法导入ardupilot代码，会引起查看不方便的问题。如下图所示 1.修复过程 0.安装ubuntu 软件中自带的eclipse 1.打开eclipse—Help—install new software 2.在 Work with中…...

编程新知 2026/1/31 5:06:34

零基础设计模式——行为型模式 - 责任链模式

第四部分：行为型模式 - 责任链模式 (Chain of Responsibility Pattern) 欢迎来到行为型模式的学习！行为型模式关注对象之间的职责分配、算法封装和对象间的交互。我们将学习的第一个行为型模式是责任链模式。核心思想：使多个对象都有机会处…...

编程新知 2026/1/31 9:33:18

学习STC51单片机32（芯片为STC89C52RCRC）OLED显示屏2

每日一言今天的每一份坚持，都是在为未来积攒底气。案例：OLED显示一个A 这边观察到一个点，怎么雪花了就是都是乱七八糟的占满了屏幕。。解释 ： 如果代码里信号切换太快（比如 SDA 刚变，SCL 立刻变&#…...

编程新知 2026/2/6 0:50:24

1. 网络结构和基本组件

2. 搭建组件

3. 搭建网络

4. 训练验证

相关文章：