当前位置：首页 > news >正文

PyTorch学习笔记（十三）——现有网络模型的使用及修改

news 2026/2/11 0:35:04

以分类模型的VGG为例

vgg16_false = torchvision.models.vgg16(weights=False)
vgg16_true = torchvision.models.vgg16(weights=True)

设置为 False 的情况，相当于网络模型中的参数都是初始化的、默认的
设置为 True 时，网络模型中的参数在数据集上是训练好的，能达到比较好的效果

print(vgg16_true)

VGG((features): Sequential(
# 输入图片先经过卷积，输入是3通道的、输出是64通道的，卷积核大小是3×3的(0): Conv2d(3, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
# 非线性(1): ReLU(inplace=True)
# 卷积、非线性、池化...(2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))(3): ReLU(inplace=True)(4): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)(5): Conv2d(64, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))(6): ReLU(inplace=True)(7): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))(8): ReLU(inplace=True)(9): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)(10): Conv2d(128, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))(11): ReLU(inplace=True)(12): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))(13): ReLU(inplace=True)(14): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))(15): ReLU(inplace=True)(16): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)(17): Conv2d(256, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))(18): ReLU(inplace=True)(19): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))(20): ReLU(inplace=True)(21): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))(22): ReLU(inplace=True)(23): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)(24): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))(25): ReLU(inplace=True)(26): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))(27): ReLU(inplace=True)(28): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))(29): ReLU(inplace=True)(30): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False))(avgpool): AdaptiveAvgPool2d(output_size=(7, 7))(classifier): Sequential((0): Linear(in_features=25088, out_features=4096, bias=True)(1): ReLU(inplace=True)(2): Dropout(p=0.5, inplace=False)(3): Linear(in_features=4096, out_features=4096, bias=True)(4): ReLU(inplace=True)(5): Dropout(p=0.5, inplace=False)
# 最后线性层输出为1000（vgg16也是一个分类模型，能分出1000个类别）(6): Linear(in_features=4096, out_features=1000, bias=True))
)

CIFAR10 把数据分成了10类，而 vgg16 模型把数据分成了 1000 类，如何应用这个网络模型呢？

方法1：把最后线性层的 out_features 从1000改为10
方法2：在最后的线性层下面再加一层，in_features为1000，out_features为10

利用现有网络去改动它的结构，避免写 vgg16。很多框架会把 vgg16 当做前置的网络结构，提取一些特殊的特征，再在后面加一些网络结构，实现功能。

方法2：添加

vgg16_true.classifier.add_module("add_linear",nn.Linear(1000,10))
print(vgg16_true)

方法1：修改

vgg16_false.classifier[6] = nn.Linear(4096,10)
print(vgg16_false)

PyTorch学习笔记（十三）——现有网络模型的使用及修改

以分类模型的VGG为例 vgg16_false torchvision.models.vgg16(weightsFalse) vgg16_true torchvision.models.vgg16(weightsTrue) 设置为 False 的情况，相当于网络模型中的参数都是初始化的、默认的设置为 True 时，网络模型中的参数在数据集上是训练好…...

编程日记 2023/8/20 2:53:34

Python爬虫的scrapy的学习（学习于b站尚硅谷）

目录一、scrapy 1. scrapy的安装 （1）什么是scrapy （2）scrapy的安装 2. scrapy的基本使用 （1）scrap的使用步骤 （2）代码的演示 3. scrapy之58同城项目结构和基本方法&…...

编程日记 2023/8/20 2:52:33

“深入解析JVM：揭秘Java虚拟机的工作原理“

标题：深入解析JVM：揭秘Java虚拟机的工作原理摘要：本文将深入解析Java虚拟机（JVM）的工作原理，探讨其内部结构和运行机制。我们将介绍JVM的组成部分、类加载过程、内存管理、垃圾回收、即时编译等关键概念&…...

编程日记 2023/8/20 2:51:32

【数据结构与算法】十大经典排序算法-归并排序

🌟个人博客：www.hellocode.top 🏰Java知识导航：Java-Navigate 🔥CSDN：HelloCode. 🌞知乎：HelloCode 🌴掘金：HelloCode ⚡如有问题，欢迎指正&#…...

编程日记 2023/8/20 2:50:31

基于深度学习创建-表情符号--附源码

表情符号深度学习概述如今，我们使用多种表情符号或头像来表达我们的心情或感受。它们充当人类的非语言线索。它们成为情感识别、在线聊天、品牌情感、产品评论等的关键部分。针对表情符号驱动的故事讲述的数据科学研究不断增加。从图像中检测人类情绪非常流行，这可能是由…...

编程日记 2023/8/20 2:49:30

.netcore grpc的proto文件字段详解

一、.proto文件字段概述 grpc的接口传输参数都是根据.proto文件约定的字段格式进行传输的grpc提供了多种类型字段；主要包括标量值类型（基础类型）、日期时间、可为null类型、字节、列表、字典、Any类型（任意类型）、One…...

编程日记 2023/8/20 2:48:27

带你了解建堆的时间复杂度

目录用向上调整建堆的时间复杂度 1.向上调整建堆的时间复杂度O(N*logN) 2.数学论证 3.相关代码用向下调整建堆的时间复杂度 1.建堆的时间复杂度为O(N) 2.数学论证 3.相关代码完结撒花✿✿ヽ(▽)ノ✿✿ 博主建议:面试的时候可能会被面试官问到建堆时间复杂度的证明过…...

编程日记 2023/8/20 2:47:25

人工智能原理（6）

目录一、机器学习概述 1、学习和机器学习 2、学习系统 3、机器学习发展简史 4、机器学习分类二、归纳学习 1、归纳学习的基本概念 2、变型空间学习 3、归纳偏置三、决策树 1、决策树组成 2、决策树的构造算法CLS 3、ID3 4、决策树的偏置四、基于实例的学习…...

编程日记 2023/8/20 2:46:20

单片机模块化编程文件创建流程

一、在工程文件夹下创建一个新的文件夹，命名为“ModulesCodesFiles”，译为“模块化代码文件”，用于存放所有模块化代码文件。二、在“ModulesCodesFiles”文件夹下为每个模块创建一个新的文件夹，命名为模块的名称，例…...

编程日记 2023/8/20 2:45:19

docker image

docker image 1. 由来 docker image是Docker容器管理工具中的一个命令，用于管理和操作Docker镜像。 2. 常见五种示例命令和说明以下是docker image的常见示例命令及其说明： 示例一：列出所有镜像 docker image ls描述：使用d…...

编程日记 2023/8/20 2:44:18

力扣75——单调栈

总结leetcode75中的单调栈算法题解题思路。上一篇：力扣75——区间集合力扣75——单调栈 1 每日温度2 股票价格跨度1 - 2 解题总结 1 每日温度题目： 给定一个整数数组 temperatures ，表示每天的温度，返回一个数组 answer &…...

编程日记 2023/8/20 2:43:16

Webpack和Parcel详解

构建工具和打包器是在开发过程中帮助组织、优化和打包项目的工具。它们可以处理依赖管理、资源优化、代码转换等任务，从而使开发流程更高效。以下是关于构建工具和打包器的一些指导： **Webpack：** Webpack 是一个功能强大的模块打包器&#…...

编程日记 2023/8/20 2:42:14

linux系统服务学习（六）FTP服务学习

文章目录 FTP、NFS、SAMBA系统服务一、FTP服务概述1、FTP服务介绍2、FTP服务的客户端工具3、FTP的两种运行模式（了解）☆ 主动模式☆ 被动模式 4、搭建FTP服务（重要）5、FTP的配置文件详解（重要） 二、FTP任务…...

编程日记 2023/8/20 2:41:12

7.原型

7.1原型【例如】另外- this指向： 构造函数和原型对象中的this都指向实例化的对象 7.2 constructor属性每个原型对象里面都有个constructor属性( constructor构造函数) 作用：该属性指向该原型对象的构造函数使用场景: 如果有多个对象的方法&#…...

编程日记 2023/8/20 2:40:11

【图像分类】理论篇（2）经典卷积神经网络 Lenet~Resenet

目录 1、卷积运算 2、经典卷积神经网络 2.1 Lenet 网络构架代码实现 2.2 Alexnet 网络构架代码实现 2.3 VGG VGG16网络构架代码实现 2.4 ResNet ResNet50网络构架代码实现 1、卷积运算在二维卷积运算中，卷积窗口从输入张量的左上角开始&#xff…...

编程日记 2023/8/20 2:39:10

C++系列-内存模型

内存模型内存模型四个区代码区全局区栈区堆区内存开辟和释放在堆区开辟数组内存模型四个区不同区域存放的数据生命周期是不同的，更为灵活。代码区：存放函数体的二进制代码，操作系统管理。全局区：存放全局变量，常…...

编程日记 2023/8/20 2:38:05

[管理与领导-30]：IT基层管理者 - 人的管理 - 向上管理，管理好你的上司，职业发展事半功倍。什么样的上司不值得跟随？

目录前言： 一、什么是向上管理二、为什么要向上管理三、如何进行向上管理四、向上管理的注意事项五、向上管理的忌讳六、向上管理常犯的错七、如何帮助上司解决他关心的问题 7.1 如何帮助上司解决他关心的问题 7.2 如何帮助上司降低压力八、什么…...

编程日记 2023/8/20 2:37:04

Java进阶篇--迭代器模式

目录同步迭代器（Synchronous Iterator）： Iterator 接口常用方法： 注意： 扩展小知识: 异步迭代器（Asynchronous Iterator）： 常用的方法注意： 总结&#xff1a…...

编程日记 2023/8/20 2:36:03

【CAM】CAM(Class Activation Mapping)——可视化CNN的特征定位

文章目录一、CAM(Class Activation Mapping)二、CAM技术实现2.1 网络修改2.2 微调2.2 特征提取三、总结Reference 完整代码见Github ：https://github.com/capsule2077/CAM-Visualization ，如果有用可以点个Star，谢谢！ 一、CAM(C…...

编程日记 2023/8/20 2:35:02

Maven教程_编程入门自学教程_菜鸟教程-免费教程分享

教程简介 Maven 是一款基于 Java 平台的项目管理和整合工具，它将项目的开发和管理过程抽象成一个项目对象模型（POM）。开发人员只需要做一些简单的配置，Maven 就可以自动完成项目的编译、测试、打包、发布以及部署等工作。Maven 是…...

编程日记 2023/8/20 2:33:58

CVPR 2025 MIMO: 支持视觉指代和像素grounding 的医学视觉语言模型

CVPR 2025 | MIMO：支持视觉指代和像素对齐的医学视觉语言模型论文信息标题：MIMO: A medical vision language model with visual referring multimodal input and pixel grounding multimodal output作者：Yanyuan Chen, Dexuan Xu, Yu Hu…...

编程新知 2025/10/6 14:17:21

SciencePlots——绘制论文中的图片

文章目录安装一、风格二、1 资源安装 # 安装最新版 pip install githttps://github.com/garrettj403/SciencePlots.git# 安装稳定版 pip install SciencePlots一、风格简单好用的深度学习论文绘图专用工具包–Science Plot 二、 1 资源论文绘图神器来了：一行…...

编程新知 2025/9/8 13:50:07

三维GIS开发cesium智慧地铁教程（5）Cesium相机控制

一、环境搭建 <script src"../cesium1.99/Build/Cesium/Cesium.js"></script> <link rel"stylesheet" href"../cesium1.99/Build/Cesium/Widgets/widgets.css"> 关键配置点： 路径验证：确保相对路径.…...

编程新知 2025/12/1 19:23:04

8k长序列建模，蛋白质语言模型Prot42仅利用目标蛋白序列即可生成高亲和力结合剂

蛋白质结合剂（如抗体、抑制肽）在疾病诊断、成像分析及靶向药物递送等关键场景中发挥着不可替代的作用。传统上，高特异性蛋白质结合剂的开发高度依赖噬菌体展示、定向进化等实验技术，但这类方法普遍面临资源消耗巨大、研发周期冗长…...

编程新知 2026/1/25 13:18:12

【位运算】消失的两个数字（hard）

消失的两个数字（hard） 题⽬描述：解法（位运算）：Java 算法代码：更简便代码题⽬链接：⾯试题 17.19. 消失的两个数字题⽬描述： 给定⼀个数组，包含从 1 到 N 所有…...

编程新知 2025/11/15 16:18:24

转转集团旗下首家二手多品类循环仓店“超级转转”开业

6月9日，国内领先的循环经济企业转转集团旗下首家二手多品类循环仓店“超级转转”正式开业。转转集团创始人兼CEO黄炜、转转循环时尚发起人朱珠、转转集团COO兼红布林CEO胡伟琨、王府井集团副总裁祝捷等出席了开业剪彩仪式。据「TMT星球」了解，“超级…...

编程新知 2026/2/8 4:08:40

【git】把本地更改提交远程新分支feature_g

创建并切换新分支 git checkout -b feature_g 添加并提交更改 git add . git commit -m “实现图片上传功能” 推送到远程 git push -u origin feature_g...

编程新知 2025/12/13 4:20:30

相机Camera日志分析之三十一：高通Camx HAL十种流程基础分析关键字汇总（后续持续更新中）

【关注我，后续持续新增专题博文，谢谢！！！】上一篇我们讲了：有对最普通的场景进行各个日志注释讲解，但相机场景太多，日志差异也巨大。后面将展示各种场景下的日志。通过notepad++打开场景下的日志，通过下列分类关键字搜索，即可清晰的分析不同场景的相机运行流程差异…...

编程新知 2025/11/20 7:13:43

EtherNet/IP转DeviceNet协议网关详解

一，设备主要功能疆鸿智能JH-DVN-EIP本产品是自主研发的一款EtherNet/IP从站功能的通讯网关。该产品主要功能是连接DeviceNet总线和EtherNet/IP网络，本网关连接到EtherNet/IP总线中做为从站使用，连接到DeviceNet总线中做为从站使用。在自动…...

编程新知 2026/1/31 6:53:51

【Java学习笔记】BigInteger 和 BigDecimal 类

BigInteger 和 BigDecimal 类二者共有的常见方法方法功能add加subtract减multiply乘divide除注意点：传参类型必须是类对象一、BigInteger 1. 作用：适合保存比较大的整型数 2. 使用说明创建BigInteger对象传入字符串 3. 代码示例 import j…...

编程新知 2025/11/8 15:39:00

相关文章：