当前位置：首页 > news >正文

深度学习15—（迁移学习）冻结和解冻神经网络模型的参数

news 2026/2/10 8:40:46

冻结与解冻代码：

def freeze_net(net):if not net:returnfor p in net.parameters():p.requires_grad = Falsedef unfreeze_net(net):if not net:returnfor p in net.parameters():p.requires_grad = True

这段代码定义了两个函数：`freeze_net` 和 `unfreeze_net`，这两个函数的目的是分别冻结和解冻一个神经网络模型的参数，控制是否对模型参数进行梯度计算。以下是对这两个函数的详细解释：

# 当调用此函数后，模型的参数将不再参与梯度计算，即在反向传播过程中不会更新这些参数的梯度值
# 输入参数 net 是一个 PyTorch 模型对象
def freeze_net(net):# 检查 net 是否为 None 或者为空，如果是则直接返回，不进行任何操作if not net:return# 通过设置 p.requires_grad = False，将参数的梯度计算设置为不可用（冻结）for p in net.parameters():p.requires_grad = False# 当调用此函数后，模型的参数将重新参与梯度计算，即在反向传播过程中会更新这些参数的梯度值
def unfreeze_net(net):# 检查 net 是否为 None 或者为空，如果是则直接返回，不进行任何操作if not net:return# 对模型的每个参数进行遍历，通过设置 p.requires_grad = True，将参数的梯度计算设置为可用（解冻）for p in net.parameters():p.requires_grad = True

这两个函数对于模型微调（fine-tuning）和迁移学习（transfer learning）等场景非常有用。例如，在迁移学习中，你可能希望冻结预训练模型的一部分参数，只更新模型的最后几层以适应新任务。通过这两个函数，可以方便地控制模型参数的梯度计算状态。

深度学习15—（迁移学习）冻结和解冻神经网络模型的参数

相关文章：

深度学习15—（迁移学习）冻结和解冻神经网络模型的参数

强化学习应用（八）：基于Q-learning的无人机物流路径规划研究（提供Python代码）

常见面试题之HTML

数据结构与算法教程，数据结构C语言版教程！（第三部分、栈(Stack)和队列(Queue)详解）六

使用Docker部署PDF多功能工具Stirling-PDF

linux安装系统遇到的问题

groovy XmlParser 递归遍历 xml 文件，修改并保存

小程序基础学习（多插槽）

爬虫补环境jsdom、proxy、Selenium案例：某条

电子学会C/C++编程等级考试2021年09月（四级）真题解析

DevExpress历史安装文件包集合

科技云报道：“存算一体”是大模型AI芯片的破局关键？

watch监听一个对象中的属性 - Vue篇

Spark---RDD序列化

Xtuner大模型微调

JavaScript基础04

HarmonyOS@Observed装饰器和@ObjectLink装饰器：嵌套类对象属性变化

x-cmd pkg | jless - 受 Vim 启发的命令行 JSON 查看器

【HuggingFace Transformer库学习笔记】基础组件学习：Datasets

[机缘参悟-126] ：实修 - 从系统论角度理解自洽的人生：和谐、稳定，不拧巴，不焦虑，不纠结

简易版抽奖活动的设计技术方案

JVM垃圾回收机制全解析

Nginx server_name 配置说明

相机从app启动流程

pikachu靶场通关笔记22-1 SQL注入05-1-insert注入(报错法)

图表类系列各种样式PPT模版分享

基于TurtleBot3在Gazebo地图实现机器人远程控制

[免费]微信小程序问卷调查系统(SpringBoot后端+Vue管理端)【论文+源码+SQL脚本】

【Linux系统】Linux环境变量：系统配置的隐形指挥官

协议转换利器，profinet转ethercat网关的两大派系，各有千秋