当前位置：首页 > news >正文

model.train()和model.eval()两种模式的原理

news 2026/2/9 19:24:49

1. model.train()

在使用 pytorch 构建神经网络的时候，训练过程中会在程序上方添加一句model.train()，作用是启用 batch normalization 和 dropout 。

如果模型中有BN层（Batch Normalization）和 Dropout ，需要在训练时添加 model.train()。

model.train() 是保证 BN 层能够用到每一批数据的均值和方差。对于 Dropout，model.train() 是随机取一部分网络连接来训练更新参数。

2. model.eval()

model.eval()的作用是不启用 Batch Normalization 和 Dropout。

如果模型中有 BN 层（Batch Normalization）和 Dropout，在测试时添加 model.eval()。

model.eval() 是保证 BN 层能够用全部训练数据的均值和方差，即测试过程中要保证 BN 层的均值和方差不变。对于 Dropout，model.eval() 是利用到了所有网络连接，即不进行随机舍弃神经元。

为什么测试时要用 model.eval() ？

训练完 train 样本后，生成的模型 model 要用来测试样本了。在 model(test) 之前，需要加上model.eval()，否则的话，有输入数据，即使不训练，它也会改变权值。这是 model 中含有 BN 层和 Dropout 所带来的的性质。

eval() 时，pytorch 会自动把 BN 和 DropOut 固定住，不会取平均，而是用训练好的值。
不然的话，一旦 test 的 batch_size 过小，很容易就会被 BN 层导致生成图片颜色失真极大。
eval() 在非训练的时候是需要加的，没有这句代码，一些网络层的值会发生变动，不会固定，你神经网络每一次生成的结果也是不固定的，生成质量可能好也可能不好。

也就是说，测试过程中使用model.eval()，这时神经网络会沿用 batch normalization 的值，而并不使用 dropout。

model.train()和model.eval()两种模式的原理

1. model.train() 在使用 pytorch 构建神经网络的时候，训练过程中会在程序上方添加一句model.train()，作用是启用 batch normalization 和 dropout 。如果模型中有BN层（Batch Normalization）和 Dropout ，需要在训练…...

编程日记 2024/2/20 10:00:38

docker的底层原理六: 联合文件系统（UnionFS）

Docker的底层存储原理基于联合文件系统（UnionFS）。联合文件系统（UnionFS）是一种特殊的文件系统，它允许独立地叠加多个目录层，呈现给用户的是这些目录层的联合视图。这种结构使得在Docker中，不…...

编程日记 2024/2/20 9:59:37

【动态规划专栏】专题一：斐波那契数列模型--------1.第N个泰波那契数

本专栏内容为：算法学习专栏，分为优选算法专栏，贪心算法专栏，动态规划专栏以及递归，搜索与回溯算法专栏四部分。通过本专栏的深入学习，你可以了解并掌握算法。 💓博主csdn个人主页：小…...

编程日记 2024/2/20 9:58:35

自养号测评低成本高效率推广，安全可控

测评的作用在于让用户更真实、清晰、快捷地了解产品以及产品的使用方法和体验。通过买家对产品的测评，也可以帮助厂商和卖家优化产品缺陷，提高用户的使用体验。这进而帮助他们获得更好的销量，并更深入地了解市场需求。因此，测评在…...

编程日记 2024/2/20 9:56:32

ubuntu22.04@laptop OpenCV Get Started: 015_deep_learning_with_opencv_dnn_module

ubuntu22.04laptop OpenCV Get Started: 015_deep_learning_with_opencv_dnn_module 1. 源由2. 应用Demo2.1 C应用Demo2.2 Python应用Demo 3. 使用 OpenCV DNN 模块进行图像分类3.1 导入模块并加载类名文本文件3.2 从磁盘加载预训练 DenseNet121 模型3.3 读取图像并准备为模型输…...

编程日记 2024/2/20 9:55:31

【elk查日志 elastic（kibana）】

文章目录概要具体的使用方式一：查找接口调用历史二：查找自己的打印日志三：查找错误日志概要每次查日志，我都需要别人帮我，时间长了总觉得不好意思，所以这次下定决心好好的梳理一下，怎么查日…...

编程日记 2024/2/20 9:52:26

RapidMiner数据挖掘2 —— 初识RapidMiner

本节由一系列练习与问题组成，这些练习与问题有助于理解多个基本概念。它侧重于各种特定步骤，以进行直接的探索性数据分析。因此，其主要目标是测试一些检查初步数据特征的方法。大多数练习都是关于图表技术，通常用于数据挖掘。为此…...

编程日记 2024/2/20 9:51:25

基于STM32的光照检测系统设计

基于STM32的光照检测系统设计摘要：随着物联网和智能家居的快速发展，光照检测系统在智能环境控制中扮演着越来越重要的角色。本文设计了一种基于STM32的光照检测系统，该系统能够实时检测环境光强度，并根据光强度调节照明设备，实现智能照明控制。本文首先介绍了系统的总体…...

编程日记 2024/2/20 9:50:24

车辆管理系统设计与实践

车辆管理系统是针对车辆信息、行驶记录、维护保养等进行全面管理的系统。本文将介绍车辆管理系统的设计原则、技术架构以及实践经验，帮助读者了解如何构建一个高效、稳定的车辆管理系统。 1. 系统设计原则在设计车辆管理系统时，需要遵循以下设计原则&…...

编程日记 2024/2/20 9:48:21

板块一 Servlet编程：第四节 HttpServletResponse对象全解与重定向来自【汤米尼克的JAVAEE全套教程专栏】

板块一 Servlet编程：第四节 HttpServletResponse对象全解与重定向一、什么是HttpServletResponse二、响应数据的常用方法三、响应乱码问题字符流乱码字节流乱码四、重定向：sendRedirect请求转发和重定向的区别在上一节中，我们系统的学习了…...

编程日记 2024/2/20 9:46:19

漫谈：C/C++ char 和 unsigned char 的用途

C/C的字符默认是有符号的，这一点非常的不爽，因为很少有人用单字节表达有符号数，毕竟，ASCII码是无符号的，对字符的绝大多数处理都是基于无符号的。这一点在其它编程语言上就好很多，基本上都提供了byte这种类…...

编程日记 2024/2/20 9:45:18

安全保护制度

安全保护制度第九条计算机信息系统实行安全等级保护。安全等级的划分标准和安全等级保护的具体办法，由公安部会同有关部门制定。第十条计算机机房应当符合国家标准和国家有关规定。在计算机机房附近施工，不得危害计算机信息系统的安全。第十一条进行国际联网的计算…...

编程日记 2024/2/20 9:42:14

沁恒CH32V30X学习笔记07---多功能按键框架使用

多功能按键框架使用参考开源框架： GitHub - 0x1abin/MultiButton: Button driver for embedded system 框架使用说明： ch32gpio基本驱动 https://blog.csdn.net/u010261063/article/details/136157718 MultiButton 简介 MultiButton 是一个小巧简单易用的事件驱动型按…...

编程日记 2024/2/20 9:40:12

如何看显卡是几G？

created: 2024-02-20T09:22:13 (UTC 08:00) tags: [] source: https://www.sysgeek.cn/windows-check-gpu-model/ author: 海猴子 6 种简单方法：如何在 Windows 中轻松查看显卡型号 - 系统极客 Excerpt 不确定你的显卡型号？使用这 6 个简单有效的方法&a…...

编程日记 2024/2/20 9:39:11

虚拟机--pc端和macOS端互通

windows开启虚拟化要在Windows系统中开启虚拟化，您可以按照以下步骤操作： 准备工作： 确保您的计算机CPU支持虚拟化技术。在BIOS中开启相应的虚拟化支持。开启虚拟化： 打开控制面板，点击程序或功能项&am…...

编程日记 2024/2/20 9:36:08

(14)Hive调优——合并小文件

目录一、小文件产生的原因二、小文件的危害三、小文件的解决方案 3.1 小文件的预防 3.1.1 减少Map数量 3.1.2 减少Reduce的数量 3.2 已存在的小文件合并 3.2.1 方式一：insert overwrite (推荐) 3.2.2 方式二：concatenate 3.2.3 方式三&#xff…...

编程日记 2024/2/20 9:35:07

Linux 驱动开发基础知识——LED 模板驱动程序的改造：设备树（十一）

个人名片： 🦁作者简介：学生 🐯个人主页：妄北y 🐧个人QQ：2061314755 🐻个人邮箱：2061314755qq.com 🦉个人WeChat：Vir2021GKBS 🐼本文由…...

编程日记 2024/2/20 9:34:06

学习文档：QT QTreeWidget及其代理

学习文档：QT QTreeWidget及其代理 1. QT QTreeWidget简介 QT QTreeWidget是QT框架中的一个重要组件，用于显示树形数据结构。它提供了一种方便的方式来展示并操作带有层次关系的数据。QTreeWidget可以显示包含多个列的树形视图，每个项目可以…...

编程日记 2024/2/20 9:33:05

代码随想录算法训练营——总结篇

不知不觉跟完了代码训练营为期两个月的训练，现在来做个总结吧~ 记得去年12月上旬的时候，我每天都非常浮躁。一方面，经历了三个多月的秋招，我的日常学习和实验室进展被完全打乱，导致状态很差；另一方面&#…...

编程日记 2024/2/20 9:32:04

更改WordPress作者存档链接author和用户名插件Change Author Link Structure

WordPress作者存档链接默认情况为/author/Administrator（用户名），为了防止用户名泄露，我们可以将其改为/author/1（用户ID），具体操作可参考『如何将WordPress作者存档链接中的用户名改为昵称或ID…...

编程日记 2024/2/20 9:25:58

iPhone密码忘记了办？iPhoneUnlocker，iPhone解锁工具Aiseesoft iPhone Unlocker 高级注册版分享

平时用 iPhone 的时候，难免会碰到解锁的麻烦事。比如密码忘了、人脸识别 / 指纹识别突然不灵，或者买了二手 iPhone 却被原来的 iCloud 账号锁住，这时候就需要靠谱的解锁工具来帮忙了。Aiseesoft iPhone Unlocker 就是专门解决这些问题的软件&…...

编程新知 2026/1/29 10:22:28

YSYX学习记录（八）

C语言，练习0： 先创建一个文件夹，我用的是物理机： 安装build-essential 练习1： 我注释掉了 #include <stdio.h> 出现下面错误在你的文本编辑器中打开ex1文件，随机修改或删除一部分，之后…...

编程新知 2026/1/24 14:31:01

【Web 进阶篇】优雅的接口设计：统一响应、全局异常处理与参数校验

系列回顾： 在上一篇中，我们成功地为应用集成了数据库，并使用 Spring Data JPA 实现了基本的 CRUD API。我们的应用现在能“记忆”数据了！但是，如果你仔细审视那些 API，会发现它们还很“粗糙”：有…...

编程新知 2026/1/22 20:46:43

网络编程（UDP编程）

思维导图 UDP基础编程（单播） 1.流程图服务器：短信的接收方创建套接字 (socket)-----------------------------------------》有手机指定网络信息-----------------------------------------------》有号码绑定套接字 (bind)--------------…...

编程新知 2026/2/4 17:31:44

Spring数据访问模块设计

前面我们已经完成了IoC和web模块的设计，聪明的码友立马就知道了，该到数据访问模块了，要不就这俩玩个6啊，查库势在必行，至此，它来了。一、核心设计理念 1、痛点在哪应用离不开数据（数据库、No…...

编程新知 2026/2/4 16:13:50

视觉slam十四讲实践部分记录——ch2、ch3

ch2 一、使用g++编译.cpp为可执行文件并运行(P30) g++ helloSLAM.cpp ./a.out运行二、使用cmake编译 mkdir build cd build cmake .. makeCMakeCache.txt 文件仍然指向旧的目录。这表明在源代码目录中可能还存在旧的 CMakeCache.txt 文件，或者在构建过程中仍然引用了旧的路…...

编程新知 2026/2/6 15:56:54

基于Java+MySQL实现（GUI）客户管理系统

客户资料管理系统的设计与实现第一章需求分析 1.1 需求总体介绍本项目为了方便维护客户信息为了方便维护客户信息，对客户进行统一管理，可以把所有客户信息录入系统，进行维护和统计功能。可通过文件的方式保存相关录入数据，对…...

编程新知 2026/1/25 10:12:06

LabVIEW双光子成像系统技术

双光子成像技术的核心特性双光子成像通过双低能量光子协同激发机制，展现出显著的技术优势： 深层组织穿透能力：适用于活体组织深度成像高分辨率观测性能：满足微观结构的精细研究需求低光毒性特点：减少对样本的损伤…...

编程新知 2026/1/31 13:04:44

解析奥地利 XARION激光超声检测系统：无膜光学麦克风 + 无耦合剂的技术协同优势及多元应用

在工业制造领域，无损检测（NDT)的精度与效率直接影响产品质量与生产安全。奥地利 XARION开发的激光超声精密检测系统，以非接触式光学麦克风技术为核心，打破传统检测瓶颈，为半导体、航空航天、汽车制造等行业提供了高灵敏…...

编程新知 2026/2/3 15:45:51

系统掌握PyTorch：图解张量、Autograd、DataLoader、nn.Module与实战模型

本文较长，建议点赞收藏，以免遗失。更多AI大模型应用开发学习视频及资料，尽在聚客AI学院。本文通过代码驱动的方式，系统讲解PyTorch核心概念和实战技巧，涵盖张量操作、自动微分、数据加载、模型构建和训练全流程&#…...

编程新知 2026/2/7 23:15:50

1. model.train()

2. model.eval()

为什么测试时要用 model.eval() ？

相关文章：