当前位置：首页 > article >正文

epoch、batch、batch size、step、iteration深度学习名词含义详细介绍

article 2026/2/16 16:27:39

卷积神经网络训练中的三个核心概念：Epoch、Batch Size 和迭代次数

在深度学习中，理解一些基本的术语非常重要，这些术语对模型的训练过程、效率以及最终性能都有很大影响。以下是一些常见术语的含义介绍：

1. Epoch（周期）

定义：

Epoch指的是整个训练数据集通过神经网络一次的过程。在一次epoch中，神经网络会使用训练集中的所有数据样本，并进行一次完整的前向传播和反向传播。

详细解释：

一个epoch意味着所有训练数据都已被模型看过一次并进行了学习。
在多次训练（多次epoch）过程中，模型会不断通过训练数据进行调整和优化。

示例：

如果训练集有1000个样本，模型训练了10个epoch，那么在训练过程中，模型将总共看到10000个样本。

2. Batch（批）

定义：

Batch指的是在一次训练过程中，输入到神经网络中的一组数据样本。训练集通常会被分成多个batch，每个batch的大小是由batch size确定的。

详细解释：

由于计算资源的限制，通常不会将整个数据集一次性输入到模型中，而是将数据分批处理，每批处理一部分数据。
一个batch由多个样本组成，网络每处理完一个batch，会更新一次参数。

示例：

如果训练集有1000个样本，batch size为100，则每个epoch会被分为10个batch。

3. Batch Size（批大小）

定义：

Batch size是指每次训练中输入神经网络的样本数量。它决定了一个batch包含多少个样本。

详细解释：

较小的batch size可以增加训练的噪声，有助于防止过拟合，但可能导致训练过程更慢。
较大的batch size则可以加速训练过程，但可能会导致模型的泛化能力下降。

示例：

如果训练集有1000个样本，选择batch size为200，则每个epoch会分为5个batch。

4. Step（步长）

定义：

在深度学习中，step通常指的是一次迭代过程中所做的参数更新步骤。每次处理一个batch后，模型都会进行一次参数更新，这个过程称为一个step。

详细解释：

每处理完一个batch，神经网络会通过反向传播算法计算梯度，并更新模型参数。这一过程称为一个step。
如果batch size较大，步长的更新会较少；如果batch size较小，步长会更频繁。

示例：

在一个epoch中，如果batch size为1000，step为1；如果batch size为100，step为10。

5. Iteration（迭代）

定义：

Iteration是指在训练过程中，一次前向传播和反向传播的过程，通常是指一次参数更新的过程。一个iteration对应着处理一个batch的数据。

详细解释：

每个iteration包括了前向传播（计算输出）和反向传播（更新参数）两个步骤。
迭代次数取决于训练集的大小和batch size。

示例：

假设训练集有1000个样本，batch size为100，完成一个epoch需要1000/100 = 10次迭代。

各个概念之间的关系

Epoch和Iteration：
- 一个epoch由多个iteration组成。假设训练集大小为 $m$ ，batch size为 $b$ ，则每个epoch的iteration数为：
  $\text{Iteration数} = \frac{m}{b}$
Batch和Batch Size：
- Batch是指一组数据样本，而batch size是每个batch中数据样本的数量。选择适当的batch size对训练效果和速度有显著影响。

总结

名词	含义
Epoch	训练数据集完整通过神经网络一次
Batch	神经网络每次处理的一组样本
Batch Size	每个batch中的样本数量
Step	每次处理一个batch并更新一次模型参数的步骤
Iteration	训练过程中前向传播与反向传播一次的过程

进阶概念

1. 梯度累积(Gradient Accumulation)

当GPU内存不足时，可以使用小batch size多次累积梯度后再更新：

for i, (inputs, targets) in enumerate(dataloader):outputs = model(inputs)loss = criterion(outputs, targets)loss = loss / accumulation_steps  # 归一化loss.backward()if (i+1) % accumulation_steps == 0:optimizer.step()optimizer.zero_grad()

2. 可变Batch Size

一些研究使用逐渐增大的batch size：
$b_t = b_0 \times k^t$
其中 $k$ 是增长因子， $t$ 是epoch数

3. 迭代与epoch的权衡

更多epoch：模型看到更多数据变体
更多迭代：更精细的梯度更新

实际代码示例(PyTorch)

import torch
from torch.utils.data import DataLoader# 假设我们有一个包含1000个样本的数据集
dataset = torch.randn(1000, 3, 224, 224)  # 1000张3通道224x224图像
labels = torch.randint(0, 10, (1000,))    # 1000个0-9的标签# 创建DataLoader
batch_size = 64
dataloader = DataLoader(dataset=torch.utils.data.TensorDataset(dataset, labels),batch_size=batch_size,shuffle=True)num_epochs = 10
total_samples = len(dataset)
iterations_per_epoch = total_samples // batch_size
total_iterations = num_epochs * iterations_per_epochprint(f"总样本数: {total_samples}")
print(f"Batch Size: {batch_size}")
print(f"每个epoch的迭代次数: {iterations_per_epoch}")
print(f"{num_epochs}个epoch的总迭代次数: {total_iterations}")# 训练循环
for epoch in range(num_epochs):for i, (inputs, targets) in enumerate(dataloader):# 这里进行实际训练步骤print(f"Epoch: {epoch+1}/{num_epochs}, Iteration: {i+1}/{iterations_per_epoch}")# 前向传播、计算损失、反向传播、参数更新...

总结

Batch Size：决定每次参数更新使用的样本数，影响内存使用和梯度噪声
迭代次数：完成一个epoch需要的参数更新次数，等于总样本数/batch size
Epoch：完整遍历整个训练集的次数，是训练进度的宏观度量

理解这三个概念及其相互关系对于有效训练深度学习模型至关重要。合理设置这些超参数可以显著影响模型的训练速度、收敛性和最终性能。

epoch、batch、batch size、step、iteration深度学习名词含义详细介绍

卷积神经网络训练中的三个核心概念：Epoch、Batch Size 和迭代次数在深度学习中，理解一些基本的术语非常重要，这些术语对模型的训练过程、效率以及最终性能都有很大影响。以下是一些常见术语的含义介绍： 1. Epoch（周…...

编程日记 2026/2/15 16:09:16

pytorch中不同的mask方法：masked_fill, masked_select, masked_scatter

在 PyTorch 中，masked_fill、masked_select 和 masked_scatter 是三种常用的掩码（mask）操作方法，它们通过布尔类型的掩码张量（mask）对原始张量进行条件筛选或修改。以下是它们的详细解释和对比：…...

编程日记 2026/1/22 10:00:40

TCP 协议算法解析 | RTT / 滑动窗口 / 拥塞控制

注：本文为 “TCP 协议算法解析” 相关文章合辑。略作重排，未去重。如有内容异常，请看原文。 TCP 的那些事儿（上） 2014 年 05 月 28 日陈皓 TCP 是一个极为复杂的协议，因为它需要解决众多问题&#x…...

编程日记 2026/2/15 15:18:29

卷积神经网络 - ResNet（残差网络）

残差网络(Residual Network，ResNet)通过给非线性的卷积层增加直连边 (Shortcut Connection)(也称为残差连接(Residual Connection))的方式来提高信息的传播效率。这是一种特殊的深度神经网络结构，由 Kaiming He 等人在 2015 年提出，目的是解…...

编程日记 2026/2/14 20:39:32

GreenPlum学习

简介 Greenplum是一个面向数据仓库应用的关系型数据库，因为有良好的体系结构，所以在数据存储、高并发、高可用、线性扩展、反应速度、易用性和性价比等方面有非常明显的优势。Greenplum是一种基于PostgreSQL的分布式数据库，其采用sharednothi…...

编程日记 2026/2/14 19:24:05

传统神经网络、CNN与RNN

在网络上找了很多关于深度学习的资料，也总结了一点小心得，于是就有了下面这篇文章。这里内容较为简单，适合初学者查看，所以大佬看到这里就可以走了。话不多说，上图 #mermaid-svg-Z3k5YhiQ2o5AnvZE {font-family:&quo…...

编程日记 2026/2/16 1:03:05

无人机，雷达定点飞行时，位置发散，位置很飘，原因分析

参考： 无人车传感器 IMU与GPS数据融合进行定位机制_gps imu 组合定位原始数-CSDN博客我的无人机使用雷达定位，位置模式很飘雷达的更新频率也是10HZ， 而px飞控的频率是100HZ，没有对两者之间的频率差异做出处理所以才导致无人…...

编程日记 2026/2/15 10:16:58

【Linux探索学习】第二十九弹——线程概念：Linux线程的基本概念与线程控制详解

Linux学习笔记： https://blog.csdn.net/2301_80220607/category_12805278.html?spm1001.2014.3001.5482 前言： 在现代操作系统中，线程是程序执行流的最小单元。与进程相比，线程更加轻量级，创建和销毁的开销更小&…...

编程日记 2026/2/15 10:08:10

做游戏的发展方向

自己做的游戏（询问发展方向） 请选择发展方向（截止时间5.1）(投票截止3.24) （这将影响接下来用的游戏发展(未登录也可参加)） 网页 c(原)...

编程日记 2026/2/13 19:44:56

深入探索 iOS 卡顿优化

认识卡顿一些概念 FPS：Frames Per Second，表示每秒渲染的帧数，通过用于衡量画面的流畅度，数值越高则表示画面越流畅。CPU：负责对象的创建和销毁、对象属性的调整、布局计算、文本的计算和排版、图片的格式转换和解码…...

编程日记 2026/2/15 13:09:46

# 基于 OpenCV 的选择题自动批改系统实现

在教育领域，选择题的批改工作通常较为繁琐且重复性高。为了提高批改效率，我们可以利用计算机视觉技术，通过 OpenCV 实现选择题的自动批改。本文将详细介绍如何使用 Python 和 OpenCV 实现一个简单的选择题自动批改系统。 1. 项目背景选择题…...

编程日记 2026/2/13 7:02:27

在Linux系统中将html保存为PNG图片

1 前言之前使用Pyecharts库在Windows系统中生成图表并转换为PNG格式图片（传送门），现将代码放于Linux服务器上运行，结果发现错误，生成html文件之后无法保存图片。 2 原理基于Selenium库的保存方案，其原…...

编程日记 2026/2/15 14:28:39

身份验证：区块链如何让用户掌控一切

在网上证明你自称的身份变得越来越复杂。由于日常生活的很多方面现在都在网上进行，保护你的数字身份比以往任何时候都更加重要。我们可能都接受过安全培训，这些培训鼓励我们选择安全的密码、启用双因素身份验证或回答安全问题，例如“你祖母…...

编程日记 2026/2/15 16:52:06

嵌入式硬件： GPIO与二极管基础知识详解

1. 前言在嵌入式系统和硬件开发中，GPIO（通用输入输出）是至关重要的控制方式，而二极管作为基础电子元件，广泛应用于信号整流、保护电路等。本文将从基础原理出发，深入解析GPIO的输入输出模式，包…...

编程日记 2026/2/14 19:18:34

Android HAL 架构详解，底层开发不再难

目录 HAL 基础概念 HAL 是个啥？为啥要有 HAL？ HAL 在系统中的位置 HAL 工作原理抽象接口：硬件的 “通用语言” 接口的设计思路核心结构体版本与兼容性实例：相机 HAL 接口模块加载：动态链接的魔法加载步骤优化策略实例：加载音频 HAL 通信机制：HAL…...

编程日记 2026/2/14 12:01:44

游戏引擎学习第194天

为当天的活动做铺垫正在进行游戏开发中的调试和视图功能开发。目标是增加一些新功能，使得在开发过程中能够有效地检查游戏行为。今天的重点是推进用户界面（UI）的开发，并且尝试在调试变量的管理上找到一个折中的解决方案。计划探…...

编程日记 2026/2/12 21:24:20

js文字两端对齐

目录一、问题二、原因及解决方法三、总结一、问题 1.text-align: justify; 不就可以了吗？但是实际测试无效二、原因及解决方法 1.原因：text-align只对非最后一行文字有效。只有一行文字时，text-align无效，要用text-alig…...

编程日记 2026/2/16 4:21:08

经典论文解读系列：MapReduce 论文精读总结：简化大规模集群上的数据处理

🧠 MapReduce 论文解读总结：简化大规模集群上的数据处理原文标题：MapReduce: Simplified Data Processing on Large Clusters 作者：Jeffrey Dean & Sanjay Ghemawat 发表时间：2004 年发表机构：Google…...

编程日记 2026/2/16 8:18:22

HarmonyOS 介绍

HarmonyOS简介随着万物互联时代的开启，应用的设备底座将从几十亿手机扩展到数百亿IoT设备。全新的全场景设备体验，正深入改变消费者的使用习惯。同时应用开发者也面临设备底座从手机单设备到全场景多设备的转变，全场景多设备的全新底座&am…...

编程日记 2026/2/15 14:39:26

每天一篇目标检测文献（六）——Part One

今天看的是《Object Detection with Deep Learning: A Review》目录一、摘要 1.1 原文 1.2 翻译二、介绍 2.1 信息区域选择 2.2 特征提取 2.3 分类三、深度学习的简要回顾 3.1 历史、诞生、衰落和繁荣 3.2 CNN架构和优势一、摘要 1.1 原文 Due to object dete…...

编程日记 2026/2/16 12:18:11

ESXI 安装及封装第三方驱动和在ESXI系统下安装驱动

ESXI 安装及封装第三方驱动和在ESXI系统下安装驱动准备工作在线安装 Windows PowerShell离线安装 Windows PowerShell更新在线更新离线更新下载 ESXi-Customizer-PS-v2.6.0.ps1安装Python安装pip安装相关插件下载离线捆绑包下载对应的网卡驱动（如果纯净版可以进去…...

编程日记 2026/2/14 2:06:01