当前位置：首页 > news >正文

深度学习中的并行策略概述：2 Data Parallelism

news 2026/4/3 2:00:09

深度学习中的并行策略概述：2 Data Parallelism
在这里插入图片描述
数据并行（Data Parallelism）的核心在于将模型的数据处理过程并行化。具体来说，面对大规模数据批次时，将其拆分为较小的子批次，并在多个计算设备上同时进行处理。每个设备负责处理一个子批次，实现并行计算。处理完成后，将各个设备上的计算结果汇总，以便对模型进行统一更新。由于其在深度学习中的普遍应用，数据并行成为了一种广泛支持的并行计算策略，并在主流框架中得到了良好的实现。

以下代码展示了如何在PyTorch中使用nn.DataParallel和DistributedDataParallel实现数据并行，以加速模型的训练过程。

使用nn.DataParallel实现数据并行

import torch
import torch.nn as nn
from torch.utils.data import Dataset, DataLoader# 假设我们有一个简单的数据集类
class SimpleDataset(Dataset):def __init__(self, data, target):self.data = dataself.target = targetdef __len__(self):return len(self.data)def __getitem__(self, idx):return self.data[idx], self.target[idx]# 假设我们有一个简单的神经网络模型
class SimpleModel(nn.Module):def __init__(self, input_dim):super(SimpleModel, self).__init__()self.fc = nn.Linear(input_dim, 1)def forward(self, x):return torch.sigmoid(self.fc(x))# 假设我们有一些数据
n_sample = 100
n_dim = 10
batch_size = 10
X = torch.randn(n_sample, n_dim)
Y = torch.randint(0, 2, (n_sample,)).float()
dataset = SimpleDataset(X, Y)
data_loader = DataLoader(dataset, batch_size=batch_size, shuffle=True)# 初始化模型
device_ids = [0, 1, 2]  # 指定使用的GPU编号
model = SimpleModel(n_dim).to(device_ids[0])
model = nn.DataParallel(model, device_ids=device_ids)# 定义优化器和损失函数
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)
criterion = nn.BCELoss()# 训练模型
for epoch in range(10):for batch_idx, (inputs, targets) in enumerate(data_loader):inputs, targets = inputs.to('cuda'), targets.to('cuda')outputs = model(inputs)loss = criterion(outputs, targets.unsqueeze(1))optimizer.zero_grad()loss.backward()optimizer.step()print(f'Epoch {epoch}, Batch {batch_idx}, Loss: {loss.item()}')

使用DistributedDataParallel实现数据并行

import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader, Dataset
import torch.distributed as dist
from torch.nn.parallel import DistributedDataParallel as DDP# 假设我们有一个简单的数据集类
class SimpleDataset(Dataset):def __init__(self, data, target):self.data = dataself.target = targetdef __len__(self):return len(self.data)def __getitem__(self, idx):return self.data[idx], self.target[idx]# 假设我们有一个简单的神经网络模型
class SimpleModel(nn.Module):def __init__(self, input_dim):super(SimpleModel, self).__init__()self.fc = nn.Linear(input_dim, 1)def forward(self, x):return torch.sigmoid(self.fc(x))# 初始化进程组
def init_process(rank, world_size, backend='nccl'):dist.init_process_group(backend, rank=rank, world_size=world_size)# 训练函数
def train(rank, world_size):init_process(rank, world_size)torch.cuda.set_device(rank)model = SimpleModel(10).to(rank)model = DDP(model, device_ids=[rank])dataset = SimpleDataset(torch.randn(100, 10), torch.randint(0, 2, (100,)).float())sampler = torch.utils.data.distributed.DistributedSampler(dataset, num_replicas=world_size, rank=rank)data_loader = DataLoader(dataset, batch_size=10, sampler=sampler)optimizer = optim.SGD(model.parameters(), lr=0.01)criterion = nn.BCELoss()for epoch in range(10):for inputs, targets in data_loader:inputs, targets = inputs.to(rank), targets.to(rank)optimizer.zero_grad()outputs = model(inputs)loss = criterion(outputs, targets.unsqueeze(1))loss.backward()optimizer.step()if __name__ == "__main__":world_size = 4torch.multiprocessing.spawn(train, args=(world_size,), nprocs=world_size, join=True)

深度学习中的并行策略概述：2 Data Parallelism

使用nn.DataParallel实现数据并行

使用DistributedDataParallel实现数据并行

相关文章：

深度学习中的并行策略概述：2 Data Parallelism

Python大数据可视化：基于Python对B站热门视频的数据分析与研究_flask+hive+spider

利用 Python 编写一个 VIP 音乐下载脚本

linux内核如何实现TCP的？

【Spring】基于XML的Spring容器配置——FactoryBean的使用

Docker使用——国内Docker的安装办法

电商会员门店消费数据分析

Vue.js 入门与进阶：打造高效的前端开发体验

Java包装类型的缓存

【蓝桥杯——物联网设计与开发】拓展模块4 - 脉冲模块

.NET平台用C#通过字节流动态操作Excel文件

SpringMVC详解

springboot、spring、springmvc有哪些注解

Apache Commons ThreadUtils 的使用与优化

重温设计模式--5、职责链模式

下午四点半

嵌入式单片机中Flash存储器控制与实现

loki failed to flush

微信小程序打印生产环境日志

利用 deepin-IDE 的 AI 能力，我实现了文件加密扩展

面向对象分析模型深入分析

【Python内存管理终极指南】：20年专家亲授智能内存优化策略与OOM报错秒级修复方案

4.1第一次练习作业

Spring Boot 3.x面试全攻略：自动配置+事务+AOT，2026最新考点

小米设备集成终极测试指南：确保HomeAssistant稳定运行的7个关键步骤

G-Helper深度解析：华硕笔记本轻量级性能控制工具实战指南

Load-Use冒险避坑指南：为什么你的RISC流水线转发电路会失效？

五大赛道齐亮相！第四届世界科学智能大赛启动报名，首设人文科学赛道

百度智能云千帆AppBuilder API调用全攻略：从密钥获取到实战代码示例

三维激光熔覆模拟技术：精准控制、高效制造的数字化解决方案