当前位置：首页 > news >正文

《动手深度学习》线性回归简洁实现实例

news 2026/2/8 15:05:34

🎈 作者：Linux猿

🎈 简介：CSDN博客专家🏆，华为云享专家🏆，Linux、C/C++、云计算、物联网、面试、刷题、算法尽管咨询我，关注我，有问题私聊！

🎈 欢迎小伙伴们点赞👍、收藏⭐、留言💬

本文是《动手深度学习》线性回归简洁实现实例的实现和分析，主要对代码进行详细讲解，有问题欢迎在评论区讨论交流。

一、代码实现

实现代码如下所示。

import torch
from torch.utils import data
# d2l包是李沐老师等人开发的动手深度学习配套的包,
# 里面封装了很多有关与数据集定义，数据预处理，优化损失函数的包
from d2l import torch as d2l
# nn 是神经网络 Neural Network 的缩写，提供了一系列的模块和类，实现创建、训练、保存、恢复神经网络
from torch import nn'''
1. 生成数据集，共 1000 条
true_w 和 true_b 是临时变量用于生成数据集
生成 X, y ：满足关系 y = Xw + b + noise
'''
true_w = torch.tensor([2, -3.4])
true_b = 4.2
features, labels = d2l.synthetic_data(true_w, true_b, 1000)'''
2. 构造循环读取数据集的迭代器
'''
def load_array(data_arrays, batch_size, is_train=True):  #@save# 构造一个 PyTorch 数据迭代器，对 tensor 进行打包，包装成 dataset。dataset = data.TensorDataset(*data_arrays)# 根据数据集构造一个迭代器return data.DataLoader(dataset, batch_size, shuffle=is_train)# 小批量数据
batch_size = 10
# 设置了一个数据读取的迭代器，每次读取 batch_size(10) 条
data_iter = load_array((features, labels), batch_size)'''
3. 设置全连接层
'''
'''
# nn.Linear(in_features, out_features, bias=True)
# in_features : 输入向量的列数
# out_features : 输出向量的列数
# bias = True 是否包含偏置
执行线性变换：Yn*o = Xn*i Wi*o + b
其中：W 和 b 模型需要学习的参数
在本例中：n = 10，i = 2, o = 1
'''
net = nn.Sequential(nn.Linear(2, 1))
# 设置权重 w 和 偏置 b
net[0].weight.data.normal_(0, 0.01)
net[0].bias.data.fill_(0)'''
4. 定义损失函数
'''
# 均方误差，是预测值与真实值之差的平方和的平均值
loss = nn.MSELoss()
# lr 学习率 learning rate
trainer = torch.optim.SGD(net.parameters(), lr=0.03)'''
4. 训练数据
'''
# 超参数 设置批次
num_epochs = 3
for epoch in range(num_epochs): # 进行 num_epochs 个迭代周期for X, y in data_iter:l = loss(net(X) ,y) # 计算损失，net(X) 计算预测值 y1，loss(y1, y) 计算预测值和真实值之间的差距trainer.zero_grad() # 将所有模型参数的梯度置为 0l.backward() # 求梯度，不使用从零实现中 l.sum.backward 的原因是损失计算中使用了平均的 gardtrainer.step() # 优化参数 w 和 bl = loss(net(features), labels)print(f'epoch {epoch + 1}, loss {l:f}')w = net[0].weight.data
print('w的估计误差：', true_w - w.reshape(true_w.shape))
b = net[0].bias.data
print('b的估计误差：', true_b - b)

二、实现解析

针对实例中重要的函数解析如下。

2.1 Linear 函数

nn.Linear(in_features, out_features, bias=True)

神经网络的线性层，也成为全连接层，进行 Y = XW + b 的线性变换。

参数：

in_features : 输入向量的列数

out_features : 输出向量的列数

bias = True 是否包含偏置

in_features 和 out_features 是 W 的行和列。

执行线性变换：Yn*o = Xn*i Wi*o + b

其中：W 和 b 模型需要学习的参数

在本例中：n = 10，i = 2, o = 1。

2.2 Sequential 函数

一个序列容器，用于搭建神经网络的模块，按照传入构造器的顺序添加到 nn.Sequential() 容器中。按照内部模块的顺序自动依次计算并输出结果。

2.3 MSELoss 函数

均方误差，是预测值与真实值之差的平方和的平均值，即：

2.4 TensorDataset 函数

用来对 tensor 进行打包，就好像 python 中的 zip 功能。该类通过每一个 tensor 的第一个维度进行索引。因此，该类中的 tensor 第一维度必须相等. 另外：TensorDataset 中的参数必须是 tensor。可以参考如下例子：

import torch
from torch.utils.data import TensorDataset
from torch.utils.data import DataLoader# len = 12
a = torch.tensor([[1, 2, 3], [4, 5, 6], [7, 8, 9], [1, 2, 3], [4, 5, 6], [7, 8, 9], [1, 2, 3], [4, 5, 6], [7, 8, 9], [1, 2, 3], [4, 5, 6], [7, 8, 9]])
# len = 12
b = torch.tensor([44, 55, 66, 44, 55, 66, 44, 55, 66, 44, 55, 66])
# 将 tensor a 和 b 压缩在一起
train_ids = TensorDataset(a, b)
# 输出
for x, y in train_ids:print(x, y)

输出如下：

tensor([1, 2, 3]) tensor(44)
tensor([4, 5, 6]) tensor(55)
tensor([7, 8, 9]) tensor(66)
tensor([1, 2, 3]) tensor(44)
tensor([4, 5, 6]) tensor(55)
tensor([7, 8, 9]) tensor(66)
tensor([1, 2, 3]) tensor(44)
tensor([4, 5, 6]) tensor(55)
tensor([7, 8, 9]) tensor(66)
tensor([1, 2, 3]) tensor(44)
tensor([4, 5, 6]) tensor(55)
tensor([7, 8, 9]) tensor(66)

2.5 DataLoader 函数

DataLoader 是用来包装所使用的数据，每次抛出一批数据，下面来看一个例子。

import torch
from torch.utils import data# len = 12
a = torch.tensor([[1, 2, 3], [4, 5, 6], [7, 8, 9], [1, 2, 3], [4, 5, 6], [7, 8, 9], [1, 2, 3], [4, 5, 6], [7, 8, 9], [1, 2, 3], [4, 5, 6], [7, 8, 9]])
# len = 12
b = torch.tensor([44, 55, 66, 44, 55, 66, 44, 55, 66, 44, 55, 66])
# 将 tensor a 和 b 压缩在一起
train_ids = data.TensorDataset(a, b)
# 输出
#for x, y in train_ids:
#    print(x, y)BATCH_SIZE = 4
loader = data.DataLoader(dataset=train_ids,batch_size=BATCH_SIZE, # 每次取 BATCH_SIZE=4 个数据shuffle=False, # 不打乱顺序,便于查看num_workers=0)for x, y in loader:print(x, y)break

输出如下：

tensor([[1, 2, 3],[4, 5, 6],[7, 8, 9],[1, 2, 3]]) tensor([44, 55, 66, 44])

如上所示，输出第一个 BATCH_SIZE=4。

2.6 zero_grad 函数

trainer.zero_grad() 是用来清空模型参数梯度的函数，它将模型参数的梯度缓存设置为 0。在进行反向传播时，梯度会累加，如果不清空梯度，会影响后续的梯度计算。

2.7 backward 函数

对计算图进行梯度计算，求解计算图中所有节点的梯度。

2.8 step 函数

根据 backward 函数计算出的梯度进行参数更新。

参考链接：

线性回归的实现学习_data.tensordataset_带刺的厚崽的博客-CSDN博客

nn.Sequential()_一颗磐石的博客-CSDN博客

【Pytorch基础】torch.nn.MSELoss损失函数_一穷二白到年薪百万的博客-CSDN博客

pytorch之trainer.zero_grad()_FibonacciCode的博客-CSDN博客

清空模型参数梯度的函数 - 知乎

pytorch中backward()函数详解_backward函数_Camlin_Z的博客-CSDN博客

理解Pytorch的loss.backward()和optimizer.step() - 知乎

🎈 感觉有帮助记得「一键三连」支持下哦！有问题可在评论区留言💬，感谢大家的一路支持！🤞猿哥将持续输出「优质文章」回馈大家！🤞🌹🌹🌹🌹🌹🌹🤞

《动手深度学习》线性回归简洁实现实例

🎈 作者：Linux猿 🎈 简介：CSDN博客专家🏆，华为云享专家🏆，Linux、C/C、云计算、物联网、面试、刷题、算法尽管咨询我，关注我，有问题私聊！ &…...

编程日记 2023/10/31 8:58:56

国家数据局正式揭牌，数据专业融合型人才迎来发展良机

📕作者简介：热爱跑步的恒川，致力于C/C、Java、Python等多编程语言，热爱跑步，喜爱音乐的一位博主。 📗本文收录于恒川的日常汇报系列，大家有兴趣的可以看一看 📘相关专栏C语言初阶、C…...

编程日记 2023/10/31 8:57:55

基于springboot实现休闲娱乐代理售票平台系统项目【项目源码+论文说明】

基于springboot实现休闲娱乐代理售票系统演示摘要网络的广泛应用给生活带来了十分的便利。所以把休闲娱乐代理售票管理与现在网络相结合，利用java技术建设休闲娱乐代理售票系统，实现休闲娱乐代理售票的信息化。则对于进一步提高休闲娱乐代理售票管理发…...

编程日记 2023/10/31 8:56:54

3.AUTOSAR OS分析(一)

1. AUTOSAR OS诞生背景在最初接触汽车ECU开发时，提到最多的还是OSEK，比如OSEK NM、OSEK OS等等；而OSEK/VDK操作系统也是最先引入汽车行业；OSEK OS是基于事件触发的操作系统，有以下特性：固定优先级调度中断处理函数StartOS和StartupHook作为启动阶段的通用接口函数Shutd…...

编程日记 2023/10/31 8:55:51

AB试验（七）利用Python模拟A/B试验

AB试验（七）利用Python模拟A/B试验到现在，我相信大家理论已经掌握了，轮子也造好了。但有的人是不是总感觉还差点什么？没错，还缺了实战经验。对于AB实验平台完善的公司 ，这个经验不难获得&#…...

编程日记 2023/10/31 8:54:51

Go语言入门-流程控制语句

流程控制 Go语言中有以下几种常见的流程控制语句： 条件语句（Conditional Statements）： if语句：用于根据条件执行代码块。else语句：在if条件不满足时执行的语句块。else if语句：用于在多个条件之…...

编程日记 2023/10/31 8:51:48

深入探究ASEMI肖特基二极管MBR60100PT的材质

编辑-Z 在电子零件领域中，肖特基二极管MBR60100PT因其出色的性能和广泛的应用而显得尤为关键。理解其材质不仅有助于我们深入理解其运作原理，也有助于我们做出更合适的电子设计。那么，肖特基二极管MBR60100PT是什么材质呢? 首先&#xff0c…...

编程日记 2023/10/31 8:50:45

python类模拟“对战游戏”

Game类含玩家昵称、生命值、攻击力(整数)，暴击率、闪避率(小数)，在魔术方法init定义；attack方法中实现两个Game实例对战模拟。 (本笔记适合初通Python类class的coder翻阅) 【学习的细节是欢悦的历程】 Python 官网：https://www.py…...

编程日记 2023/10/31 8:49:42

Maven第二章：Maven基本概念与生命周期

Maven第二章：Maven基本概念与生命周期前言本章主要内容，介绍Maven基本概念，包括maven坐标含义，命名规则，继承与聚合、了解与理解生命周期，如何通过Maven进行依赖和版本管理。什么是Maven的坐标&#xf…...

编程日记 2023/10/31 8:48:39

＜蓝桥杯软件赛＞零基础备赛20周--第3周--填空题

报名明年4月蓝桥杯软件赛的同学们，如果你是大一零基础，目前懵懂中，不知该怎么办，可以看看本博客系列：备赛20周合集 20周的完整安排请点击：20周计划每周发1个博客，共20周（读者可以按…...

编程日记 2023/10/31 8:47:38

【Linux】VM及WindowsServer安装

🎉🎉欢迎来到我的CSDN主页！🎉🎉 🏅我是Java方文山，一个在CSDN分享笔记的博主。📚📚 🌟推荐给大家我的专栏《微信小程序开发实战》。🎯&#x1f3a…...

编程日记 2023/10/31 8:46:36

【实用教程】MySQL内置函数

1 背景在MySQL查询等操作过程中，我们需要根据实际情况，使用其提供的内置函数。今天我们就来一起来学习下这些函数，在之后的使用过程中更加得心应手。 2 MySQL函数 2.1 字符串函数常用的函数如下： concat(s1,s2,…sn)字符串…...

编程日记 2023/10/31 8:45:35

第十二节——ref

一、概念 ref 被用来给DOM元素或子组件注册引用信息。引用信息会根据父组件的 $refs 对象进行注册。如果在普通的DOM元素上使用，引用信息就是元素; 如果用在子组件上，引用信息就是组件实例。注意：只要想要在Vue中直接操作DOM元素&#xff…...

编程日记 2023/10/31 8:44:34

少儿编程 2023年9月中国电子学会图形化编程等级考试Scratch编程四级真题解析（判断题）

2023年9月scratch编程等级考试四级真题判断题（共10题，每题2分，共20分） 11、运行程序后，变量"result"的值是6 答案：对考点分析：考查积木综合使用，重点考查自定义积木的使用图中自定义积木实现的功能是获取两个数中最大的那个数并存放在result变量中，左…...

编程日记 2023/10/31 8:43:32

【设计模式三原则】

设计模式三原则单一职责原则开放封闭原则依赖倒转原则里氏代换原则我们在进行程序设计的时候，要尽可能地保证程序的可扩展性、可维护性和可读性，所以需要使用一些设计模式，这些设计模式都遵循了以下三个原则，下面来依次为大家介…...

编程日记 2023/10/31 8:42:32

600MW发电机组继电保护自动装置的整定计算及仿真

摘要随着科技的发展，电力已成为最重要的资源之一，如何保证电力的供应对于国民经济发展和人民生活水平的提高都有非常重要的意义。在电能输送过程中，发电机组是整个过程中最重要的一个基本元素，在电力系统中的输送和分配中被广泛应…...

编程日记 2023/10/31 8:41:30

【蓝桥每日一题]-字符串（保姆级教程篇1）#atcoder324C~E题

今天来讲字符串题型目录题目：atcoder324C题思路： 题目：atcoder324D题思路： 题目：atcoder324E题思路： 题目：atcoder324C题给一个T字符串，然后给出n个S串，对…...

编程日记 2023/10/31 8:40:28

4.2.1 SQL语句、索引、视图、存储过程

怎么执行一条select语句 1.连接器接收连接-》管理连接-》校验用户信息 2.查询缓存 kv存储，命中直接返回，否则继续执行 8.0已经删除 3.分析器词法句法分析生成语法树 4.优化器指定执行计划，选择查询成本最小的计划 5.执行器根据执行计划&a…...

编程日记 2023/10/31 8:39:27

1992-2021年全国各地级市经过矫正的夜间灯光数据（GNLD、VIIRS）

1992-2021年全国各地级市经过矫正的夜间灯光数据（GNLD、VIIRS） 1、时间：1992-2021年3月，其中1992-2013年为年度数据，2013-2021年3月为月度数据 2、来源：DMSP、VIIRS 3、范围：分区域汇总&…...

编程日记 2023/10/31 8:38:26

机器人的触发条件有什么区别，如何巧妙的使用

简介维格机器人触发条件，分为3个，分别是：有新表单提交时、有记录满足条件时、有新的记录创建时。看似3个，其实是能够满足我们非常多的使用场景。本篇将先介绍3个条件的触发条件，然后再列举一些复杂的触发条件如何用现有的触发条件来满足注意：维格机器人所有的…...

编程日记 2023/10/31 8:37:24

CVPR 2025 MIMO: 支持视觉指代和像素grounding 的医学视觉语言模型

CVPR 2025 | MIMO：支持视觉指代和像素对齐的医学视觉语言模型论文信息标题：MIMO: A medical vision language model with visual referring multimodal input and pixel grounding multimodal output作者：Yanyuan Chen, Dexuan Xu, Yu Hu…...

编程新知 2025/10/6 14:17:21

进程地址空间（比特课总结）

一、进程地址空间 1. 环境变量 1 ）⽤户级环境变量与系统级环境变量全局属性：环境变量具有全局属性，会被⼦进程继承。例如当bash启动⼦进程时，环境变量会⾃动传递给⼦进程。本地变量限制：本地变量只在当前进程(ba…...

编程新知 2025/11/15 6:48:52

css实现圆环展示百分比，根据值动态展示所占比例

代码如下 <view class""><view class"circle-chart"><view v-if"!!num" class"pie-item" :style"{background: conic-gradient(var(--one-color) 0%,#E9E6F1 ${num}%),}"></view><view v-else …...

编程新知 2026/2/5 4:28:28

突破不可导策略的训练难题：零阶优化与强化学习的深度嵌合

强化学习（Reinforcement Learning, RL）是工业领域智能控制的重要方法。它的基本原理是将最优控制问题建模为马尔可夫决策过程，然后使用强化学习的Actor-Critic机制（中文译作“知行互动”机制），逐步迭代求解…...

编程新知 2026/2/5 4:17:42

系统设计 --- MongoDB亿级数据查询优化策略

系统设计 --- MongoDB亿级数据查询分表策略背景Solution --- 分表背景使用audit log实现Audi Trail功能 Audit Trail范围: 六个月数据量: 每秒5-7条audi log，共计7千万 – 1亿条数据需要实现全文检索按照时间倒序因为license问题，不能使用ELK只能使用…...

编程新知 2026/1/4 3:47:09

Python如何给视频添加音频和字幕

在Python中，给视频添加音频和字幕可以使用电影文件处理库MoviePy和字幕处理库Subtitles。下面将详细介绍如何使用这些库来实现视频的音频和字幕添加，包括必要的代码示例和详细解释。环境准备在开始之前，需要安装以下Python库：…...

编程新知 2025/9/3 4:12:17

DeepSeek 技术赋能无人农场协同作业：用 AI 重构农田管理 “神经网”

目录一、引言二、DeepSeek 技术大揭秘2.1 核心架构解析2.2 关键技术剖析三、智能农业无人农场协同作业现状3.1 发展现状概述3.2 协同作业模式介绍四、DeepSeek 的 “农场奇妙游”4.1 数据处理与分析4.2 作物生长监测与预测4.3 病虫害防治4.4 农机协同作业调度五、实际案例大…...

编程新知 2025/9/24 13:35:36

Python ROS2【机器人中间件框架】简介

销量过万TEEIS德国护膝夏天用薄款优惠券冠生园百花蜂蜜428g 挤压瓶纯蜂蜜巨奇严选鞋子除臭剂360ml 多芬身体磨砂膏280g健70%-75%酒精消毒棉片湿巾1418cm 80片/袋3袋大包清洁食品用消毒优惠券AIMORNY52朵红玫瑰永生香皂花同城配送非鲜花七夕情人节生日礼物送女友热卖妙洁棉…...

编程新知 2026/1/29 9:12:46

保姆级教程：在无网络无显卡的Windows电脑的vscode本地部署deepseek

文章目录 1 前言2 部署流程2.1 准备工作2.2 Ollama2.2.1 使用有网络的电脑下载Ollama2.2.2 安装Ollama（有网络的电脑）2.2.3 安装Ollama（无网络的电脑）2.2.4 安装验证2.2.5 修改大模型安装位置2.2.6 下载Deepseek模型 2.3 将deepse…...

编程新知 2026/2/6 16:59:24

处理vxe-table 表尾数据是单独一个接口，表格tableData数据更新后，需要点击两下，表尾才是正确的

修改bug思路： 分别把 tabledata 和表尾相关数据 console.log() 发现更新数据先后顺序不对 settimeout延迟查询表格接口 ——测试可行升级↑：async await 等接口返回后再开始下一个接口查询 ________________________________________________________…...

编程新知 2026/1/25 6:16:49