当前位置：首页 > news >正文

《动手深度学习》线性回归从零开始实现实例

news 2025/7/10 21:19:23

🎈 作者：Linux猿

🎈 简介：CSDN博客专家🏆，华为云享专家🏆，Linux、C/C++、云计算、物联网、面试、刷题、算法尽管咨询我，关注我，有问题私聊！

🎈 欢迎小伙伴们点赞👍、收藏⭐、留言💬

本文是《动手深度学习》线性回归从零开始实现实例的实现和分析。

一、代码实现

实现代码如下所示。

# random 模块 调用 random() 方法返回随机生成的一个实数，值在[0,1)范围内
import random
# 机器学习框架 pythorch，类似于 TensorFlow 和 Keras
import torch
# 线性回归函数 y = Xw + b + e（噪音）'''
一系列封装的函数
'''
# 批量获取数据函数
def synthetic_data(w, b, num_examples):  #@save# 生成 y=Xw+b+噪声'''返回一个张量，张量里面的随机数是从相互独立的正态分布中随机生成的参与 1: 均值参与 2: 标准差参数 3: 张量的大小 [num_examples, len(w)]'''X = torch.normal(0, 1, (num_examples, len(w)))# torch.matmul 两个张量元素相乘y = torch.matmul(X, w) + b# 加上噪声y += torch.normal(0, 0.01, y.shape)return X, y.reshape((-1, 1))# 随机批量取数据函数
def data_iter(batch_size, features, labels):num_examples = len(features)# 生成存储值 0 ~ num_examples 值的列表，不重复indices = list(range(num_examples))# 在原列表 indices 中随机打乱所有元素random.shuffle(indices)# range() 第三个参数是步长for i in range(0, num_examples, batch_size):batch_indices = torch.tensor(indices[i: min(i + batch_size, num_examples)])# yield 相当于不断的 return 的作用yield features[batch_indices], labels[batch_indices]# 计算预测值，网络模型
def linreg(X, w, b):# 线性回归模型return torch.matmul(X, w) + b# 计算损失
def squared_loss(y_hat, y):# 均方损失return (y_hat - y.reshape(y_hat.shape)) ** 2 / 2# 梯度更新
def sgd(params, lr, batch_size):# 小批量随机梯度下降with torch.no_grad():for param in params:param -= lr * param.grad / batch_sizeparam.grad.zero_() # 清除 param 的梯度值为 0'''
1. 生成数据集
包含 1000 条数据，每条 [x1, x2]
'''
# 用于生成数据临时的 true_w 和 true_b
true_w = torch.tensor([2, -3.4])
true_b = 4.2
features, labels = synthetic_data(true_w, true_b, 1000)
# features: [1000, 2], labels: [1000, 1]'''
2. 初始化 w 和 b
w: 2 x 1, b: [0]
'''
# requires_grad 在计算中保留梯度信息
w = torch.normal(0, 0.01, size=(2,1), requires_grad=True)
# 初始化张量为全零
b = torch.zeros(1, requires_grad=True)'''
3. 开始训练
'''
# 设置超参数 学习率
lr = 0.03
# 设置超参数 训练批次/迭代周期
num_epochs = 3
# 设置超参数 每次训练的数据量
batch_size = 10# 重命名函数
net = linreg
loss = squared_lossfor epoch in range(num_epochs): # num_epochs 个迭代周期for X, y in data_iter(batch_size, features, labels): # 每次随机取 10 条数据一起训练l = loss(net(X, w, b), y)  # X 和 y 的小批量损失，计算损失l.sum().backward() # 损失求和后，根据构建的计算图，计算关于[w,b]的梯度，反向传播算法一定要是一个标量才能进行计算，所以进行 sum 操作后 backwardsgd([w, b], lr, batch_size)  # 使用参数的梯度更新参数# 不自动求导with torch.no_grad():train_l = loss(net(features, w, b), labels) # 使用更新后的 [w, b] 计算所有训练数据的 lossprint(f'epoch {epoch + 1}, loss {float(train_l.mean()):f}') # 通过 mean 函数取平均值'''
with torch.no_grad():
在使用 pytorch 时，并不是所有的操作都需要进行计算图的生成（计算过程的构建，以便梯度反向传播等操作）。
而对于 tensor 的计算操作，默认是要进行计算图的构建的，在这种情况下，可以使用 with torch.no_grad():，
强制之后的内容不进行计算图构建。
'''

二、实现解析

2.1 参数和超参数

⌈参数⌋是需要通过训练来得到的结果，最常见的就是神经网络的权重 W 和 b。训练模型的目的就是要找到一套好的模型参数，用于预测未知的结果。这些参数我们是不用调的，是模型来训练的过程中自动更新生成的。

⌈超参数⌋是我们控制我们模型结构、功能、效率等的调节旋钮，常见超参数：

（1）learning rate（学习率）

（2）epochs(迭代次数，也可称为 num of iterations)

（3）num of hidden layers(隐层数目)

（4）num of hidden layer units(隐层的单元数/神经元数)

（5）activation function(激活函数)

（6）batch-size(用mini-batch SGD的时候每个批量的大小)

（7）optimizer(选择什么优化器，如SGD、RMSProp、Adam)

（8）用诸如RMSProp、Adam优化器的时候涉及到的β1，β2等等

2.2 模型训练

整体的模型训练思路如下所示。

1. 数据集生成，包括：训练数据、测试数据；

2. 初始化参数 w 和 b；

3. 训练模型，设置超参数，开始训练模型；

参考链接：

深度学习中的超参数调节（learning rate、epochs、batch-size...） - 知乎

loss.sum().backward()中对于sum()的理解

🎈 感觉有帮助记得「一键三连」支持下哦！有问题可在评论区留言💬，感谢大家的一路支持！🤞猿哥将持续输出「优质文章」回馈大家！🤞🌹🌹🌹🌹🌹🌹🤞

《动手深度学习》线性回归从零开始实现实例

🎈 作者：Linux猿 🎈 简介：CSDN博客专家🏆，华为云享专家🏆，Linux、C/C、云计算、物联网、面试、刷题、算法尽管咨询我，关注我，有问题私聊！ &…...

编程日记 2023/8/29 1:20:52

Redis 命令

Redis 命令 Redis 命令用于在 redis 服务上执行操作。要在 redis 服务上执行命令需要一个 redis 客户端。Redis 客户端在我们之前下载的的 redis 的安装包中。语法 Redis 客户端的基本语法为： $ redis-cli实例以下实例讲解了如何启动 redis 客户端&#xf…...

编程日记 2023/8/29 1:19:50

Linux网络编程：线程池并发服务器 _UDP客户端和服务器_本地和网络套接字

文章目录： 一：线程池模块分析 threadpool.c 二：UDP通信 1.TCP通信和UDP通信各自的优缺点 2.UDP实现的C/S模型 server.c client.c 三：套接字 1.本地套接字 2.本地套和网络套对比 server.c client.c 一：线…...

编程日记 2023/8/29 1:18:49

nvm安装electron开发与编译环境

electron总是安装失败，下面说一下配置办法下载软件 nvm npmmirror 镜像站安装nvm 首先最好卸载node，不卸载的话，安装nvm会提示是否由其接管，保险起见还是卸载下载win中的安装包配置加速节点nvm node_mirror https://npmmi…...

编程日记 2023/8/29 1:17:48

玩转Mysql系列 - 第7篇：玩转select条件查询，避免采坑

这是Mysql系列第7篇。环境：mysql5.7.25，cmd命令中进行演示。电商中：我们想查看某个用户所有的订单，或者想查看某个用户在某个时间段内所有的订单，此时我们需要对订单表数据进行筛选，按照用户、时间进行…...

编程日记 2023/8/29 1:16:46

import subprocess subprocess.Popen(r"C:\\Program Files\\5EClient\\5EClient.exe") # 打开指定程序 import os os.system(TASKKILL /F /IM notepad.exe) # 结束指定程序 import webbrowser webbrowser.open_new_tab(https://www.baidu.com) # 打开指定网页...

编程日记 2023/8/29 1:15:45

从零开始学习 Java：简单易懂的入门指南之包装类（十九）

包装类包装类5.1 概述5.2 Integer类5.3 装箱与拆箱5.4 自动装箱与自动拆箱5.5 基本类型与字符串之间的转换基本类型转换为StringString转换成基本类型 5.6 底层原理算法小题练习一：练习二：练习三：练习四：练习五： 包装…...

编程日记 2023/8/29 1:14:44

leetcode分类刷题：哈希表（Hash Table）（一、数组交集问题）

1、当需要快速判断某元素是否出现在序列中时，就要用到哈希表了。 2、本文针对的总结题型为给定两个及多个数组，求解它们的交集。接下来，按照由浅入深层层递进的顺序总结以下几道题目。 3、以下题目需要共同注意的是：对于两个数组&…...

编程日记 2023/8/29 1:13:43

UML四大关系

文章目录引言UML的定义和作用UML四大关系的重要性和应用场景关联关系继承关系聚合关系组合关系 UML四大关系的进一步讨论UML四大关系的实际应用软件开发中的应用其他领域的应用总结引言在软件开发中，统一建模语言（Unified Modeling Language&#x…...

编程日记 2023/8/29 1:12:42

forms组件(钩子函数(局部钩子、全局钩子)、三种页面的渲染方式、数据校验的使用)、form组件的参数以及单选多选形式

一、form是组件后端代码 from django.shortcuts import render, redirect, HttpResponsedef ab_form(request):back_dict {username: , password: }if request.method POST:username request.POST.get(username)password request.POST.get(password)if 金瓶梅 in userna…...

编程日记 2023/8/29 1:11:41

跨专业申请成功|金融公司经理赴美国密苏里大学访学交流

J经理所学专业与从事工作不符，尽管如此，我们还是为其成功申请到美国密苏里大学经济学专业的访问学者职位，全家顺利过签出国。 J经理背景： 申请类型： 自费访问学者工作背景： 某金融公司经理教育背景&am…...

编程日记 2023/8/29 1:10:40

第十一章 CUDA的NMS算子实战篇(下篇)

cuda教程目录第一章指针篇第二章 CUDA原理篇第三章 CUDA编译器环境配置篇第四章 kernel函数基础篇第五章 kernel索引(index)篇第六章 kenel矩阵计算实战篇第七章 kenel实战强化篇第八章 CUDA内存应用与性能优化篇第九章 CUDA原子(atomic)实战篇第十章 CUDA流(strea…...

编程日记 2023/8/29 1:09:39

R语言01-数据类型

概念数值型（Numeric）：用于存储数值数据，包括整数和浮点数。例如：x <- 5。字符型（Character）：用于存储文本数据，以单引号或双引号括起来。例如：name &l…...

编程日记 2023/8/29 1:08:38

【网络基础实战之路】基于三层架构实现一个企业内网搭建的实战详解

系列文章传送门： 【网络基础实战之路】设计网络划分的实战详解【网络基础实战之路】一文弄懂TCP的三次握手与四次断开【网络基础实战之路】基于MGRE多点协议的实战详解【网络基础实战之路】基于OSPF协议建立两个MGRE网络的实验详解【网络基础实战之路】基于…...

编程日记 2023/8/29 1:07:37

C++11相较于C++98多了哪些可调用对象？--《包装器》篇

C98里面的可调用对象只有普通函数和函数指针。而在C11里面可调用的对象有下面几种： 普通函数函数指针仿函数lambda表达式（匿名函数）包装器普通函数、函数指针、仿函数、lambda表达式我在以前的文章里其实已经介绍过了包装器在C11里面有…...

编程日记 2023/8/29 1:06:35

栈与队列：常见的线性数据结构

栈（Stack）和队列（Queue）是计算机科学中常见的线性数据结构，它们在许多算法和编程场景中发挥着重要作用。它们的不同特点和用途使得它们适用于不同的问题和应用。栈（Stack） 栈，作为…...

编程日记 2023/8/29 1:05:34

android framework之AMS的启动管理与职责

AMS是什么？ AMS管理着activity，Service, Provide, BroadcastReceiver android10后：出现ATMS,ActivityTaskManagerService:ATMS是从AMS中抽出来，单独管理着原来AMS中的Activity组件。现在我们对AMS的分析，也就包含对…...

编程日记 2023/8/29 1:04:33

Decoupling Knowledge from Memorization: Retrieval-augmented Prompt Learning

本文是LLM系列的文章，针对《Decoupling Knowledge from Memorization: Retrieval 知识与记忆的解耦：检索增强的提示学习摘要1 引言2 提示学习的前言3 RETROPROMPT：检索增强的提示学习4 实验5 相关实验6 结论与未来工作摘要提示学习方法在…...

编程日记 2023/8/29 1:03:31

腾讯云coding平台平台inda目录遍历漏洞复现

前言其实就是一个python的库可以遍历到，并不能遍历到别的路径下，后续可利用性不大，并且目前这个平台私有部署量不多，大多都是用腾讯云在线部署的。 CODING DevOps 是面向软件研发团队的一站式研发协作管理平台，提供…...

编程日记 2023/8/29 1:02:30

无法正常访问服务器

网络原因，本地网络：解决办法：检查本地网络是否正常，访问外网是否流畅。机房网络：通过路由追踪查看是否中间有节点不通，确定是线路出现丢包。远程连接，检查远程连接是否启用以及远程计算机上的…...

编程日记 2023/8/29 1:01:29

Leetcode 3576. Transform Array to All Equal Elements

Leetcode 3576. Transform Array to All Equal Elements 1. 解题思路2. 代码实现题目链接：3576. Transform Array to All Equal Elements 1. 解题思路这一题思路上就是分别考察一下是否能将其转化为全1或者全-1数组即可。至于每一种情况是否可以达到&#xf…...

编程新知 2025/7/7 16:55:31

MySQL 隔离级别：脏读、幻读及不可重复读的原理与示例

一、MySQL 隔离级别 MySQL 提供了四种隔离级别，用于控制事务之间的并发访问以及数据的可见性，不同隔离级别对脏读、幻读、不可重复读这几种并发数据问题有着不同的处理方式，具体如下：隔离级别脏读不可重复读幻读性能特点及锁机制读未提交（READ UNCOMMITTED）允许出现允许…...

编程新知 2025/6/17 15:33:10

el-switch文字内置

el-switch文字内置效果 vue <div style"color:#ffffff;font-size:14px;float:left;margin-bottom:5px;margin-right:5px;">自动加载</div> <el-switch v-model"value" active-color"#3E99FB" inactive-color"#DCDFE6"…...

编程新知 2025/7/10 5:45:43

C# SqlSugar：依赖注入与仓储模式实践

C# SqlSugar：依赖注入与仓储模式实践在 C# 的应用开发中，数据库操作是必不可少的环节。为了让数据访问层更加简洁、高效且易于维护，许多开发者会选择成熟的 ORM（对象关系映射）框架，SqlSugar 就是其中备受…...

编程新知 2025/7/5 18:24:10

OPenCV CUDA模块图像处理-----对图像执行均值漂移滤波（Mean Shift Filtering）函数meanShiftFiltering()

操作系统：ubuntu22.04 OpenCV版本：OpenCV4.9 IDE:Visual Studio Code 编程语言：C11 算法描述在 GPU 上对图像执行均值漂移滤波（Mean Shift Filtering），用于图像分割或平滑处理。该函数将输入图像中的…...

编程新知 2025/7/8 6:47:12

Python基于历史模拟方法实现投资组合风险管理的VaR与ES模型项目实战

说明：这是一个机器学习实战项目（附带数据代码文档），如需数据代码文档可以直接到文章最后关注获取。 1.项目背景在金融市场日益复杂和波动加剧的背景下，风险管理成为金融机构和个人投资者关注的核心议题之一。VaR&…...

编程新知 2025/7/7 22:29:30

SQL慢可能是触发了ring buffer

简介最近在进行 postgresql 性能排查的时候，发现 PG 在某一个时间并行执行的 SQL 变得特别慢。最后通过监控监观察到并行发起得时间 buffers_alloc 就急速上升，且低水位伴随在整个慢 SQL，一直是 buferIO 的等待事件，此时也没有其他会话的争抢。SQL 虽然不是高效 SQL ，但…...

编程新知 2025/6/21 16:18:00

Razor编程中@Html的方法使用大全

文章目录 1. 基础HTML辅助方法1.1 Html.ActionLink()1.2 Html.RouteLink()1.3 Html.Display() / Html.DisplayFor()1.4 Html.Editor() / Html.EditorFor()1.5 Html.Label() / Html.LabelFor()1.6 Html.TextBox() / Html.TextBoxFor() 2. 表单相关辅助方法2.1 Html.BeginForm() …...

编程新知 2025/7/9 2:45:58

【Linux手册】探秘系统世界：从用户交互到硬件底层的全链路工作之旅

目录前言操作系统与驱动程序是什么，为什么怎么做 system call 用户操作接口总结前言日常生活中，我们在使用电子设备时，我们所输入执行的每一条指令最终大多都会作用到硬件上，比如下载一款软件最终会下载到硬盘上&am…...

编程新知 2025/7/8 17:30:24

Linux部署私有文件管理系统MinIO

最近需要用到一个文件管理服务，但是又不想花钱，所以就想着自己搭建一个，刚好我们用的一个开源框架已经集成了MinIO，所以就选了这个我这边对文件服务性能要求不是太高，单机版就可以安装非常简单，几个命令就…...

编程新知 2025/7/10 16:04:29

《动手深度学习》线性回归从零开始实现实例

一、代码实现

二、实现解析

2.1 参数和超参数

2.2 模型训练

相关文章：

《动手深度学习》线性回归从零开始实现实例

Redis 命令

Linux网络编程：线程池并发服务器 _UDP客户端和服务器_本地和网络套接字

nvm安装electron开发与编译环境

玩转Mysql系列 - 第7篇：玩转select条件查询，避免采坑

启动程序结束程序打开指定网页

从零开始学习 Java：简单易懂的入门指南之包装类（十九）

leetcode分类刷题：哈希表（Hash Table）（一、数组交集问题）

UML四大关系

forms组件(钩子函数(局部钩子、全局钩子)、三种页面的渲染方式、数据校验的使用)、form组件的参数以及单选多选形式

跨专业申请成功|金融公司经理赴美国密苏里大学访学交流

第十一章 CUDA的NMS算子实战篇(下篇)

R语言01-数据类型

【网络基础实战之路】基于三层架构实现一个企业内网搭建的实战详解

C++11相较于C++98多了哪些可调用对象？--《包装器》篇

栈与队列：常见的线性数据结构

android framework之AMS的启动管理与职责

Decoupling Knowledge from Memorization: Retrieval-augmented Prompt Learning

腾讯云coding平台平台inda目录遍历漏洞复现

无法正常访问服务器

Leetcode 3576. Transform Array to All Equal Elements

MySQL 隔离级别：脏读、幻读及不可重复读的原理与示例

el-switch文字内置

C# SqlSugar：依赖注入与仓储模式实践

OPenCV CUDA模块图像处理-----对图像执行均值漂移滤波（Mean Shift Filtering）函数meanShiftFiltering()

Python基于历史模拟方法实现投资组合风险管理的VaR与ES模型项目实战

SQL慢可能是触发了ring buffer

Razor编程中@Html的方法使用大全

【Linux手册】探秘系统世界：从用户交互到硬件底层的全链路工作之旅

Linux部署私有文件管理系统MinIO