当前位置：首页 > news >正文

【PyTorch】线性回归

news 2026/2/11 4:06:11

文章目录

1. 模型与代码实现
2. Q&A

1. 模型与代码实现

模型
$\hat{y} = w_1 x_1 + ... + w_d x_d + b = \mathbf{w}^\top \mathbf{x} + b.$
代码实现

import torch
from torch import nn
from torch.utils import data
from d2l import torch as d2l# 全局参数设置
batch_size = 10
num_epochs = 3
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')# 生成数据集
true_w = torch.tensor([2, -3.4])
true_b = 4.2
features, labels = d2l.synthetic_data(true_w, true_b, 1000)
features, labels = features.to(device), labels.to(device)# 加载数据集
dataset = data.TensorDataset(features, labels)
dataloader = data.DataLoader(dataset, batch_size, shuffle=True)# 创建神经网络
net = nn.Linear(2, 1).to(device)# 初始化模型参数
nn.init.normal_(net.weight, mean=0, std=0.01)
nn.init.constant_(net.bias, val=0)# 设置损失函数
criterion = nn.MSELoss()# 设置优化器
optimizer = torch.optim.SGD(net.parameters(), lr=0.03)# 训练模型
for epoch in range(num_epochs):for X, y in dataloader:X, y = X.to(device), y.to(device)loss = criterion(net(X) ,y)optimizer.zero_grad()loss.backward()optimizer.step()loss = criterion(net(features), labels)print(f'epoch {epoch + 1}, loss {loss:f}')# 评估训练结果
w = net.weight.data.cpu()
print('w的估计误差：', true_w - w.reshape(true_w.shape))
b = net.bias.data.cpu()
print('b的估计误差：', true_b - b)

输出结果

epoch 1, loss 0.000211
epoch 2, loss 0.000099
epoch 3, loss 0.000099
w的估计误差： tensor([ 4.2558e-04, -5.3167e-05])
b的估计误差： tensor([0.0005])

2. Q&A

如何安装d2l模块？
```
pip install d2l
```
为什么模型参数初始化时要将偏置设为0？
在机器学习中，我们通常会使用非常小的学习率来进行梯度下降，以防止在更新参数时发生剧烈的波动。如果偏置项的初始值不为0，那么在开始训练模型时，可能会因为偏置的影响，导致权重更新的方向出现偏差。
为什么选择均方损失作为线性回归模型的损失函数？
因为在高斯噪声的假设下，最小化均方误差 $\Leftrightarrow$ 对给定 $\mathbf{x}$ 观测 $y$ 的极大似然估计 $\Leftrightarrow \mathbf{w},b$ 取最优值。详细推导。均方误差函数如下： $\mathbf{MSE}=\frac{1}{n}\sum_{i=1}^{n}{(y_i-\hat{y_i})^2}$ 其中 $y_i$ 是真实数据， $\hat{y_i}$ 是拟合数据。

如何理解模型训练过程？

for epoch in range(num_epochs):for X, y in dataloader:X, y = X.to(device), y.to(device)# 计算网络输出结果与预期结果的误差loss = criterion(net(X) ,y)# 清空参数梯度缓存值，否则梯度会与上一个batch的数据相关optimizer.zero_grad()# 误差反向传播计算参数梯度值loss.backward()# 更新模型参数optimizer.step()# 计算在整个训练集上的误差loss = criterion(net(features), labels)print(f'epoch {epoch + 1}, loss {loss:f}')

【PyTorch】线性回归

文章目录 1. 模型与代码实现2. Q&A 1. 模型与代码实现模型 y ^ w 1 x 1 . . . w d x d b w ⊤ x b . \hat{y} w_1 x_1 ... w_d x_d b \mathbf{w}^\top \mathbf{x} b. y^w1x1...wdxdbw⊤xb. 代码实现 import torch from torch import nn from to…...

编程日记 2023/12/4 10:02:32

硝烟弥漫的科技战场——GPT之战

没想到2023年的双11之后，还能看到如此多的科技圈大佬针对GPT提出火药味十足的讨论和极具戏剧性的表演。历史回顾： 11月6日，OpenAI发布会：GPT-4 Turbo模型、GPT应用商店、开源Whisper-large-v3等；11月17日&#xff0…...

编程日记 2023/12/4 10:01:31

re:Invent 构建未来：云计算生成式 AI 诞生科技新局面

文章目录前言什么是云计算云计算类型亚马逊云科技云计算最多的功能最大的客户和合作伙伴社区最安全最快的创新速度最成熟的运营专业能力什么是生成式 AI如何使用生成式 AI后记前言在科技发展的滚滚浪潮中，我们见证了云计算的崛起和生成式 AI 的突破&#xff0c…...

编程日记 2023/12/4 9:57:28

oneApi实现并⾏排序算法

零、OneApi简介 oneAPI是由英特尔推出的一个开放、统一的编程模型和工具集合，旨在简化跨不同硬件架构的并行计算。oneAPI的目标是提供一个统一的编程模型，使开发人员能够使用相同的代码在不同类型的硬件上进行并行计算，包括CPU、GPU、FPGA和…...

编程日记 2023/12/4 9:56:27

语音芯片的BUSY状态指示功能特征：提升用户体验与系统稳定性的关键

在电子产品的音频系统中，语音芯片扮演着至关重要的角色。为了保证音频的流畅播放和功能的正常运行，语音芯片的各种状态指示功能变得尤为重要。其中，BUSY状态指示功能是语音芯片中的一项关键特征，它对于提升用户体验和系统稳定性具…...

编程日记 2023/12/4 9:53:24

Leetcode2661. 找出叠涂元素

Every day a Leetcode 题目来源：2661. 找出叠涂元素解法1：哈希题目很绕，理解题意后就很简单。由于矩阵 mat 中每一个元素都不同，并且都在数组 arr 中，所以首先我们用一个哈希表 hash 来存储 mat 中每一个元素的…...

编程日记 2023/12/4 9:50:20

免费最新6款热门SEO优化排名工具

网站的存在感对于业务和品牌的成功至关重要。在众多网站推广方法中，搜索引擎优化（SEO）是提高网站可见性的关键。而SEO的核心之一就是关键词排名。为了更好地帮助您优化网站。 SEO关键词排名工具在如今信息过载的互联网时代，用户…...

编程日记 2023/12/4 9:49:19

绝地求生在steam叫什么？

绝地求生在Steam的全名是《PlayerUnknowns Battlegrounds》，简称为PUBG。作为一款风靡全球的多人在线游戏，PUBG于2017年3月23日正式上线Steam平台，并迅速成为一部热门游戏。 PUBG以生存竞技为核心玩法，玩家将被投放到一个辽阔的荒…...

编程日记 2023/12/4 9:48:18

Elasticsearch：什么是大语言模型（LLM）？

大语言模型定义大语言模型 (LLM) 是一种深度学习算法，可以执行各种自然语言处理 (natural language processing - NLP) 任务。大型语言模型使用 Transformer 模型，并使用大量数据集进行训练 —— 因此规模很大。这使他们能够识别、翻译、预测或生成文…...

编程日记 2023/12/4 9:47:17

Kubernetes1.27容器化部署Prometheus

Kubernetes1.27容器化部署Prometheus GitHub链接根据自己的k8s版本选择对应的版本修改镜像地址部署命令对Etcd集群进行监控（云原生监控）创建Etcd Service创建Etcd证书的Secret创建Etcd ServiceMonitorgrafana导入模板成功截图对MySQL进行监控&#xff0…...

编程日记 2023/12/4 9:45:15

fasterxml 注解组装实体

使用 FasterXML Jackson 的注解 JsonTypeInfo 和 JsonSubTypes 可以实现多态类型的处理。在你的 User 类上，你可以添加这些注解来指示 Jackson 如何处理多态类型。以下是使用 JsonTypeInfo 和 JsonSubTypes 注解的 User 类的修改： import com.fasterx…...

编程日记 2023/12/4 9:43:13

自写一个函数将js对象转为Ts的Interface接口

如今的前端开发typescript 已经成为一项必不可以少的技能了，但是频繁的定义Interface接口会给我带来许多工作量，我想了想如何来减少这些非必要且费时的工作量呢，于是决定写一个函数，将对象放进它自动帮我们转换成Interface接口&am…...

编程日记 2023/12/4 9:42:11

【数据结构】拆分详解 - 二叉树的链式存储结构

文章目录一、前置说明二、二叉树的遍历 1. 前序、中序以及后序遍历 1.1 前序遍历 1.2 中序遍历 1.3 后序遍历 2. 层序遍历三、常见接口实现 0. 递归中的分治思想 1. 查找与节点个数 1.1 节点个数 1.2 叶子节点个数 1.3 第k层节…...

编程日记 2023/12/4 9:40:08

Laravel修改默认的auth模块为md5(password+salt)验证

首先声明：这里只是作为一个记录，实行拿来主义，懒得去记录那些分析源码的过程，不喜勿喷，可直接划走。第一步：创建文件夹：app/Helpers/Hasher; 第二步：创建文件： app/Help…...

编程日记 2023/12/4 9:39:07

OpenStack-train版安装之安装Keystone（认证服务）、Glance（镜像服务）、Placement

安装Keystone（认证服务）、Glance（镜像服务）、Placement 安装Keystone（认证服务）安装Glance（镜像服务）安装Placement 安装Keystone（认证服务） 数据库创建、创…...

编程日记 2023/12/4 9:38:06

【九日集训】第九天：简单递归

递归就是自己调用自己，例如斐波那契数列就是可以用简单递归来实现。第一题 172. 阶乘后的零 https://leetcode.cn/problems/factorial-trailing-zeroes/description/ 这一题纯粹考数学推理能力，我这种菜鸡看了好久都没有懂。大概是这样的思路&#x…...

编程日记 2023/12/4 9:37:06

Prime 1.0

信息收集存活主机探测 arp-scan -l 或者利用nmap nmap -sT --min-rate 10000 192.168.217.133 -oA ./hosts 可以看到存活主机IP地址为：192.168.217.134 端口探测 nmap -sT -p- 192.168.217.134 -oA ./ports UDP端口探测详细服务等信息探测开放端口22&#x…...

编程日记 2023/12/4 9:36:05

Java 如何正确比较两个浮点数

看下面这段代码，将 d1 和 d2 两个浮点数进行比较，输出的结果会是什么？ double d1 .1 * 3; double d2 .3; System.out.println(d1 d2);按照正常逻辑来看，d1 经过计算之后的结果应该是 0.3，最后打印的结果应该是 tru…...

编程日记 2023/12/4 9:32:01

Qt 如何操作SQLite3数据库？数据库创建和表格的增删改查？

# 前言项目源码下载 https://gitcode.com/m0_45463480/QSQLite3/tree/main # 第一步项目配置平台：windows10 Qt版本：Qt 5.14.2 在.pro添加 QT += sql 需要的头文件 #include <QSqlDatabase>#include <QSqlError>#include <QSqlQuery>#include &…...

编程日记 2023/12/4 9:27:58

【Hadoop】分布式文件系统 HDFS

目录一、介绍二、HDFS设计原理2.1 HDFS 架构2.2 数据复制复制的实现原理三、HDFS的特点四、图解HDFS存储原理1. 写过程2. 读过程3. HDFS故障类型和其检测方法故障类型和其检测方法读写故障的处理DataNode 故障处理副本布局策略一、介绍 HDFS （Hadoop Distribute…...

编程日记 2023/12/4 9:26:57

Lombok 的 @Data 注解失效，未生成 getter/setter 方法引发的HTTP 406 错误

HTTP 状态码 406 (Not Acceptable) 和 500 (Internal Server Error) 是两类完全不同的错误，它们的含义、原因和解决方法都有显著区别。以下是详细对比： 1. HTTP 406 (Not Acceptable) 含义： 客户端请求的内容类型与服务器支持的内容类型不匹…...

编程新知 2026/2/1 20:49:03

【SQL学习笔记1】增删改查+多表连接全解析（内附SQL免费在线练习工具）

可以使用Sqliteviz这个网站免费编写sql语句，它能够让用户直接在浏览器内练习SQL的语法，不需要安装任何软件。链接如下： sqliteviz 注意： 在转写SQL语法时，关键字之间有一个特定的顺序，这个顺序会影响到…...

编程新知 2026/2/5 4:36:53

镜像里切换为普通用户

如果你登录远程虚拟机默认就是 root 用户，但你不希望用 root 权限运行 ns-3（这是对的，ns3 工具会拒绝 root），你可以按以下方法创建一个非 root 用户账号并切换到它运行 ns-3。一次性解决方案：创建非 roo…...

编程新知 2025/9/11 11:00:29

苍穹外卖--缓存菜品

1.问题说明用户端小程序展示的菜品数据都是通过查询数据库获得，如果用户端访问量比较大，数据库访问压力随之增大 2.实现思路通过Redis来缓存菜品数据，减少数据库查询操作。缓存逻辑分析： ①每个分类下的菜品保持一份缓存数据…...

编程新知 2026/2/7 15:39:49

Cloudflare 从 Nginx 到 Pingora：性能、效率与安全的全面升级

在互联网的快速发展中，高性能、高效率和高安全性的网络服务成为了各大互联网基础设施提供商的核心追求。Cloudflare 作为全球领先的互联网安全和基础设施公司，近期做出了一个重大技术决策：弃用长期使用的 Nginx，转而采用其内部开发…...

编程新知 2026/1/29 21:20:51

04-初识css

一、css样式引入 1.1.内部样式 <div style"width: 100px;"></div>1.2.外部样式 1.2.1.外部样式1 <style>.aa {width: 100px;} </style> <div class"aa"></div>1.2.2.外部样式2 <!-- rel内表面引入的是style样…...

编程新知 2026/1/29 17:54:05

OPENCV形态学基础之二腐蚀

一.腐蚀的原理 (图1) 数学表达式：dst(x,y) erode(src(x,y)) min(x,y)src(xx,yy) 腐蚀也是图像形态学的基本功能之一，腐蚀跟膨胀属于反向操作，膨胀是把图像图像变大，而腐蚀就是把图像变小。腐蚀后的图像变小变暗淡。腐蚀…...

编程新知 2026/2/8 22:00:17

【无标题】路径问题的革命性重构：基于二维拓扑收缩色动力学模型的零点隧穿理论

路径问题的革命性重构：基于二维拓扑收缩色动力学模型的零点隧穿理论一、传统路径模型的根本缺陷在经典正方形路径问题中（图1）： mermaid graph LR A((A)) --- B((B)) B --- C((C)) C --- D((D)) D --- A A -.- C[无直接路径] B -…...

编程新知 2025/10/21 1:07:59

三分算法与DeepSeek辅助证明是单峰函数

前置单峰函数有唯一的最大值，最大值左侧的数值严格单调递增，最大值右侧的数值严格单调递减。单谷函数有唯一的最小值，最小值左侧的数值严格单调递减，最小值右侧的数值严格单调递增。三分的本质三分和二分一样都是通过不断缩…...

编程新知 2026/1/31 2:50:32

MySQL的pymysql操作

本章是MySQL的最后一章，MySQL到此完结，下一站Hadoop！！！ 这章很简单，完整代码在最后，详细讲解之前python课程里面也有，感兴趣的可以往前找一下一、查询操作我们需要打开pycharm …...

编程新知 2026/1/20 12:20:43

文章目录

1. 模型与代码实现

2. Q&A

相关文章：