当前位置：首页 > news >正文

【李沐】3.3线性回归的简洁实现

news 2026/2/10 17:16:01

1、生成数据集

import numpy as np
import torch
from torch.utils import data
from d2l import torch as d2l
true_w = torch.tensor([2, -3.4])  # 定义真实权重 true_w，其中 [2, -3.4] 表示两个特征的权重值
true_b = 4.2  # 定义真实偏差 true_b，表示模型的截距项# 调用 synthetic_data 函数生成合成数据集，传入真实权重 true_w、偏差 true_b 和样本数量 1000
# 这将返回特征矩阵 features 和目标值 labels，用于训练和测试模型
features, labels = d2l.synthetic_data(true_w, true_b, 1000)

2、读取数据集

def load_array(data_arrays, batch_size, is_train=True):  # 定义函数 load_array，接受数据数组、批量大小和是否训练标志 is_train 作为参数"""构造一个 PyTorch 数据迭代器"""dataset = data.TensorDataset(*data_arrays)  # 创建一个 PyTorch 数据集，使用给定的数据数组# 使用 data.DataLoader 构造数据迭代器，传入数据集、批量大小和是否训练标志# 当 is_train 为 True 时，数据会被随机打乱，用于训练；否则，数据不会被打乱，用于测试或验证return data.DataLoader(dataset, batch_size, shuffle=is_train)
batch_size = 10
data_iter = load_array((features, labels), batch_size)
batch_size = 10
data_iter = load_array((features, labels), batch_size)

3、定义模型
线性层输入2，输出1

# nn是神经⽹络的缩写
from torch import nn
net = nn.Sequential(nn.Linear(2, 1))

4、初始化模型
通过net[0]选择⽹络中的第⼀个图层，然后使⽤weight.data和bias.data⽅法访问参数。我们还可以使⽤替换⽅法normal_和fill_来重写参数值。
0,0.0.01的意思是均值为0、标准差为0.01的正态分布中随机采样

net[0].weight.data.normal_(0, 0.01)
net[0].bias.data.fill_(0)

5、定义损失函数
均方误差，L2范数

loss = nn.MSELoss()

6、定义优化函数
net.parameters() 返回神经网络模型中需要被优化的参数列表

trainer = torch.optim.SGD(net.parameters(), lr=0.03)

7、训练
主要是注意里面的写法，看到的别的代码知道啥意思就可以

num_epochs = 3  # 定义训练轮次数量为 3for epoch in range(num_epochs):  # 迭代每个训练轮次for X, y in data_iter:  # 遍历数据迭代器中的每个数据批次l = loss(net(X), y)  # 计算模型预测值与真实标签之间的损失trainer.zero_grad()  # 清零梯度，以便进行下一轮的梯度计算l.backward()  # 对损失进行反向传播，计算参数的梯度trainer.step()  # 使用优化器更新模型参数l = loss(net(features), labels)  # 在整个训练集上计算损失print(f'epoch {epoch + 1}, loss {l:f}')  # 打印当前训练轮次和损失值

【李沐】3.3线性回归的简洁实现

1、生成数据集 import numpy as np import torch from torch.utils import data from d2l import torch as d2l true_w torch.tensor([2, -3.4]) # 定义真实权重 true_w，其中 [2, -3.4] 表示两个特征的权重值 true_b 4.2 # 定义真实偏差 true_b，表示…...

编程日记 2023/8/19 18:39:50

Ghost-free High Dynamic Range Imaging withContext-aware Transformer

Abstract 高动态范围(HDR)去鬼算法旨在生成具有真实感细节的无鬼HDR图像。受感受野局部性的限制，现有的基于CNN的方法在大运动和严重饱和度的情况下容易产生重影伪影和强度畸变。本文提出了一种新的上下文感知视觉转换器（CA-VIT）用于高动态…...

编程日记 2023/8/19 18:38:49

过来，我告诉你个秘密：送给程序员男友最好的礼物，快教你对象学习磁盘分区啦！小点声哈，别让其他人学会了！

[原文连接:来自给点知识](过来，我告诉你个秘密：送给程序员男友最好的礼物，快教你对象学习磁盘分区啦！小点声哈，别让其他人学会了！) 再唱不出那样的歌曲听到都会红着脸躲避虽然会经常忘了我依然爱着你 …...

编程日记 2023/8/19 18:37:48

Cadence+硬件每日学习十个知识点（38）23.8.18 （Cadence的使用，界面介绍）

文章目录 1.Cadence有共享数据库的途径2.Cadence启动3.Cadence界面菜单简介（file、edit、view、place、options）4.Cadence界面的图标简介5.我的下载资源有三本书 1.Cadence有共享数据库的途径答： AD缺少共享数据库的途径，目前我…...

编程日记 2023/8/19 18:36:46

React Native Expo项目，复制文本到剪切板

装包： npx expo install expo-clipboard import * as Clipboard from expo-clipboardconst handleCopy async (text) > {await Clipboard.setStringAsync(text)Toast.show(复制成功, {duration: 3000,position: Toast.positions.CENTER,})} 参考链接&#xff1a…...

编程日记 2023/8/19 18:35:44

React源码解析18（5）------ 实现函数组件【修改beginWork和completeWork】

摘要经过之前的几篇文章，我们实现了基本的jsx，在页面渲染的过程。但是如果是通过函数组件写出来的组件，还是不能渲染到页面上的。所以这一篇，主要是对之前写得方法进行修改，从而能够显示函数组件，所以现…...

编程日记 2023/8/19 18:34:43

vscode ssh 远程 gdb 调试

一、点运行与调试，生成launch.json 文件二、点添加配置，选择GDB 三、修改启动程序路径...

编程日记 2023/8/19 18:33:43

云原生 AI 工程化实践之 FasterTransformer 加速 LLM 推理

作者：颜廷帅（瀚廷） 01 背景 OpenAI 在 3 月 15 日发布了备受瞩目的 GPT4，它在司法考试和程序编程领域的惊人表现让大家对大语言模型的热情达到了顶点。人们纷纷议论我们是否已经跨入通用人工智能的时代。与此同时，基…...

编程日记 2023/8/19 18:32:41

PHP酒店点菜管理系统mysql数据库web结构apache计算机软件工程网页wamp

一、源码特点 PHP 酒店点菜管理系统是一套完善的web设计系统，对理解php编程开发语言有帮助，系统具有完整的源代码和数据库，系统主要采用B/S模式开发。代码下载 https://download.csdn.net/download/qq_41221322/88232051 论文 https://…...

编程日记 2023/8/19 18:31:40

【面试复盘】知乎暑期实习算法工程师二面

来源：投稿作者：LSC 编辑：学姐 1. 自我介绍 2. 介绍自己的项目 3. 编程题判断一个链表是不是会文链表class ListNode: def __init__(self, val, nextNone):self.val valself.next nextdef reverse(head):pre Nonep headwhile p ! No…...

编程日记 2023/8/19 18:30:39

内网穿透和服务器+IP 实现公网访问内网的区别

内网穿透和服务器IP 实现公网访问内网的区别在于实现方式和使用场景。内网穿透（Port Forwarding）：内网穿透是一种通过网络技术将公网用户的请求通过中转服务器传输到内网设备的方法。通过在路由器或防火墙上进行配置，将公网请求…...

编程日记 2023/8/19 18:29:37

JAVA权限管理助力企业精细化运营

在企业的日常经营中，企业人数达到一定数量之后，就需要对企业的层级和部门进行细分，建立企业的树形组织架构。围绕着树形组织架构，企业能够将权限落实到个人，避免企业内部出现管理混乱等情况。权限管理是每个企业管理中…...

编程日记 2023/8/19 18:28:35

金融语言模型：FinGPT

项目简介 FinGPT是一个开源的金融语言模型（LLMs），由FinNLP项目提供。这个项目让对金融领域的自然语言处理（NLP）感兴趣的人们有了一个可以自由尝试的平台，并提供了一个与专有模型相比更容易获取的金融数据。…...

编程日记 2023/8/19 18:27:34

LeetCode--HOT100题（30）

目录题目描述：24. 两两交换链表中的节点（中等）题目接口解题思路代码 PS: 题目描述：24. 两两交换链表中的节点（中等） 给你一个链表，两两交换其中相邻的节点，并返回交换后链表的头节…...

编程日记 2023/8/19 18:26:33

Springboot 实践（3）配置DataSource及创建数据库

前文讲述了利用MyEclipse2019开发工具，创建maven工程、加载springboot、swagger-ui功能。本文讲述创建数据库，为项目配置数据源，实现数据的增删改查服务，并通过swagger-ui界面举例调试服务控制器创建数据库项目使用MySQL 8.0.…...

编程日记 2023/8/19 18:25:32

【问题整理】Ubuntu 执行 apt-get install xxx 报错

Ubuntu 执行 apt-get install xxx 报错一、问题描述: 执行apt-get install fcitx时，报如下错误 grub-pc E: Sub-process /usr/bin/dpkg returned an error code (1)二、解决方法: 尝试修复依赖问题： sudo apt-get -f install这个命令会尝试修复系统…...

编程日记 2023/8/19 18:24:30

Java课题笔记~ SpringBoot简介

1. 入门案例问题导入 SpringMVC的HelloWord程序大家还记得吗？ SpringBoot是由Pivotal团队提供的全新框架，其设计目的是用来简化Spring应用的初始搭建以及开发过程原生开发SpringMVC程序过程 1.1 入门案例开发步骤 ①：创建新模块&#…...

编程日记 2023/8/19 18:23:28

一种基于springboot、redis的分布式任务引擎的实现（一）

总体思路是，主节点接收到任务请求，将根据任务情况拆分成多个任务块，将任务块标识的主键放入redis。发送redis消息，等待其他节点运行完毕，结束处理。接收到信息的节点注册本节点信息到redis、开启多线程、获取任务块、执…...

编程日记 2023/8/19 18:22:26

基于IDE Eval Resetter延长IntelliJ IDEA等软件试用期的方法（包含新版本软件的操作方法）

本文介绍基于IDE Eval Resetter插件，对集成开发环境IntelliJ IDEA等JetBrains公司下属的多个开发软件，加以试用期延长的方法。我们这里就以IntelliJ IDEA为例，来介绍这一插件发挥作用的具体方式。不过，需要说明使用IDE Eval Rese…...

编程日记 2023/8/19 18:21:25

RocketMQ消费者可以手动消费但无法主动消费问题，或生成者发送超时

1.大多数是配置问题修改rocketmq文件夹broker.conf 2.配置与集群IP或本地IPV4一样重启在RocketMQ独享实例中支持IPv4和IPv6双栈，主要是通过在网络层面上同时支持IPv4和IPv6协议栈来实现的。RocketMQ的Broker端、Namesrv端和客户端都需要支持IPv4和IPv6协议&…...

编程日记 2023/8/19 18:20:23

浏览器访问 AWS ECS 上部署的 Docker 容器（监听 80 端口）

✅ 一、ECS 服务配置 Dockerfile 确保监听 80 端口 EXPOSE 80 CMD ["nginx", "-g", "daemon off;"]或 EXPOSE 80 CMD ["python3", "-m", "http.server", "80"]任务定义（Task Definition&…...

编程新知 2026/2/8 15:03:14

【位运算】消失的两个数字（hard）

消失的两个数字（hard） 题⽬描述：解法（位运算）：Java 算法代码：更简便代码题⽬链接：⾯试题 17.19. 消失的两个数字题⽬描述： 给定⼀个数组，包含从 1 到 N 所有…...

编程新知 2025/11/15 16:18:24

UDP(Echoserver)

网络命令 Ping 命令检测网络是否连通使用方法: ping -c 次数网址ping -c 3 www.baidu.comnetstat 命令 netstat 是一个用来查看网络状态的重要工具. 语法：netstat [选项] 功能：查看网络状态常用选项： n 拒绝显示别名&#…...

编程新知 2026/1/24 7:56:15

【第二十一章 SDIO接口(SDIO)】

第二十一章 SDIO接口目录第二十一章 SDIO接口(SDIO) 1 SDIO 主要功能 2 SDIO 总线拓扑 3 SDIO 功能描述 3.1 SDIO 适配器 3.2 SDIOAHB 接口 4 卡功能描述 4.1 卡识别模式 4.2 卡复位 4.3 操作电压范围确认 4.4 卡识别过程 4.5 写数据块 4.6 读数据块 4.7 数据流…...

编程新知 2026/2/1 13:28:03

【2025年】解决Burpsuite抓不到https包的问题

环境：windows11 burpsuite:2025.5 在抓取https网站时，burpsuite抓取不到https数据包，只显示： 解决该问题只需如下三个步骤： 1、浏览器中访问 http://burp 2、下载 CA certificate 证书 3、在设置--隐私与安全--…...

编程新知 2026/1/28 3:43:20

相机从app启动流程

一、流程框架图二、具体流程分析 1、得到cameralist和对应的静态信息目录如下：重点代码分析：启动相机前，先要通过getCameraIdList获取camera的个数以及id，然后可以通过getCameraCharacteristics获取对应id camera的capabilities（静态信息）进行一些openCamera前的…...

编程新知 2026/1/31 5:09:19

04-初识css

一、css样式引入 1.1.内部样式 <div style"width: 100px;"></div>1.2.外部样式 1.2.1.外部样式1 <style>.aa {width: 100px;} </style> <div class"aa"></div>1.2.2.外部样式2 <!-- rel内表面引入的是style样…...

编程新知 2026/1/29 17:54:05

自然语言处理——Transformer

自然语言处理——Transformer 自注意力机制多头注意力机制Transformer 虽然循环神经网络可以对具有序列特性的数据非常有效，它能挖掘数据中的时序信息以及语义信息，但是它有一个很大的缺陷——很难并行化。我们可以考虑用CNN来替代RNN，但是…...

编程新知 2026/2/1 7:05:07

MySQL中【正则表达式】用法

MySQL 中正则表达式通过 REGEXP 或 RLIKE 操作符实现（两者等价），用于在 WHERE 子句中进行复杂的字符串模式匹配。以下是核心用法和示例： 一、基础语法 SELECT column_name FROM table_name WHERE column_name REGEXP pattern; …...

编程新知 2025/11/21 22:02:37

IT供电系统绝缘监测及故障定位解决方案

随着新能源的快速发展，光伏电站、储能系统及充电设备已广泛应用于现代能源网络。在光伏领域，IT供电系统凭借其持续供电性好、安全性高等优势成为光伏首选，但在长期运行中，例如老化、潮湿、隐裂、机械损伤等问题会影响光伏板绝缘层…...

编程新知 2026/2/1 6:36:36

相关文章：