当前位置：首页 > news >正文

人工智能-深度学习-Torch框架-手动构建回归流程

news 2025/11/6 1:27:26

from sklearn.datasets import make_regression
import math
import random
import torch

from sklearn.datasets import make_regression: 导入make_regression函数，用于生成回归数据集。
import math: 导入math模块，用于进行数学计算，例如向上取整。
import random: 导入random模块，用于随机打乱数据集。
import torch: 导入torch库，用于张量操作和神经网络训练。

构建数据集

def build_data():'''构建数据集'''noise = 14.6#噪声n_sample = 1000#样本数量X,y,coef = make_regression(n_samples=n_sample,n_features=4,coef=True)X = torch.tensor(X,dtype=torch.float64,requires_grad=True)y = torch.tensor(y,dtype=torch.float64,requires_grad=True)return X,y,coef

def build_data():: 定义一个名为build_data的函数，用于构建数据集。
noise = 14.6: 设置噪声水平为14.6，用于生成带有噪声的数据。
n_sample = 1000: 设置样本数量为1000，用于生成1000个样本。
X, y, coef = make_regression(n_samples=n_sample, n_features=4, coef=True): 使用make_regression生成回归数据集，包含1000个样本和4个特征，并返回真实系数。
X = torch.tensor(X, dtype=torch.float64, requires_grad=True): 将生成的特征矩阵X转换为PyTorch张量，数据类型为torch.float64，并设置requires_grad=True以启用梯度计算。
y = torch.tensor(y, dtype=torch.float64, requires_grad=True): 将生成的目标向量y转换为PyTorch张量，数据类型为torch.float64，并设置requires_grad=True以启用梯度计算。
return X, y, coef: 返回特征矩阵X、目标向量y和真实系数coef。

构建数据加载器

def data_loader(x,y):'''数据加载器'''#配置参数batch_size = 16#一个批次的数量n_sample = x.shape[0]#len(x)长度n_batches = math.ceil(n_sample/batch_size)#一轮的训练次数index = [i for i in range(n_sample)]random.shuffle(index)for i in range(0,n_batches):indexs = index[i*batch_size:min((i+1)*batch_size,n_sample)]yield x[indexs],y[indexs]

def data_loader(x, y):: 定义一个名为data_loader的函数，用于加载数据。
batch_size = 16: 设置每个批次的样本数量为16，用于控制每次训练的样本数量。
n_sample = x.shape[0]: 获取样本数量，用于计算批次数量。
n_batches = math.ceil(n_sample / batch_size): 计算每轮的批次数量，使用math.ceil向上取整，确保所有样本都能被处理。
index = [i for i in range(n_sample)]: 创建一个包含所有样本索引的列表，用于随机打乱样本顺序。
random.shuffle(index): 打乱样本索引，以随机化样本顺序，避免训练过程中的顺序偏差。
for i in range(0, n_batches):: 遍历每个批次，确保每个批次都能被处理。
indexs = index[i * batch_size:min((i + 1) * batch_size, n_sample)]: 获取当前批次的索引，确保最后一个批次也能被处理。
yield x[indexs], y[indexs]: 返回当前批次的特征矩阵和目标向量，使用yield生成一个生成器，用于按需加载数据。

构建模型函数

def myregreser(x,w,b):return x@w+b#一个容器中装着的是每一条样本数据的预测值

x@w+b 跟 y = x*w+b差不多，无需多言哈

def myregreser(x, w, b):: 定义一个名为myregreser的函数，用于计算线性回归模型的预测值。
return x @ w + b: 返回预测值，使用矩阵乘法@计算x和w的乘积，然后加上偏置b，实现线性回归模型.

构建损失函数

def MSE(y_pred,y_true):return torch.mean((y_pred-y_true)**2)

def MSE(y_pred, y_true):: 定义一个名为MSE的函数，用于计算均方误差（MSE）损失。
return torch.mean((y_pred - y_true) ** 2): 返回预测值和真实值之间的均方误差，用于衡量模型的预测精度。

把参数初始化

def  initialize(n_featrue):torch.manual_seed(666)w = torch.randn(n_featrue,requires_grad=True,dtype=torch.float64)# print(w)b = torch.tensor(14.5,requires_grad=True,dtype=torch.float64)return w,b

def initialize(n_feature):: 定义一个名为initialize的函数，用于初始化模型参数。
torch.manual_seed(666): 设置随机种子为666，以确保结果可重复，避免随机性带来的不确定性。
w = torch.randn(n_feature): 使用随机值初始化权重w，确保模型初始状态具有一定的随机性。
b = torch.tensor(14.5, requires_grad=True, dtype=torch.float64): 初始化偏置b，并设置requires_grad=True以启用梯度计算，确保偏置可以被优化。
return w, b: 返回初始化的权重和偏置。

构建梯度下降函数

def optim_step(w,b,dw,db,lr):
#更新梯度，朝着梯度下降的方向去更新梯度w.data = w.data-lr*dw.datab.data = b,data-lr*db.data

def optim_step(w, b, dw, db, lr):: 定义一个名为optim_step的函数，用于更新模型参数。
w.data = w.data - lr * dw.data: 更新权重w，沿着梯度下降的方向，使用学习率lr控制更新的步长。
b.data = b.data - lr * db.data: 更新偏置b，沿着梯度下降的方向，使用学习率lr控制更新的步长。

使用上面构建的函数进行实战训练

def train():#生成数据x,y,coef = build_data()#初始化参数w,b = initialize(x.shape[1])#定义训练参数lr = 0.01epoch = 100for i in range(epoch):loss_e = 0count = 0for batch_x,batch_y_true in data_loader(x,y):y_bacth_pred = myregreser(batch_x,w,b)loss = MSE(y_bacth_pred,batch_y_true)loss_e+=losscount+=1#梯度清零if w.grad is not None:w.data.zero_()if b.grad is not None:b.data.zero_()#反向传播（梯度计算）loss.backward()#梯度更行optim_step(w,b,w.grad,b.grad,lr)print(f'epoch:{i},loss:{loss_e/count}')return w,b,coef
if __name__=='__main__':w,b,coef = train()print(w,b)print(coef)print(torch.allclose(w,torch.tensor(coef)))

def train():: 定义一个名为train的函数，用于训练模型。
x, y, coef = build_data(): 生成数据集，获取特征矩阵x、目标向量y和真实系数coef。
w, b = initialize(x.shape[1]): 初始化模型参数，获取初始化的权重w和偏置b。
lr = 0.01: 设置学习率为0.01，控制参数更新的步长。
epoch = 100: 设置训练轮数为100，控制训练的迭代次数。
for i in range(epoch):: 外层循环，遍历每个训练轮，确保模型在多个轮次中进行训练。
loss_e = 0: 初始化每轮的总损失为0，用于累加每个批次的损失。
count = 0: 初始化批次计数为0，用于计算每轮的平均损失。
for batch_x, batch_y_true in data_loader(x, y):: 内层循环，遍历每个批次的数据，确保每个批次都能被处理。
y_batch_pred = myregreser(batch_x, w, b): 计算预测值，使用当前的权重和偏置进行预测。
loss = MSE(y_batch_pred, batch_y_true): 计算损失，使用均方误差衡量预测值和真实值之间的差异。
loss_e += loss: 累加损失，用于计算每轮的总损失。
count += 1: 计数批次数量，用于计算每轮的平均损失。
if w.grad is not None:: 检查权重w的梯度是否存在，确保梯度已经计算。
w.grad.zero_(): 清零权重w的梯度，避免梯度累积。
if b.grad is not None:: 检查偏置b的梯度是否存在，确保梯度已经计算。
b.grad.zero_(): 清零偏置b的梯度，避免梯度累积。
loss.backward(): 反向传播，计算梯度，用于更新模型参数。
optim_step(w, b, w.grad, b.grad, lr): 更新参数，沿着梯度下降的方向更新权重和偏置。
print(f'epoch:{i}, loss:{loss_e / count}'): 打印每轮的平均损失，用于监控训练过程。
return w, b, coef: 返回训练后的权重、偏置和真实系数，用于评估模型性能。

人工智能-深度学习-Torch框架-手动构建回归流程

from sklearn.datasets import make_regression import math import random import torch from sklearn.datasets import make_regression: 导入make_regression函数，用于生成回归数据集。 import math: 导入math模块，用于进行数学计算，例如…...

编程日记 2024/11/26 5:24:50

SpringBoot源码解析(五)：准备应用环境

SpringBoot源码系列文章 SpringBoot源码解析(一)：SpringApplication构造方法 SpringBoot源码解析(二)：引导上下文DefaultBootstrapContext SpringBoot源码解析(三)：启动开始阶段 SpringBoot源码解析(四)：解析应用参数args Sp…...

编程日记 2024/11/26 5:21:47

MySQL面试-1

InnoDB中ACID的实现先说一下原子性是怎么实现的。事务要么失败，要么成功，不能做一半。聪明的InnoDB，在干活儿之前，先将要做的事情记录到一个叫undo log的日志文件中，如果失败了或者主动rollback，就可以通…...

编程日记 2024/11/26 5:19:45

方法1 location / {index index.html index.htm;add_header Cache-Control no-cache,no-store;try_files $uri $uri/ /index.html;#include mime.types;if ($request_filename ~* .*\.(htm|html)$) {add_header Cache-Control "private, no-store, no-cache, must-revali…...

编程日记 2024/11/26 5:16:41

PHP导出EXCEL含合计行，设置单元格格式

PHP导出EXCEL含合计行，设置单元格格式，水平居中垂直居中 public function exportSalary(Request $request){//水平居中垂直居中$styleArray [alignment > [horizontal > Alignment::HORIZONTAL_CENTER,vertical > Alignment::VERTICAL_CE…...

编程日记 2024/11/26 5:09:34

RabbitMQ 之死信队列

一、死信的概念先从概念解释上搞清楚这个定义，死信，顾名思义就是无法被消费的消息，字面意思可以这样理解，一般来说，producer 将消息投递到 broker 或者直接到 queue 里了，consumer 从 queue 取出消息进行…...

编程日记 2024/11/26 5:08:33

【创建型设计模式】单例模式

【创建型设计模式】单例模式这篇博客接下来几篇都将阐述设计模式相关内容。接下来的顺序大概是：单例模式、工厂方法模式、抽象工厂模式、建造者模式、原型模式。一、什么是单例模式单例模式是一种创建型设计模式，它保证一个类仅有一个实例&#…...

编程日记 2024/11/26 5:04:29

Charles抓包工具-笔记

摘要概念： Charles是一款基于 HTTP 协议的代理服务器，通过成为电脑或者浏览器的代理，然后截取请求和请求结果来达到分析抓包的目的。功能： Charles 是一个功能全面的抓包工具，适用于各种网络调试和优化场景。它…...

编程日记 2024/11/26 5:03:28

Go语言使用 kafka-go 消费 Kafka 消息教程

Go语言使用 kafka-go 消费 Kafka 消息教程在这篇教程中，我们将介绍如何使用 kafka-go 库来消费 Kafka 消息，并重点讲解 FetchMessage 和 ReadMessage 的区别，以及它们各自适用的场景。通过这篇教程，你将了解如何有效地使用 kafk…...

编程日记 2024/11/26 5:02:27

【论文笔记】Number it: Temporal Grounding Videos like Flipping Manga

🍎个人主页：小嗷犬的个人主页 🍊个人网站：小嗷犬的技术小站 🥭个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。基本信息标题: Number it: Temporal Grou…...

编程日记 2024/11/26 5:01:25

C语言菜鸟入门·关键字·int的用法

目录 1. int关键字 1.1 取值范围 1.2 符号类型 1.3 运算 1.3.1 加法运算() 1.3.2 减法运算(-) 1.3.3 乘法运算(*) 1.3.4 除法运算(/) 1.3.5 取余运算(%) 1.3.6 自增()与自减(--) 1.3.7 位运算 2. 更多关键字 1. int关键字 int 是一个关键字&#xff0…...

编程日记 2024/11/26 5:00:23

基于企业微信客户端设计一个文件下载与预览系统

在企业内部沟通与协作中，文件分享和管理是不可或缺的一部分。企业微信（WeCom）作为一款广泛应用于企业的沟通工具，提供了丰富的API接口和功能，帮助企业进行高效的团队协作。然而，随着文件交换和协作的日益增…...

编程日记 2024/11/26 4:58:21

昇思MindSpore第七课---文本解码原理

1. 文本解码原理文本解码是将模型的输出（通常是概率分布或词汇索引）转换为可读的自然语言文本的过程。在生成文本时，常见的解码方法包括贪心解码、束搜索（BeamSearch）、随机采样等。 2 实践 2.1 配置环境安装mindn…...

编程日记 2024/11/26 4:57:20

C# 数据结构之【图】C#图

1. 图的概念图是一种重要的数据结构，用于表示节点（顶点）之间的关系。图由一组顶点和连接这些顶点的边组成。图可以是有向的（边有方向）或无向的（边没有方向），可以是加权的&#xff…...

编程日记 2024/11/26 4:54:16

传输控制协议（TCP）和用户数据报协议（UDP）

一、传输控制协议（TCP） 传输控制协议（Transmission Control Protocol，TCP）是一种面向连接的、可靠的、基于字节流的传输层通信协议，由 IETF 的 RFC 793 定义。它通过三次握手建立连接，确保数…...

编程日记 2024/11/26 4:53:14

【Python爬虫】Scrapy框架实战---百度首页热榜新闻

如何利用Scrapy框架实战提取百度首页热榜新闻的排名、标题和链接一、安装Scrapy库二、创建项目（以BaiduSpider为例） scrapy startproject BaiduSpider生成每个文件的功能： 二、创建爬虫脚本（爬虫名：news&#xff…...

编程日记 2024/11/26 4:48:07

采用python3.12 +django5.1 结合 RabbitMQ 和发送邮件功能,实现一个简单的告警系统前后端分离 vue-element

一、开发环境搭建和配置 #mac环境 brew install python3.12 python3.12 --version python3.12 -m pip install --upgrade pip python3.12 -m pip install Django5.1 python3.12 -m django --version #用于检索系统信息和进程管理 python3.12 -m pip install psutil #集成 pika…...

编程日记 2024/11/26 4:43:02

Qt 实现网络数据报文大小端数据的收发

1.大小端数据简介大小端（Endianness）是计算机体系结构的一个术语，它描述了多字节数据在内存中的存储顺序。以下是大小端的定义和它们的特点： 大端（Big-Endian） 在大端模式中，一个字的最高有效…...

编程日记 2024/11/26 4:34:54

[译]Elasticsearch Sequence ID实现思路及用途

原文地址:https://www.elastic.co/blog/elasticsearch-sequence-ids-6-0 如果几年前，在Elastic，我们问自己一个"如果"问题，我们知道这将带来有趣的见解： "如果我们在Elasticsearch中对索引操作进行全面排序会怎样…...

编程日记 2024/11/26 4:22:40

Java基于SpringBoot+Vue的藏区特产销售平台

博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专栏推荐订阅👇…...

编程日记 2024/11/26 4:14:29

eNSP-Cloud(实现本地电脑与eNSP内设备之间通信)

说明： 想象一下，你正在用eNSP搭建一个虚拟的网络世界，里面有虚拟的路由器、交换机、电脑（PC）等等。这些设备都在你的电脑里面“运行”，它们之间可以互相通信，就像一个封闭的小王国。但是&#…...

编程新知 2025/11/6 1:08:25

在HarmonyOS ArkTS ArkUI-X 5.0及以上版本中，手势开发全攻略：

在 HarmonyOS 应用开发中，手势交互是连接用户与设备的核心纽带。ArkTS 框架提供了丰富的手势处理能力，既支持点击、长按、拖拽等基础单一手势的精细控制，也能通过多种绑定策略解决父子组件的手势竞争问题。本文将结合官方开发文档&#xff0c…...

编程新知 2025/9/19 4:31:58

【Go】3、Go语言进阶与依赖管理

前言本系列文章参考自稀土掘金上的【字节内部课】公开课，做自我学习总结整理。 Go语言并发编程 Go语言原生支持并发编程，它的核心机制是 Goroutine 协程、Channel 通道，并基于CSP（Communicating Sequential Processes&#xff0…...

编程新知 2025/10/7 0:32:40

从零开始打造 OpenSTLinux 6.6 Yocto 系统（基于STM32CubeMX）（九）

设备树移植和uboot设备树修改的内容同步到kernel将设备树stm32mp157d-stm32mp157daa1-mx.dts复制到内核源码目录下源码修改及编译修改arch/arm/boot/dts/st/Makefile，新增设备树编译 stm32mp157f-ev1-m4-examples.dtb \stm32mp157d-stm32mp157daa1-mx.dtb修改…...

编程新知 2025/10/26 5:13:25

鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个生活电费的缴纳和查询小程序

一、项目初始化与配置 1. 创建项目 ohpm init harmony/utility-payment-app 2. 配置权限 // module.json5 {"requestPermissions": [{"name": "ohos.permission.INTERNET"},{"name": "ohos.permission.GET_NETWORK_INFO"…...

编程新知 2025/9/30 12:05:28

SAP学习笔记 - 开发26 - 前端Fiori开发 OData V2 和 V4 的差异 (Deepseek整理）

上一章用到了V2 的概念，其实 Fiori当中还有 V4，咱们这一章来总结一下 V2 和 V4。 SAP学习笔记 - 开发25 - 前端Fiori开发 Remote OData Service(使用远端Odata服务)，代理中间件（ui5-middleware-simpleproxy）-CSDN博客…...

编程新知 2025/11/3 20:51:50

如何更改默认 Crontab 编辑器？

在 Linux 领域中，crontab 是您可能经常遇到的一个术语。这个实用程序在类 unix 操作系统上可用，用于调度在预定义时间和间隔自动执行的任务。这对管理员和高级用户非常有益，允许他们自动执行各种系统任务。编辑 Crontab 文件通常使用文本编…...

编程新知 2025/10/29 0:30:24

Golang——6、指针和结构体

指针和结构体 1、指针1.1、指针地址和指针类型1.2、指针取值1.3、new和make 2、结构体2.1、type关键字的使用2.2、结构体的定义和初始化2.3、结构体方法和接收者2.4、给任意类型添加方法2.5、结构体的匿名字段2.6、嵌套结构体2.7、嵌套匿名结构体2.8、结构体的继承 3、结构体与…...

编程新知 2025/10/29 18:22:23

WebRTC从入门到实践 - 零基础教程

WebRTC从入门到实践 - 零基础教程目录 WebRTC简介基础概念工作原理开发环境搭建基础实践三个实战案例常见问题解答 1. WebRTC简介 1.1 什么是WebRTC？ WebRTC（Web Real-Time Communication）是一个支持网页浏览器进行实时语音…...

编程新知 2025/8/9 9:56:56

【Linux】自动化构建-Make/Makefile

前言上文我们讲到了Linux中的编译器gcc/g 【Linux】编译器gcc/g及其库的详细介绍-CSDN博客本来我们将一个对于编译来说很重要的工具：make/makfile 1.背景在一个工程中源文件不计其数，其按类型、功能、模块分别放在若干个目录中，mak…...

编程新知 2025/10/31 4:01:03

人工智能-深度学习-Torch框架-手动构建回归流程

构建数据集

构建数据加载器

构建模型函数

构建损失函数

把参数初始化

构建梯度下降函数

使用上面构建的函数进行实战训练

相关文章：

人工智能-深度学习-Torch框架-手动构建回归流程

SpringBoot源码解析(五)：准备应用环境

MySQL面试-1

nginx配置不缓存资源

PHP导出EXCEL含合计行，设置单元格格式

RabbitMQ 之死信队列

【创建型设计模式】单例模式

Charles抓包工具-笔记

Go语言使用 kafka-go 消费 Kafka 消息教程

【论文笔记】Number it: Temporal Grounding Videos like Flipping Manga

C语言菜鸟入门·关键字·int的用法

基于企业微信客户端设计一个文件下载与预览系统

昇思MindSpore第七课---文本解码原理

C# 数据结构之【图】C#图

传输控制协议（TCP）和用户数据报协议（UDP）

【Python爬虫】Scrapy框架实战---百度首页热榜新闻

采用python3.12 +django5.1 结合 RabbitMQ 和发送邮件功能,实现一个简单的告警系统前后端分离 vue-element

Qt 实现网络数据报文大小端数据的收发

[译]Elasticsearch Sequence ID实现思路及用途

Java基于SpringBoot+Vue的藏区特产销售平台

eNSP-Cloud(实现本地电脑与eNSP内设备之间通信)

在HarmonyOS ArkTS ArkUI-X 5.0及以上版本中，手势开发全攻略：

【Go】3、Go语言进阶与依赖管理

从零开始打造 OpenSTLinux 6.6 Yocto 系统（基于STM32CubeMX）（九）

鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个生活电费的缴纳和查询小程序

SAP学习笔记 - 开发26 - 前端Fiori开发 OData V2 和 V4 的差异 (Deepseek整理）

如何更改默认 Crontab 编辑器？

Golang——6、指针和结构体

WebRTC从入门到实践 - 零基础教程

【Linux】自动化构建-Make/Makefile