当前位置：首页 > news >正文

【机器学习】自定义数据集使用pytorch框架实现逻辑回归并保存模型，然后保存模型后再加载模型进行预测，对预测结果计算精确度和召回率及F1分数

news 2025/7/13 2:13:48

一、使用pytorch框架实现逻辑回归

1. 数据部分：

首先自定义了一个简单的数据集，特征 X 是 100 个随机样本，每个样本一个特征，目标值 y 基于线性关系并添加了噪声。
将 numpy 数组转换为 PyTorch 张量，方便后续在模型中使用。

2. 模型定义部分：

方案 1：使用 `nn.Sequential` 直接按顺序定义了一个线性层，简洁直观。

import torch
import torch.nn as nn
import numpy as np
from sklearn.metrics import mean_squared_error, r2_score# 自定义数据集
X = np.random.rand(100, 1).astype(np.float32)
y = 2 * X + 1 + 0.3 * np.random.randn(100, 1).astype(np.float32)# 转换为 PyTorch 张量
X_tensor = torch.from_numpy(X)
y_tensor = torch.from_numpy(y)# 定义线性回归模型
model = nn.Sequential(nn.Linear(1, 1)
)# 定义损失函数和优化器
criterion = nn.MSELoss()
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)# 训练模型
num_epochs = 1000
for epoch in range(num_epochs):# 前向传播outputs = model(X_tensor)loss = criterion(outputs, y_tensor)# 反向传播和优化optimizer.zero_grad()loss.backward()optimizer.step()if (epoch + 1) % 100 == 0:print(f'Epoch [{epoch + 1}/{num_epochs}], Loss: {loss.item():.4f}')# 模型评估
with torch.no_grad():y_pred = model(X_tensor).numpy()mse = mean_squared_error(y, y_pred)
r2 = r2_score(y, y_pred)
print(f"均方误差 (MSE): {mse}")
print(f"决定系数 (R²): {r2}")# 输出模型的系数和截距
print("模型系数:", model[0].weight.item())
print("模型截距:", model[0].bias.item())

方案 2：使用 `nn.ModuleList` 存储线性层，在 `forward` 方法中依次调用层进行前向传播，适合动态构建层序列。

import torch
import torch.nn as nn
import numpy as np
from sklearn.metrics import mean_squared_error, r2_score# 自定义数据集
X = np.random.rand(100, 1).astype(np.float32)
y = 2 * X + 1 + 0.3 * np.random.randn(100, 1).astype(np.float32)# 转换为 PyTorch 张量
X_tensor = torch.from_numpy(X)
y_tensor = torch.from_numpy(y)# 定义线性回归模型
class LinearRegression(nn.Module):def __init__(self):super(LinearRegression, self).__init__()self.layers = nn.ModuleList([nn.Linear(1, 1)])def forward(self, x):for layer in self.layers:x = layer(x)return xmodel = LinearRegression()# 定义损失函数和优化器
criterion = nn.MSELoss()
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)# 训练模型
num_epochs = 1000
for epoch in range(num_epochs):# 前向传播outputs = model(X_tensor)loss = criterion(outputs, y_tensor)# 反向传播和优化optimizer.zero_grad()loss.backward()optimizer.step()if (epoch + 1) % 100 == 0:print(f'Epoch [{epoch + 1}/{num_epochs}], Loss: {loss.item():.4f}')# 模型评估
with torch.no_grad():y_pred = model(X_tensor).numpy()mse = mean_squared_error(y, y_pred)
r2 = r2_score(y, y_pred)
print(f"均方误差 (MSE): {mse}")
print(f"决定系数 (R²): {r2}")# 输出模型的系数和截距
print("模型系数:", model.layers[0].weight.item())
print("模型截距:", model.layers[0].bias.item())

方案 3：使用 `nn.ModuleDict` 以字典形式存储层，通过键名调用层，适合需要对层进行命名和灵活访问的场景。

import torch
import torch.nn as nn
import numpy as np
from sklearn.metrics import mean_squared_error, r2_score# 自定义数据集
X = np.random.rand(100, 1).astype(np.float32)
y = 2 * X + 1 + 0.3 * np.random.randn(100, 1).astype(np.float32)# 转换为 PyTorch 张量
X_tensor = torch.from_numpy(X)
y_tensor = torch.from_numpy(y)# 定义线性回归模型
class LinearRegression(nn.Module):def __init__(self):super(LinearRegression, self).__init__()self.layers = nn.ModuleDict({'linear': nn.Linear(1, 1)})def forward(self, x):x = self.layers['linear'](x)return xmodel = LinearRegression()# 定义损失函数和优化器
criterion = nn.MSELoss()
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)# 训练模型
num_epochs = 1000
for epoch in range(num_epochs):# 前向传播outputs = model(X_tensor)loss = criterion(outputs, y_tensor)# 反向传播和优化optimizer.zero_grad()loss.backward()optimizer.step()if (epoch + 1) % 100 == 0:print(f'Epoch [{epoch + 1}/{num_epochs}], Loss: {loss.item():.4f}')# 模型评估
with torch.no_grad():y_pred = model(X_tensor).numpy()mse = mean_squared_error(y, y_pred)
r2 = r2_score(y, y_pred)
print(f"均方误差 (MSE): {mse}")
print(f"决定系数 (R²): {r2}")# 输出模型的系数和截距
print("模型系数:", model.layers['linear'].weight.item())
print("模型截距:", model.layers['linear'].bias.item())

方案 4：直接继承 `nn.Module`，在 `init` 方法中定义线性层，在 `forward` 方法中实现前向传播逻辑，是最常见和基础的定义模型方式。

import torch
import torch.nn as nn
import numpy as np
from sklearn.metrics import mean_squared_error, r2_score# 自定义数据集
X = np.random.rand(100, 1).astype(np.float32)
y = 2 * X + 1 + 0.3 * np.random.randn(100, 1).astype(np.float32)# 转换为 PyTorch 张量
X_tensor = torch.from_numpy(X)
y_tensor = torch.from_numpy(y)# 定义线性回归模型
class LinearRegression(nn.Module):def __init__(self):super(LinearRegression, self).__init__()self.linear = nn.Linear(1, 1)def forward(self, x):return self.linear(x)model = LinearRegression()# 定义损失函数和优化器
criterion = nn.MSELoss()
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)# 训练模型
num_epochs = 1000
for epoch in range(num_epochs):# 前向传播outputs = model(X_tensor)loss = criterion(outputs, y_tensor)# 反向传播和优化optimizer.zero_grad()loss.backward()optimizer.step()if (epoch + 1) % 100 == 0:print(f'Epoch [{epoch + 1}/{num_epochs}], Loss: {loss.item():.4f}')# 模型评估
with torch.no_grad():y_pred = model(X_tensor).numpy()mse = mean_squared_error(y, y_pred)
r2 = r2_score(y, y_pred)
print(f"均方误差 (MSE): {mse}")
print(f"决定系数 (R²): {r2}")# 输出模型的系数和截距
print("模型系数:", model.linear.weight.item())
print("模型截距:", model.linear.bias.item())

3. 训练和评估部分：

定义了均方误差损失函数 nn.MSELoss 和随机梯度下降优化器 torch.optim.SGD。
通过多个 epoch 进行训练，每个 epoch 包含前向传播、损失计算、反向传播和参数更新。
训练结束后，在无梯度计算模式下进行预测，并使用 scikit-learn 的指标计算均方误差和决定系数评估模型性能，最后输出模型的系数和截距。

二、保存pytorch框架逻辑回归模型

在 PyTorch 中，有两种常见的保存模型的方式：保存模型的权重和其他参数，以及保存整个模型。下面将结合一个简单的逻辑回归模型示例，详细介绍这两种保存方式及对应的加载方法。

方式 1：保存模型的权重和其他参数

这种方式只保存模型的状态字典（state_dict），它包含了模型的所有可学习参数（如权重和偏置）。这种方法的优点是文件体积小，便于共享和迁移，缺点是加载时需要先定义模型结构。

import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np# 自定义数据集
X = np.random.randn(100, 2).astype(np.float32)
y = (2 * X[:, 0] + 3 * X[:, 1] > 0).astype(np.float32).reshape(-1, 1)X_tensor = torch.from_numpy(X)
y_tensor = torch.from_numpy(y)# 定义逻辑回归模型
class LogisticRegression(nn.Module):def __init__(self, input_size):super(LogisticRegression, self).__init__()self.linear = nn.Linear(input_size, 1)self.sigmoid = nn.Sigmoid()def forward(self, x):out = self.linear(x)out = self.sigmoid(out)return out# 初始化模型
input_size = 2
model = LogisticRegression(input_size)# 定义损失函数和优化器
criterion = nn.BCELoss()
optimizer = optim.SGD(model.parameters(), lr=0.01)# 训练模型
num_epochs = 1000
for epoch in range(num_epochs):outputs = model(X_tensor)loss = criterion(outputs, y_tensor)optimizer.zero_grad()loss.backward()optimizer.step()if (epoch + 1) % 100 == 0:print(f'Epoch [{epoch + 1}/{num_epochs}], Loss: {loss.item():.4f}')# 保存模型的权重和其他参数
torch.save(model.state_dict(), 'model_weights.pth')# 加载模型的权重和其他参数
loaded_model = LogisticRegression(input_size)
loaded_model.load_state_dict(torch.load('model_weights.pth'))
loaded_model.eval()# 生成新数据进行预测
new_X = np.random.randn(10, 2).astype(np.float32)
new_X_tensor = torch.from_numpy(new_X)with torch.no_grad():predictions = loaded_model(new_X_tensor)predicted_labels = (predictions >= 0.5).float()print("预测概率:")
print(predictions.numpy())
print("预测标签:")
print(predicted_labels.numpy())

代码解释

模型训练：首先定义并训练一个逻辑回归模型。
保存模型：使用 torch.save(model.state_dict(), 'model_weights.pth') 保存模型的状态字典到文件 model_weights.pth。
加载模型：先创建一个新的模型实例 loaded_model，然后使用 loaded_model.load_state_dict(torch.load('model_weights.pth')) 加载保存的状态字典。
预测：将模型设置为评估模式，生成新数据进行预测。

方式 2：保存整个模型

这种方式会保存整个模型对象，包括模型的结构和状态字典。优点是加载时不需要重新定义模型结构，缺点是文件体积较大，并且可能会受到 Python 版本和库版本的限制。

import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np# 自定义数据集
X = np.random.randn(100, 2).astype(np.float32)
y = (2 * X[:, 0] + 3 * X[:, 1] > 0).astype(np.float32).reshape(-1, 1)X_tensor = torch.from_numpy(X)
y_tensor = torch.from_numpy(y)# 定义逻辑回归模型
class LogisticRegression(nn.Module):def __init__(self, input_size):super(LogisticRegression, self).__init__()self.linear = nn.Linear(input_size, 1)self.sigmoid = nn.Sigmoid()def forward(self, x):out = self.linear(x)out = self.sigmoid(out)return out# 初始化模型
input_size = 2
model = LogisticRegression(input_size)# 定义损失函数和优化器
criterion = nn.BCELoss()
optimizer = optim.SGD(model.parameters(), lr=0.01)# 训练模型
num_epochs = 1000
for epoch in range(num_epochs):outputs = model(X_tensor)loss = criterion(outputs, y_tensor)optimizer.zero_grad()loss.backward()optimizer.step()if (epoch + 1) % 100 == 0:print(f'Epoch [{epoch + 1}/{num_epochs}], Loss: {loss.item():.4f}')# 保存整个模型
torch.save(model, 'whole_model.pth')# 加载整个模型
loaded_model = torch.load('whole_model.pth')
loaded_model.eval()# 生成新数据进行预测
new_X = np.random.randn(10, 2).astype(np.float32)
new_X_tensor = torch.from_numpy(new_X)with torch.no_grad():predictions = loaded_model(new_X_tensor)predicted_labels = (predictions >= 0.5).float()print("预测概率:")
print(predictions.numpy())
print("预测标签:")
print(predicted_labels.numpy())

代码解释

模型训练：同样先定义并训练逻辑回归模型。
保存模型：使用 torch.save(model, 'whole_model.pth') 保存整个模型对象到文件 whole_model.pth。
加载模型：使用 torch.load('whole_model.pth') 直接加载整个模型。
预测：将模型设置为评估模式，生成新数据进行预测。

通过以上两种方式，可以根据实际需求选择合适的模型保存和加载方法。

三、加载pytorch框架逻辑回归模型

以下将分别详细介绍在 PyTorch 中针对只保存模型参数和保存结构与参数这两种不同保存方式对应的模型加载方法，同时给出完整的代码示例。

方式 1：只保存模型参数的加载方式

当用户只保存了模型的参数（即 state_dict）时，在加载模型时需要先定义好与原模型相同结构的模型，再将保存的参数加载到该模型中。

import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np# 自定义数据集
X = np.random.randn(100, 2).astype(np.float32)
y = (2 * X[:, 0] + 3 * X[:, 1] > 0).astype(np.float32).reshape(-1, 1)X_tensor = torch.from_numpy(X)
y_tensor = torch.from_numpy(y)# 定义逻辑回归模型
class LogisticRegression(nn.Module):def __init__(self, input_size):super(LogisticRegression, self).__init__()self.linear = nn.Linear(input_size, 1)self.sigmoid = nn.Sigmoid()def forward(self, x):out = self.linear(x)out = self.sigmoid(out)return out# 初始化模型
input_size = 2
model = LogisticRegression(input_size)# 定义损失函数和优化器
criterion = nn.BCELoss()
optimizer = optim.SGD(model.parameters(), lr=0.01)# 训练模型
num_epochs = 1000
for epoch in range(num_epochs):outputs = model(X_tensor)loss = criterion(outputs, y_tensor)optimizer.zero_grad()loss.backward()optimizer.step()if (epoch + 1) % 100 == 0:print(f'Epoch [{epoch + 1}/{num_epochs}], Loss: {loss.item():.4f}')# 保存模型的参数
torch.save(model.state_dict(), 'model_params.pth')# 加载模型的参数
# 重新定义模型结构
loaded_model = LogisticRegression(input_size)
# 加载保存的参数
loaded_model.load_state_dict(torch.load('model_params.pth'))
# 将模型设置为评估模式
loaded_model.eval()# 生成新数据进行预测
new_X = np.random.randn(10, 2).astype(np.float32)
new_X_tensor = torch.from_numpy(new_X)# 进行预测
with torch.no_grad():predictions = loaded_model(new_X_tensor)predicted_labels = (predictions >= 0.5).float()print("预测概率:")
print(predictions.numpy())
print("预测标签:")
print(predicted_labels.numpy())

代码解释

模型定义与训练：定义了一个简单的逻辑回归模型，并使用自定义数据集进行训练。
保存参数：使用 torch.save(model.state_dict(), 'model_params.pth') 保存模型的参数。
加载参数：
- 重新定义与原模型相同结构的 loaded_model。
- 使用 loaded_model.load_state_dict(torch.load('model_params.pth')) 加载保存的参数。
预测：将模型设置为评估模式，生成新数据进行预测。

方式 2：保存结构和参数的模型加载方式

当保存了模型的结构和参数时，加载模型就相对简单，直接使用 torch.load 函数即可加载整个模型。

import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np# 自定义数据集
X = np.random.randn(100, 2).astype(np.float32)
y = (2 * X[:, 0] + 3 * X[:, 1] > 0).astype(np.float32).reshape(-1, 1)X_tensor = torch.from_numpy(X)
y_tensor = torch.from_numpy(y)# 定义逻辑回归模型
class LogisticRegression(nn.Module):def __init__(self, input_size):super(LogisticRegression, self).__init__()self.linear = nn.Linear(input_size, 1)self.sigmoid = nn.Sigmoid()def forward(self, x):out = self.linear(x)out = self.sigmoid(out)return out# 初始化模型
input_size = 2
model = LogisticRegression(input_size)# 定义损失函数和优化器
criterion = nn.BCELoss()
optimizer = optim.SGD(model.parameters(), lr=0.01)# 训练模型
num_epochs = 1000
for epoch in range(num_epochs):outputs = model(X_tensor)loss = criterion(outputs, y_tensor)optimizer.zero_grad()loss.backward()optimizer.step()if (epoch + 1) % 100 == 0:print(f'Epoch [{epoch + 1}/{num_epochs}], Loss: {loss.item():.4f}')# 保存整个模型（结构和参数）
torch.save(model, 'whole_model.pth')# 加载整个模型
loaded_model = torch.load('whole_model.pth')
# 将模型设置为评估模式
loaded_model.eval()# 生成新数据进行预测
new_X = np.random.randn(10, 2).astype(np.float32)
new_X_tensor = torch.from_numpy(new_X)# 进行预测
with torch.no_grad():predictions = loaded_model(new_X_tensor)predicted_labels = (predictions >= 0.5).float()print("预测概率:")
print(predictions.numpy())
print("预测标签:")
print(predicted_labels.numpy())

代码解释

模型定义与训练：同样定义并训练逻辑回归模型。
保存整个模型：使用 torch.save(model, 'whole_model.pth') 保存模型的结构和参数。
加载整个模型：使用 torch.load('whole_model.pth') 直接加载整个模型。
预测：将模型设置为评估模式，生成新数据进行预测。

通过以上两种方式，可以根据不同的保存情况正确加载 PyTorch 模型。

五、计算pytorch模型预测结果的精确度

在机器学习任务中，计算预测结果的精确度（Accuracy）是评估模型性能的重要指标。对于回归任务，通常使用均方误差（MSE）、平均绝对误差（MAE）或R² 分数 来评估模型的性能；而对于分类任务，则使用准确率（Accuracy）、精确率（Precision）、召回率（Recall） 等指标。

以下是如何在 PyTorch 中计算预测结果的精确度（以回归任务为例）：

1. 分类任务的精确度计算

对于分类任务，常用的评估指标是准确率（Accuracy），即预测正确的样本数占总样本数的比例。

代码实现

import torch# 假设有真实标签和预测标签
y_true = torch.tensor([0, 1, 1, 0, 1, 0, 0, 1])  # 真实标签
y_pred = torch.tensor([0, 1, 0, 0, 1, 0, 1, 1])  # 预测标签# 计算准确率
accuracy = (y_true == y_pred).float().mean()
print(f"准确率: {accuracy.item():.4f}")

2. 回归任务的精确度计算

对于回归任务，常用的评估指标包括：

均方误差（MSE）：预测值与真实值之间差异的平方的平均值。
平均绝对误差（MAE）：预测值与真实值之间差异的绝对值的平均值。
R² 分数：表示模型对数据的拟合程度，取值范围为 [0, 1]，越接近 1 表示模型越好。

代码实现

import torch
import torch.nn as nn# 假设有真实值和预测值
y_true = torch.tensor([3.0, 5.0, 7.0, 9.0], dtype=torch.float32)
y_pred = torch.tensor([2.8, 5.1, 7.2, 8.9], dtype=torch.float32)# 计算均方误差 (MSE)
mse = nn.MSELoss()(y_pred, y_true)
print(f"Mean Squared Error (MSE): {mse.item():.4f}")# 计算平均绝对误差 (MAE)
mae = nn.L1Loss()(y_pred, y_true)
print(f"Mean Absolute Error (MAE): {mae.item():.4f}")# 计算 R² 分数
def r2_score(y_true, y_pred):ss_total = torch.sum((y_true - torch.mean(y_true)) ** 2)ss_residual = torch.sum((y_true - y_pred) ** 2)r2 = 1 - (ss_residual / ss_total)return r2r2 = r2_score(y_true, y_pred)
print(f"R²分数: {r2.item():.4f}")

六、计算pytorch模型预测结果的召回率

1. 召回率的定义

在分类任务中，召回率（Recall） 是一个重要的评估指标，用于衡量模型对正类样本的识别能力。召回率的定义是：

$Recall= \frac{True Positives (TP)}{True Positives (TP)+False Negatives (FN)}$

其中：

True Positives (TP)：模型正确预测为正类的样本数。
False Negatives (FN)：模型错误预测为负类的正类样本数。

2. 计算召回率的步骤

获取真实标签和预测标签：

真实标签（y_true）：数据集中样本的真实类别。
预测标签（y_pred）：模型对样本的预测类别。

计算混淆矩阵：

通过比较 y_true 和 y_pred，计算混淆矩阵中的 TP 和 FN。

计算召回率：

使用公式 $Recall= \frac{TP}{TP+FN}$ 计算召回率。

3. 二分类任务召回率代码

对于二分类任务，召回率衡量模型对正类样本的识别能力。

import torch# 假设有真实标签和预测标签
y_true = torch.tensor([0, 1, 1, 0, 1, 0, 0, 1])  # 真实标签
y_pred = torch.tensor([0, 1, 0, 0, 1, 0, 1, 1])  # 预测标签# 计算混淆矩阵
def confusion_matrix(y_true, y_pred):TP = ((y_true == 1) & (y_pred == 1)).sum().item()  # 模型正确预测为正类的样本数FN = ((y_true == 1) & (y_pred == 0)).sum().item()  # 模型错误预测为负类的正类样本数FP = ((y_true == 0) & (y_pred == 1)).sum().item()  # 模型错误预测为正类的正类样本数TN = ((y_true == 0) & (y_pred == 0)).sum().item()  # 模型正确预测为负类的样本数return TP, FN, FP, TN# 计算召回率
def recall_score(y_true, y_pred):TP, FN, _, _ = confusion_matrix(y_true, y_pred)if TP + FN == 0:return 0.0  # 避免除以零return TP / (TP + FN)# 计算召回率
recall = recall_score(y_true, y_pred)
print(f"召回率: {recall:.4f}")

4. 多分类任务召回率代码

对于多分类任务，可以分别计算每个类别的召回率，然后取平均值。

import torch# 假设有真实标签和预测标签（多分类任务）
y_true = torch.tensor([0, 1, 2, 0, 1, 2])  # 真实标签
y_pred = torch.tensor([0, 1, 0, 0, 1, 2])  # 预测标签# 计算每个类别的召回率
def recall_score_multiclass(y_true, y_pred, num_classes):recall_scores = []for cls in range(num_classes):TP = ((y_true == cls) & (y_pred == cls)).sum().item()  # 模型正确预测为正类的样本数FN = ((y_true == cls) & (y_pred != cls)).sum().item()  # 模型错误预测为负类的正类样本数if TP + FN == 0:recall_scores.append(0.0)  # 避免除以零else:recall_scores.append(TP / (TP + FN))return recall_scores# 计算召回率
num_classes = 3
recall_scores = recall_score_multiclass(y_true, y_pred, num_classes)
for cls, recall in enumerate(recall_scores):print(f"每个类别的召回率 {cls}: {recall:.4f}")# 计算宏平均召回率
macro_recall = sum(recall_scores) / num_classes
print(f"宏平均召回率: {macro_recall:.4f}")

七、计算pytorch模型预测结果的F1分数

1. F1分数的定义

F1 分数（F1 Score） 是分类任务中常用的评估指标，结合了 精确率（Precision） 和 召回率（Recall） 的信息。F1 分数的定义是：

$F1 Score= 2\times \frac{Precision\times ×Recall}{Precision+Recall}$

其中：

精确率（Precision）：预测为正类的样本中，实际为正类的比例。
召回率（Recall）：实际为正类的样本中，预测为正类的比例。

F1 分数的取值范围为 [0, 1]，越接近 1 表示模型性能越好。

2. 计算 F1 分数的步骤

获取真实标签和预测标签：

真实标签（y_true）：数据集中样本的真实类别。
预测标签（y_pred）：模型对样本的预测类别。

计算混淆矩阵：

通过比较 y_true 和 y_pred，计算混淆矩阵中的 TP、FP 和 FN。

计算精确率和召回率：

精确率：

$Precision=\frac{TP}{TP+FP}$

召回率：

$Recall=\frac{TP}{TP+FN}$

计算 F1 分数：

使用公式：

$F1 Score= 2\times \frac{Precision\times ×Recall}{Precision+Recall}$

3. 二分类任务F1分数代码

对于二分类任务，F1 分数结合了精确率和召回率，是评估模型性能的重要指标。

import torch# 假设有真实标签和预测标签
y_true = torch.tensor([0, 1, 1, 0, 1, 0, 0, 1])  # 真实标签
y_pred = torch.tensor([0, 1, 0, 0, 1, 0, 1, 1])  # 预测标签# 计算混淆矩阵
def confusion_matrix(y_true, y_pred):TP = ((y_true == 1) & (y_pred == 1)).sum().item()  # 模型正确预测为正类的样本数FN = ((y_true == 1) & (y_pred == 0)).sum().item()  # 模型错误预测为负类的正类样本数FP = ((y_true == 0) & (y_pred == 1)).sum().item()  # 模型错误预测为正类的正类样本数TN = ((y_true == 0) & (y_pred == 0)).sum().item()  # 模型正确预测为负类的样本数return TP, FN, FP, TN# 计算 F1 分数
def f1_score(y_true, y_pred):TP, FN, FP, _ = confusion_matrix(y_true, y_pred)# 计算精确率和召回率precision = TP / (TP + FP) if (TP + FP) > 0 else 0.0recall = TP / (TP + FN) if (TP + FN) > 0 else 0.0# 计算 F1 分数if precision + recall == 0:return 0.0  # 避免除以零f1 = 2 * (precision * recall) / (precision + recall)return f1# 计算 F1 分数
f1 = f1_score(y_true, y_pred)
print(f"F1分数: {f1:.4f}")

4. 多分类任务F1分数代码

对于多分类任务，可以分别计算每个类别的 F1 分数，然后取平均值。

import torch# 假设有真实标签和预测标签（多分类任务）
y_true = torch.tensor([0, 1, 2, 0, 1, 2])  # 真实标签
y_pred = torch.tensor([0, 1, 0, 0, 1, 2])  # 预测标签# 计算每个类别的 F1 分数
def f1_score_multiclass(y_true, y_pred, num_classes):f1_scores = []for cls in range(num_classes):TP = ((y_true == cls) & (y_pred == cls)).sum().item()  # 模型正确预测为正类的样本数FN = ((y_true == cls) & (y_pred != cls)).sum().item()  # 模型错误预测为负类的正类样本数FP = ((y_true != cls) & (y_pred == cls)).sum().item()  # 模型错误预测为正类的正类样本数# 计算精确率和召回率precision = TP / (TP + FP) if (TP + FP) > 0 else 0.0recall = TP / (TP + FN) if (TP + FN) > 0 else 0.0# 计算 F1 分数if precision + recall == 0:f1_scores.append(0.0)  # 避免除以零else:f1_scores.append(2 * (precision * recall) / (precision + recall))return f1_scores# 计算 F1 分数
num_classes = 3
f1_scores = f1_score_multiclass(y_true, y_pred, num_classes)
for cls, f1 in enumerate(f1_scores):print(f"每个类别的F1分数 {cls}: {f1:.4f}")# 计算宏平均 F1 分数
macro_f1 = sum(f1_scores) / num_classes
print(f"宏平均 F1 分数: {macro_f1:.4f}")

八、完整流程（使用直接继承 `nn.Module`逻辑回归，且仅保存模型的权重和其他参数，计算了二分类任务的精确度、召回率及F1分数）

1. 实现思路

① 自定义数据集：

生成 100 个样本，每个样本有 2 个特征。

根据特征生成标签，使用简单的线性组合和阈值判断。

② 定义逻辑回归模型：

使用 nn.Linear 定义一个线性层，并通过实现逻辑回归。

③ 训练模型：

使用二元交叉熵损失 (nn.BCELoss) 和随机梯度下降优化器 (optim.SGD) 训练模型。

④ 保存模型：

使用 torch.save 保存模型参数。

⑤ 加载模型：

使用 torch.load 加载模型参数。

⑥ 预测：

加载模型后，使用新数据进行预测，并将概率转换为类别（0 或 1）。

⑦ 评估模型：

计算模型的精确度、召回率和 F1 分数。

2. 代码示例

import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np# 自定义数据集
# 生成 100 个样本，每个样本有 2 个特征
X = np.random.randn(100, 2).astype(np.float32)
# 根据特征生成标签，使用简单的线性组合和阈值判断
y = (2 * X[:, 0] + 3 * X[:, 1] > 0).astype(np.float32).reshape(-1, 1)# 将 numpy 数组转换为 PyTorch 张量
X_tensor = torch.from_numpy(X)
y_tensor = torch.from_numpy(y)# 定义逻辑回归模型
class LogisticRegression(nn.Module):def __init__(self, input_size):super(LogisticRegression, self).__init__()self.linear = nn.Linear(input_size, 1)self.sigmoid = nn.Sigmoid()def forward(self, x):out = self.linear(x)out = self.sigmoid(out)return out# 初始化模型
input_size = 2
model = LogisticRegression(input_size)# 定义损失函数和优化器
criterion = nn.BCELoss()  # 二元交叉熵损失函数
optimizer = optim.SGD(model.parameters(), lr=0.01)# 训练模型
num_epochs = 1000
for epoch in range(num_epochs):# 前向传播outputs = model(X_tensor)loss = criterion(outputs, y_tensor)# 反向传播和优化optimizer.zero_grad()loss.backward()optimizer.step()if (epoch + 1) % 100 == 0:print(f'Epoch [{epoch + 1}/{num_epochs}], Loss: {loss.item():.4f}')# 保存模型
torch.save(model.state_dict(), 'logistic_regression_model.pth')# 加载模型
loaded_model = LogisticRegression(input_size)
loaded_model.load_state_dict(torch.load('logistic_regression_model.pth'))
loaded_model.eval()# 生成新数据进行预测
new_X = np.random.randn(10, 2).astype(np.float32)
new_X_tensor = torch.from_numpy(new_X)# 使用加载的模型进行预测
with torch.no_grad():predictions = loaded_model(new_X_tensor)predicted_labels = (predictions >= 0.5).float()print("预测概率:")
print(predictions.numpy())
print("预测标签:")
print(predicted_labels.numpy())# 计算精确度、召回率和 F1 分数
def evaluate_model(y_true, y_pred):# 计算混淆矩阵TP = ((y_true == 1) & (y_pred == 1)).sum().item()  # 模型正确预测为正类的样本数FN = ((y_true == 1) & (y_pred == 0)).sum().item()  # 模型错误预测为负类的正类样本数FP = ((y_true == 0) & (y_pred == 1)).sum().item()  # 模型错误预测为正类的正类样本数TN = ((y_true == 0) & (y_pred == 0)).sum().item()  # 模型正确预测为负类的样本数# 计算精确度、召回率和 F1 分数accuracy = (TP + TN) / (TP + TN + FP + FN) if (TP + TN + FP + FN) > 0 else 0.0precision = TP / (TP + FP) if (TP + FP) > 0 else 0.0recall = TP / (TP + FN) if (TP + FN) > 0 else 0.0f1 = 2 * (precision * recall) / (precision + recall) if (precision + recall) > 0 else 0.0return accuracy, precision, recall, f1# 对训练集进行预测，计算评估指标
with torch.no_grad():train_predictions = loaded_model(X_tensor)train_predicted_labels = (train_predictions >= 0.5).float()# 计算评估指标
accuracy, precision, recall, f1 = evaluate_model(y_tensor, train_predicted_labels)# 输出结果
print("\n模型评估结果:")
print(f"精确度: {accuracy:.4f}")
print(f"精确率: {precision:.4f}")
print(f"召回率: {recall:.4f}")
print(f"F1分数: {f1:.4f}")

3. 代码解释

① 数据集生成：

X = np.random.randn(100, 2).astype(np.float32)：生成 100 个样本，每个样本有 2 个特征。
y = (2 * X[:, 0] + 3 * X[:, 1] > 0).astype(np.float32).reshape(-1, 1)：根据特征的线性组合生成标签，大于 0 标记为 1，否则标记为 0。
X_tensor = torch.from_numpy(X) 和 y_tensor = torch.from_numpy(y)：将 numpy 数组转换为 PyTorch 张量。

② 模型定义：

LogisticRegression 类继承自 nn.Module，包含一个线性层 nn.Linear 和一个 Sigmoid 激活函数 nn.Sigmoid。
forward 方法定义了前向传播的逻辑。

③ 损失函数和优化器：

criterion = nn.BCELoss()：使用二元交叉熵损失函数，适用于二分类问题。
optimizer = optim.SGD(model.parameters(), lr=0.01)：使用随机梯度下降优化器，学习率为 0.01。

④ 模型训练：

通过多次迭代进行前向传播、损失计算、反向传播和参数更新。
每 100 个 epoch 打印一次损失值。

⑤ 模型保存：

torch.save(model.state_dict(), 'logistic_regression_model.pth')：保存模型的参数到本地文件 logistic_regression_model.pth。

⑥ 模型加载和预测：

loaded_model = LogisticRegression(input_size)：创建一个新的模型实例。
loaded_model.load_state_dict(torch.load('logistic_regression_model.pth'))：加载保存的模型参数。
loaded_model.eval()：将模型设置为评估模式。
生成新数据 new_X 并转换为张量 new_X_tensor。
使用 loaded_model 进行预测，通过 (predictions >= 0.5).float() 将预测概率转换为标签。

⑦ 模型评估：

定义 evaluate_model 函数：

计算混淆矩阵（TP、FN、FP、TN）。

计算精确度、精确率、召回率和 F1 分数。

对训练集进行预测并计算评估指标：

train_predictions = loaded_model(X_tensor)：计算训练集的预测概率。

train_predicted_labels = (train_predictions >= 0.5).float()：将预测概率转换为标签。

输出评估结果：

精确度（Accuracy）：模型预测正确的样本比例。

精确率（Precision）：预测为正类的样本中，实际为正类的比例。

召回率（Recall）：实际为正类的样本中，预测为正类的比例。

F1 分数（F1 Score）：精确率和召回率的调和平均值。

【机器学习】自定义数据集使用pytorch框架实现逻辑回归并保存模型，然后保存模型后再加载模型进行预测，对预测结果计算精确度和召回率及F1分数

一、使用pytorch框架实现逻辑回归 1. 数据部分： 首先自定义了一个简单的数据集，特征 X 是 100 个随机样本，每个样本一个特征，目标值 y 基于线性关系并添加了噪声。将 numpy 数组转换为 PyTorch 张量，方便后续在模型中…...

编程日记 2025/2/1 8:49:06

unity学习23：场景scene相关，场景信息，场景跳转

目录 1 默认场景和Assets里的场景 1.1 scene的作用 1.2 scene作为project的入口 1.3 默认场景 2 场景scene相关 2.1 创建scene 2.2 切换场景 2.3 build中的场景，在构建中包含的场景 （否则会认为是失效的Scene） 2.4 Scenes in Bui…...

编程日记 2025/2/1 8:47:54

AI（计算机视觉）自学路线

本文仅用来记录一下自学路线方便日后复习，如果对你自学有帮助的话也很开心o(*￣▽￣*)ブ B站吴恩达机器学习->B站小土堆pytorch基础学习->opencv相关知识（Halcon或者opencv库）->四类神经网络（这里跟…...

编程日记 2025/2/1 8:44:43

Linux第104步_基于AP3216C之I2C实验

Linux之I2C实验是在AP3216C的基础上实现的，进一步熟悉修改设备树和编译设备树，以及学习如何编写I2C驱动和APP测试程序。 1、AP3216C的原理图 AP3216C集成了一个光强传感器ALS，一个接近传感器PS和一个红外LED，为三合一的环境传感…...

编程日记 2025/2/1 8:39:35

常用Android模拟器(雷电 MuMu 夜神 Genymotion 蓝叠) - 20250131

常用Android模拟器(雷电 MuMu 夜神 Genymotion 蓝叠) - 20250131 Android模拟器概述 Android 模拟器是一种软件工具，允许用户在 Windows、Linux 或 macOS 电脑上运行 Android 操作系统，以模拟 Android 设备的行为。它广泛用于开发测试、应用运行、游戏…...

编程日记 2025/2/1 8:38:30

算法题（53）：对称二叉树

审题： 需要我们判断二叉树是否满足对称结构，并返回判断结果思路： 方法一：递归其实是否对称分成两部分判断第一部分：根节点是否相等第二部分：根节点一的左子树和根节点二的右子树是否相等，根…...

编程日记 2025/2/1 8:37:27

Golang 并发机制-2：Golang Goroutine 和竞争条件

在今天的软件开发中，我们正在使用并发的概念，它允许一次执行多个任务。在Go编程中，理解Go例程是至关重要的。本文试图详细解释什么是例程，它们有多轻，通过简单地使用“go”关键字创建它们，以及可能出现的竞…...

编程日记 2025/2/1 8:33:19

深入剖析 CSRF 漏洞：原理、危害案例与防护

目录前言漏洞介绍漏洞原理产生条件产生的危害靶场练习 post 请求csrf案例防御措施验证请求来源设置 SameSite 属性双重提交 Cookie 结语前言在网络安全领域，各类漏洞层出不穷，时刻威胁着用户的隐私与数据安全。跨站请求伪造&…...

编程日记 2025/2/1 8:32:17

C++和Python实现SQL Server数据库导出数据到S3并导入Redshift数据仓库

用C实现高性能数据处理，Python实现操作Redshift导入数据文件。在Visual Studio 2022中用C和ODBC API导出SQL Server数据库中张表中的所有表的数据为CSV文件格式的数据流，用逗号作为分隔符，用双引号包裹每个数据，字符串类型的数据…...

编程日记 2025/2/1 8:30:08

AI大模型开发原理篇-5：循环神经网络RNN

神经概率语言模型NPLM也存在一些明显的不足之处:模型结构简单，窗口大小固定，缺乏长距离依赖捕捉，训练效率低，词汇表固定等。为了解决这些问题，研究人员提出了一些更先进的神经网络语言模型，如循环神经网络、…...

编程日记 2025/2/1 8:26:02

4-图像梯度计算

文章目录 4.图像梯度计算（1）Sobel算子（2）梯度计算方法（3）Scharr与Laplacian算子4.图像梯度计算（1）Sobel算子图像梯度-Sobel算子 Sobel算子是一种经典的图像边缘检测算子，广泛应用于图像处理和计算机视觉领域。以下是关于Sobel算子的详细介绍：基本原理 Sobel算子…...

编程日记 2025/2/1 8:19:45

数据结构与算法 —— 常用算法模版

数据结构与算法 —— 常用算法模版二分查找素数筛最大公约数与最小公倍数二分查找人间若有天堂，大马士革必在其中；天堂若在天空，大马士革必与之齐名。 —— 阿拉伯谚语算法若有排序，二分查找必在其中；排序若要使用…...

编程日记 2025/2/1 8:18:36

DDD - 领域事件_解耦微服务的关键

文章目录 Pre领域事件的核心概念领域事件的作用领域事件的识别领域事件的技术实现领域事件的运行机制案例领域事件驱动的优势 Pre DDD - 微服务设计与领域驱动设计实战(中)_ 解决微服务拆分难题 EDA - Spring Boot构建基于事件驱动的消息系统领域事件的核心概念领域事件&a…...

编程日记 2025/2/1 8:07:09

芯片AI深度实战：实战篇之vim chat

利用vim-ollama这个vim插件，可以在vim内和本地大模型聊天。系列文章： 芯片AI深度实战：基础篇之Ollama-CSDN博客芯片AI深度实战：基础篇之langchain-CSDN博客芯片AI深度实战：实战篇之vim chat-CSDN博客芯片AI深度…...

编程日记 2025/2/1 8:05:03

【产品经理学习案例——AI翻译棒出海业务】

前言： 本文主要讲述了硬件产品在出海过程中，翻译质量、翻译速度和本地化落地策略是硬件产品规划需要考虑的核心因素。针对不同国家，需要优化翻译质量和算法，关注市场需求和文化差异，以便更好地满足当地用户的需求。同…...

编程日记 2025/2/1 8:02:54

在运行一个Vue项目时报错，产生下面问题 D:\node\npm.cmd run dev npm WARN logfile could not be created: Error: EPERM: operation not permitted, open D:\node\node_cache\_logs\2025-01-31T01_01_58_076Z-debug-0.log npm WARN logfile could not be created:…...

编程日记 2025/2/1 8:01:48

【07-编译工程与导入网表】

这里写自定义目录标题一丶编译原理图编译默认属性一丶编译项目二丶输出BOM材料报告优化EXCEL-BOM清单三丶输出PDF原理图给维修人员看四丶导入网格表查看是否有错误常见错误其他问题什么是位号(C1)?EXCEL添加序号列和居中显示?位号(序号)与单位(型号)EXCEL设置自动换行编…...

编程日记 2025/2/1 7:58:43

FireFox | Google Chrome | Microsoft Edge 禁用更新 final版

之前的方式要么失效，要么对设备有要求，这次梳理一下对设备、环境几乎没有要求的通用方式，universal & final 版。 1.Firefox 方式 FireFox火狐浏览器企业策略禁止更新_火狐浏览器禁止更新-CSDN博客这应该是目前最好用的方式。火狐也…...

编程日记 2025/2/1 7:54:38

conda配置channel

你收到 CondaKeyError: channels: value https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main not present in config 错误是因为该镜像源（https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main）可能没有被正确添加到 Conda 的配置文件中&…...

编程日记 2025/2/1 7:50:33

【MQ】探索 Kafka

基本概念主题：Topic。主题是承载消息的逻辑容器，在实际使用中多用来区分具体的业务。分区：Partition。一个有序不变的消息序列。每个主题下可以有多个分区。消息位移：Offset。表示分区中每条消息的位置信息，是一个…...

编程日记 2025/2/1 7:49:28

Flask RESTful 示例

目录 1. 环境准备2. 安装依赖3. 修改main.py4. 运行应用5. API使用示例获取所有任务获取单个任务创建新任务更新任务删除任务中文乱码问题： 下面创建一个简单的Flask RESTful API示例。首先，我们需要创建环境，安装必要的依赖，然后…...

编程新知 2025/7/10 10:50:33

CMake基础：构建流程详解

目录 1.CMake构建过程的基本流程 2.CMake构建的具体步骤 2.1.创建构建目录 2.2.使用 CMake 生成构建文件 2.3.编译和构建 2.4.清理构建文件 2.5.重新配置和构建 3.跨平台构建示例 4.工具链与交叉编译 5.CMake构建后的项目结构解析 5.1.CMake构建后的目录结构 5.2.构…...

编程新知 2025/7/10 11:34:31

【大模型RAG】Docker 一键部署 Milvus 完整攻略

本文概要 Milvus 2.5 Stand-alone 版可通过 Docker 在几分钟内完成安装；只需暴露 19530（gRPC）与 9091（HTTP/WebUI）两个端口，即可让本地电脑通过 PyMilvus 或浏览器访问远程 Linux 服务器上的 Milvus。下面…...

编程新知 2025/7/11 23:46:22

抖音增长新引擎：品融电商，一站式全案代运营领跑者

抖音增长新引擎：品融电商，一站式全案代运营领跑者在抖音这个日活超7亿的流量汪洋中，品牌如何破浪前行？自建团队成本高、效果难控；碎片化运营又难成合力——这正是许多企业面临的增长困局。品融电商以「抖音全案代运营…...

编程新知 2025/7/12 13:52:29

Rapidio门铃消息FIFO溢出机制

关于RapidIO门铃消息FIFO的溢出机制及其与中断抖动的关系，以下是深入解析： 门铃FIFO溢出的本质在RapidIO系统中，门铃消息FIFO是硬件控制器内部的缓冲区，用于临时存储接收到的门铃消息（Doorbell Message）。…...

编程新知 2025/6/20 15:59:42

深度学习习题2

1.如果增加神经网络的宽度，精确度会增加到一个特定阈值后，便开始降低。造成这一现象的可能原因是什么？ A、即使增加卷积核的数量，只有少部分的核会被用作预测 B、当卷积核数量增加时，神经网络的预测能力会降低 C、当卷…...

编程新知 2025/7/12 16:34:46

GitHub 趋势日报 (2025年06月06日)

📊 由 TrendForge 系统生成 | 🌐 https://trendforge.devlive.org/ 🌐 本日报中的项目描述已自动翻译为中文 📈 今日获星趋势图今日获星趋势图 590 cognee 551 onlook 399 project-based-learning 348 build-your-own-x 320 ne…...

编程新知 2025/7/6 4:09:59

怎么让Comfyui导出的图像不包含工作流信息，

为了数据安全，让Comfyui导出的图像不包含工作流信息，导出的图像就不会拖到comfyui中加载出来工作流。 ComfyUI的目录下node.py 直接移除 pnginfo（推荐） 在 save_images 方法中，删除或注释掉所有与 metadata …...

编程新知 2025/7/9 16:29:12

STM32---外部32.768K晶振（LSE）无法起振问题

晶振是否起振主要就检查两个1、晶振与MCU是否兼容；2、晶振的负载电容是否匹配目录一、判断晶振与MCU是否兼容二、判断负载电容是否匹配 1. 晶振负载电容（CL）与匹配电容（CL1、CL2）的关系 2. 如何选择 CL1 和 CL…...

编程新知 2025/7/11 6:27:19

嵌入式常见 CPU 架构

架构类型架构厂商芯片厂商典型芯片特点与应用场景PICRISC (8/16 位)MicrochipMicrochipPIC16F877A、PIC18F4550简化指令集，单周期执行；低功耗、CIP 独立外设；用于家电、小电机控制、安防面板等嵌入式场景8051CISC (8 位)Intel（原始…...

编程新知 2025/6/10 21:24:01

一、使用pytorch框架实现逻辑回归

1. 数据部分：

2. 模型定义部分：

方案 1：使用 nn.Sequential 直接按顺序定义了一个线性层，简洁直观。

方案 2：使用 nn.ModuleList 存储线性层，在 forward 方法中依次调用层进行前向传播，适合动态构建层序列。

方案 3：使用 nn.ModuleDict 以字典形式存储层，通过键名调用层，适合需要对层进行命名和灵活访问的场景。

方案 4：直接继承 nn.Module，在 __init__ 方法中定义线性层，在 forward 方法中实现前向传播逻辑，是最常见和基础的定义模型方式。

3. 训练和评估部分：

二、保存pytorch框架逻辑回归模型

方式 1：保存模型的权重和其他参数

代码解释

方式 2：保存整个模型

代码解释

三、加载pytorch框架逻辑回归模型

方式 1：只保存模型参数的加载方式

代码解释

方式 2：保存结构和参数的模型加载方式

代码解释

五、计算pytorch模型预测结果的精确度

1. 分类任务的精确度计算

代码实现

2. 回归任务的精确度计算

代码实现

六、计算pytorch模型预测结果的召回率

1. 召回率的定义

2. 计算召回率的步骤

3. 二分类任务召回率代码

4. 多分类任务召回率代码

七、计算pytorch模型预测结果的F1分数

1. F1分数的定义

2. 计算 F1 分数的步骤

3. 二分类任务F1分数代码

4. 多分类任务F1分数代码

八、完整流程（使用直接继承 nn.Module逻辑回归，且仅保存模型的权重和其他参数，计算了二分类任务的精确度、召回率及F1分数）

1. 实现思路

① 自定义数据集：

② 定义逻辑回归模型：

③ 训练模型：

④ 保存模型：

⑤ 加载模型：

⑥ 预测：

⑦ 评估模型：

2. 代码示例

3. 代码解释

① 数据集生成：

② 模型定义：

③ 损失函数和优化器：

④ 模型训练：

⑤ 模型保存：

⑥ 模型加载和预测：

⑦ 模型评估：

相关文章：

方案 1：使用 `nn.Sequential` 直接按顺序定义了一个线性层，简洁直观。

方案 2：使用 `nn.ModuleList` 存储线性层，在 `forward` 方法中依次调用层进行前向传播，适合动态构建层序列。

方案 3：使用 `nn.ModuleDict` 以字典形式存储层，通过键名调用层，适合需要对层进行命名和灵活访问的场景。

方案 4：直接继承 `nn.Module`，在 `init` 方法中定义线性层，在 `forward` 方法中实现前向传播逻辑，是最常见和基础的定义模型方式。

八、完整流程（使用直接继承 `nn.Module`逻辑回归，且仅保存模型的权重和其他参数，计算了二分类任务的精确度、召回率及F1分数）