当前位置: 首页 > news >正文

多层感知机的从零实现与softmax的从零实现(真·0000零基础)

今天再读zh.d2l书(4.2. 多层感知机的从零开始实现 — 动手学深度学习 2.0.0 documentation),

看了关于多层感知机的从零实现与softmax的从零实现

目录

mlp从零实现,

点击“paddle”的代码

点击“torch”的代码

训练 

参数解释

   - `loss`:

参数说明:

softmax从零实现

一些工具

torch的矩阵乘法matmul

张量.numel返回张量元素数 

zip

isinstance(a,b)判断a是否是b类

 反向传播  张量.backward()

绘制动画

损失函数的定义

定义accuracy

定义精度(net模型,data_iter数据集)

定义的Accumulator(2)

定义net

定义训练函数

定义updater()

训练

使用训好的net预测 


mlp从零实现

点击“paddle”的代码

里面用到paddle库,可以方便的实现一些神经网络的东西

从paddle引入nn模块,

import warnings
from d2l import paddle as d2lwarnings.filterwarnings("ignore")
import paddle
from paddle import nnbatch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)

比如nn.linear(),可以构造线性层

nn.CrossEntropyLoss(),可以快速构造交叉熵损失函数


#初始化参数
num_inputs, num_outputs, num_hiddens = 784, 10, 256W1 = paddle.randn([num_inputs, num_hiddens]) * 0.01
W1.stop_gradient = False
b1 = paddle.zeros([num_hiddens])
b1.stop_gradient = False
W2 = paddle.randn([num_hiddens, num_outputs]) * 0.01
W2.stop_gradient = False
b2 = paddle.zeros([num_outputs])
b2.stop_gradient = Falseparams = [W1, b1, W2, b2]
#损失函数
loss = nn.CrossEntropyLoss(reduction='none')

(其实是没注意点错了才发现) 

点击“torch”的代码

就是是从torch引入nn

import torch
from torch import nn
from d2l import torch as d2lbatch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)

训练 

num_epochs, lr = 10, 0.1
updater = torch.optim.SGD(params, lr=lr)
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, updater)
参数解释


1. `num_epochs`: 这个变量表示神经网络训练的轮数(或称为“纪元”)。每一轮遍历整个数据集一次就叫做一个epoch。例如,设置`num_epochs = 10`意味着网络将会被训练10次完整的迭代。
2. `lr`: 这是学习率(Learning Rate)的缩写。它决定了在每一步更新时权重更新的幅度。较小的学习率会导致更慢的收敛速度,但可能找到更好的局部最小值;较大的学习率可能会导致错过最优解或者在最优解附近震荡。这里设置了两个不同的学习率:`0.1` 和 `0.01`,可能是为了在不同阶段进行超参数调整。
3. `updater`: 这是一个函数或对象,用于执行权重的更新操作。

在这个例子中,它是通过调用`torch.optim.SGD(params, lr=lr)`创建的SGD优化器实例。

这里的`params`指的是需要优化的模型的参数集合,

num_inputs, num_outputs, num_hiddens = 784, 10, 256W1 = nn.Parameter(torch.randn(num_inputs, num_hiddens, requires_grad=True) * 0.01)
b1 = nn.Parameter(torch.zeros(num_hiddens, requires_grad=True))
W2 = nn.Parameter(torch.randn(num_hiddens, num_outputs, requires_grad=True) * 0.01)
b2 = nn.Parameter(torch.zeros(num_outputs, requires_grad=True))params = [W1, b1, W2, b2]

而`lr`则是之前定义的学习率。


4. `d21.train_ch3(net, train_iter, test_iter, loss, num_epochs, updater)`: 这行代码调用了某个模块(假设为`d21`)中的一个方法`train_ch3`来开始训练过程。这个方法的参数包括:
   - `net`: 需要训练的网络模型。

def net(X):X = X.reshape((-1, num_inputs))H = relu(X@W1 + b1)  # 这里“@”代表矩阵乘法return (H@W2 + b2)


   - `train_iter`: 训练数据的迭代器,用于逐批次地获取训练样本。
   - `test_iter`: 测试数据的迭代器,用于评估模型在未见过的数据上的性能。

这里从库里自动调的,batch size 为256 的迭代器


batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)


   - `loss`:

用于计算损失值的函数或类,通常用来衡量预测与真实标签之间的差距。

这里从torch.nn直接取的交叉熵损失,没有传入具体参数,只是设置none

loss = nn.CrossEntropyLoss(reduction='none')
参数说明:

在PyTorch中,nn.CrossEntropyLoss是一个损失函数,用于测量分类任务的预测值与真实值之间的差距。 

  • reduction: 这个参数决定了如何处理输出损失张量。它有三个可选的值:

    • 'none': 不应用任何缩减。返回的损失与每个输入元素相对应。
    • 'mean': 返回损失的平均值。
    • 'sum': 返回所有损失的求和。

loss = nn.CrossEntropyLoss(reduction='none')reduction='none'表示损失函数会返回一个与输入同样大小的损失张量,而不是将所有损失值缩减为一个单一的数值。这意味着每个输入样本都会有一个对应的损失值,这对于需要单独处理每个样本的损失(例如在自定义的损失计算中)非常有用。

例如,如果有一个批量大小为N的输入和一个对应的标签,nn.CrossEntropyLoss(reduction='none')将会返回一个长度为N的损失张量,其中每个元素都是对应输入样本的交叉熵损失。这样, 可以根据需要进一步处理这些损失值,例如进行加权平均或者选择性地更新模型参数。

  

d2l提供的接口——

num_epochs, lr = 10, 0.1
updater = torch.optim.SGD(params, lr=lr)
d2l.train_ch3(
net, train_iter, test_iter, loss, num_epochs, updater)

train_iter, test_iter,loss,updater以及其内的params都是torch.nn调用的

其余是自定义的,net函数以及一些数字变量

softmax从零实现

一些工具

torch的矩阵乘法matmul

就是矩阵乘法AB

张量.numel返回张量元素数 

在PyTorch中,`.numel()` 是一个Tensor(张量)的方法,用于返回该张量的元素数量。这里的 "y" 应该是一个Tensor对象,它可能代表了一个标签或类别的向量。
具体来说,`.numel()` 方法会计算张量中所有元素的个数,不考虑张量的形状或维度。例如,对于一个形状为 `(3, 4)` 的二维张量,`.numel()` 会返回 \(3 \times 4 = 12\),表示这个张量总共有12个元素。
在你的代码片段中,`y.numel()` 可能被用来获取类别总数,这在某些情况下是需要的,比如计算某个统计量时需要知道总的样本数。
 

zip

list1 = [1, 2, 3]
list2 = ['a', 'b', 'c']
zipped = zip(list1, list2)
print(list(zipped))  # 输出: [(1, 'a'), (2, 'b'), (3, 'c')]

isinstance(a,b)判断a是否是b类

在Python中,isinstance() 是一个内置函数,用于检查一个对象是否是一个特定类型的实例,或者是其子类的实例。它的基本语法如下:

python

isinstance(object, classinfo)

其中:

  • object 是要检查的对象;
  • classinfo 可以是一个类,也可以是一个类型(tuple),比如 (int, str)

isinstance() 会根据 classinfo 参数来判断 object 是否为指定的数据类型。如果是,则返回 True;否则返回 False

 反向传播  张量.backward()

Q:反向传播函数需要自己写吗?还是每次只要.backward就行了?

A:在PyTorch中,通常不需要自己手动编写反向传播函数。PyTorch的自动微分(autograd)系统已经为大多数常见的数学运算提供了内置的反向传播函数。当你使用PyTorch的张量(tensor)进行操作时,这些操作会被记录在一个计算图中,PyTorch能够自动地计算并应用链式法则来执行反向传播。

因此,对于大多数情况,你只需要在计算完损失函数之后调用 .backward() 方法,PyTorch就会自动处理反向传播过程。

import torch# 假设有一些输入数据和标签
x = torch.randn(5, requires_grad=True)
y = torch.randn(5)# 定义一个线性模型
linear_model = torch.nn.Linear(5, 1)# 计算模型的输出
predictions = linear_model(x)# 定义损失函数
loss = torch.nn.functional.mse_loss(predictions, y)# 反向传播
loss.backward()# 现在可以访问模型的梯度
print(linear_model.weight.grad)
print(linear_model.bias.grad)

backward()看似只是一行代码,没有任何赋值,实际上是update的迭代更新需要访问梯度,backward求出了梯度的值存储在哪里以便直接访问了 。

.backward() 方法被调用来计算损失函数关于模型参数的梯度。这些梯度是自动累积在参数的 .grad 属性中的。然后,优化器(updater)使用这些梯度来更新模型的参数。

下面是详细的过程:

  1. l.mean().backward() 或 l.sum().backward():这行代码计算了损失函数 l 关于模型参数的梯度,并将这些梯度保存在每个参数的 .grad 属性中。

  2. updater.zero_grad():在调用 .backward() 之前,这行代码清除了过往的梯度。这是必须的,因为默认情况下,梯度是累积的(即每次调用 .backward() 时,梯度会加到之前的梯度上)。

  3. updater.step():这行代码使用计算出的梯度来更新模型的参数。这是优化器的一个方法,它执行了实际的参数更新步骤。

在 updater.step() 调用之后,模型的参数就被更新了,这是 .backward() 的结果被使用的地方。这个过程在训练循环的每次迭代中都会发生,因此模型的参数会在每个批次的数据处理后逐渐改进。

总结一下,.backward() 的结果是用来更新模型参数的,这个更新是通过优化器的 step() 方法实现的。在代码中没有直接显示使用 .backward() 的结果,因为这是通过优化器内部机制隐式完成的。

绘制动画

这里先不详细看,使用了animate类

class Animator:  #@save"""在动画中绘制数据"""def __init__(self, xlabel=None, ylabel=None, legend=None, xlim=None,ylim=None, xscale='linear', yscale='linear',fmts=('-', 'm--', 'g-.', 'r:'), nrows=1, ncols=1,figsize=(3.5, 2.5)):# 增量地绘制多条线if legend is None:legend = []d2l.use_svg_display()self.fig, self.axes = d2l.plt.subplots(nrows, ncols, figsize=figsize)if nrows * ncols == 1:self.axes = [self.axes, ]# 使用lambda函数捕获参数self.config_axes = lambda: d2l.set_axes(self.axes[0], xlabel, ylabel, xlim, ylim, xscale, yscale, legend)self.X, self.Y, self.fmts = None, None, fmtsdef add(self, x, y):# 向图表中添加多个数据点if not hasattr(y, "__len__"):y = [y]n = len(y)if not hasattr(x, "__len__"):x = [x] * nif not self.X:self.X = [[] for _ in range(n)]if not self.Y:self.Y = [[] for _ in range(n)]for i, (a, b) in enumerate(zip(x, y)):if a is not None and b is not None:self.X[i].append(a)self.Y[i].append(b)self.axes[0].cla()for x, y, fmt in zip(self.X, self.Y, self.fmts):self.axes[0].plot(x, y, fmt)self.config_axes()display.display(self.fig)display.clear_output(wait=True)def train_ch3(net, train_iter, test_iter, loss, num_epochs, updater):  #@save"""训练模型(定义见第3章)"""animator = Animator(xlabel='epoch', xlim=[1, num_epochs], ylim=[0.3, 0.9],legend=['train loss', 'train acc', 'test acc'])for epoch in range(num_epochs):train_metrics = train_epoch_ch3(net, train_iter, loss, updater)test_acc = evaluate_accuracy(net, test_iter)animator.add(epoch + 1, train_metrics + (test_acc,))train_loss, train_acc = train_metricsassert train_loss < 0.5, train_lossassert train_acc <= 1 and train_acc > 0.7, train_accassert test_acc <= 1 and test_acc > 0.7, test_acc

损失函数的定义

def cross_entropy(y_hat, y):return - torch.log(y_hat[range(len(y_hat)), y])cross_entropy(y_hat, y)

就是一个有着两个输入的函数

(预测值,真实值)

定义accuracy

def accuracy(y_hat, y):  #@save"""计算预测正确的数量"""if len(y_hat.shape) > 1 and y_hat.shape[1] > 1:y_hat = y_hat.argmax(axis=1)cmp = y_hat.type(y.dtype) == yreturn float(cmp.type(y.dtype).sum())

就是一个有着两个输入的函数

(预测值,真实值)

定义精度(net模型,data_iter数据集)

同样,对于任意数据迭代器data_iter可访问的数据集, 我们可以评估在任意模型net的精度。

MXNETPYTORCHTENSORFLOWPADDLE

def evaluate_accuracy(net, data_iter):  #@save"""计算在指定数据集上模型的精度"""if isinstance(net, torch.nn.Module):net.eval()  # 将模型设置为评估模式metric = Accumulator(2)  # 正确预测数、预测总数with torch.no_grad():for X, y in data_iter:metric.add(accuracy(net(X), y), y.numel())return metric[0] / metric[1]

data_iter是二元元祖(输入特征X,输出类别y)构成的可迭代列表,每个元祖是一个样本。

定义的Accumulator(2)

这里定义一个实用程序类Accumulator,用于对多个变量进行累加。 在上面的evaluate_accuracy函数中, 我们在Accumulator实例中创建了2个变量, 分别用于存储正确预测的数量和预测的总数量。 当我们遍历数据集时,两者都将随着时间的推移而累加。

class Accumulator:  #@save"""在n个变量上累加"""def __init__(self, n):self.data = [0.0] * ndef add(self, *args):self.data = [a + float(b) for a, b in zip(self.data, args)]def reset(self):self.data = [0.0] * len(self.data)def __getitem__(self, idx):return self.data[idx]

解释:

metric.add(accuracy(net(X), y), y.numel())这里accuracy(net(X), y), y.numel()都是args

不妨设某次迭代前metric的值为(x1,x2)

迭代的传入的args为(acc,y.numel)

则经过metric.add(accuracy(net(X), y), y.numel())之后,metric变成了(x1+acc,x2+y.numel)

而metric初值为(0,0)

所以最后metric为(所有样本acc之和,所有样本的特征数之和(特征数*样本数))

定义net

def net(X):return softmax(torch.matmul(X.reshape((-1, W.shape[0])), W) + b)

输入是torch张量,输出也是

定义训练函数

def train_epoch_ch3(net, train_iter, loss, updater):  #@save"""训练模型一个迭代周期(定义见第3章)"""# 将模型设置为训练模式if isinstance(net, torch.nn.Module):net.train()# 训练损失总和、训练准确度总和、样本数metric = Accumulator(3)for X, y in train_iter:# 计算梯度并更新参数y_hat = net(X)l = loss(y_hat, y)if isinstance(updater, torch.optim.Optimizer):# 使用PyTorch内置的优化器和损失函数updater.zero_grad()l.mean().backward()updater.step()else:# 使用定制的优化器和损失函数l.sum().backward()updater(X.shape[0])metric.add(float(l.sum()), accuracy(y_hat, y), y.numel())# 返回训练损失和训练精度return metric[0] / metric[2], metric[1] / metric[2]

解释 

def train_epoch_ch3(net, train_iter, loss, updater):  #@save"""训练模型一个迭代周期(定义见第3章)"""
  • 定义一个名为 train_epoch_ch3 的函数,它接受四个参数:net(神经网络模型)、train_iter(训练数据迭代器)、loss(损失函数)和 updater(优化器或自定义更新规则)。
  • 使用 #@save 注释标记该函数,这可能是一个特殊的标记,用于保存或记录函数定义。

    # 将模型设置为训练模式if isinstance(net, torch.nn.Module):net.train()
  • 检查 net 是否是 torch.nn.Module 类的一个实例(即是否是一个PyTorch模型)。
  • 如果是,调用 net.train() 方法将模型设置为训练模式。在训练模式下,某些层(如Dropout和BatchNorm)的行为会有所不同。

    # 训练损失总和、训练准确度总和、样本数metric = Accumulator(3)
  • 初始化一个名为 metric 的 Accumulator 实例,用于累积训练损失总和、训练准确度总和和样本数。Accumulator 可能是一个自定义的类,用于简化统计数据的累积。

    for X, y in train_iter:
  • 遍历 train_iter 迭代器,每次迭代获取一个批量数据 X 和对应的标签 y

        # 计算梯度并更新参数y_hat = net(X)
  • 使用模型 net 对输入数据 X 进行前向传播,得到预测结果 y_hat

        l = loss(y_hat, y)
  • 使用损失函数 loss 计算 y_hat 和真实标签 y 之间的损失 l

        if isinstance(updater, torch.optim.Optimizer):
  • 检查 updater 是否是 torch.optim.Optimizer 类的一个实例,即是否是一个PyTorch内置的优化器。

            # 使用PyTorch内置的优化器和损失函数updater.zero_grad()
  • 如果 updater 是内置优化器,调用 updater.zero_grad() 清除模型参数的梯度

            l.mean().backward()
  • 计算损失 l 的平均值,并调用 .backward() 方法进行反向传播,计算梯度

            updater.step()
  • 调用 updater.step() 更新模型的参数。

        else:# 使用定制的优化器和损失函数l.sum().backward()
  • 如果 updater 不是内置优化器,则计算损失 l 的总和,并调用 .backward() 方法进行反向传播。

            updater(X.shape[0])
  • 调用自定义的 updater 函数,可能传入批量大小的参数 X.shape[0](有多少个样本就是几),用于更新模型参数。

        metric.add(float(l.sum()), accuracy(y_hat, y), y.numel())
  • 使用 metric.add() 方法累积当前批量的损失总和、准确度和样本数。accuracy(y_hat, y) 可能是一个计算准确度的自定义函数,而 y.numel() 返回标签张量中的元素数量。

    # 返回训练损失和训练精度return metric[0] / metric[2], metric[1] / metric[2]
  • 计算并返回整个迭代周期的平均训练损失(总损失除以样本数)和平均训练精度(总准确度除以样本数)。

定义updater()

lr = 0.1def updater(batch_size):return d2l.sgd([W, b], lr, batch_size)

这里是使用了d2l现成的()

训练

num_epochs = 10
train_ch3(net, train_iter, test_iter, cross_entropy, num_epochs, updater)

使用训好的net预测 

def predict_ch3(net, test_iter, n=6):  #@save"""预测标签(定义见第3章)"""for X, y in test_iter:breaktrues = d2l.get_fashion_mnist_labels(y)preds = d2l.get_fashion_mnist_labels(net(X).argmax(axis=1))titles = [true +'\n' + pred for true, pred in zip(trues, preds)]d2l.show_images(X[0:n].reshape((n, 28, 28)), 1, n, titles=titles[0:n])predict_ch3(net, test_iter)

解释 

def predict_ch3(net, test_iter, n=6):  #@save"""预测标签(定义见第3章)"""
  • 定义一个名为 predict_ch3 的函数,它接受三个参数:net(神经网络模型)、test_iter(测试数据迭代器)和 n(默认值为6,表示要显示的图像数量)。

    for X, y in test_iter:break
  • 遍历 test_iter 迭代器以获取测试数据集的第一个批次的数据 X(图像)和标签 y,然后立即退出循环。

这里是想展示一下第一个X,y的预测效果,所以就拿了第一批的样本(第一批,也有很多,就像后面的图上。)

    trues = d2l.get_fashion_mnist_labels(y)
  • 调用 d2l.get_fashion_mnist_labels 函数(假设这是一个自定义函数,用于将标签索引转换为可读的标签字符串),并将真实标签 y 作为输入,获取真实标签的字符串表示。

    preds = d2l.get_fashion_mnist_labels(net(X).argmax(axis=1))
  • 使用神经网络 net 对输入数据 X 进行预测,得到预测结果。.argmax(axis=1) 用于获取每个样本预测结果中的最大值索引(即预测的类别)。然后,使用 d2l.get_fashion_mnist_labels 函数将预测的类别索引转换为可读的标签字符串。

    titles = [true +'\n' + pred for true, pred in zip(trues, preds)]
  • 创建一个标题列表 titles,其中每个标题由真实标签和预测标签组成,中间用换行符分隔。

    d2l.show_images(X[0:n].reshape((n, 28, 28)), 1, n, titles=titles[0:n])
  • 调用 d2l.show_images 函数(假设这也是一个自定义函数,用于显示图像)来显示前 n 张图像。X[0:n].reshape((n, 28, 28)) 将前 n 张图像的数据重塑为适合显示的形状(每张图像是28x28像素)。1 表示图像的行数,n 表示列数,titles=titles[0:n] 将之前创建的标题与图像一起显示。

就是画图和显示

predict_ch3(net, test_iter)
  • 调用 predict_ch3 函数,传入模型 net 和测试数据迭代器 test_iter,执行预测并显示结果。

这个函数的作用是使用给定的神经网络模型对测试数据集的前 n 张图像进行预测,并将预测结果与真实标签一起显示出来。

画的图——

 (2024年10月27日终于知道为什么当时从CNN开始看看不懂了,基础的都在这里讲了。。。)

相关文章:

多层感知机的从零实现与softmax的从零实现(真·0000零基础)

今天再读zh.d2l书&#xff08;4.2. 多层感知机的从零开始实现 — 动手学深度学习 2.0.0 documentation&#xff09;&#xff0c; 看了关于多层感知机的从零实现与softmax的从零实现 目录 mlp从零实现&#xff0c; 点击“paddle”的代码 点击“torch”的代码 训练 参数解…...

【Rust练习】18.特征 Trait

练习题来自&#xff1a;https://practice-zh.course.rs/generics-traits/traits.html 1 // 完成两个 impl 语句块 // 不要修改 main 中的代码 trait Hello {fn say_hi(&self) -> String {String::from("hi")}fn say_something(&self) -> String; }str…...

【自动化测试之oracle数据库】MacOs如何安装oracle- client

操作系统为Mac OS&#xff0c;本地在pycharm上跑自动化脚本时&#xff0c;因为有操作oracle数据库的部分&#xff0c;所以需要安装oracle数据库的客户端&#xff0c;并install cx_oracle,本文主要介绍如何在macOS上完成安装&#xff0c;并在python自动化测试代码中配置&#xf…...

Spring MVC的MultipartFile

定义 MultipartFile接口是Spring MVC中用来处理上传文件的接口&#xff0c;它提供了访问上传文件内容、文件名称、文件大小等信息的方法。 源码&#xff1a; package org.springframework.web.multipart;import java.io.File; import java.io.IOException; import java.io.I…...

●Leetcode| 242.有效的字母异位词 ● 349. 两个数组的交集 ● 202. 快乐数● 1. 两数之和

242,该题目中数组范围比较短&#xff0c;可以数组使用并不会占太多的空间&#xff0c;利用数组的映射&#xff0c;查找到自己所需要的字符 class Solution { public:bool isAnagram(string s, string t) {int record[26] {0};for(int i0;i<s.size();i){record[s[i] - a];/…...

关于算法的时间复杂度和空间复杂度的分析

由于最近开始准备蓝桥杯(python组)&#xff0c;开始对编程基础进行一些复习&#xff0c;当我发现蓝桥对大多数题目程序运行时间及大小有要求时&#xff0c;我知道我不得不考虑性能问题&#xff0c;而不是能跑就行&#x1f913; 写下这篇文章希望对其他同志有帮助吧 什么是算法…...

深入浅出 C++ STL:解锁高效编程的秘密武器

引言 C 标准模板库&#xff08;STL&#xff09;是现代 C 的核心部分之一&#xff0c;为开发者提供了丰富的预定义数据结构和算法&#xff0c;极大地提升了编程效率和代码的可读性。理解和掌握 STL 对于 C 开发者来说至关重要。以下是对 STL 的详细介绍&#xff0c;涵盖其基础知…...

2024年1024程序人生总结

2024-1024 0.大环境0.1.经济0.2.战争 1.我的程序人生1.1.游戏 2.节日祝福 0.大环境 今年的1024最大的感触就是没有节日氛围&#xff0c;往年公司还会准备节日礼物&#xff0c;今年没有&#xff0c;由此可见大环境有多么糟糕。 除此之外&#xff0c;就是到公司应聘的程序员越来…...

【p2p、分布式,区块链笔记 分布式容错算法】: 拜占庭将军问题+实用拜占庭容错算法PBFT

papercodehttps://pmg.csail.mit.edu/papers/osdi99.pdfhttps://github.com/luckydonald/pbft 其他相关实现&#xff1a;This is an implementation of the Pracltical Byzantine Fault Tolerance protocol using PythonAn implementation of the PBFT consensus algorithm us…...

鸿蒙NEXT开发-应用数据持久化之用户首选项(基于最新api12稳定版)

注意&#xff1a;博主有个鸿蒙专栏&#xff0c;里面从上到下有关于鸿蒙next的教学文档&#xff0c;大家感兴趣可以学习下 如果大家觉得博主文章写的好的话&#xff0c;可以点下关注&#xff0c;博主会一直更新鸿蒙next相关知识 专栏地址: https://blog.csdn.net/qq_56760790/…...

人工智能_神经网络103_感知机_感知机工作原理_感知机具备学习能力_在学习过程中自我调整权重_优化效果_多元线性回归_逻辑回归---人工智能工作笔记0228

由于之前一直对神经网络不是特别清楚,尤其是对神经网络中的一些具体的概念,包括循环,神经网络卷积神经网络以及他们具体的作用,都是应用于什么方向不是特别清楚,所以现在我们来做教程来具体明确一下。 当然在机器学习之后还有深度学习,然后在深度学习中对各种神经网络的…...

WISE:重新思考大语言模型的终身模型编辑与知识记忆机制

论文地址&#xff1a;https://arxiv.org/abs/2405.14768https://arxiv.org/abs/2405.14768 1. 概述 随着世界知识的不断变化&#xff0c;大语言模型&#xff08;LLMs&#xff09;需要及时更新&#xff0c;纠正其生成的虚假信息或错误响应。这种持续的知识更新被称为终身模型编…...

网络安全证书介绍

网络安全领域有很多专业的证书&#xff0c;可以帮助你提升知识和技能&#xff0c;增强在这个行业中的竞争力。以下是一些常见的网络安全证书&#xff1a; 1. CompTIA Security 适合人群&#xff1a;初级安全专业人员证书内容&#xff1a;基础的网络安全概念和实践&#xff0c…...

【已解决】【hadoop】【hive】启动不成功 报错 无法与MySQL服务器建立连接 Hive连接到MetaStore失败 无法进入交互式执行环境

启动hive显示什么才是成功 当你成功启动Hive时&#xff0c;通常会看到一系列的日志信息输出到控制台&#xff0c;这些信息包括了Hive服务初始化的过程以及它与Metastore服务连接的情况等。一旦Hive完成启动并准备就绪&#xff0c;你将看到提示符&#xff08;如 hive> &#…...

基于架设一台NFS服务器实操作业

架设一台NFS服务器&#xff0c;并按照以下要求配置 首先需要关闭防火墙和SELinux 1、开放/nfs/shared目录&#xff0c;供所有用户查询资料 赋予所有用户只读的权限&#xff0c;sync将数据同步写到磁盘上 在客户端需要创建挂载点&#xff0c;把服务端共享的文件系统挂载到所创建…...

eachers中的树形图在点击其中某个子节点时关闭其他同级子节点

答案在代码末尾&#xff01;&#xff01;&#xff01;&#xff01;&#xff01; tubiaoinit(params: any) {// 手动触发变化检测this.changeDetectorRef.detectChanges();if (this.myChart ! undefined) {this.myChart.dispose();}this.myChart echarts.init(this.pieChart?…...

Maven 介绍与核心概念解析

目录 1. pom文件解析 2. Maven坐标 3. Maven依赖范围 4. Maven 依赖传递与冲突解决 Maven&#xff0c;作为一个广泛应用于 Java 平台的自动化构建和依赖管理工具&#xff0c;其强大功能和易用性使得它在开发社区中备受青睐。本文将详细解析 Maven 的几个核心概念&a…...

计算机网络-MSTP概述

一、RSTP/STP的缺陷与不足 前面我们学习了RSTP对于STP的一些优化与快速收敛机制。但在划分VLAN的网络中运行RSTP/STP&#xff0c;局域网内所有的VLAN共享一棵生成树&#xff0c;被阻塞后的链路将不承载任何流量&#xff0c;无法在VLAN间实现数据流量的负载均衡&#xff0c;导致…...

Redisson(三)应用场景及demo

一、基本的存储与查询 分布式环境下&#xff0c;为了方便多个进程之间的数据共享&#xff0c;可以使用RedissonClient的分布式集合类型&#xff0c;如List、Set、SortedSet等。 1、demo <parent><groupId>org.springframework.boot</groupId><artifact…...

考研要求掌握的C语言程度(堆排序)1

含义 堆排序就是把数组的内容在心中建立为大根堆&#xff0c;然后每次循环把根顶和没交换过的根末进行调换&#xff0c;再次建立大根堆的过程 建树的几个公式 一个数组有n个元素 最后一个父亲节点是n/2-1; 假如父亲节点在数组的下标为a 那么左孩子节点在数组下标为2*a1,…...

chronyd配置了local的NTP server之后, NTP报文中出现public IP的问题

描述 客户在Rocky Linux 9.4的VM上配了一个local的NTP server(IP: 10.64.1.76)。 配置完成后, 时钟可以同步&#xff0c;但一段时间后客户的firewall收到告警, 拒绝了大量目标端口为123的请求, 且这些请求的目的IP并不是客户指定的NTP server的IP&#xff0c;客户要求解释原因…...

docker常用命令整理

文章目录 docker 常用操作命令一、镜像类操作1.构建镜像2.从容器创建镜像3.查看镜像列表4.删除镜像5. 从远程镜像仓库拉取镜像6. 将镜像推送到镜像仓库中7. 将镜像导出8. 导入镜像9. 登录镜像仓库 二、容器相关操作1. 运行容器2. 进入容器3. 查看容器的运行状态4. 查看容器的日…...

将CSDN博客转换为PDF的Python Web应用开发--Flask实战

文章目录 项目概述技术栈介绍 项目目录应用结构 功能实现单页博客转换示例&#xff1a; 专栏合集博客转换示例&#xff1a; PDF效果&#xff1a; 代码依赖文件requirements.txt:app.py&#xff1a;代码解释&#xff1a; /api/onepage.py:代码解释&#xff1a; /api/zhuanlan.py…...

AIGC学习笔记(3)——AI大模型开发工程师

文章目录 AI大模型开发工程师002 GPT大模型开发基础1 OpenAI账户注册2 OpenAI官网介绍3 OpenAI GPT费用计算4 OpenAI Key获取与配置5 OpenAI 大模型总览6 代码演示安装依赖导入依赖初始化客户端执行代码遇到的问题 AI大模型开发工程师 002 GPT大模型开发基础 1 OpenAI账户注册…...

Windows server 2003服务器的安装

Windows server 2003服务器的安装 安装前的准备&#xff1a; 1.镜像SN序列号 图1-1 Windows server 2003的安装包非常人性化 2.指定一个安装位置 图1-2 选择好安装位置 3.启动虚拟机打开安装向导 图1-3 打开VMware17安装向导 图1-4 给虚拟光驱插入光盘镜像 图1-5 输入SN并…...

HTML作业

作业 复现下面的图片 复现结果 代码 <!DOCTYPE html> <html><head><meta charset"utf-8"><title></title></head><body><form action"#"method"get"enctype"text/plain"><…...

MYSQL-SQL-04-DCL(Data Control Language,数据控制语言)

DCL&#xff08;数据控制语言&#xff09; DCL英文全称是Data Control Language(数据控制语言)&#xff0c;用来管理数据库用户、控制数据库的访问权限。 一、管理用户 1、查询用户 在MySQL数据库管理系统中&#xff0c;mysql 是一个特殊的系统数据库名称&#xff0c;它并不…...

多线程进阶——线程池的实现

什么是池化技术 池化技术是一种资源管理策略&#xff0c;它通过重复利用已存在的资源来减少资源的消耗&#xff0c;从而提高系统的性能和效率。在计算机编程中&#xff0c;池化技术通常用于管理线程、连接、数据库连接等资源。 我们会将可能使用的资源预先创建好&#xff0c;…...

C++网络编程之C/S模型

C网络编程之C/S模型 引言 在网络编程中&#xff0c;C/S&#xff08;Client/Server&#xff0c;客户端/服务器&#xff09;模型是一种最基本且广泛应用的架构模式。这种模型将应用程序分为两个部分&#xff1a;服务器&#xff08;Server&#xff09;和客户端&#xff08;Clien…...

目标检测:YOLOv11(Ultralytics)环境配置,适合0基础纯小白,超详细

目录 1.前言 2. 查看电脑状况 3. 安装所需软件 3.1 Anaconda3安装 3.2 Pycharm安装 4. 安装环境 4.1 安装cuda及cudnn 4.1.1 下载及安装cuda 4.1.2 cudnn安装 4.2 创建虚拟环境 4.3 安装GPU版本 4.3.1 安装pytorch&#xff08;GPU版&#xff09; 4.3.2 安装ultral…...