当前位置：首页 > news >正文

KNN及降维预处理方法LDA｜PCA｜MDS

news 2025/11/4 4:31:06

文章目录

基本原理
- 模型介绍
- 模型分析
python代码实现
降维处理
- 维数灾难 curse of dimensionality
- 线性变换 Linear Transformation
- - LDA - 线性判别分析
  - LDA python 实现
  - PCA - 主成分分析
  - PCA最近重构性
  - PCA最大可分性
  - PCA求解及说明
  - PCA python实现
- 多维缩放 Multiple Dimensional Scaling
R代码实现

基本原理

模型介绍

knn是一种监督式学习方法

其工作机制十分简单：给定测试样本，基于某种距离度量找出训练集中与其最靠近的k个样本，然后基于这k个临近点的信息来进行该测试样本所属类别的预测。

通常而言，在分类任务中一般使用“投票法”，即选择k个样本中出现最多的类别标记作为输出结果；

在回归任务中一般使用“平均法”，即将这k个样本的实际值的平均值作为输出结果

模型分析

作为一种监督式学习模型，knn不存在显式的模型训练过程

也就是说，在训练阶段我们只需要把样本保存起来，训练时间开销几乎为0

在机器学习中，这种模式又被称为"懒惰学习"

python代码实现

python sklearn neighbors包下包含了全部knn及其拓展算法的实现

KNeighborsClassifier中比较重要的超参数有：

n_neighbors 表示k值
weights “uniform”|“distance” 表示进行投票时每个数据点的权值
metric “minkowski”
p 2 二者共同定义距离计算公式式欧氏距离，即闵氏距离p=2的情况

import numpy as np
import pandas as pd
import warnings 
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
from sklearn.neighbors import KNeighborsClassifierwarnings.filterwarnings("ignore")
iris_x, iris_y = load_iris(return_X_y=True)
# 为了可视化方便，我们只取iris中的前两个属性
iris_x = iris_x[:,:2]
x_train, x_test, y_train, y_test \= train_test_split(iris_x,iris_y,test_size=0.2,random_state=42)
knn_clf = KNeighborsClassifier(n_neighbors=7)
knn_clf.fit(x_train,y_train)
y_pred = knn_clf.predict(x_test)

import matplotlib as mpl
from matplotlib import pyplot as plt%matplotlib inline
mpl.rcParams["font.sans-serif"] = "SimHei"
fig,ax = plt.subplots(1,3,figsize=(12,4),facecolor="whitesmoke",edgecolor="gray")
class0 = []
class1 = []
class2 = []
for idx,cls in enumerate(iris_y):if cls == 0:class0.append(iris_x[idx,:])elif cls == 1:class1.append(iris_x[idx,:])else:class2.append(iris_x[idx,:])
ax[0].set_title("original dataset class")
ax[0].scatter(np.asarray(class0)[:,0],np.asarray(class0)[:,1],marker="*",color="r",s=3,label="class0")
ax[0].scatter(np.asarray(class1)[:,0],np.asarray(class1)[:,1],marker="*",color="orange",s=3,label="class0")
ax[0].scatter(np.asarray(class2)[:,0],np.asarray(class2)[:,1],marker="*",color="purple",s=3,label="class0")
ax[0].legend(loc="upper right")
ax[0].set_ylim([2.0,4.5])
ax[0].set_xlim([4.0,8.0])class0_pred = []
class1_pred = []
class2_pred = []
for idx,cls in enumerate(y_pred):if cls == 0:class0_pred.append(x_test[idx,:])elif cls == 1:class1_pred.append(x_test[idx,:])else:class2_pred.append(x_test[idx,:])
ax[1].set_title("original test dataset class")
ax[1].scatter(np.asarray(class0_pred)[:,0],np.asarray(class0_pred)[:,1],marker="*",color="r",s=3,label="class0")
ax[1].scatter(np.asarray(class1_pred)[:,0],np.asarray(class1_pred)[:,1],marker="*",color="orange",s=3,label="class0")
ax[1].scatter(np.asarray(class2_pred)[:,0],np.asarray(class2_pred)[:,1],marker="*",color="purple",s=3,label="class0")
ax[1].legend(loc="upper right")
ax[1].set_ylim([2.0,4.5])
ax[1].set_xlim([4.0,8.0])class0_test = []
class1_test = []
class2_test = []
for idx,cls in enumerate(y_test):if cls == 0:class0_test.append(x_test[idx,:])elif cls == 1:class1_test.append(x_test[idx,:])else:class2_test.append(x_test[idx,:])
ax[2].set_title("predict test dataset class")
ax[2].scatter(np.asarray(class0_test)[:,0],np.asarray(class0_test)[:,1],marker="*",color="r",s=3,label="class0")
ax[2].scatter(np.asarray(class1_test)[:,0],np.asarray(class1_test)[:,1],marker="*",color="orange",s=3,label="class0")
ax[2].scatter(np.asarray(class2_test)[:,0],np.asarray(class2_test)[:,1],marker="*",color="purple",s=3,label="class0")
ax[2].legend(loc="upper right")
ax[2].set_ylim([2.0,4.5])
ax[2].set_xlim([4.0,8.0])

请添加图片描述
可以看出，knn存在一定的分类误差，我们可以通过调节k的数量来使模型更精确，下面计算模型精确度：

accuracy = accuracy_score(y_pred, y_test)
$ accuracy 0.7666666666666667

降维处理

维数灾难 curse of dimensionality

经过极差对所有维度进行标准化变换后，我们可以将n个样本点视为p维单位超立方体中均匀分布的n个点

Bellman研究表明，假设样本点 $X_0$ 处于超立方体的一个顶点位置，找到他的近邻比率 $r$ （近邻数量占全部数据量的比值）时超立方体各边的期望边界长度为
$Ed_p(r) = r^{\frac{1}{p}}$
也就是说，对于一个 $p = 10$ 的10维空间而言，要找到 $r = 0.01$ 或者 $r = 0.1$ 的近邻， $Ed(0.01)=0.01^{\frac{1}{10}}=0.63$ 和 $Ed(0.1)=0.1^{\frac{1}{10}}=0.8$ ，计算结果表明取值距离跨越了总长度的 $63\%$ 和 $80\%$

与此同时，单纯减少r的量值也不能够对超立方体各边界期望长度的减少做出多大贡献，但是同时会增大预测的方差

以上推导从一个侧面证明当维度增高时，数据点在高维度空间中的分布将不再平均，它们将更多集中在空间的边缘位置，从而导致算法的开销明显增大

下面我们将介绍两种降维的思路，其一是基于线性变化的思想，另一种则是利用低维嵌入的思想

线性变换 Linear Transformation

一般来说，最简单的维度变换即为对原始高维空间进行线性变换，给定d维空间中的样本
$\mathbf{X}=\{\mathbf{x_1},\mathbf{x_1},\cdots,\mathbf{x_m}\}$
变换后得到 $d^{\prime}<d$ 维空间中的样本
$Z = W^TX$
其中 $W\in \mathbb{R}^{d\times d^\prime}$ 是变换矩阵， $Z\in \mathbb{R}^{d^\prime \times m}$ 是样本在新空间中的表达

接下来，我们根据变换后对于低维子空间性质的不同要求可以构造出相应的最优化问题，并对 $W$ 施加不同约束，

最常见的线性变换包括LDA以及PCA

LDA - 线性判别分析

传统的LDA是二分类线性判别模型，属于有监督学习的范畴，放在这里是因为我们的确使用到了线性变换的模型思路

与此同时，我们可以通过OVO或是OVR的组合模式将该二分类模型扩展至多分类模型之中

在该线性变换模型中，我们将对高维空间( $n$ 维)中的数据点投影到 $n - 1$ 维度的超平面上，投影后的点将按照类别进行区分

相应的约束条件是：投影后类内方差最小，类间方差最大

请添加图片描述

LDA二维示意图【实际上可能有多维】，其中“+”和“-”分别代表正例和反例

首先，我们定义数据集中的主要变量

给定数据集
$D=\{(x_i,y_i)\}^{m}_{i=1}, y_i \in (0,1)$
令 $X_i,\mu_i,\Sigma_i$ 分别为第 $\in (0,1)$ 类实例的集合、均值向量和协方差矩阵

若将数据投影到直线 $\mathbf{\omega}$ 上，我们可以分别得出两类样本均值和协方差矩阵的投影分别为
$\mathbf{\omega}^T\mathbf{\mu_0},\mathbf{\omega}^T\mathbf{\mu_1},\mathbf{\omega}^T\mathbf{\Sigma_0}\mathbf{\omega},\mathbf{\omega}^T\mathbf{\Sigma_1}\mathbf{\omega}$

欲使得同类样本投影点尽可能接近，即同类样本投影点的协方差尽可能小，我们需要
$\mathbf{\omega}^T\mathbf{\Sigma_0}\mathbf{\omega}+ \mathbf{\omega}^T\mathbf{\Sigma_1}\mathbf{\omega}$
尽可能小

欲使得异类样本投影点尽可能远离，即类中心之间距离尽可能大，我们需要
$||\mathbf{\omega}^T\mathbf{\mu_0}-\mathbf{\omega}^T\mathbf{\mu_1}||^{2}_{2}$
尽可能大

同时考虑二者，我们可以通过比率的方法构造最优化问题的目标函数
$\begin{array}{ll} J & = & \frac{||\mathbf{\omega}^T\mathbf{\mu_0}-\mathbf{\omega}^T\mathbf{\mu_1}||^{2}_{2}}{\mathbf{\omega}^T\mathbf{\Sigma_0}\mathbf{\omega}+ \mathbf{\omega}^T\mathbf{\Sigma_1}\mathbf{\omega}} \\ & = &\frac{\mathbf{\omega}^T(\mathbf{\mu_0}-\mathbf{\mu_1}){(\mathbf{\mu_0}-\mathbf{\mu_1})}^T\mathbf{\omega}}{\mathbf{\omega}^T(\mathbf{\Sigma_0}+\mathbf{\Sigma_1})\mathbf{\omega}} \end{array}$

为了简化公式的书写，我们构造类内散度矩阵
$S_w = \mathbf{\Sigma_0}+\mathbf{\Sigma_1}$
以及类间散度矩阵
$S_b = (\mathbf{\mu_0}-\mathbf{\mu_1}){(\mathbf{\mu_0}-\mathbf{\mu_1})}^T$

则最优化问题目标函数可以重写为
$\frac{\mathbf{\omega}^TS_b\mathbf{\omega}}{\mathbf{\omega}^TS_w\mathbf{\omega}}$

由于最优化问题目标函数都是 $\mathbf{\omega}$ 的二次项，这表明该问题与其长度无关

不失一般性，我们令分母 $\mathbf{\omega}^TS_w\mathbf{\omega}=1$ ，则最优化问题可以表述如下：
$\begin{array}{ll} & \mathop{\arg\min}_{\omega} & -\mathbf{\omega}^TS_b\mathbf{\omega} \\ & s.t. & \mathbf{\omega}^TS_w\mathbf{\omega}=1 \end{array}$

求解该类最优化问题我们将使用拉格朗日乘子法配合KKT条件，这里不再赘述，最后得到分类直线方程为：
$\mathbf{\omega} = {S_{\omega}}^{-1}(\mathbf{\mu_0}-\mathbf{\mu_1})$

LDA python 实现

python sklearn 包中 LinearDiscriminantAnalysis 提供LDA功能

import numpy as np
import pandas as pd 
import warnings 
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
from sklearn.metrics import accuracy_scorewarnings.filterwarnings("ignore")
iris_x, iris_y = load_iris(return_X_y=True)
iris_x.shape$(150,4)

可以看出，原始数据中我们拥有4个属性，也就是说降维之前我们的维度p=4

# 注意，由于受到svd影响，输出降维后的矩阵实际上是（属性值-1）和（类别值-1）二者之间的最小值
lda_model = LinearDiscriminantAnalysis(solver='svd')
lda_model.fit(iris_x,iris_y)
iris_transformed = lda_model.transform(iris_x)
iris_transformed.shape$(150,2)

使用LDA进行降维后，我们的属性来到了2个。当我们评价降维对模型带来的增益时，我们常常通过对模型本身的准确度提升来间接评价降维带来的优势

PCA - 主成分分析

主成分分析所要达到的主要目的在于能够使用一个低维的超平面更恰当的表达在高维中存在的各数据点

如何评价这样的超平面呢？我们有以下两种方式：

最近重构性：样本点到这个超平面的距离足够近
最大可分性：样本点在这个超平面上的投影能尽可能分开

有趣的是，基于以上两种判别标准，我们能够分别推导出PCA相同的最优化问题

PCA最近重构性

假定样本进行了中心化，即
$\sum_{i}x_i = 0$
同时假定投影变换后得到的新坐标系为：
$\{\omega_1,\omega_1,\cdots,\omega_d\}$
其中 $\omega_i$ 是标准正交基向量，这意味着
$\left \{ \begin{array}{ll} ||\omega_i||_2 = 1 \\ {\omega_i}^T{\omega_j} = 0, (i \ne j) \end{array} \right .$

PCA的目标是将维度降低到 $d^{\prime}<d$ ，那么样本点 $x_i$ 在低位坐标系中的投影为
$z_i=(z_{i1},z_{i2},\cdots,z_{id^\prime})$
其中 $z_{ij}={\omega_j}^Tx_i$ 是 $x_i$ 在低维坐标系下第j维的坐标

若基于 $z_i$ 来重构 $x_i$ ，则会得到
$\hat x_i = \sum^{d^\prime}_{j=1}z_{ij}\omega_j$

那么，我们可以构造原样本点 $x_i$ 与基于地位样本点重构的样本点 $\hat x_i$ 之间的距离
$\begin{array}{ll} \displaystyle\sum_{i=1}^{m}\lvert\lvert\displaystyle\sum_{j=1}^{d^\prime}z_{ij}\omega_j-x_i||^2_2 & = & \displaystyle\sum_{i=1}^{m}{z_i}^Tz_i - 2 \displaystyle\sum_{i=1}^{m}{z_i}^TW^Tx_i + const \\ & \propto & -tr(W^T\displaystyle\sum_{i=1}^{m}{z_i}^Tx_i) \\ & \propto & -tr(W^T\displaystyle\sum_{i=1}^{m}(W^Tx_i)^Tx_i) \\ & \propto & -tr(W^T(\displaystyle\sum_{i=1}^{m}x_i{x_i}^T)W) \end{array}$

其中， $W$ 是一个 $(d,d^\prime)$ 变换矩阵，根据最近重构性、也就是重构前后样本点距离相差最小原则，以上距离应当被构造成最优化问题中的最小化结构，
考虑到 $\omega_i$ 是标准正交基， $\displaystyle\sum_{i=1}^{m}x_i{x_i}^T$ 是协方差矩阵，因此我们构造最优化问题如下：
$\begin{array}{ll} \mathop{\arg\min}\limits_{W} & -tr(W^TX{X}^TW) \\ s.t. & W^TW = I \\ \end{array}$

PCA最大可分性

从最大可分性出发，我们知道，投影后的样本点可以表示为 $W^Tx_i$ ,
若要求所有样本点在投影后能够尽可能分开，就要求投影后样本点之间的方差最大
投影哦呼样本点之间的方差为 $\sum_i W^Tx_i{x_i}^TW$ ,于是我们可以构造相应的优化问题如下：
$\begin{array}{ll} \mathop{\arg\max}\limits_{W} & tr(W^TX{X}^TW) \\ s.t. & W^TW = I \\ \end{array}$

PCA求解及说明

我们可以发现，两种方法得到的最优化问题是对偶的。

使用拉格朗日乘子法求解最优化问题，可得：
$XX^T\omega_i = \lambda_i\omega_i$
接下来我们对 $XX^T$ 进行特征值分解，讲求的的特征值排序，取前 $d^\prime$ 个特征值对应的特征向量构成 $W^*$ ，该矩阵即为线性变换矩阵

但是我们需要注意的是，PCA模型的解释性是较低的，从另一种角度来说即为PCA降维后得到的特征是偏离原特征的实际价值的，我么只能从数学角度认为PCA处理后的特征能够更清晰地区分不同类别，但是不能够说明新生成的特征具备具体的物理意义。

PCA python实现

python sklearn decomposition.PCA 包提供PCA的相关操作

需要注意的是，PCA包中实际使用的是svd替代方阵的特征值分解，这样做的目的是减少计算开销并且尽可能小的影响精度

现在我们对sklearn.decomposition.PCA的主要参数做一个介绍：

n_components：这个参数可以帮我们指定希望PCA降维后的特征维度数目。最常用的做法是直接指定降维到的维度数目，此时n_components是一个大于等于1的整数。当然，我们也可以指定主成分的方差和所占的最小比例阈值，让PCA类自己去根据样本特征方差来决定降维到的维度数，此时n_components是一个（0，1]之间的数。当然，我们还可以将参数设置为"mle", 此时PCA类会用MLE算法根据特征的方差分布情况自己去选择一定数量的主成分特征来降维。我们也可以用默认值，即不输入n_components，此时n_components=min(样本数，特征数)。
whiten：判断是否进行白化。所谓白化，就是对降维后的数据的每个特征进行归一化，让方差都为1.对于PCA降维本身来说，一般不需要白化。如果你PCA降维后有后续的数据处理动作，可以考虑白化。默认值是False，即不进行白化。
svd_solver：即指定奇异值分解SVD的方法，由于特征分解是奇异值分解SVD的一个特例，一般的PCA库都是基于SVD实现的。有4个可以选择的值：{‘auto’, ‘full’, ‘arpack’, ‘randomized’}。randomized一般适用于数据量大，数据维度多同时主成分数目比例又较低的PCA降维，它使用了一些加快SVD的随机算法。 full则是传统意义上的SVD，使用了scipy库对应的实现。arpack和randomized的适用场景类似，区别是randomized使用的是scikit-learn自己的SVD实现，而arpack直接使用了scipy库的sparse SVD实现。默认是auto，即PCA类会自己去在前面讲到的三种算法里面去权衡，选择一个合适的SVD算法来降维。一般来说，使用默认值就够了。

除了这些输入参数外，有两个PCA类的成员值得关注。第一个是explained_variance_，它代表降维后的各主成分的方差值。方差值越大，则说明越是重要的主成分。第二个是explained_variance_ratio_，它代表降维后的各主成分的方差值占总方差值的比例，这个比例越大，则越是重要的主成分

import numpy as np
import pandas as pd 
import warnings
from sklearn.datasets import load_iris
from sklearn.decomposition import PCA
from sklearn.model_selection import train_test_splitwarnings.filterwarnings("ignore")
iris_x, iris_y = load_iris(return_X_y=True)
iris_x.shape$(150,4)

pca = PCA(n_components=2)
iris_de = pca.fit_transform(iris_x)
iris_de.shape$(150,2)

多维缩放 Multiple Dimensional Scaling

多维缩放是另一种降维处理的思路，我们强调缩放前后向量的某种特性保持不变，

这种认识可以理解为我们只关心高维空间中某一个低维的分布，就好像这个低维分布是这个高维分布中的一个嵌入

因此，MDS追求原始空间中样本之间的距离在低维空间中得以保存

R代码实现

set.seed(42)
# prepare data
x1 <- runif(60,-1,1)
x2 <- runif(60,-1,1)
y <- sample(c(0,1),size=60,replace=TRUE, prob=c(0.3,0.7))
data <- data.frame(Fx1=x1, Fx2=x2, Fy=y)
# separate train and test set
sampleID <- sample(x=1:60,size=60*0.3)
x_test <- data[sampleID,]
x_train <- data[-sampleID,]
par(mfrow=c(2,2),mar=c(4,6,4,4))
plot(data[,1:2],pch=data[,3]+1,cex=0.8,xlab="x1",ylab="x2",main="total sample")
plot(x_train[,1:2],pch=x_train[,3]+1,cex=0.8,xlab="x1",ylab="x2",main="train and test sample")
points(x_test[,1:2],pch=x_test[,3]+16,col=2,cex=0.8)# use all data 
err_ratio <- vector()
for(i in 1:30){knn_fit <- knn(train=data[,1:2],test=data[,1:2],cl=as.factor(data[,3]),k=i)cross_table <- table(data[,3],knn_fit)err_ratio <- c(err_ratio,(1-sum(diag(cross_table))/sum(cross_table))*100)
}
plot(err_ratio, type="l", xlab="number of K", ylab="error rate %", main="k and error rate",ylim=c(0,80),hold=TRUE)# offsetting method 旁置法
err_ratio_offset <- vector()
for(i in 1:30){knn_fit_offset <- knn(train=x_train[,1:2],test=x_test[,1:2],cl=as.factor(x_train[,3]),k=i)cross_table_offset <- table(x_test[,3],knn_fit_offset)err_ratio_offset <- c(err_ratio_offset, (1-sum(diag(cross_table_offset))/sum(cross_table_offset))*100)
}
lines(1:30,err_ratio_offset,lty=2,col=2)# cross validation 留一法
error_ratio_cv <- vector()
for(i in 1:30){knn_fit_cv <- knn.cv(train=data[,1:2],cl=as.factor(data[,3]),k=i)cross_table_cv <- table(data[,3],knn_fit_cv)error_ratio_cv <- c(error_ratio_cv,(1-sum(diag(cross_table_cv))/sum(cross_table_cv))*100)
}
lines(1:30,error_ratio_cv,lty=3,col=4)# knn regression 回归
set.seed(24)
x3 <- runif(60,-1,1)
x4 <- runif(60,-1,1)
y2 <- runif(60,10,20)
data_reg <- data.frame(Fx3=x3, Fx4=x4, Fy=y2)
sampleID <- sample(x=1:60, size=60*0.3)
x2_test <- data_reg[sampleID,]
x2_train <- data_reg[-sampleID,]mse_vector <- vector()
for(i in 1:30){knn_fit_reg <- knn(train=x2_train[,1:2],test=x2_test[,1:2],cl=x2_train[,3],k=i,prob=FALSE)# due to the fact that res of knn is a factor, # we need to change it back to numeric vectorknn_fit_reg <- as.double(as.vector(knn_fit_reg))mse <- sum((x2_test[,3]-knn_fit_reg)^2)/length(x2_test[,3])print((x2_test[,3]-knn_fit_reg)^2)print(mse)mse_vector <- c(mse_vector,mse)
}
plot(mse_vector,type="l", xlab="k", ylab="mse",main="k-mse relationship",ylim=c(0,80))

请添加图片描述

KNN及降维预处理方法LDA｜PCA｜MDS

文章目录基本原理模型介绍模型分析 python代码实现降维处理维数灾难 curse of dimensionality线性变换 Linear TransformationLDA - 线性判别分析LDA python 实现PCA - 主成分分析PCA最近重构性PCA最大可分性PCA求解及说明PCA python实现多维缩放 Multiple Dimensional Scali…...

编程日记 2024/5/25 17:21:39

论文精读-SwinIR Image Restoration Using Swin Transformer

论文精读-SwinIR: Image Restoration Using Swin Transformer SwinIR:使用 Swin Transformer进行图像恢复参数量：SR 11.8M、JPEG压缩伪影 11.5M、去噪 12.0M 优点：1、提出了新的网络结构。它采用分块设计。包括浅层特征提取：cnn提取&#…...

编程日记 2024/5/25 17:19:35

解释Spring Bean的生命周期

Spring Bean的生命周期涉及到Bean的创建、配置、使用和销毁的各个阶段。理解这个生命周期对于编写高效的Spring应用和充分利用框架的功能非常重要。下面是Spring Bean生命周期的主要步骤： 1. 实例化Bean Spring容器首先将使用Bean的定义（无论是XML、注…...

编程日记 2024/5/25 17:18:34

CTF网络安全大赛web题目：字符？正则？

题目来源于：bugku 题目难度：难题目描　　述: 字符？正则？ 题目htmnl源代码： <code><span style"color: #000000"> <span style"color: #0000BB"><?php <br />highl…...

编程日记 2024/5/25 17:17:33

Linux——Docker容器虚拟化平台

安装docker 安装 Docker | Docker 从入门到实践https://vuepress.mirror.docker-practice.com/install/ 不需要设置防火墙 docker命令说明 docker images #查看所有本地主机的镜像 docker search 镜像名 #搜索镜像 docker pull 镜像名 [标签] #下载镜像&…...

编程日记 2024/5/25 17:16:32

Transformer详解(3)-多头自注意力机制

attention multi-head attention pytorch代码实现 import math import torch from torch import nn import torch.nn.functional as Fclass MultiHeadAttention(nn.Module):def __init__(self, heads8, d_model128, droput0.1):super().__init__()self.d_model d_model # 12…...

编程日记 2024/5/25 17:15:31

运用HTML、CSS设计Web网页——“西式甜品网”图例及代码

目录一、效果展示图二、设计分析 1.整体效果分析 2.头部header模块效果分析 3.导航及banner模块效果分析 4.分类classify模块效果分析 5.产品展示show模块效果分析 6.版权banquan模块效果分析三、HTML、CSS代码分模块展示 1. 头部header模块代码 2.导航及bann…...

编程日记 2024/5/25 17:13:29

大语言模型是通用人工智能的实现路径吗？【文末有福利】

相关说明这篇文章的大部分内容参考自我的新书《解构大语言模型：从线性回归到通用人工智能》，欢迎有兴趣的读者多多支持。关于大语言模型的内容，推荐参考这个专栏。内容大纲相关说明一、哲学与人工智能二、内容简介三、书籍简介与福利粉…...

编程日记 2024/5/25 17:12:28

c语言——宏offsetof

1.介绍 ！！！ offsetof 是一个宏 2.使用举例结构体章节的计算结构体占多少字节需要先掌握（本人博客结构体篇章中已经讲解过） 计算结构体中某变量相对于首地址的偏移，并给出说明首先，结构体首个…...

编程日记 2024/5/25 17:11:27

C#串口通信-串口相关参数介绍

串口通讯(Serial Communication)，是指外设和计算机间，通过数据信号线、地线等，按位进行传输数据的一种双向通讯方式。串口是一种接口标准，它规定了接口的电气标准，没有规定接口插件电缆以及使用的通信协议&#xff0c…...

编程日记 2024/5/25 17:10:25

节省时间与精力：用BAT文件和任务计划器自动执行重复任务

文章目录 1.BAT文件详解2. 经典BAT文件及使用场景3. 使用方法4. 如何设置BAT文件为定时任务5. 实例应用：自动清理临时文件 BAT文件，也就是批处理文件，是一种在Windows操作系统中自动执行一系列命令的文本文件。这些文件的扩展名为 .bat。通过…...

编程日记 2024/5/25 17:09:24

一年前的Java作业，模拟游戏玩家战斗

说明：一年前写的作业，感觉挺有意思的，将源码分享给大家。刚开始看题也觉得很难，不过写着写着思路更加清晰，发现也没有想象中的那么难。一、作业题目描述： 题目：模拟游戏玩家战斗 1.1 基础功…...

编程日记 2024/5/25 17:08:23

C++ 学习关于引用

🙋本文主要讲讲C的引用是基础入门篇~ 本文是阅读C Primer 第五版的笔记 🌈 关于引用几个比较重要的点 🌿引用相当于为一个已经存在的对象所起的另外一个名字 🌞 定义引用时，程序把引用和它的初始值绑定（b…...

编程日记 2024/5/25 17:05:20

BERT ner 微调参数的选择

针对批大小和学习率的组合进行收敛速度测试，结论： 相同轮数的条件下，batchsize-32 相比 batchsize-256 的迭代步数越多，收敛更快批越大的话，学习率可以相对设得大一点画图代码（deepseek生成）…...

编程日记 2024/5/25 17:04:19

【MySQL精通之路】系统变量-持久化系统变量

MySQL服务器维护用于配置其操作的系统变量。系统变量可以具有影响整个服务器操作的全局值，也可以具有影响当前会话的会话值，或者两者兼而有之。许多系统变量是动态的，可以在运行时使用SET语句进行更改，以影响当前服务器实例的…...

编程日记 2024/5/25 17:03:18

fdk-aac将aac格式转为pcm数据

int sampleRate 44100; // 采样率int sampleSizeInBits 16; // 采样位数，通常是16int channels 2; // 通道数，单声道为1，立体声为2FILE *m_fd NULL;FILE *m_fd2 NULL;HANDLE_AACDECODER decoder aacDecoder_Open(TT_MP4_ADTS, 1);if (!…...

编程日记 2024/5/25 17:02:17

【C语言深度解剖】(15)：动态内存管理和柔性数组

🤡博客主页：醉竺 🥰本文专栏：《C语言深度解剖》 😻欢迎关注：感谢大家的点赞评论关注，祝您学有所成！ ✨✨💜💛想要学习更多C语言深度解剖点击专栏链接查看&…...

编程日记 2024/5/25 17:01:16

力扣每日一题 5/25

题目： 给你一个下标从 0 开始、长度为 n 的整数数组 nums ，以及整数 indexDifference 和整数 valueDifference 。你的任务是从范围 [0, n - 1] 内找出 2 个满足下述所有条件的下标 i 和 j ： abs(i - j) > indexDifference 且abs(nums…...

编程日记 2024/5/25 17:00:14

（1）无线电失控保护（一）

文章目录前言 1 何时触发失控保护 2 将会发生什么 3 接收机配置...

编程日记 2024/5/25 16:59:14

基于51单片机的多功能万年历温度计—可显示农历

基于51单片机的万年历温度计 （仿真＋程序＋原理图＋设计报告） 功能介绍具体功能： 本设计基于STC89C52（与AT89S52、AT89C52通用，可任选）单片机以及DS1302时钟芯片、DS18B…...

编程日记 2024/5/25 16:58:13

3.3.1_1 检错编码（奇偶校验码）

从这节课开始，我们会探讨数据链路层的差错控制功能，差错控制功能的主要目标是要发现并且解决一个帧内部的位错误，我们需要使用特殊的编码技术去发现帧内部的位错误，当我们发现位错误之后，通常来说有两种解决方案。第一…...

编程新知 2025/11/2 4:43:51

论文浅尝 | 基于判别指令微调生成式大语言模型的知识图谱补全方法（ISWC2024）

笔记整理：刘治强，浙江大学硕士生，研究方向为知识图谱表示学习，大语言模型论文链接：http://arxiv.org/abs/2407.16127 发表会议：ISWC 2024 1. 动机传统的知识图谱补全（KGC）模型通过…...

编程新知 2025/11/1 5:28:50

【git】把本地更改提交远程新分支feature_g

创建并切换新分支 git checkout -b feature_g 添加并提交更改 git add . git commit -m “实现图片上传功能” 推送到远程 git push -u origin feature_g...

编程新知 2025/8/15 18:53:03

2025年渗透测试面试题总结-腾讯[实习]科恩实验室-安全工程师（题目+回答）

安全领域各种资源，学习文档，以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具，欢迎关注。目录腾讯[实习]科恩实验室-安全工程师一、网络与协议 1. TCP三次握手 2. SYN扫描原理 3. HTTPS证书机制二…...

编程新知 2025/10/28 11:52:32

（一）单例模式

一、前言单例模式属于六大创建型模式，即在软件设计过程中，主要关注创建对象的结果，并不关心创建对象的过程及细节。创建型设计模式将类对象的实例化过程进行抽象化接口设计，从而隐藏了类对象的实例是如何被创建的，封装了软件系统使用的具体对象类型。六大创建型模式包括…...

编程新知 2025/10/30 19:52:34

c++第七天继承与派生2

这一篇文章主要内容是派生类构造函数与析构函数在派生类中重写基类成员以及多继承第一部分：派生类构造函数与析构函数当创建一个派生类对象时，基类成员是如何初始化的？ 1.当派生类对象创建的时候，基类成员的初始化顺序 …...

编程新知 2025/10/29 9:54:06

AI语音助手的Python实现

引言语音助手（如小爱同学、Siri）通过语音识别、自然语言处理（NLP）和语音合成技术，为用户提供直观、高效的交互体验。随着人工智能的普及，Python开发者可以利用开源库和AI模型，快速构建自定义语音助手。本文由浅入深，详细介绍如何使用Python开发AI语音助手，涵盖基础功…...

编程新知 2025/10/29 14:41:59

WPF八大法则：告别模态窗口卡顿

⚙️ 核心问题：阻塞式模态窗口的缺陷原始代码中ShowDialog()会阻塞UI线程，导致后续逻辑无法执行： var result modalWindow.ShowDialog(); // 线程阻塞 ProcessResult(result); // 必须等待窗口关闭根本问题&#xff1a…...

编程新知 2025/11/4 3:41:51

使用SSE解决获取状态不一致问题

使用SSE解决获取状态不一致问题 1. 问题描述2. SSE介绍2.1 SSE 的工作原理2.2 SSE 的事件格式规范2.3 SSE与其他技术对比2.4 SSE 的优缺点 3. 实战代码 1. 问题描述目前做的一个功能是上传多个文件，这个上传文件是整体功能的一部分，文件在上传的过程中…...

编程新知 2025/10/26 17:23:54

java+webstock

maven依赖 <dependency><groupId>org.java-websocket</groupId><artifactId>Java-WebSocket</artifactId><version>1.3.5</version></dependency><dependency><groupId>org.apache.tomcat.websocket</groupId&…...

编程新知 2025/10/20 16:10:30