机器学习——基本概念
如何选择合适的模型评估指标?AUC、精准度、召回率、F1值都是什么?如何计算?有什么优缺点?
选择合适的模型评估指标需要结合具体的问题场景,根据不同的需求来选择不同的指标。以下是几个常用的评估指标:
AUC(Area Under the ROC Curve):ROC曲线下的面积,用于评估分类模型的性能。AUC的取值范围为0.5到1,AUC越接近1,说明模型性能越好。AUC计算方法是先计算出模型的ROC曲线,然后计算ROC曲线下的面积。
精准度(Precision):正确预测为正例的样本数占预测为正例的样本总数的比例。精准度越高,说明模型的误判率越低。计算公式为:精准度 = TP / (TP + FP)。
召回率(Recall):正确预测为正例的样本数占实际为正例的样本总数的比例。召回率越高,说明模型的漏判率越低。计算公式为:召回率 = TP / (TP + FN)。
F1值:综合考虑精准度和召回率的评估指标。F1值越高,说明模型的整体性能越好。计算公式为:F1值 = 2 * 精准度 * 召回率 / (精准度 + 召回率)。
这些评估指标各有优缺点:
AUC的优点是不受正负样本比例不均和分类阈值的影响,但它的缺点是无法直接解释分类器的表现情况。
精准度和召回率可以用于评估分类器的不同性能方面,但它们是互相矛盾的,提高一个指标会降低另一个指标。
F1值综合考虑了精准度和召回率的权衡,但是它也无法解决分类器的误判问题。
选择合适的评估指标需要根据具体的问题场景来确定,例如在医学诊断中,对于一些疾病的检测,需要提高召回率来减少漏诊的情况,而在广告推荐中,需要提高精准度来减少误判的情况。
回归模型和分类模型常用损失函数有哪些?各有什么优缺点
均方误差(Mean Squared Error,MSE):对于回归模型来说,MSE是最常用的损失函数之一,计算预测值与实际值之间的平均差的平方。MSE的优点是容易计算和理解,但它对异常值比较敏感,可能会导致模型出现较大的偏差。
平均绝对误差(Mean Absolute Error,MAE):也是回归模型中常用的损失函数,计算预测值与实际值之间的平均差的绝对值。相对于MSE,MAE更加鲁棒,对异常值不敏感,但是相对计算量较大。
交叉熵(Cross-entropy):对于分类模型来说,交叉熵是常用的损失函数之一,特别是在二分类和多分类问题中。交叉熵测量了预测概率分布和真实标签的差距。它的优点是对于概率分布预测误差的惩罚比较明显,可用于处理多分类和不平衡分类问题,但是相对计算量较大。
对数损失(Logarithmic Loss,LogLoss):也是二分类和多分类问题中常用的损失函数之一。对数损失计算了预测的概率分布与真实标签之间的负对数似然,可以用于评估分类器的准确性,但对于错误分类的惩罚较小。
Hinge损失:主要应用于支持向量机(SVM)的分类任务中,将预测结果与真实结果之间的差距转换为一个非线性的分类损失函数。Hinge损失可以将模型的输出空间分为正例和负例两部分,用于解决二分类问题,但它不适用于多分类问题。
总之,选择适当的损失函数可以帮助我们优化模型的性能。在选择损失函数时,需要考虑模型的特点、数据的特点和目标任务的要求。例如,在处理异常值较多的数据集时,可以选择MAE损失函数;在处理分类问题时,可以选择交叉熵或对数损失函数。
损失函数中 交叉熵 的介绍
交叉熵(Cross-entropy)是机器学习中常用的损失函数之一,特别是在分类任务中广泛应用。交叉熵测量了预测概率分布和真实标签之间的差距。在二分类问题中,交叉熵损失可以表示为:
在多分类问题中,交叉熵损失可以表示为:
ROC曲线如何绘制?相比P-R曲线有什么特点?
Precision-Recall曲线
P=TP/(TP+FP) ,P是代表预测为真且真实为真的数据占预测为真数据的比例。
R=TP/(TP+FN),R是代表预测为真且真实为真的数据占真实为真数据的比例。
ROC:横坐标为假阳率(False Positive Rate,FPR)
纵坐标为真阳率(True Positive Rate,TPR)
当正负样本的分布发生变化时,ROC曲线的形状能够基本保持不变,而P-R曲线的形状一般会发生较剧烈的变化。
损失函数是什么,如何定义合理的损失函数?为什么用这个损失函数?
损失函数是机器学习模型中用于衡量预测值与真实值之间差异的函数。模型的目标是使损失函数尽可能小,以达到最优的预测效果。
定义合理的损失函数需要考虑以下几个方面:
损失函数应该与问题的特性相匹配。例如,对于回归问题,均方误差(MSE)通常是一个比较好的损失函数,而对于分类问题,交叉熵损失函数通常更适合。
损失函数应该能够衡量预测值与真实值之间的差异,并且具有可导性。在优化过程中,需要对损失函数进行求导,以便找到能够使损失函数最小化的参数值。
损失函数应该避免过拟合。过拟合是指模型在训练集上表现良好,但在测试集上表现不佳的现象。如果损失函数过于关注训练集中的细节,可能导致模型过拟合。因此,损失函数需要适当平衡训练集和测试集的表现。
如何评判模型是过拟合还是欠拟合?遇到过拟合或欠拟合时,你是如何解决?
评判模型是过拟合还是欠拟合,通常可以通过观察模型在训练集和验证集上的表现来判断。
如果模型在训练集上表现良好,但在验证集上表现较差,说明模型可能过拟合了。过拟合的原因是模型过于复杂,使得模型在训练集上过度拟合,而在新数据上表现不佳。可以采取以下措施来解决过拟合问题:
1增加训练数据,使得模型可以学习更多的样本信息,从而减少过拟合的可能性。
2减少模型复杂度,例如减少模型参数或采用正则化方法。
3使用dropout等技术,可以随机删除一些神经元,从而防止过度拟合。如果模型在训练集和验证集上的表现都比较差,说明模型可能欠拟合了。欠拟合的原因是模型过于简单,无法充分地表达样本之间的关系。此时,可以考虑采取以下措施来解决欠拟合问题:
1增加模型复杂度,例如增加模型的参数或层数。
2增加训练数据量,以更好地学习样本之间的关系。
3调整超参数,例如学习率、批次大小等。
你是如何针对应用场景选择合适的模型?
1.数据类型和特征:不同类型和特征的数据适合不同类型的模型。例如,图像数据适合卷积神经网络,文本数据适合循环神经网络,表格数据适合决策树等。
2.任务类型:不同的任务类型需要不同的模型。例如,分类任务可以使用逻辑回归、支持向量机、决策树等,而回归任务可以使用线性回归、岭回归、Lasso回归等。
3.数据规模和计算资源:对于大规模的数据集,需要使用分布式训练或者GPU等计算资源,因此选择合适的模型也需要考虑计算资源的限制。
4.模型性能:最终目标是选择表现最好的模型,因此需要在训练集和验证集上对模型进行评估比较。
如何选择模型中的超参数?有什么方法,并说说其优劣点
网格搜索:在超参数空间中穷举搜索,找到最佳超参数组合。优点是保证找到最优解,缺点是计算复杂度高,时间和计算资源成本高。
随机搜索:在超参数空间中随机采样,找到一组较好的超参数组合。优点是时间和计算资源成本较低,缺点是可能无法找到最优解。
贝叶斯优化:基于贝叶斯方法进行优化,寻找最优解。优点是能够快速找到较好的超参数组合,缺点是可能需要一定的理论基础。
自动机器学习(AutoML):通过自动化的方式搜索超参数空间,包括特征选择、算法选择、超参数选择等。优点是无需专业知识,缺点是可能无法找到最优解。
在选择超参数时,需要权衡优缺点,根据具体情况选择合适的方法。通常来说,网格搜索和随机搜索比较常用,贝叶斯优化和AutoML则逐渐被广泛应用。
简述解决一个机器学习问题时,你的流程是怎样的?
通常情况下,解决一个机器学习问题可以遵循以下流程:
确定问题:首先需要明确要解决的问题是什么,例如分类、回归或聚类等。在明确问题的同时,需要收集数据,确保数据集合适并能够用于训练模型。
数据预处理:对数据进行预处理是机器学习流程中非常重要的一步。数据预处理包括清理数据,去除重复项,处理缺失值,以及对数据进行归一化或标准化等操作,以确保数据集合适用于训练模型。
特征工程:特征工程指的是将原始数据转换为可以输入到机器学习模型中的特征。这可能涉及到数据转换、特征选择和特征提取等操作。
选择模型:选择适合当前问题的机器学习模型。这可能需要先了解不同模型的优缺点以及它们的适用范围。选择模型时,还需要注意参数调整、交叉验证等问题。
训练模型:使用数据集训练机器学习模型,并对模型进行调整和优化,以获得更好的性能。
模型评估:对模型进行评估,以确定模型的性能是否达到要求。可以使用交叉验证、混淆矩阵等方法进行模型评估。
部署模型:将模型部署到实际应用中,以解决实际问题。
监测和优化:对部署的模型进行监测和优化,以确保模型在生产环境中的性能和可靠性。这可能需要进行反馈学习、数据更新和模型更新等操作。
什么是结构误差和经验误差?训练模型的时候如何判断已经达到最优?
结构误差和经验误差是机器学习中常用的两个概念,它们都是用来评估模型性能的指标。
经验误差:指模型在训练集上的误差,即模型在已有数据上的表现。一般来说,经验误差会随着模型的复杂度增加而降低。
结构误差:指模型在测试集上的误差,即模型在未知数据上的表现。结构误差通常包含两个部分,即模型的偏差和方差。模型的偏差是指模型预测结果与真实结果之间的差异,方差则是指模型对数据的变化敏感程度。
在训练模型的过程中,我们通常需要控制模型的复杂度,以避免模型出现过拟合或欠拟合的情况。当经验误差和结构误差都较小时,我们可以认为模型已经达到最优。判断模型是否达到最优的具体方法包括:
分离数据集:将数据集分成训练集、验证集和测试集,其中训练集用于训练模型,验证集用于调整模型超参数,测试集用于测试模型的泛化能力。
使用正则化方法:如L1正则化和L2正则化等,以控制模型复杂度和防止过拟合。
交叉验证:通过将数据集划分成多个子集,然后使用每个子集轮流作为测试集,其余部分作为训练集,最终求出模型的平均误差来评估模型的性能。
调整超参数:通过调整模型的超参数(如学习率、正则化参数、网络层数等)来控制模型复杂度和提高模型性能。
综合考虑这些方法,我们可以在训练模型的过程中找到最优的模型,以便在实际应用中获得最佳的性能。
模型的“泛化”能力是指?如何提升模型泛化能力?
模型的“泛化”能力是指模型在面对新数据时的表现能力,即模型从已知数据中学到的知识能否适用于未知数据。提高模型的泛化能力是机器学习中至关重要的问题,因为只有具有良好泛化能力的模型才能在实际¿应用中取得好的效果。
以下是提升模型泛化能力的一些常用方法:
数据增强:通过一系列变换操作,如旋转、平移、缩放等,对训练数据进行扩充,增加数据的多样性,以提高模型对新数据的适应能力。
正则化:如L1正则化和L2正则化等,可以对模型进行约束,限制模型的参数空间,防止模型过拟合,提高模型的泛化能力。
早停策略:在训练模型的过程中,可以设置一个验证集,当模型在验证集上的表现不再提升时,就停止训练,避免模型在训练集上过拟合。
模型集成:将多个模型的预测结果进行加权平均或投票等方式进行融合,以提高模型的稳定性和泛化能力。
Dropout:在模型的训练过程中,随机将一部分神经元的输出置为0,以强制模型学习更鲁棒的特征,提高模型的泛化能力。
Batch Normalization:对输入数据进行标准化处理,减少模型对数据分布的依赖性,提高模型的泛化能力。
数据预处理:对原始数据进行缩放、标准化等处理,可以减少特征之间的差异性,提高模型的泛化能力。
综上所述,提高模型泛化能力需要结合具体问题和场景进行选择和调整,以获得最佳的模型性能。
机器学习中,你是如何进行误差分析?
进行误差分析是机器学习中非常重要的一步,它可以帮助我们更好地理解模型的性能,找到模型存在的问题,为模型改进提供指导。以下是我通常进行误差分析的步骤:
收集数据集:从模型实际应用中收集足够的数据集,以便进行误差分析。
分析误差:通过对模型产生的错误进行分类和分析,了解不同类型的错误出现的频率和原因。可以通过混淆矩阵、ROC曲线等指标来分析误差。其中,混淆矩阵可以帮助我们分析模型在不同类别上的表现,例如真阳性、真阴性、假阳性和假阴性等。
找出错误的原因:分析误差的原因,包括数据本身的问题、模型设计的问题、数据预处理的问题等。例如,在图像分类任务中,模型可能无法识别黑色背景上的黑色物体,这时我们可以通过增加数据样本或者修改图像预处理方法来改进模型。
采取措施改进:根据误差分析结果,采取相应的措施改进模型,包括调整模型参数、修改模型结构、改进数据质量等。例如,在文本分类任务中,如果我们发现模型对一些专业术语的识别效果不佳,我们可以通过增加包含这些术语的样本,或者修改模型的词向量表达方法来提高模型性能。
你是如何理解模型的偏差和方差?什么样的情况是高偏差,什么情况是高方差?
模型的偏差(Bias)和方差(Variance),用来衡量模型的泛化能力和性能。
偏差是指模型对训练数据的拟合能力,即模型在训练数据上的表现能力。如果模型的偏差高,那么它可能会在训练数据上表现得很差,而在测试数据上表现也不会好。通常来说,高偏差意味着模型过于简单,无法捕捉数据中的复杂关系。
方差是指模型对数据的变化的敏感程度,即模型在不同的训练数据上的表现能力。如果模型的方差高,那么它可能会在训练数据上表现得很好,但在测试数据上表现却不好。通常来说,高方差意味着模型过于复杂,对数据的噪声和随机性过于敏感。
当模型的偏差和方差都很高时,我们称之为模型的过拟合(Overfitting),这时模型在训练数据上表现很好,但在测试数据上表现不佳。而当模型的偏差和方差都很低时,我们称之为模型的欠拟合(Underfitting),这时模型在训练数据和测试数据上的表现都不佳。
出现高偏差(模型简单)或者高方差(模型复杂)的时候你有什么优化策略?
当出现高偏差或高方差时,我们可以采取不同的优化策略,具体如下:
- 高偏差优化策略:
- 添加特征:如果模型过于简单,无法捕捉数据中的复杂关系,可以添加更多的特征或者组合特征。
- 减少正则化:正则化可以帮助我们避免过拟合,但是如果正则化的强度过大,会导致模型过于简单,可以适当减少正则化的强度。
- 使用更复杂的模型:可以使用更复杂的模型,比如增加神经网络的层数或单元数等。
- 高方差优化策略:
- 增加数据量:增加更多的数据可以帮助模型更好地学习数据的规律。
- 数据增强:可以通过一些数据增强的方法,如旋转、翻转、裁剪等方式扩充数据集。
- 减少特征:如果模型过于复杂,可以减少特征的数量或者进行特征选择,去除无关或冗余的特征。
- 增加正则化:可以增加正则化的强度,避免模型对噪声和随机性过于敏感。
需要注意的是,选择优化策略时需要综合考虑模型的特性、数据的特点和应用场景等因素,不同的场景可能需要采用不同的优化策略。同时,优化策略也可能会相互影响,需要细心地权衡和调整。
奥卡姆剃刀定律是什么?对机器学习模型优化有何启发?举例说明
奥卡姆剃刀定律(Occam's Razor)是一种科学思想,通常被解释为“如果有多种解释可以解释同一个现象,那么最简单的解释往往是最好的解释”。也就是说,如果有多个解释都能够解释某个现象,那么应该选择最简单、最符合逻辑的解释。
在机器学习中,奥卡姆剃刀定律的启示是,应该尽量选择简单的模型来解决问题,而不是过于复杂的模型。这是因为过于复杂的模型可能会过拟合训练数据,导致泛化能力不足。
举个例子,假设我们要建立一个分类模型,可以选择逻辑回归、支持向量机(SVM)、神经网络等不同的模型。如果我们的数据集很小,仅有几百个样本,那么使用神经网络可能会过于复杂,容易过拟合。此时,逻辑回归或SVM可能更适合,因为它们相对简单,容易优化,并且在小数据集上也可以取得不错的性能。
当然,在实际应用中,我们还需要综合考虑模型的准确性、可解释性、计算效率等多个因素,选择最优的模型。但是,奥卡姆剃刀定律的思想提醒我们不要盲目追求复杂的模型,而是应该尽可能地使用简单、有效的模型来解决问题。
相关文章:

机器学习——基本概念
如何选择合适的模型评估指标?AUC、精准度、召回率、F1值都是什么?如何计算?有什么优缺点? 选择合适的模型评估指标需要结合具体的问题场景,根据不同的需求来选择不同的指标。以下是几个常用的评估指标: AUC…...
Qt---感觉挺重要的部分
目录 一、讲述Qt信号槽机制与优势与不足 二、Qt信号和槽的本质是什么 三、描述QT中的文件流(QTextStream)和数据流(QDataStream)的区别 四、描述QT的TCP通讯流程 服务端:(QTcpServer) 客户端:(QTcpSocket…...

springboot+vue家乡特色推荐系统(源码+文档)
风定落花生,歌声逐流水,大家好我是风歌,混迹在java圈的辛苦码农。今天要和大家聊的是一款基于springboot的家乡特色推荐系统。项目源码以及部署相关请联系风歌,文末附上联系信息 。 💕💕作者:风…...
在Shell脚本中通过ssh从脚本运行函数
文章目录 在Shell脚本中通过ssh从脚本运行函数declare -f 和typset -f,这两个命令有什么区别declare -f 和typset -f,这两个命令可以通过ssh运行脚本中的函数吗如果我有main.sh和util.sh,并且在main.sh中引用了util.sh,该怎么办&a…...
简单学习一下 MyBatis 动态SQL使用及原理
MyBatis 是一个优秀的持久层框架,它提供了丰富的 SQL 映射功能,可以让我们通过 XML 或注解方式来定义 SQL 语句。它很大程度上简化了数据库操作,提高了开发效率。动态 SQL 是其中一个非常重要的功能,可以让我们根据不同的条件动态…...

WhatsApp如何让客户参与变得更简单?
WhatsApp对你的品牌来说可能和Twitter和Facebook一样重要,你可能已经把它们纳入你的社交媒体战略。 是的,WhatsApp不仅仅可以用来给同事发短信或与远方的亲戚视频聊天,它也适用于商业。 在发展WhatsApp业务时,小企业主得到了最优…...

记一次 MySQL 主从同步异常的排查记录,百转千回
本文主要内容如下: 一、现象 最近项目的测试环境遇到一个主备同步的问题: 备库的同步线程停止了,无法同步主库的数据更改。 备库报错如下: 完整的错误信息: Relay log read failure: Could not parse relay log even…...
Cpython的多线程技术之痛
历史原因 在Python官网下载的默认解释器是采用C语言编写的Cpython解释器。在Python语言开发之初,计算机都是单核CPU,每个单核CPU同一时刻只能运行一个线程。为了模拟多线程工作,这里采用了模拟机制,让不同线程根据时间片段&#…...

NDK OpenGL离屏渲染与工程代码整合
NDK系列之OpenGL离屏渲染与工程代码整合,本节主要是对上一节OpenGL渲染画面效果代码进行封装设计,将各种特效代码进行分离解耦,便于后期增加其他特效。 实现效果: 实现逻辑: 1.封装BaseFilter过滤器基类,…...

Python基础入门编程代码练习(二)
一、求1~100之间不能被3整除的数之和 循环条件:i<100循环操作 实现代码如下: def sums():sum 0for num in range(1, 101):if num % 3 ! 0:sum numprint("1~100之间不能被3整除的数之和为:%s" % (sum))sums() print("1~…...

C# | 对象池
对象池 文章目录 对象池前言什么是对象池对象池的优点对象池的缺点 实现思路示例代码 结束语 前言 当我们开发一个系统或者应用程序时,我们通常需要创建很多的对象,这些对象可能是线程、内存、数据库连接、文件句柄等等。在某些情况下,我们需…...

CSS小技巧之圆形虚线边框
虚线相信大家日常都用的比较多,常见的用法就是使用 border-style 控制不同的样式,比如设置如下边框代码: border-style: dotted dashed solid double;这将设置顶部的边框样式为点状,右边的边框样式为虚线,底部的边框样…...
QString与QByteArray互相转换的方法
QString与QByteArray互相转换的方法 [1] QString与QByteArray互相转换的方法QString转QByteArray方法QByteArray转QString方法QByteArray类同样不以’\0’为结尾QByteArray转QString,主要用buf.toHex()即可 [2] Qt开发串口通讯软件中的数据转换问题1.读取串口命令-Q…...

Springboot +Flowable,设置流程变量的方式(一)
一.简介 为什么需要流程变量。 举个例子,假设有如下一个流程,截图如下: 这是一个请假流程,那么谁请假、请几天、起始时间、请假理由等等,这些都需要说明,不然领导审批的依据是啥?那么如何传递…...

机器学习13(正则化)
文章目录 简介正则化经验风险和结构风险过拟合正则化建模策略 逻辑回归逻辑回归评估器 练习评估器训练与过拟合实验评估器的手动调参 简介 这一节详细探讨关于正则化的相关内容,并就 sklearn 中逻辑回归(评估器)的参数进行详细解释由于 skle…...
并发编程学习(十一):原子数组、
1、数组类型的原子类 原子数组类型,这个其实和AtomicInteger等类似,只不过在修改时需要指明数组下标。 CAS是按照来根据地址进行比较。数组比较地址,肯定是不行的,只能比较下标元素。而比较下标元素,就和元素的…...

递归到动态规划:省去枚举行为
如果在动态规划的过程中没有枚举行为,那严格位置依赖和傻缓存的方式并没有太大区别,但是当有枚举行为的时候(一个位置依赖于多个位置),那严格位置依赖是有优化空间的,枚举行为也许可以省去,题目…...

服务(第二十一篇)mysql高级查询语句(二)
①视图表: 视图表是虚拟表,用来存储SQL语句的定义 如果视图表和原表的字段相同,是可以进行数据修改的; 如果两者的字段不通,不可以修改数据。 语法: 创建:create view 试图表名 as ... 查…...

MYSQL高可用配置(MHA)
1、什么是MHA MHA(Master High Availability)是一套优秀的MySQL高可用环境下故障切换和主从复制的软件。 MHA 的出现就是解决MySQL 单点的问题。 MySQL故障切换过程中,MHA能做到0-30秒内自动完成故障切换操作。 MHA能在故障切换的过程中最大…...

单精度浮点数与十进制数据相互转换
一、float基础: Float类型占4个字节,也就是32bit,其中最高位是符号位,2~9位是指数位,后边的23bit是数值位.如下所示 大部分数据的二进制形式都可以用科学计数法表示,即1.m*2^n这种形式,只要知道m和n,就能确定一个数值 二、小数位如何转变为二进制: 下面…...
RestClient
什么是RestClient RestClient 是 Elasticsearch 官方提供的 Java 低级 REST 客户端,它允许HTTP与Elasticsearch 集群通信,而无需处理 JSON 序列化/反序列化等底层细节。它是 Elasticsearch Java API 客户端的基础。 RestClient 主要特点 轻量级ÿ…...

理解 MCP 工作流:使用 Ollama 和 LangChain 构建本地 MCP 客户端
🌟 什么是 MCP? 模型控制协议 (MCP) 是一种创新的协议,旨在无缝连接 AI 模型与应用程序。 MCP 是一个开源协议,它标准化了我们的 LLM 应用程序连接所需工具和数据源并与之协作的方式。 可以把它想象成你的 AI 模型 和想要使用它…...

为什么需要建设工程项目管理?工程项目管理有哪些亮点功能?
在建筑行业,项目管理的重要性不言而喻。随着工程规模的扩大、技术复杂度的提升,传统的管理模式已经难以满足现代工程的需求。过去,许多企业依赖手工记录、口头沟通和分散的信息管理,导致效率低下、成本失控、风险频发。例如&#…...

学习STC51单片机31(芯片为STC89C52RCRC)OLED显示屏1
每日一言 生活的美好,总是藏在那些你咬牙坚持的日子里。 硬件:OLED 以后要用到OLED的时候找到这个文件 OLED的设备地址 SSD1306"SSD" 是品牌缩写,"1306" 是产品编号。 驱动 OLED 屏幕的 IIC 总线数据传输格式 示意图 …...
C++.OpenGL (10/64)基础光照(Basic Lighting)
基础光照(Basic Lighting) 冯氏光照模型(Phong Lighting Model) #mermaid-svg-GLdskXwWINxNGHso {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-GLdskXwWINxNGHso .error-icon{fill:#552222;}#mermaid-svg-GLd…...
大模型多显卡多服务器并行计算方法与实践指南
一、分布式训练概述 大规模语言模型的训练通常需要分布式计算技术,以解决单机资源不足的问题。分布式训练主要分为两种模式: 数据并行:将数据分片到不同设备,每个设备拥有完整的模型副本 模型并行:将模型分割到不同设备,每个设备处理部分模型计算 现代大模型训练通常结合…...

网站指纹识别
网站指纹识别 网站的最基本组成:服务器(操作系统)、中间件(web容器)、脚本语言、数据厍 为什么要了解这些?举个例子:发现了一个文件读取漏洞,我们需要读/etc/passwd,如…...

基于江科大stm32屏幕驱动,实现OLED多级菜单(动画效果),结构体链表实现(独创源码)
引言 在嵌入式系统中,用户界面的设计往往直接影响到用户体验。本文将以STM32微控制器和OLED显示屏为例,介绍如何实现一个多级菜单系统。该系统支持用户通过按键导航菜单,执行相应操作,并提供平滑的滚动动画效果。 本文设计了一个…...

如何把工业通信协议转换成http websocket
1.现状 工业通信协议多数工作在边缘设备上,比如:PLC、IOT盒子等。上层业务系统需要根据不同的工业协议做对应开发,当设备上用的是modbus从站时,采集设备数据需要开发modbus主站;当设备上用的是西门子PN协议时…...

网络安全问题及对策研究
摘 要 网络安全问题一直是近年来社会乃至全世界十分关注的重要性问题,网络关乎着我们的生活,政治,经济等多个方面,致力解决网络安全问题以及给出行之有效的安全策略是网络安全领域的一大目标。 本论文简述了课题的开发背景&…...