当前位置：首页 > news >正文

人工智能基础--AI作业1-ML基础

news 2026/2/9 5:45:54

1.监督学习和无监督学习都是机器学习中常用的方法。

监督学习是一种机器学习方法，其中机器学习算法根据给定的输入数据和其对应的输出标签进行训练，以学习如何预测新的输入数据的输出标签。简单来说，监督学习就是通过已知的数据进行学习，从而预测未知的数据。

无监督学习则是一种机器学习方法，其中机器学习算法使用没有标签的输入数据进行训练，以学习数据的隐藏结构和模式。简单来说，无监督学习就是对未知的数据进行学习，从中找到其内在的规律和关系。

2.分类和回归都是机器学习中的基本概念。

分类是指将数据分成不同的类别或标签。例如，将电子邮件分类为“垃圾邮件”或“非垃圾邮件”，将数字图像分类为“狗”或“猫”。分类问题的目标是通过训练一个模型，使其能够自动地将新的输入数据分到正确的类别中。

回归是指对数据进行预测，以输出一个连续的数值。例如，预测房价、销售额等。回归问题的目标是通过训练一个模型，使其能够自动地预测给定输入的输出值。回归问题通常涉及到连续的输出值和输入值之间的关系建模，如线性回归、多项式回归等。

总的来说，分类和回归是机器学习中最常用的两种基本问题类型，两者的主要区别在于输出值的类型。

3.聚类和降维都是机器学习中的基本概念。

聚类是指将数据分成不同的组，每组中的数据都具有相似的特征。例如，将客户根据他们的购买行为分为不同的群组，将文本数据中的相似文章分为一组。聚类问题的目标是将相似的数据聚集在一起，使得组内的数据相似度尽可能高，组间的数据相似度尽可能低。

降维是指将数据的维度从高维度空间降低到低维度空间，同时保留数据的重要信息。例如，将图片从RGB颜色空间转换为灰度颜色空间，将高维度的文本数据转换为低维度的向量表示。降维问题的目标是减少数据的冗余信息和计算成本，同时保留数据的主要特征，以便更好地理解和处理数据。

总的来说，聚类和降维是机器学习中常用的两种数据分析方法，两者都是为了更好地理解和处理数据。

4.损失函数是用来衡量机器学习模型预测结果与真实结果之间差距的一种函数。

在机器学习中，我们通过训练模型来使其能够自动地从数据中学习到模式和规律。而损失函数则是衡量模型预测结果与真实结果之间的差距的一种方法。通常来说，损失函数越小，模型的预测结果就越接近真实结果。

例如，在分类问题中，常用的损失函数是交叉熵损失函数，它可以衡量模型的预测结果与真实结果之间的差异。在回归问题中，常用的损失函数是均方误差损失函数，它可以衡量模型的预测结果与真实结果之间的平均差距。

总的来说，损失函数在机器学习中扮演着非常重要的角色，它帮助我们评估模型的性能，并且优化模型的参数，以使得模型能够更好地适应数据。

5.在机器学习中，我们通常会将数据集分成训练集、测试集和验证集三部分。

训练集是用来训练模型的数据集，模型通过学习训练集中的数据来建立模式和规律。通常来说，训练集占总数据集的比例很高，通常为 60% - 80%。

测试集是用来评估模型性能的数据集，模型在测试集上进行测试，以评估其对未见过的数据的泛化能力。通常来说，测试集占总数据集的比例较小，通常为 10% - 20%。

验证集是用来调整模型参数的数据集，通过验证集上的评估结果来选择模型最佳参数，以避免模型在测试集上出现过拟合或欠拟合的情况。通常来说，验证集占总数据集的比例也比较小，通常为 10% - 20%。

总的来说，训练集、测试集和验证集都是机器学习中非常重要的数据集，它们帮助我们训练出更加准确和泛化能力更强的模型。同时，需要注意的是，训练集、测试集和验证集的划分应该是随机的，并且要保证数据集的代表性和平衡性。

6.过拟合和欠拟合都是机器学习中模型性能不佳的情况。

过拟合指的是模型在训练集上表现非常好，但在测试集上表现很差的情况。这是因为模型在训练过程中过于关注训练集中的细节和噪声，导致其无法泛化到新数据上。过拟合的解决方法包括增加数据量、减小模型复杂度、添加正则化等。

欠拟合指的是模型在训练集和测试集上的表现都很差，这意味着模型无法很好地捕捉数据中的规律和模式。这可能是因为模型太过简单，或者数据中存在着复杂的模式和规律。欠拟合的解决方法包括增加模型复杂度、增加特征数量、改进数据预处理等。

总的来说，过拟合和欠拟合都是机器学习中需要解决的问题，我们需要通过合适的方法和技术来避免或解决它们，以获得更好的模型性能。

7.经验风险和期望风险是机器学习中用来衡量模型性能的两个概念。

经验风险指的是模型在训练集上的表现，也就是模型对于已经见过的数据的预测能力。通常来说，经验风险越小，表示模型在训练集上的表现越好。

期望风险指的是模型在所有可能出现的情况下的表现，也就是模型对于未见过的数据的预测能力。通常来说，期望风险越小，表示模型的泛化能力越强，即能够更好地适应新数据。

在机器学习中，我们的目标是使模型的期望风险最小化，也就是让模型在未见过的数据上的表现最好。为了达到这个目标，我们需要通过训练集来优化模型的参数，以使得模型在训练集上的经验风险尽可能地小，从而提高其泛化能力。

总的来说，经验风险和期望风险都是机器学习中非常重要的概念，它们帮助我们评估和优化模型的性能，从而提高模型的泛化能力。

人工智能基础--AI作业1-ML基础

相关文章：

人工智能基础--AI作业1-ML基础

关于JS中this对象指向问题总结

Codeforces Round 855 (Div. 3) A-E2

Spark Yarn 运行环境搭建

SpringMVC 页面跳转指南：转发和重定向的实现与比较

ModStartCMS v5.9.0 后台浅色模式，系统样式升级

2020蓝桥杯真题反倍数 C语言/C++

PTA：L1-025 正整数A+B、L1-026 I Love GPLT、L1-027 出租（C++）

状态机的Go语言实现版本

第2章线程安全与共享资源竞争

77. writerows写入多行

STM32MP157-Linux输入设备应用编程-多点触摸屏编程

mybatis-plus的一般实现过程（超详细）

Spark（5）：RDD概述

面向对象 - 继承

计算机网络的166个概念你知道几个第十二部分

【RabbitMQ】RabbitMQ各版本的兼容性与技术支持时限

【Git】P5 Git 远程仓库（3）pull 发生冲突

关于世界坐标系，相机坐标系，图像坐标系，像素坐标系的一些理解

企业防护ddos的注意事项，你知道吗？

【Linux】shell脚本忽略错误继续执行

黑马Mybatis

蓝牙 BLE 扫描面试题大全(2)：进阶面试题与实战演练

Frozen-Flask ：将 Flask 应用“冻结”为静态文件

解决本地部署 SmolVLM2 大语言模型运行 flash-attn 报错

让回归模型不再被异常值“带跑偏“，MSE和Cauchy损失函数在噪声数据环境下的实战对比

Fabric V2.5 通用溯源系统——增加图片上传与下载功能

SQL慢可能是触发了ring buffer

R 语言科研绘图第 55 期 --- 网络图-聚类

Web后端基础(基础知识)