人工智能基础--AI作业1-ML基础
1.监督学习和无监督学习都是机器学习中常用的方法。
监督学习是一种机器学习方法,其中机器学习算法根据给定的输入数据和其对应的输出标签进行训练,以学习如何预测新的输入数据的输出标签。简单来说,监督学习就是通过已知的数据进行学习,从而预测未知的数据。
无监督学习则是一种机器学习方法,其中机器学习算法使用没有标签的输入数据进行训练,以学习数据的隐藏结构和模式。简单来说,无监督学习就是对未知的数据进行学习,从中找到其内在的规律和关系。
2.分类和回归都是机器学习中的基本概念。
分类是指将数据分成不同的类别或标签。例如,将电子邮件分类为“垃圾邮件”或“非垃圾邮件”,将数字图像分类为“狗”或“猫”。分类问题的目标是通过训练一个模型,使其能够自动地将新的输入数据分到正确的类别中。
回归是指对数据进行预测,以输出一个连续的数值。例如,预测房价、销售额等。回归问题的目标是通过训练一个模型,使其能够自动地预测给定输入的输出值。回归问题通常涉及到连续的输出值和输入值之间的关系建模,如线性回归、多项式回归等。
总的来说,分类和回归是机器学习中最常用的两种基本问题类型,两者的主要区别在于输出值的类型。
3.聚类和降维都是机器学习中的基本概念。
聚类是指将数据分成不同的组,每组中的数据都具有相似的特征。例如,将客户根据他们的购买行为分为不同的群组,将文本数据中的相似文章分为一组。聚类问题的目标是将相似的数据聚集在一起,使得组内的数据相似度尽可能高,组间的数据相似度尽可能低。
降维是指将数据的维度从高维度空间降低到低维度空间,同时保留数据的重要信息。例如,将图片从RGB颜色空间转换为灰度颜色空间,将高维度的文本数据转换为低维度的向量表示。降维问题的目标是减少数据的冗余信息和计算成本,同时保留数据的主要特征,以便更好地理解和处理数据。
总的来说,聚类和降维是机器学习中常用的两种数据分析方法,两者都是为了更好地理解和处理数据。
4.损失函数是用来衡量机器学习模型预测结果与真实结果之间差距的一种函数。
在机器学习中,我们通过训练模型来使其能够自动地从数据中学习到模式和规律。而损失函数则是衡量模型预测结果与真实结果之间的差距的一种方法。通常来说,损失函数越小,模型的预测结果就越接近真实结果。
例如,在分类问题中,常用的损失函数是交叉熵损失函数,它可以衡量模型的预测结果与真实结果之间的差异。在回归问题中,常用的损失函数是均方误差损失函数,它可以衡量模型的预测结果与真实结果之间的平均差距。
总的来说,损失函数在机器学习中扮演着非常重要的角色,它帮助我们评估模型的性能,并且优化模型的参数,以使得模型能够更好地适应数据。
5.在机器学习中,我们通常会将数据集分成训练集、测试集和验证集三部分。
训练集是用来训练模型的数据集,模型通过学习训练集中的数据来建立模式和规律。通常来说,训练集占总数据集的比例很高,通常为 60% - 80%。
测试集是用来评估模型性能的数据集,模型在测试集上进行测试,以评估其对未见过的数据的泛化能力。通常来说,测试集占总数据集的比例较小,通常为 10% - 20%。
验证集是用来调整模型参数的数据集,通过验证集上的评估结果来选择模型最佳参数,以避免模型在测试集上出现过拟合或欠拟合的情况。通常来说,验证集占总数据集的比例也比较小,通常为 10% - 20%。
总的来说,训练集、测试集和验证集都是机器学习中非常重要的数据集,它们帮助我们训练出更加准确和泛化能力更强的模型。同时,需要注意的是,训练集、测试集和验证集的划分应该是随机的,并且要保证数据集的代表性和平衡性。
6.过拟合和欠拟合都是机器学习中模型性能不佳的情况。
过拟合指的是模型在训练集上表现非常好,但在测试集上表现很差的情况。这是因为模型在训练过程中过于关注训练集中的细节和噪声,导致其无法泛化到新数据上。过拟合的解决方法包括增加数据量、减小模型复杂度、添加正则化等。
欠拟合指的是模型在训练集和测试集上的表现都很差,这意味着模型无法很好地捕捉数据中的规律和模式。这可能是因为模型太过简单,或者数据中存在着复杂的模式和规律。欠拟合的解决方法包括增加模型复杂度、增加特征数量、改进数据预处理等。
总的来说,过拟合和欠拟合都是机器学习中需要解决的问题,我们需要通过合适的方法和技术来避免或解决它们,以获得更好的模型性能。
7.经验风险和期望风险是机器学习中用来衡量模型性能的两个概念。
经验风险指的是模型在训练集上的表现,也就是模型对于已经见过的数据的预测能力。通常来说,经验风险越小,表示模型在训练集上的表现越好。
期望风险指的是模型在所有可能出现的情况下的表现,也就是模型对于未见过的数据的预测能力。通常来说,期望风险越小,表示模型的泛化能力越强,即能够更好地适应新数据。
在机器学习中,我们的目标是使模型的期望风险最小化,也就是让模型在未见过的数据上的表现最好。为了达到这个目标,我们需要通过训练集来优化模型的参数,以使得模型在训练集上的经验风险尽可能地小,从而提高其泛化能力。
总的来说,经验风险和期望风险都是机器学习中非常重要的概念,它们帮助我们评估和优化模型的性能,从而提高模型的泛化能力。
相关文章:
人工智能基础--AI作业1-ML基础
1.监督学习和无监督学习都是机器学习中常用的方法。监督学习是一种机器学习方法,其中机器学习算法根据给定的输入数据和其对应的输出标签进行训练,以学习如何预测新的输入数据的输出标签。简单来说,监督学习就是通过已知的数据进行学习&#…...
关于JS中this对象指向问题总结
一、前言 关于JS中this对象指向问题,相信做过项目的小伙伴多多少少都会遇到过,明明感觉代码写的没问题,可是运行的时候,就会报错,比如报错 xxx is not a function。 我最近也遇到了,百度学习了不少前辈对于…...
Codeforces Round 855 (Div. 3) A-E2
比赛链接:Dashboard - Codeforces Round 855 (Div. 3) - Codeforces A:模拟 题意:给定一个字符串,问这个字符串是不是猫叫。定义是猫叫得字符串: 1:必须由大写或小写得M(m),E&…...
Spark Yarn 运行环境搭建
文章目录Spark Yarn 运行环境搭建1、解压缩文件2、修改配置环境文件3、配置历史服务器Spark Yarn 运行环境搭建 1、解压缩文件 将spark3.2.3的压缩包上传到 linux /opt/software 目录下 输入命令: tar -zxvf spark-3.2.3-bin-hadoop3.2-scala2.13.tgz -C /opt/ 解…...
SpringMVC 页面跳转指南:转发和重定向的实现与比较
SpringMVC 是一款非常流行的 Java Web 框架,它提供了丰富的特性和功能,使得开发者可以轻松地开发 Web 应用程序。其中,转发和重定向是 SpringMVC 中非常常见的两个操作,它们可以用于控制请求的流转和页面的跳转。本文将深入探讨 S…...
ModStartCMS v5.9.0 后台浅色模式,系统样式升级
ModStart 是一个基于 Laravel 模块化极速开发框架。模块市场拥有丰富的功能应用,支持后台一键快速安装,让开发者能快的实现业务功能开发。 系统完全开源,基于 Apache 2.0 开源协议,免费且不限制商业使用。 功能特性 丰富的模块市…...
2020蓝桥杯真题反倍数 C语言/C++
题目描述 给定三个整数 a,b,c,如果一个整数既不是 a 的整数倍也不是 b 的整数倍还不是 c 的整数倍,则这个数称为反倍数。 请问在 1 至 n 中有多少个反倍数。 输入描述 输入的第一行包含一个整数 n。 第二行包含三个整数a,b,c,相邻两个数之…...
PTA:L1-025 正整数A+B、L1-026 I Love GPLT、L1-027 出租(C++)
目录 L1-025 正整数AB 问题描述: 实现代码: L1-026 I Love GPLT 问题描述: 实现代码: L1-027 出租 问题描述: 实现代码: 原理思路: 出租那道题有点意思哈 L1-025 正整数AB 问题描述…...
状态机的Go语言实现版本
一、状态机 1. 定义 有限状态机(Finite-state machine, FSM),简称状态机,是表示有限个状态以及在这些状态之间的转移和动作等行为的数学模型。 2. 组成要素 现态(src state):事务当前所处的状…...
第2章 线程安全与共享资源竞争
第2章 线程安全与共享资源竞争 2.1 synchronized同步介绍 synchronized要解决的是共享资源冲突的问题。当共享资源被任务使用时,要对资源提前加锁。所有任务都采用抢占模式,即某个任务会抢先对共享资源加上第一把锁。如果这是一个排他锁,…...
77. writerows写入多行
文章目录1. 目标任务2. 准备工作3. writerow单行写入4. writerows多行写入5. a以追加的模式写入值6. 总结1. 目标任务 新建【各班级成绩】文件夹; 在该文件夹下新建一个【1班成绩单.csv】文件; 在该文件中写入下面的内容: 成绩 姓名 刘一…...
STM32MP157-Linux输入设备应用编程-多点触摸屏编程
文章目录前言多点触摸屏tslib库简介tslib库移植tslib库函数使用打开触摸屏设备配置触摸屏设备打开并配置触摸屏设备读取触摸屏设备多点触摸屏程序编写触点数据结构体定义事件定义计算触点数量判断单击、双击判断长按、移动判断放大、缩小外部调用代码流程图(草图&am…...
mybatis-plus的一般实现过程(超详细)
MyBatis-Plus 是 MyBatis 的增强工具,在 MyBatis 的基础上提供了许多实用的功能,如分页查询、条件构造器、自动填充等。下面是 MyBatis-Plus 的完整代码实现流程: ①、引入 MyBatis-Plus 依赖 在 Maven 中,可以通过以下方式引入 …...
Spark(5):RDD概述
目录 0. 相关文章链接 1. 什么是RDD 2. RDD核心属性 3. 执行原理 0. 相关文章链接 Spark文章汇总 1. 什么是RDD RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是 Spark 中最基本的数据处理模型。代码中是一个抽象类&#x…...
面向对象 - 继承
Hello , 各位同学朋友大家好啊, 今天给大家分享的技术呢, 是面向对象三大特征之一的继承,我们今天主要按照以下几个点, 展开继承的讲解。目录 :* 继承的介绍* 继承的好处和弊端* 继承中成员访问特点 - 成员变量* 继承中成员访问特点 - 成员方法* 方法重写* 继承中成…...
计算机网络的166个概念你知道几个 第十二部分
计算机网络安全安全通信的四大要素:机密性、保温完整性、端点鉴别和运行安全性。机密性:报文需要在一定程度上进行加密,用来防止窃听者截取报文。报文完整性:在报文传输过程中,需要确保报文的内容不会发生改变。端点鉴…...
【RabbitMQ】RabbitMQ各版本的兼容性与技术支持时限
今天在研究RabbitMQ的监控时,发现这个消息队列软件的版本真的很令人崩溃,版本众多,且组件之间还存在版本的兼容性,此外各个组件还对操作系统存在兼容性关系。为了帮大家节省一些查阅官方文档的时间,我把官方文档里面涉…...
【Git】P5 Git 远程仓库(3)pull 发生冲突
pull 发生冲突冲突在什么场景下发生?为什么要先 pull 再 push构建一个冲突场景初始开始操作:程序员2:程序员1:程序员2:发生冲突:查看冲突:解决冲突:冲突在什么场景下发生?…...
关于世界坐标系,相机坐标系,图像坐标系,像素坐标系的一些理解
关于世界坐标系,相机坐标系,图像坐标系,像素坐标系的一些理解前言一、各坐标系的含义二、坐标系转换1.世界坐标系与相机坐标系(旋转与平移)2.相机坐标系与图像坐标系(透视)3.图像坐标系与像素坐…...
企业防护ddos的注意事项,你知道吗?
DDoS,分布式拒绝服务攻击,是指处于不同位置的多个攻击者同时向一个或数个目标发动攻击,或者一个攻击者控制了位于不同位置的多台机器并利用这些机器对受害者同时实施攻击。在当下,DDoS 攻击是非常常见的一种攻击方式,大…...
SpringBoot-17-MyBatis动态SQL标签之常用标签
文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…...
挑战杯推荐项目
“人工智能”创意赛 - 智能艺术创作助手:借助大模型技术,开发能根据用户输入的主题、风格等要求,生成绘画、音乐、文学作品等多种形式艺术创作灵感或初稿的应用,帮助艺术家和创意爱好者激发创意、提高创作效率。 - 个性化梦境…...
基于距离变化能量开销动态调整的WSN低功耗拓扑控制开销算法matlab仿真
目录 1.程序功能描述 2.测试软件版本以及运行结果展示 3.核心程序 4.算法仿真参数 5.算法理论概述 6.参考文献 7.完整程序 1.程序功能描述 通过动态调整节点通信的能量开销,平衡网络负载,延长WSN生命周期。具体通过建立基于距离的能量消耗模型&am…...
自然语言处理——Transformer
自然语言处理——Transformer 自注意力机制多头注意力机制Transformer 虽然循环神经网络可以对具有序列特性的数据非常有效,它能挖掘数据中的时序信息以及语义信息,但是它有一个很大的缺陷——很难并行化。 我们可以考虑用CNN来替代RNN,但是…...
C++八股 —— 单例模式
文章目录 1. 基本概念2. 设计要点3. 实现方式4. 详解懒汉模式 1. 基本概念 线程安全(Thread Safety) 线程安全是指在多线程环境下,某个函数、类或代码片段能够被多个线程同时调用时,仍能保证数据的一致性和逻辑的正确性…...
SAP学习笔记 - 开发26 - 前端Fiori开发 OData V2 和 V4 的差异 (Deepseek整理)
上一章用到了V2 的概念,其实 Fiori当中还有 V4,咱们这一章来总结一下 V2 和 V4。 SAP学习笔记 - 开发25 - 前端Fiori开发 Remote OData Service(使用远端Odata服务),代理中间件(ui5-middleware-simpleproxy)-CSDN博客…...
JavaScript基础-API 和 Web API
在学习JavaScript的过程中,理解API(应用程序接口)和Web API的概念及其应用是非常重要的。这些工具极大地扩展了JavaScript的功能,使得开发者能够创建出功能丰富、交互性强的Web应用程序。本文将深入探讨JavaScript中的API与Web AP…...
AirSim/Cosys-AirSim 游戏开发(四)外部固定位置监控相机
这个博客介绍了如何通过 settings.json 文件添加一个无人机外的 固定位置监控相机,因为在使用过程中发现 Airsim 对外部监控相机的描述模糊,而 Cosys-Airsim 在官方文档中没有提供外部监控相机设置,最后在源码示例中找到了,所以感…...
STM32---外部32.768K晶振(LSE)无法起振问题
晶振是否起振主要就检查两个1、晶振与MCU是否兼容;2、晶振的负载电容是否匹配 目录 一、判断晶振与MCU是否兼容 二、判断负载电容是否匹配 1. 晶振负载电容(CL)与匹配电容(CL1、CL2)的关系 2. 如何选择 CL1 和 CL…...
uniapp 集成腾讯云 IM 富媒体消息(地理位置/文件)
UniApp 集成腾讯云 IM 富媒体消息全攻略(地理位置/文件) 一、功能实现原理 腾讯云 IM 通过 消息扩展机制 支持富媒体类型,核心实现方式: 标准消息类型:直接使用 SDK 内置类型(文件、图片等)自…...
