当前位置: 首页 > news >正文

机器学习—基本术语

目录

1.样本(示例)

2.属性

3.属性值

4.属性空间

5.样本空间

6.学习(训练)

7.数据集

8.测试

9.假设

10.学习器

11.标记

12.样例

13.标记空间(样例空间)

14.分类与回归

15.有监督学习、无监督学习

16.真相

17.聚类

18.未见样本

19.未见分布

20.泛化能力


1.样本(示例)

描述一个事件或者对象的数据。例如我的设计一个洋娃娃的数据如下:

(肤色=白皮肤 ;眼睛颜色=蓝眼睛 ;头发颜色=金色)这条数据就是一个样本或者叫做示例。

特征向量:我们把肤色、眼睛颜色、头发颜色看成坐标轴,这一组值,对应一个坐标,因此我们也可以把样本示例叫做特征向量,一个样本对应的所有特征组成的向量称为特征向量。

2.属性

表示事件或者事物的特征,我们称为属性。例如:肤色、眼睛颜色、头发颜色。

3.属性值

属性的值我们称为属性值。例如:白皮肤、蓝眼睛、金色。

4.属性空间

是由所有属性组成的空间,通常每个维度对应一个属性。在属性空间中,每个样本都可以被表示为一个点。

5.样本空间

是所有样本组成的集合,每个样本在样本空间中是唯一的。样本空间的维度取决于属性的数量。

6.学习(训练)

我们根据数据生成模型的过程就可以称为训练或者是学习。在这个过程中,模型通过学习样本中的模式或规律来进行预测或分类。

7.数据集

所有数据组成的集合,数据集包括=70%训练集+20%验证集+10%测试集。训练过程中使用的数据称为训练数据,每一个样本称为训练样本。

8.测试

模型训练结束后测试模型效果的过程。

9.假设

学习的模型具有的某种潜在规律我们称为假设。假设通过调整模型参数进行表达。

假设你想训练一个模型来预测明天的天气。你有过去一年每天的天气数据,包括温度、湿度、风速等。为了让机器学习模型从这些数据中学到规律,你可能会做出一个假设,比如说:

天气的变化与温度和湿度有关。如果温度升高,湿度降低,那么明天可能是晴天。

在这个例子中,你的假设是一种对天气变化规律的猜测。你认为温度和湿度是影响天气的关键因素。机器学习模型在训练过程中会尝试调整参数,使得这个假设能够对过去的数据有很好的解释,并且在未见过的数据上能够进行准确的预测。

总的来说,假设是机器学习中用来表示我们对数据规律的一种猜测或假定。这个假设在训练模型时起着重要的作用,因为它指导模型学习数据中的模式和关系。

10.学习器

模型被称为学习器。因为模型就是通过学习经验从而对于新情况进行预测。

11.标记

样例的输出结果。例如:上述样例的中国人洋娃娃、美国人洋娃娃。

12.样例

有标记信息的样本称为样例。

13.标记空间(样例空间)

所有有标记信息的集合。

14.分类与回归

学习任务分为分类和回归问题。分类问题是由离散值组成的,eg:中国人洋娃娃、美国人洋娃娃,如果是输出的是连续的值eg:0.37、0.65这种就是回归问题。

分类问题又分为二分类和多分类,二分类又分为正类和负类(反类)。

15.有监督学习、无监督学习

根据数据有无标记信息,将模型的训练过程分为有监督学习和无监督学习。

16.真相

在进行模型训练时,你给模型提供的标准答案。它对新样本进行预测,并于标准答案进行比较,验证是否准确。

真相详解:机器学习里面的Ground Truth是什么意思-CSDN博客

17.聚类

根据数据的分布结构进行自动分组,一般用于无监督学习。

18.未见样本

模型在训练时没有见过的样本我们称为未见样本,我们在同时使用未见样本来测试模型的泛化能力。

19.未见分布

模型在训练过程中没有见过的分布被称为未见分布,通常出现未见分布会使得模型性能下降。

20.泛化能力

模型在训练时,模型对于未出现过的数据进行准确预测的能力。对于不同样本得预测结果都比较准确我们称为该模型泛化能力好。

相关文章:

机器学习—基本术语

目录 1.样本(示例) 2.属性 3.属性值 4.属性空间 5.样本空间 6.学习(训练) 7.数据集 8.测试 9.假设 10.学习器 11.标记 12.样例 13.标记空间(样例空间) 14.分类与回归 15.有监督学习、无监督…...

pytorch单精度、半精度、混合精度、单卡、多卡(DP / DDP)、FSDP、DeepSpeed模型训练

pytorch单精度、半精度、混合精度、单卡、多卡(DP / DDP)、FSDP、DeepSpeed(环境没搞起来)模型训练代码,并对比不同方法的训练速度以及GPU内存的使用 代码:pytorch_model_train FairScale(你真…...

基于PHP的纺织用品商城系统

有需要请加文章底部Q哦 可远程调试 基于PHP的纺织用品商城系统 一 介绍 此纺织用品商城系统基于原生PHP开发,数据库mysql,前端bootstrap。用户可注册登录,购物下单,评论等。管理员登录后台可对纺织用品,用户&#xf…...

Go使用命令行输出二维码

引言 二维码(QR code)是一种矩阵条码的标准,广泛应用于商业、移动支付和数据存储等领域。在开发过程中,我们可能需要在命令行中显示二维码,这可以帮助我们快速生成和分享二维码信息。本文将介绍如何使用Go语言生成二维…...

最长连续序列[中等]

优质博文:IT-BLOG-CN 一、题目 给定一个未排序的整数数组nums,找出数字连续的最长序列(不要求序列元素在原数组中连续)的长度。请你设计并实现时间复杂度为O(n)的算法解决此问题。 示例 1: 输入:nums […...

设计模式-状态模式-笔记

状态模式State 在组件构建过程中,某些对象的状态经常面临变化,如何对这些变化进行有效的管理?同时又维持高层模块的稳定?“状态变化”模式为这一问题提供了一种解决方案。 经典模式:State、Memento 动机&#xff08…...

Java中for、foreach、stream区别和性能比较

文章目录 性能比较区别使用方式和行为 性能比较 最终总结:如果数据在1万以内的话,for循环效率高于foreach和stream;如果数据量在10万的时候,stream效率最高,其次是foreach,最后是for。另外需要注意的是如果数据达到10…...

[CSS] 文本折行

文本折行一般分为两种情况: CJK(Chinese/Japanese/Korean) 字符和非 CJK 字符。一般非 CJK 字符折行发生在两个单词的空格中间,见下图: 图中文本 “hello world” 包裹容器的宽度为 2rem,但是 hello 并没有…...

033-从零搭建微服务-日志插件(一)

写在最前 如果这个项目让你有所收获,记得 Star 关注哦,这对我是非常不错的鼓励与支持。 源码地址(后端):mingyue: 🎉 基于 Spring Boot、Spring Cloud & Alibaba 的分布式微服务架构基础服务中心 源…...

短期经济波动:均衡国民收入决定理论(三)

短期经济波动:国民收入决定理论(三) 文章目录 短期经济波动:国民收入决定理论(三)[toc]1 总需求曲线及其变动1.1 总需求曲线含义1.2 总需求曲线推导1.2.1 代数推导1.2.2 几何推导 1.3 AD曲线及其变动1.3.1 扩张性财政政策1.3.2 扩张性货币政策 2 总供给曲…...

电力感知边缘计算网关产品设计方案-网关软件架构

边缘计算网关采用ARM定制硬件平台架构,包含上位机端(内网)和FPGA网关端(外网)两部分,通过芯片间的高速信号总线实现边缘计算网关工业数据采集、数据实时传输、数据存储、网关状态信息收集等功能。 边缘计算网关上位机端(内网)重点完成工业数据采集、业务软件运算、客户…...

最新AI创作系统ChatGPT系统运营源码/支持最新GPT-4-Turbo模型/支持DALL-E3文生图

一、AI创作系统 SparkAi创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型国内AI全模型。本期针对源码系统整体测试下来非常完美,可以说SparkAi是目前国内一款的ChatGPT对接OpenAI软件系统。那么如…...

Java使用Redis的几种客户端介绍

Redis是一种高性能的内存数据库,可以提供快速的数据读写操作。在Java中使用Redis,需要使用Redis客户端。目前,Java中常用的Redis客户端有以下几种: Jedis Jedis是Java中最流行的Redis客户端之一,它提供了丰富的API和…...

程序员的护城河

程序员的护城河 算法,一定是过硬的算法!!!举个栗子:算法不硬吃大亏写在最后 算法,一定是过硬的算法!!! 其实会什么技术不重要,掌握多少种编程语言也不重要&a…...

常见面试题-MySQL软删除以及索引结构

为什么 mysql 删了行记录,反而磁盘空间没有减少? 答: 在 mysql 中,当使用 delete 删除数据时,mysql 会将删除的数据标记为已删除,但是并不去磁盘上真正进行删除,而是在需要使用这片存储空间时…...

信号的机制——信号处理函数的注册

在 Linux 操作系统中,为了响应各种各样的事件,也是定义了非常多的信号。我们可以通过 kill -l 命令,查看所有的信号。 # kill -l1) SIGHUP 2) SIGINT 3) SIGQUIT 4) SIGILL 5) SIGTRAP6) SIGABRT 7) SIGBUS …...

JS-项目实战-鼠标悬浮变手势(鼠标放单价上生效)

1、鼠标悬浮和离开事件.js //当页面加载完成后执行后面的匿名函数 window.onload function () {//get:获取 Element:元素 By:通过...方式//getElementById()根据id值获取某元素let fruitTbl document.getElementById("fruit_tbl");//table.rows:获取这个表格…...

redis运维(十一) python操作redis

一 python操作redis ① 安装pyredis redis常见错误 说明:由于redis服务器是5.0.8的,为了避免出现问题,默认最高版本的即可 --> 适配 ② 操作流程 核心:获取redis数据库连接对象 ③ Python 字符串前面加u,r,b的含义 原因: 字符串在…...

黑马程序员微服务 第五天课程 分布式搜索引擎2

分布式搜索引擎02 在昨天的学习中,我们已经导入了大量数据到elasticsearch中,实现了elasticsearch的数据存储功能。但elasticsearch最擅长的还是搜索和数据分析。 所以今天,我们研究下elasticsearch的数据搜索功能。我们会分别使用DSL和Res…...

什么是UV贴图?

UV 是与几何图形的顶点信息相对应的二维纹理坐标。UV 至关重要,因为它们提供了表面网格与图像纹理如何应用于该表面之间的联系。它们基本上是控制纹理上哪些像素对应于 3D 网格上的哪个顶点的标记点。它们在雕刻中也很重要。 为什么UV映射很重要? 默认情…...

非支配排序蜣螂优化算法(NSDBO)——多目标优化问题的有效解决方法

非支配排序的蜣螂优化算法(Non-dominated Sorting Dung Beetle Optimization, NSDBO)是一种结合了非支配排序机制和蜣螂优化算法(Dung Beetle Optimization, DBO)的进化计算方法,专门用于解决多目标优化问题。 在多目标…...

MyBatisPlus SQL解析踩坑记:JSqlParser版本升级的那些事儿

MyBatisPlus SQL解析踩坑记:JSqlParser版本升级的那些事儿 当你在深夜被生产环境的报警短信惊醒,发现原本运行良好的SQL查询突然报出Encountered unexpected token错误时,很可能正遭遇JSqlParser版本升级带来的"惊喜"。作为MyBatis…...

springboot-vue基于web框架的高校教材征订管理系统的设计与实现

目录技术选型与架构设计核心功能模块划分数据库设计要点开发阶段规划关键技术实现方案部署与运维方案项目技术支持源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作技术选型与架构设计 后端技术栈 采用Spring Boot作为核心框架,整…...

COMSOL 钢制支架静态分析:从建模到结果解析

comsol支架-静态分析, COMSOL Multiphysics 和“结构力学模块”中对结构力学问题进行建模的基本原理及操作。 介绍线性静态分析,包括材料属性和边界条件的定义。 在计算出解之后,学习如何分析结果并检查反作用力。 模型是钢制支架。 这种支架…...

流处理 vs 批处理:大数据时代的技术选择指南

流处理 vs 批处理:大数据时代的技术选择指南 关键词:流处理、批处理、大数据、实时计算、离线计算、延迟、吞吐量 摘要:在大数据时代,数据处理就像一场永不停歇的"数据马拉松"。流处理和批处理是两种最核心的技术方案&a…...

AHT10 vs DHT11:国产温湿度传感器性能对比与选型建议

AHT10 vs DHT11:国产温湿度传感器性能对比与选型建议 在物联网和智能硬件快速发展的今天,温湿度传感器作为环境感知的基础元件,其性能直接影响到整个系统的可靠性和精度。面对市场上众多的传感器选择,开发者常常需要在成本、精度和…...

小样本学习:OpenClaw+nanobot镜像快速领域适配方案

小样本学习:OpenClawnanobot镜像快速领域适配方案 1. 为什么需要小样本领域适配 作为一名长期关注AI落地的开发者,我经常遇到这样的困境:通用大模型在垂直领域表现不佳,而从头训练专业模型又需要海量标注数据。直到发现OpenClaw…...

AI产品经理崛起:技术人转型的新风口

技术浪潮下的职业新机遇人工智能(AI)技术的爆炸式发展正重塑全球产业格局,催生出一系列新兴职业。其中,AI产品经理(AI PM)作为连接技术与商业的桥梁,已成为当下最炙手可热的岗位。数据显示&…...

深耕.NET开发三载,我靠技术实力买下人生第一套房

作为一名深耕.NET领域的开发者,从刚毕业敲下第一行C#代码的青涩,到如今拿到属于自己的房产证,这一路,是技术能力的层层进阶,是职业道路的稳步前行,更是用代码筑造起现实生活的温暖港湾。在很多人眼里&#…...

新手必看:5分钟学会用Visio绘制PAD图和N-S图(附实例解析)

零基础掌握Visio绘制PAD图与N-S图的实战指南 在软件设计领域,可视化工具的重要性不言而喻。对于刚入门的开发者来说,掌握如何将抽象的逻辑思维转化为直观的图表是一项必备技能。Visio作为微软旗下的专业绘图工具,以其友好的界面和强大的功能&…...