当前位置：首页 > news >正文

1. 机器学习基本知识(2)——机器学习分类

news 2026/4/6 4:21:21

1.4 机器学习分类

1.4.1 训练监督

1. 监督学习：已对训练数据完成标记

分类：根据数据及其分类信息来进行训练，使模型能够对新的数据进行分类

回归：给出一组特征值来预测目标数值

2. 无监督学习：没有对训练数据进行任何标记

聚类：在大量数据中找到一些关联，并将其分类
可视化算法：提供大量复杂、未标记的数据，使用算法绘制其2D或3D表示，以尽可能保留其结构
降维：在不丢失太多信息情况下简化数据
- 特征提取：将几个相关的特征值合并成为一个
将训练数据提供给另一个机器学习算法前，先进行降维算法减少训练数据的维度，能够加快算法运行、减少数据的空间占用（磁盘、内存），有时还能使得算法表现得更好。
异常检测：系统在训练期间主要使用正常实例，因此它会学习识别它们。然后，当看到一个新实例时，系统可以判断这个新实例看起来是正常的还是异常的
- 新颖性检测：需要有一个非常“干净”的训练集，没有任何你希望算法能够检测到的实例。
新颖性算法与异常检测的不同：训练集中极少出现过的，如果在测试集合中出现

a) 新颖性算法：不认为是新颖的，因为测试集里面见到过

b) 异常检测：认为是异常的，因为很少出现
关联规则学习：目标是挖掘大量数据并发现属性之间有趣的关系

例如，假设你开了一家超市，在销售日志上运行关联规则可能会发现购买烧烤酱和薯片的人也倾向于购买牛排。因此，你可能希望将这几样商品摆放得更近一些。

3. 半监督学习：对训练数据进行了部分标记

现实案例：照片托管服务，在大量照片中，根据照片中出现的人物将其分成不同的分组（无监督学习内容）

大多数半监督学习算法是无监督和监督算法的组合。

例如，可以使用聚类算法将相似的实例分组在一起，然后每个未标记的实例都可以用其集群中最常见的标签进行标记。一旦标记了整个数据集，就可以使用任何监督学习算法。

4. 自监督学习：从完全未标记的数据集生成完全标记的数据集。

例如，如果你有一个很大的未标记图像数据集，你可以随机屏蔽每个图像的一小部分，然后训练一个模型来恢复出原始图像。在训练期间，屏蔽的图像用作模型的输入，原始图像用作标签。

迁移学习：将知识从一项任务转移到另一项任务称为迁移学习
自监督学习与无监督学习的区别：自监督学习在训练期间是使用（生成的）标签的，因此在这方面它更接近于监督学习。在处理聚类、降维或异常检测等任务时，通常会使用术语“无监督学习”，而自监督学习侧重于与监督学习相同的任务，主要是分类和回归。

5. 强化学习：自行学习策略以随时间推移获得最大回报

强化学习，RL，这个学习系统（在此上下文中称为智能体）可以观察环境，选择和执行动作，并获得回报（或负回报形式的惩罚）。然后它必须自行学习什么是最好的方法，称为策略，以便随着时间的推移获得最大的回报。策略定义了智能体在给定情况下应该选择的动作。

一般执行强化学习的流程为：

观察环境
使用策略选择下一步的动作
执行动作
获得惩罚或回报
更新策略（学习步骤）
迭代直到找到最优策略

AlphaGo就是强化学习的示例。

1.4.2 批量学习与在线学习

对机器学习系统进行分类的另一个标准是系统能否从输入数据流中进行增量学习。

1. 批量学习：无法进行增量学习

在批量学习中，系统无法进行增量学习：它必须使用所有可用的数据进行训练。这通常会占用大量的时间和计算资源，因此通常需要离线完成。

离线学习：首先对系统进行训练，然后将其投入生产环境运行，就不再学习了。它只是应用它学到的东西。这称为离线学习。
模型腐烂/数据漂移：由于现实世界不断变化发展，而模型却保持不变，导致模型性能随着时间推移慢慢变差的现象。
解决模型腐烂的方案：定期根据最新的数据重新训练模型。重新训练的间隔次取决于用例，猫狗识别类性能衰减缓慢的模型可以间隔稍长，金融预测类性能衰减迅速的模型应该间隔较短。
批量学习的优缺点：
- 优点：数据量小时，重新训练、评估和启动机器学习系统的整个过程可以相当容易地自动化，效果较好
- 缺点：数据量大，或者训练资源占用大时，重新训练系统成本巨大

如果系统需要能够自动学习并且它的资源有限（例如，智能手机应用程序或火星上的漫游机器人），那么携带大量训练数据并占用大量资源来每天训练数小时是不太可能的。

在这些情况下，更好的选择是使用能够增量学习的算法。

2. 在线学习：进行增量学习

在在线学习中，通过以单独的数据或小批量的小组数据方式循序地向系统提供数据实例来对系统进行增量训练。每个学习步骤都既快速又便宜，因此系统可以即时学习新数据

在线学习的适用场景
- 需要快速适用变化的系统（金融、股票）
- 计算资源受限的设备
- 超大数据集：超出一台计算机的主存储器所能容纳的数据，需要用到核外学习
核外学习：(out-of-core)学习，该算法加载部分数据，在该数据上运行一个训练步骤，然后重复该过程，直到它在所有数据上运行完。核外学习通常是离线（即不在实时系统上）完成的
学习率：在线学习系统适应不断变化的数据的速度
- 学习率高：系统会快速适应新数据，但它也会很快忘记旧数据
- 学习率低：系统会有惰性，会学习得更慢，但它对新数据中的噪声或非典型数据点（异常值）序列的敏感度也会降低。
在线学习的挑战：如果将不良数据输入系统，系统的性能可能会迅速下降（取决于数据的质量和学习率）。为降低这种风险，你需要密切监控系统，并在检测到性能下降时立即关闭学习（并尽量恢复到之前的工作状态）。你可能还想监控输入数据并对异常数据做出反应。例如，使用异常检测算法。

1.4.3 泛化方法

对机器学习系统进行分类的另一种方法是根据它们的泛化方式。

大多数机器学习任务都与做出预测有关。这意味着在给定大量训练样例的情况下，系统需要能够对它以前未见到过的样例做出良好的预测（泛化）。在训练数据上有很好的性能是好的，但还不够，真正的目标是在新实例上表现良好。

泛化方法主要有两种：基于实例的学习和基于模型的学习。

1. 基于实例的学习

系统用心学习样例，然后通过使用相似性度量将它们与学习到的样例（或它们的子集）进行比较来泛化到新实例。

2. 基于模型的学习

为需要进行泛化的样例构建一个模型，然后使用该模型进行预测。这称为基于模型的学习。

代价函数：对于线性回归问题，人们通常使用代价函数来衡量线性模型的预测与训练样例之间的差距，目的在于最小化这个差距。

示例1-1：一个线性回归模型：Linear Regression

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from sklearn.linear_model import LinearRegression# 下载和准备数据
data_root ='https://github.com/ageron/data/raw/main/'
lifesat = pd.read_csv(data_root+'lifesat/lifesat.csv')
X = lifesat[["GDP per capita (USD)"]].values
Y = lifesat[["Life satisfaction"]].values# 可视化数据
lifesat.plot(kind='scatter',grid=True,x="GDP per capita (USD)",y="Life satisfaction")
plt.axis([23_500,62_500,4,9])
plt.show()# 选择线性模型
model = LinearRegression()# 训练模型
model.fit(X,Y)# 对Cyprus进行预测
X_new = [[37_655.2]]    #Cyprus的GDP（2020年）
print(model.predict(X_new)) # 输出[[6.30165767]]

输出结果：

[[6.30165767]]

在上述代码中，用k近邻回归替换线性回归模型：

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from sklearn.neighbors import KNeighborsRegressor# 下载和准备数据
data_root ='https://github.com/ageron/data/raw/main/'
lifesat = pd.read_csv(data_root+'lifesat/lifesat.csv')
X = lifesat[["GDP per capita (USD)"]].values
Y = lifesat[["Life satisfaction"]].values# 可视化数据
lifesat.plot(kind='scatter',grid=True,x="GDP per capita (USD)",y="Life satisfaction")
plt.axis([23_500,62_500,4,9])
plt.show()# 选择线性模型
model = KNeighborsRegressor(n_neighbors=3)# 训练模型
model.fit(X,Y)# 对Cyprus进行预测
X_new = [[37_655.2]]    #Cyprus的GDP（2020年）
print(model.predict(X_new)) # 输出

输出结果：

[[6.33333333]]

1.4.4 机器学习的典型步骤

研究数据
选择模型
使用训练数据进行训练（即学习算法搜索最小化代价函数的模型参数值）
应用模型对新实例进行预测（推断），目标是该模型能够很好地被泛化

1. 机器学习基本知识(2)——机器学习分类

1.4 机器学习分类 1.4.1 训练监督 1. 监督学习：已对训练数据完成标记分类：根据数据及其分类信息来进行训练，使模型能够对新的数据进行分类回归：给出一组特征值来预测目标数值 2. 无监督学习：没有对训练数据进行任…...

编程日记 2024/12/16 1:23:00

四叉树算法在游戏碰撞检测中的应用

简介在游戏开发中，碰撞检测是一个非常重要但计算成本较高的环节。如果采用简单的暴力检测方法，需要对场景中的每个物体与其他所有物体进行碰撞检测，时间复杂度为O(n)。四叉树(Quadtree)算法通过空间划分的方式，可以显著降低碰撞…...

编程日记 2024/12/16 1:15:54

IDEA 打包普通JAVA项目为jar包

需求：普通java项目（有添加依赖的jar包），没有用maven管理依赖和打包，要打成jar包，包可以用“java -jar 包名” 启动程序。讲如何打包前，先记录下普通项目的目录结构和怎么添加依赖包 1.目录结…...

编程日记 2024/12/16 1:14:53

Docker Compose 多应用部署一键部署

介绍 Docker Compose通过一个单独的docker-compose.yml模板文件(YAML格式)来定义一组相关联的应用容器，帮助我们实现多个相互关联的Docker容器的快速部署。如：springbootmysqlnginx 如果一个个去部署他会非常的麻烦，这时候可以选择Docker …...

编程日记 2024/12/16 1:13:49

.东方仙盟_小世界 {margin-top: 2%;padding: 0 3%;background: #fff; } .东方仙盟_小世界 li span {width: 55px;padding-left: 0px; }.东方仙盟_小世界 li span {display: block;position: absolute;left: 0px;padding-left: 10px;width: 55px;font-size: 16px;background-siz…...

编程日记 2024/12/16 1:07:43

人工智能大语言模型起源篇（二），从通用语言微调到驾驭LLM

上一篇：《人工智能大语言模型起源篇（一），从哪里开始》 （5）Howard 和 Ruder 于2018年发表的《Universal Language Model Fine-tuning for Text Classification》，https://arxiv.org/abs/1801.06…...

编程日记 2024/12/16 1:05:41

VBA 连续打印多个内容成PDF

VBA 连续打印多个内容成PDF Dim wb As Workbook Dim sht1 As Worksheet Set sht1 ActiveSheet PT ThisWorkbook.PathApplication.ScreenUpdating FalseApplication.DisplayAlerts FalseApplication.Calculation xlCalculationManual For i [aa2] To [ab2][ad2] iSet wb …...

编程日记 2024/12/16 1:04:40

9. 高效利用Excel设置归档Tag

高效利用Excel设置归档Tag 1. Excle批量新建/修改归档Tag2. 趋势记录模型批量导入归档Tag（Method1）2. 趋势记录模型批量导入归档Tag（Method2）3. 趋势记录控件1. Excle批量新建/修改归档Tag Fcatory Talk常常需要归档模拟量，对于比较大的项目工程会有成千上万个重要数据需…...

编程日记 2024/12/16 1:02:34

ubuntu系统生成SSL证书配置https

自签名【Lets Encrypt】的测试证书，有效期三个月。第一步：安装acme，如果没有安装git，需要提前安装下载came资源 git clone https://github.com/Neilpang/acme.sh.git 无法访问，可以试用gitee的资源，安…...

编程日记 2024/12/16 0:56:27

顺序表（数据结构初阶）

文章目录顺序表一：线性表1.1概念： 二：顺序表2.1概念与结构：2.2分类：2.2.1静态顺序表2.2.2动态顺序表 2.3动态顺序表的实现声明（初始化）检查空间容量尾插头插尾删头删查找指定位置之前插入数据指…...

编程日记 2024/12/16 0:54:21

AOF和RDB【Redis持久化篇】

文章目录 1.什么是持久化？2.RDB3.AOF 1.什么是持久化？ Redis是跑在内存里的，当程序重启或者服务器崩溃，数据就会丢失，如果业务场景希望重启之后数据还在，就需要持久化，即把数据保存到可永久保存…...

编程日记 2024/12/16 0:52:19

数据可视化大屏UI组件库：B端科技感素材PSD

在数据可视化领域，一个出色的大屏UI设计不仅能够准确传达数据背后的信息，更能提升用户的视觉体验。然而，对于UI设计师而言，设计这样一款界面往往面临着寻找合适设计素材的挑战。为了应对这一难题，我们推出了这款数据可…...

编程日记 2024/12/16 0:46:04

【力扣算法】234.回文链表

快慢指针：一个指针走两步，一个指针走一步，当快指针走到链表末尾时，慢指针走到中间位置。逆转链表：根据指针位置分成两个表，逆转第二个表。按序判断就可以，如果是相同就是回文，反之…...

编程日记 2024/12/16 0:45:01

MVC流程分析

DisaptcherServlet本质是servlet，执行init()方法，自启动底层执行代码， 作用： 1、读取springmvc配置文件，创建Controller对象，放入容器中，map<"id",对象> 2、接收用户请求&#…...

编程日记 2024/12/16 0:44:01

编程中常见的技术难题有哪些？

技术的未来：如何驾驭变革引言在科技迅猛发展的今天，变革已成为常态。你是否感受到这一波潮流的力量？我们正身处一个充满机遇与挑战的时代。诸如人工智能、区块链、云计算等技术如同狂风骤雨，席卷我们的生活与工作方式。那么&a…...

编程日记 2024/12/16 0:42:59

「Mac玩转仓颉内测版50」小学奥数篇13 - 动态规划入门

本篇将通过 Python 和 Cangjie 双语介绍动态规划的基本概念，并解决一个经典问题：斐波那契数列。学生将学习如何使用动态规划优化递归计算，并掌握编程中的重要算法思想。关键词小学奥数Python Cangjie动态规划斐波那契数列一、题目描述 …...

编程日记 2024/12/16 0:40:57

前端退出对话框也就是点击右上角的叉，显示灰色界面，已经解决

文章目录遇到一个前端bug，点击生成邀请码打开对话框然后我再点击叉号，退出对话框，虽然退出了对话框，但是显示灰色界面。如下图： 导致界面就会失效，点击任何地方都没有反应。发现是如下代码的问题&am…...

编程日记 2024/12/16 0:39:56

使div每次隐藏显示后都从顶部开始

<div ref"addmodel" >  </div> methods:{ // 页面显示时滚动至顶部 scrollToTop() { const addmodel this.$refs.addmodel; if (addmodel) { addmodel.scrollTop 0; } }, } 在div每次显示或者…...

编程日记 2024/12/16 0:36:54

资源付费软件开发资源付费系统源码资源付费类型小程序APP

应用场景资源付费软件广泛应用于多个领域，以下是其主要应用场景： 在线教育： 各类教育机构、名师通过资源付费软件提供课程、讲座等学习资源，为学生提供个性化的学习服务。用户可以通过软件学习专业知识、职业技能等&#xff0c…...

编程日记 2024/12/16 0:35:53

文件的读写

所涉及到的函数如下：<stdio.h> 函数介绍网站：cplusplus.com - The C Resources Network 读写文件之前要先打开文件，使用完要关闭文件归返空间： fopen 打开 fclose 关闭返回的是FILE*型，第一个参数是文…...

编程日记 2024/12/16 0:34:51

激光测距技术：从原理到选型的全方位指南

1. 激光测距技术的基本原理激光测距技术本质上是通过测量激光信号从发射到接收的时间或相位变化来计算距离。想象一下你在山谷里大喊一声，通过听到回声的时间差就能估算出对面山壁的距离，激光测距就是这个原理的"高科技版本"。只不过激光的速…...

编程新知 2026/4/6 4:14:39

AI摄影师助手：OpenClaw调用Qwen3-32B自动筛选与修图

AI摄影师助手：OpenClaw调用Qwen3-32B自动筛选与修图 1. 从手动修图到AI助手的转变作为一名摄影爱好者，我经常面临一个令人头疼的问题：每次拍摄结束后，相机里堆积如山的RAW文件需要花费大量时间筛选和后期处理。直到上个月&…...

编程新知 2026/4/6 2:02:15

探索MATLAB/Simulink下风光储电解制氢与氢燃料电池系统仿真模型

MATLAB/Simulink风光储电解制氢与用氢燃料电池系统仿真模型（风光伏耦合电解槽制氢和PEM燃料发电附参考文献电解槽和燃料电池都有水热管理模型光储电解制氢模型，电解槽恒功率制氢，光伏风机耦合PEM制氢，电解槽与燃料电池&#xf…...

编程新知 2026/4/6 1:23:41

网络基础面试题：简单谈谈你对CDN的理解？原理+流程图+通俗讲解

网络基础面试题：简单谈谈你对CDN的理解？原理流程图通俗讲解一、前言二、CDN 是什么？（一句话核心）三、为什么要用 CDN？四、CDN 工作流程图（最清晰）五、CDN 工作步骤（简单 …...

编程新知 2026/4/6 0:51:24

YOLOv11涨点改进| TPAMI 2025顶刊 |独家创新首发、Conv改进篇| 引入LPRM局部像素关系卷积模块，提升细节表达和边界定位能力，助力小目标检测、语义分割、图像分割、图像增强有效涨点

一、本文介绍 🔥本文给大家介绍使用 LPRM局部像素关系卷积模块改进YOLOv11网络模型，通过建模局部像素之间的关系对特征进行细化优化，使模型在特征融合或上采样阶段能够更好地恢复空间结构信息并增强区域间的上下文联系。其优势体现在能够提升细节表达和边界定位能力，增强…...

编程新知 2026/4/6 0:49:22

【2026年最新600套毕设项目分享】springboot河南特色美食分享系统（14338）

有需要的同学，源代码和配套文档领取，加文章最下方的名片哦一、项目演示项目演示视频二、资料介绍完整源代码（前后端源代码SQL脚本）配套文档（LWPPT开题报告/任务书）远程调试控屏包运行一键启动项目&…...

编程新知 2026/4/5 23:07:26

别再只盯着报点率了：聊聊电容触摸屏算法里那些不为人知的‘软实力’

电容触摸屏算法的隐秘战场：超越报点率的技术博弈在智能家居面板的清晨唤醒中，工业HMI产线的精准操控里，或是车载中控的流畅滑动间，电容触摸屏已成为人机交互的核心界面。当大多数技术选型讨论聚焦于报点率、触控精度这些硬指标时…...

编程新知 2026/4/5 20:28:26

价值：社会对劳动所产生的效用增量形成的局部共识

价值：社会对劳动所产生的效用增量形成的局部共识在探讨经济学和政治经济学的核心问题时，“价值是什么”始终是一个无法绕开的根本追问。传统马克思主义劳动价值论认为，商品的价值由生产它所耗费的“社会必要劳动时间”决定，这是一…...

编程新知 2026/4/5 19:02:50

多年研究图像增强算法，包括但不限于：retinex，gamma，clahe，滤波算法。如果有需要此方面的需要，可以找我哦，理论算法打包带走

多年研究图像增强算法，包括但不限于：retinex，gamma，clahe，滤波算法。如果有需要此方面的需要，可以找我哦，理论算法打包带走...

编程新知 2026/4/5 18:34:25

5步解锁AMD显卡AI潜能：ollama-for-amd本地化部署全指南

5步解锁AMD显卡AI潜能：ollama-for-amd本地化部署全指南【免费下载链接】ollama-for-amd Get up and running with Llama 3, Mistral, Gemma, and other large language models.by adding more amd gpu support. 项目地址: https://gitcode.com/gh_mirrors/ol/oll…...

编程新知 2026/4/5 18:15:54