当前位置: 首页 > news >正文

python学习第十四天之机器学习名词介绍

名词介绍

    • 1. 常用术语解释
    • 2.常见机器学习任务
    • 3. 机器学习常见算法
      • 1. 监督学习(Supervised Learning)
      • 2. 非监督学习(Unsupervised Learning)
      • 3.深度学习
      • 4.**对比总结**

1. 常用术语解释

  • 拟合(Fit):指将模型应用于训练数据,并通过训练调整模型的参数。model.fit(X_train, y_train),链接:
  • 预测(Predict):根据训练好的模型,对未知数据进行预测。model.predict(X_test)
  • 评估(Score):评估模型的性能,通常返回一个评分指标,例如准确率。model.score(X_test, y_test)
  • 交叉验证(Cross-validation):将数据集划分为多个子集,通过多次训练和验证,评估模型的稳定性和泛化能力。

2.常见机器学习任务

  • 回归问题:预测连续值的问题,例如预测房价根据房子的大小、位置等因素。这有点像尝试猜测一个不断移动的目标的确切位置。
  • 分类问题:就像给不同的水果分类一样,比如苹果、香蕉和橙子。在机器学习中,我们使用数据训练模型来识别对象属于哪一类。
  • 聚类问题:将相似的数据分组在一起,但不像分类那样提前知道类别。想象你有一堆没有标签的照片,需要把看起来相似的照片放在一起。
  • 降维问题:减少数据集中的特征数量,同时保留尽可能多的信息。就像是将一张高分辨率的照片压缩成低分辨率版本,但仍然保持照片的主要特征。

3. 机器学习常见算法

1. 监督学习(Supervised Learning)

一句话解释:就像老师教学生做题,数据自带“标准答案”,模型通过反复练习这些带答案的数据来学习规律。

举个栗子:

  • 你有一堆水果照片,每张照片都标好了名字(苹果、香蕉、橘子)。

  • 你让模型看这些照片和名字,学习怎么区分不同水果。

  • 学完后,给它一张新照片,它就能告诉你这是什么水果。

典型算法

  • 线性回归(Linear Regression)
  • 逻辑回归(Logistic Regression)
  • 支持向量机(SVM)
  • K-近邻算法(KNN)
  • 决策树(Decision Tree)
  • 随机森林(Random Forest)

常见用途:

  • 分类问题(判断是苹果还是香蕉)

  • 回归问题(预测房价、股票价格)

  • 例如:垃圾邮件识别、人脸识别、疾病诊断。

优点:

目标明确:因为有标准答案,模型学得快,结果容易评估。

效果直接:适合解决具体任务(比如预测或分类)。

缺点:

依赖标签:需要大量人工标注的数据(比如给每张图片标名字)。

成本高:标注数据费时费力,尤其是复杂任务(比如标100万张医疗影像)。

局限性强:只能学习已知标签的规律,无法发现新知识。

2. 非监督学习(Unsupervised Learning)

一句话解释:数据没有标准答案,模型自己“瞎琢磨”,找出数据中的隐藏规律或分组。

举个栗子:

  • 你有一堆水果照片,但没有任何标签(不知道名字)。

  • 你让模型自己看这些照片,它可能根据颜色、形状把水果分成几类。

  • 分完后,你发现它把红的归为一类(苹果)、长的归为一类(香蕉),虽然它不知道这些名字。

典型算法

  • K-均值聚类(K-Means Clustering)
  • 主成分分析(PCA)

常见用途:

  • 聚类(自动分组,比如用户分群)

  • 降维(简化数据,比如把100个特征压缩成3个)

  • 例如:推荐系统、社交网络分析、异常检测。

优点:

  • 无需标签:直接处理原始数据,省去标注成本。

  • 探索性强:能发现数据中隐藏的模式(比如用户行为分组)。

  • 灵活:适合没有明确目标的场景(比如数据探索)。

缺点:

  • 结果不明确:分组的含义可能需要人工解释(比如模型分的类到底代表什么)。

  • 评估困难:因为没有标准答案,很难量化模型效果。

  • 可能跑偏:如果数据本身没规律,模型可能得出无意义的结论。

3.深度学习

一句话总结:像人脑神经网络的超级加强版,用多层“神经元”处理复杂数据。

核心特点:

  • 多层神经网络:通过多层的计算单元(神经元)逐步提取数据特征。

  • 自动学习特征:无需手动设计特征,模型自己从数据中学习(比如从像素到猫脸)。

  • 适合复杂任务:如图像、语音、自然语言处理。

例子:

  • 图像识别:人脸识别、自动驾驶中的物体检测。

  • 语音助手:Siri、小爱同学的语音转文字。

  • 机器翻译:把中文翻译成英文。

常见用途:

  • 卷积神经网络(CNN):专攻图像处理(如识别猫狗)。

  • 循环神经网络(RNN):处理序列数据(如文本、语音)。

  • 生成对抗网络(GAN):生成逼真的图片或视频(比如AI绘画)。

  • Transformer:处理自然语言(如ChatGPT)。

4.对比总结

类型是否需要标签典型任务例子适合场景
监督学习需要预测、分类、回归房价预测、垃圾邮件分类有明确答案的任务
非监督学习不需要聚类、降维、关联分析用户分群、数据压缩探索数据中的隐藏规律
深度学习可监督或非监督复杂模式识别图像识别、自然语言处理处理高维度、非结构化的复杂数据

生活化比喻

  • 监督学习:像考试复习,老师给你一本带答案的习题集,你通过反复做题学会解题方法

  • 非监督学习:像自己整理笔记,没有答案,你通过观察知识点之间的联系,总结出章节结构

  • 深度学习:像培养一个天才儿童,通过大量练习(数据)和复杂的大脑(多层网络),学会解决超级难题(比如下围棋、画画)

总结

  • 监督学习:解决“有答案”的问题,比如预测和分类。

  • 非监督学习:解决“找规律”的问题,比如分群和简化数据。

  • 深度学习:解决“复杂模式”的问题,依赖多层网络自动学习特征。
    三者常结合使用,例如:先用非监督学习分群,再对每个群用监督学习预测;深度学习模型(如CNN)本身可以用于监督或非监督任务。

怎么选?

  • 如果你有明确的预测目标,且能拿到标注数据 → 监督学习。
  • 如果你只想探索数据规律,或者标注数据太贵 → 非监督学习。

相关文章:

python学习第十四天之机器学习名词介绍

名词介绍 1. 常用术语解释2.常见机器学习任务3. 机器学习常见算法1. 监督学习(Supervised Learning)2. 非监督学习(Unsupervised Learning)3.深度学习4.**对比总结** 1. 常用术语解释 拟合(Fit)&#xff1…...

天津三石峰科技——汽车生产厂的设备振动检测项目案例

汽车产线有很多传动设备需要长期在线运行,会出现老化、疲劳、磨损等 问题,为了避免意外停机造成损失,需要加装一些健康监测设备,监测设备运 行状态。天津三石峰科技采用 12 通道振动信号采集卡(下图 1)对…...

汽车与AI深度融合:CES Asia 2025前瞻

在科技飞速发展的当下,汽车与AI的融合正成为行业变革的关键驱动力。近日,吉利、极氪、岚图、智己等多家车企纷纷官宣与DeepSeek模型深度融合,其中岚图知音更是将成为首个搭载该模型的量产车型,这无疑是汽车智能化进程中的重要里程…...

前端实现 GIF 图片循环播放

前言 使用 img 加载 GIF 图片,内容只会播放一次,之后就会自动暂停; 通过定时器在一段时间后重新加载图片的方式,会导致浏览器内存不断增大,并且可能会有闪烁、卡顿的问题; ImageDecoder WebCodecs API 的…...

React - 事件绑定this

在 React 中,this 的绑定是一个常见问题,尤其在类组件中使用事件处理函数时。JavaScript 中的 bind 函数用于设置函数调用时 this 的值。 bind 函数的作用 bind() 方法创建一个新的函数,当被调用时,其 this 关键字被设置为提供的…...

STM32系统架构介绍

STM32系统架构 1. CM3/4系统架构2. CM3/4系统架构-----存储器组织结构2.1 寄存器地址映射(特殊的存储器)2.2 寄存器地址计算2.3 寄存器的封装 3. CM3/4系统架构-----时钟系统 STM32 和 ARM 以及 ARM7是什么关系? ARM 是一个做芯片标准的公司&#xff0c…...

Macbook Pro快速搭建Easysearch学习环境

在学习过程中,我们有时身边没有可用的服务器,这时就需要借助自己的 Mac 来安装和学习 Easysearch。然而,Easysearch 官网并未提供 Mac 版本的安装教程,下面我将详细整理我在 Mac 上安装和使用 Easysearch 的折腾经历。 Easysearc…...

老游戏回顾:SWRacer

竞速类游戏里,我很怀念它。 虽然已经25年过去了。 相比之下,别的游戏真的没法形容。 ---- 是LucasArts制作的一款赛车竞速游戏; 玩家要扮演一名银河旅行者参加各种赛车比赛,赢得奖金,在经历了八个不同星球上的24场…...

Firefox无法隐藏标题栏

Openbox 窗管 Firefox 无法隐藏标题栏。 深度Linux安装火狐,Linux(deepin) 下隐藏 Firefox 标题栏-CSDN博客 需要在 desktop 的 exec 中增加环境变量: Execenv MOZ_GTK_TITLEBAR_DECORATIONclient firefox...

vue基础(五)

Vue 实例在创建、挂载、更新、销毁的过程中会触发一系列的生命周期钩子(Lifecycle Hooks),让开发者可以在不同阶段执行逻辑。 1. Vue 2 生命周期完整流程 生命周期的四个主要阶段 创建阶段(Creation)挂载阶段&#…...

MySQL的深度分页如何优化?

大家好,我是锋哥。今天分享关于【MySQL的深度分页如何优化?】面试题。希望对大家有帮助; MySQL的深度分页如何优化? 1000道 互联网大厂Java工程师 精选面试题-Java资源分享网 MySQL的深度分页(即跳过大量数据后进行分…...

深度学习每周学习总结R6(RNN实现阿尔茨海默病诊断)

🍨 本文为🔗365天深度学习训练营 中的学习记录博客R8中的内容,为了便于自己整理总结起名为R6🍖 原作者:K同学啊 | 接辅导、项目定制 目录 0. 总结1. 数据集介绍2. 数据预处理3. 模型构建4. 初始化模型及优化器5. 训练函…...

Node.js 多模态图像描述服务 调用siliconflow:现代 JavaScript 实践

Node.js 多模态图像描述服务:现代 JavaScript 实践 项目背景 本项目使用 Node.js 和 TypeScript 实现一个高性能的图像描述微服务,展示 JavaScript 在多模态 AI 应用中的强大能力。 技术栈 Node.jsTypeScriptExpress.jsOpenAI APIdotenvRxJS (可选&a…...

机器学习数学基础:21.特征值与特征向量

一、引言 在现代科学与工程的众多领域中,线性代数扮演着举足轻重的角色。其中,特征值、特征向量以及相似对角化的概念和方法,不仅是线性代数理论体系的核心部分,更是解决实际问题的有力工具。无论是在物理学中描述系统的振动模式…...

【目标检测json2txt】label从COCO格式json文件转YOLO格式txt文件

目录 🍀🍀1.COCO格式json文件 🌷🌷2.YOLO格式txt文件 💖💖3.xml2json代码(python) 🐸🐸4.输入输出展示 🙋🙋4.1输入json 🍂🍂4.2输出txt 整理不易,欢迎一键三连!!! 送你们一条美丽的--分割线-- 🍀🍀1.COCO格式json文件 COCO数…...

强化学习之 PPO 算法:原理、实现与案例深度剖析

目录 一、引言二、PPO 算法原理2.1 策略梯度2.2 PPO 核心思想 三、PPO 算法公式推导3.1 重要性采样3.2 优势函数估计 四、PPO 算法代码实现(以 Python 和 PyTorch 为例)五、PPO 算法案例应用5.1 机器人控制5.2 自动驾驶 六、总结 一、引言 强化学习作为…...

vue-点击生成动态值,动态渲染回显输入框

1.前言 动态点击生成数值&#xff0c;回显输入框&#xff0c;并绑定。 2.实现 <template><div style"display:flex;align-items: center;flex-direction:row"><a-input:key"inputKey"v-model"uploadData[peo.field]"placehold…...

高性能 :OpenAI Triton Open-source GPU programming Language LINUX 环境配置

目录 配置triton环境cudabuild-essential带有pip的python环境直接安装pipanaconda 安装 triton 环境pip install tritonpip install torch 运行test示例vector-add.pylaunch.json 配置triton环境 cuda wget http://developer.download.nvidia.com/compute/cuda/11.0.2/local_…...

TCP 端口号为何位于首部前四个字节?协议设计的智慧与启示

知乎的一个问题很有意思&#xff1a;“为什么在TCP首部中要把TCP的端口号放入最开始的四个字节&#xff1f;” 这种问题很适合我这种搞历史的人&#xff0c;大年初一我给出了一个简短的解释&#xff0c;但仔细探究这个问题&#xff0c;我们将会获得 TCP/IP 被定义的过程。 文…...

HTML之JavaScript函数声明

HTML之JavaScript函数声明 1. function 函数名(){}2. var 函数名 function(){}<!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1…...

黑马Mybatis

Mybatis 表现层&#xff1a;页面展示 业务层&#xff1a;逻辑处理 持久层&#xff1a;持久数据化保存 在这里插入图片描述 Mybatis快速入门 ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/6501c2109c4442118ceb6014725e48e4.png //logback.xml <?xml ver…...

STM32F4基本定时器使用和原理详解

STM32F4基本定时器使用和原理详解 前言如何确定定时器挂载在哪条时钟线上配置及使用方法参数配置PrescalerCounter ModeCounter Periodauto-reload preloadTrigger Event Selection 中断配置生成的代码及使用方法初始化代码基本定时器触发DCA或者ADC的代码讲解中断代码定时启动…...

将对透视变换后的图像使用Otsu进行阈值化,来分离黑色和白色像素。这句话中的Otsu是什么意思?

Otsu 是一种自动阈值化方法&#xff0c;用于将图像分割为前景和背景。它通过最小化图像的类内方差或等价地最大化类间方差来选择最佳阈值。这种方法特别适用于图像的二值化处理&#xff0c;能够自动确定一个阈值&#xff0c;将图像中的像素分为黑色和白色两类。 Otsu 方法的原…...

ffmpeg(四):滤镜命令

FFmpeg 的滤镜命令是用于音视频处理中的强大工具&#xff0c;可以完成剪裁、缩放、加水印、调色、合成、旋转、模糊、叠加字幕等复杂的操作。其核心语法格式一般如下&#xff1a; ffmpeg -i input.mp4 -vf "滤镜参数" output.mp4或者带音频滤镜&#xff1a; ffmpeg…...

反射获取方法和属性

Java反射获取方法 在Java中&#xff0c;反射&#xff08;Reflection&#xff09;是一种强大的机制&#xff0c;允许程序在运行时访问和操作类的内部属性和方法。通过反射&#xff0c;可以动态地创建对象、调用方法、改变属性值&#xff0c;这在很多Java框架中如Spring和Hiberna…...

Robots.txt 文件

什么是robots.txt&#xff1f; robots.txt 是一个位于网站根目录下的文本文件&#xff08;如&#xff1a;https://example.com/robots.txt&#xff09;&#xff0c;它用于指导网络爬虫&#xff08;如搜索引擎的蜘蛛程序&#xff09;如何抓取该网站的内容。这个文件遵循 Robots…...

解决本地部署 SmolVLM2 大语言模型运行 flash-attn 报错

出现的问题 安装 flash-attn 会一直卡在 build 那一步或者运行报错 解决办法 是因为你安装的 flash-attn 版本没有对应上&#xff0c;所以报错&#xff0c;到 https://github.com/Dao-AILab/flash-attention/releases 下载对应版本&#xff0c;cu、torch、cp 的版本一定要对…...

鸿蒙DevEco Studio HarmonyOS 5跑酷小游戏实现指南

1. 项目概述 本跑酷小游戏基于鸿蒙HarmonyOS 5开发&#xff0c;使用DevEco Studio作为开发工具&#xff0c;采用Java语言实现&#xff0c;包含角色控制、障碍物生成和分数计算系统。 2. 项目结构 /src/main/java/com/example/runner/├── MainAbilitySlice.java // 主界…...

MySQL账号权限管理指南:安全创建账户与精细授权技巧

在MySQL数据库管理中&#xff0c;合理创建用户账号并分配精确权限是保障数据安全的核心环节。直接使用root账号进行所有操作不仅危险且难以审计操作行为。今天我们来全面解析MySQL账号创建与权限分配的专业方法。 一、为何需要创建独立账号&#xff1f; 最小权限原则&#xf…...

Redis的发布订阅模式与专业的 MQ(如 Kafka, RabbitMQ)相比,优缺点是什么?适用于哪些场景?

Redis 的发布订阅&#xff08;Pub/Sub&#xff09;模式与专业的 MQ&#xff08;Message Queue&#xff09;如 Kafka、RabbitMQ 进行比较&#xff0c;核心的权衡点在于&#xff1a;简单与速度 vs. 可靠与功能。 下面我们详细展开对比。 Redis Pub/Sub 的核心特点 它是一个发后…...