当前位置: 首页 > news >正文

1. 机器学习基本知识(5)——练习题(1)

1.7 🐦‍🔥练习题(本章重点回顾与总结)

0.回答格式约定:

对于书本内容的回答,将优先寻找书本内容作为答案进行回答。


书本内容回答完毕后,将对问题进行补充回答,上面分割线作为两个答案的分界。

参考答案请见这篇👉1. 机器学习基本知识(5)——练习题(参考答案)

回答完一个问题,将用以下的100%长实线分割线来作为两个问题的分界。


1.如何定义机器学习?

本书定义:

机器学习是一门通过编程让计算机从数据中进行学习的科学(和艺术)。

通用定义:

机器学习是一个研究领域让计算机无须进行明确编程就具备学习能力。—亚瑟·塞缪尔(Arthur Samuel),1959

工程化定义:

一个计算机程序利用经验E来学习任务T,性能是P,如果针对任务T的性能P随着经验E不断增长,则称为机器学习。—汤姆·米切尔(Tom Mitchell),1997


机器学习是一种人工智能的分支,它使计算机系统能够利用数据和算法自动学习和改进其性能。在机器学习中,计算机算法不是通过显式编程来执行特定任务,而是通过使用样本数据(即训练数据)来“学习”如何执行任务。这些数据包含了输入和期望的输出,算法会分析这些数据并找出完成任务的模式或规则。

简单来说,机器学习涉及以下几个关键步骤:

  1. 数据收集:收集用于训练模型的数据。
  2. 数据预处理:清洗和准备数据,使其适合用于训练。
  3. 模型选择:选择一个合适的机器学习算法或模型。
  4. 训练:使用训练数据来训练模型,使其能够识别数据中的模式。
  5. 评估:使用验证集或测试集来评估模型的性能。
  6. 优化:根据评估结果调整模型参数以提高性能。
  7. 预测:使用训练好的模型对新数据进行预测。

机器学习可以进一步分为监督学习、无监督学习、半监督学习和强化学习等类型,每种类型适用于不同的问题和数据类型。


2.机器学习在哪些问题上表现突出,你能说出四类应用吗?

机器学习的适用领域:

  • 现有解决方案需要有大量微调或一长串规则来解决的问题(机器学习模型通常可以简化代码并且比传统方法执行得更好)。
  • 使用传统方法无法解决的复杂问题(最好的机器学习技术可能会找到解决方案)。
  • 变化的环境(机器学习系统可以很容易地根据新数据重新训练,始终保持最新状态)。
  • 深入了解复杂问题和大量数据。

应用:

名称类型详细
让应用程序对语音命令做出反应语音识别需要处理音频样本:由于它们是很长、很复杂的序列,因此通常使用RNN、CNN或Transformer进行处理
分析生产线上的产品图像来对产品进行自动分类图像分类卷积神经网络(CNN)、Transformer
通过脑部扫描发现肿瘤语义图像分割CNN或Transformer
根据许多绩效指标来预测公司下一年的收入回归/预测线性回归或多项式回归模型、支持向量机、随机森林或人工神经网络。如果考虑过去的绩效指标,可能需要使用RNN、CNN或Transformer

相对于传统的解决问题方案,机器学习方法具有以下几个突出的地方:

  1. 数据驱动的预测问题:机器学习方法特别擅长处理可以通过数据分析和模式识别来优化决策或预测的问题。这包括分类问题(如垃圾邮件识别)、回归问题(如房价预测)和时间序列预测(如天气预测)。

  2. 自动化和预测能力:机器学习算法通过对数据的学习和模式识别,可以自动化地进行预测和决策。这种能力使得算法可以应用于各种实际问题,如需求预测、风险评估、推荐系统等,帮助人们做出更准确的预测和决策。

  3. 复杂关系的建模:许多实际问题涉及到大量的数据和复杂的关系。机器学习算法能够从数据中学习规律,并建立模型来描述数据之间的复杂关系。这样可以更好地理解问题背后的本质,并为解决问题提供指导。

  4. 大规模数据处理:随着数据的快速增长,传统的手工分析和处理变得困难和低效。机器学习算法具有处理大规模数据的能力,可以高效地从海量数据中提取有用的信息和知识。这对于实际问题的解决非常重要,因为它可以加快处理速度、发现隐藏的模式和趋势。

  5. 持续优化:机器学习模型可以基于数据自我学习和迭代,持续地发挥价值。这意味着随着时间的推移和数据的积累,模型可以不断优化,提高其预测或决策的准确性。

  6. 处理高复杂度模型构建:机器学习方法,尤其是深度学习,能够构建和训练高复杂度的模型,这些模型在图像识别、自然语言处理等领域表现出色。

  7. 实时数据处理与预测:机器学习方法可以用于实时数据处理和预测,这对于需要快速响应的应用场景(如股票市场预测、实时推荐系统)至关重要。

  8. 跨模态任务处理能力:深度学习作为机器学习的一个子集,能够处理更复杂的输入,适配各种各样的任务,包括跨模态任务,如文生图、图生文、文生音、文生视频等,这是传统机器学习方法难以比拟的。

  9. 模型的泛化能力:机器学习方法,尤其是深度学习,在相同任务下(以分类为例)的准确度更高,泛化性更强,能够更好地适应未见过的数据。

  10. 算法的多样性和集成学习:机器学习融合了各种学习方法,且形式多样的集成学习系统研究正在兴起,这为解决复杂问题提供了更多的工具和方法。

综上所述,机器学习方法在处理大规模数据、自动化预测、复杂关系建模、持续优化、高复杂度模型构建、实时数据处理、跨模态任务处理以及算法多样性方面具有突出的优势。

机器学习在多个领域表现出色,有如下的应用:

  1. 推荐系统:机器学习被广泛应用于推荐系统中,如电商网站的商品推荐、社交媒体的内容推荐等。通过分析用户的历史行为和偏好,机器学习算法可以预测用户可能感兴趣的内容,并提供个性化的推荐。

  2. 自然语言处理:自然语言处理是机器学习的另一个重要应用领域,包括语音识别、机器翻译、情感分析、垃圾邮件过滤等。机器学习算法可以帮助计算机理解和生成人类语言,实现人机交互的智能化。

  3. 图像识别和处理:机器学习在图像识别和处理方面也发挥着重要作用,如人脸识别、车牌识别、图像检索、物体识别等。通过训练大量的图像数据,机器学习算法可以学习并识别出图像中的特征,从而实现对图像的智能处理。

  4. 金融和保险:机器学习在金融和保险领域也有广泛的应用,如信用评估、欺诈检测、风险管理等。通过分析大量的金融数据,机器学习算法可以帮助金融机构更好地评估风险和制定策略。

  5. 医疗和生物科学:机器学习在医疗和生物科学领域也有重要的应用,如医学影像分析、药物研发、基因分析等。机器学习算法可以帮助医生更准确地诊断疾病和制定治疗方案,同时也可以帮助科研人员更好地理解和研究生物科学问题。

  6. 自动驾驶:自动驾驶汽车是机器学习的重要应用场景之一。通过使用计算机视觉和深度学习等技术,自动驾驶汽车能够识别路况、障碍物和交通信号,从而实现自主驾驶。

  7. 智能客服:智能客服是机器学习在客服领域的运用。通过自然语言处理和深度学习技术,智能客服能够理解用户的问题,并提供准确的答案。

  8. 语音识别与合成:语音识别与合成是机器学习在语音技术方面的应用。通过训练大量的语音数据,机器学习模型能够实现语音识别和语音合成功能。

  9. 机器人技术:机器学习技术可以帮助机器人更好地与人类交互,并完成更复杂的任务。

  10. 智能家居:机器学习技术可以帮助智能家居系统实现自动化的家居控制和节能管理等功能。

这些应用场景展示了机器学习在处理复杂问题、需要大量数据和持续优化的场景中的突出表现。随着技术的不断发展,机器学习的应用前景将更加广阔。


3.什么是被标记的训练集?

被标记的训练集是指在机器学习中,每个实例都有对应的标签或输出结果的数据集。

这些数据集用于监督学习,即利用已知类别的样本来训练模型,使其能够学习如何对新的数据进行分类或预测。在被标记的训练集中,每个样本都包括输入数据和对应的正确输出标签,这样模型就可以通过比较预测输出和实际标签来学习并调整其参数。

这种类型的数据集对于训练分类器和回归模型至关重要,因为它们提供了模型需要学习的“正确答案”。简而言之,被标记的训练集是监督学习中的核心,它使得模型能够通过实例学习并泛化到新的、未见过的数据上。


4.最常见的两种监督学习任务是什么?

分类和回归

最常见的两种监督学习任务是回归(Regression)和分类(Classification)。

  • 回归任务的目标是预测连续值,例如预测房价、股票价格等。

  • 分类任务的目标是将输入数据分配到离散类别中,例如垃圾邮件检测、疾病诊断等。


5.你能说出四种常见的无监督学习任务吗?

  1. 聚类:在大量数据中找到一些关联,并将其分类

  2. 可视化算法:提供大量复杂、未标记的数据,使用算法绘制其2D或3D表示,以尽可能保留其结构

  3. 降维:在不丢失太多信息情况下简化数据

  4. 异常检测:系统在训练期间主要使用正常实例,因此它会学习识别它们。然后,当看到一个新实例时,系统可以判断这个新实例看起来是正常的还是异常的

  5. 关联规则学习:目标是挖掘大量数据并发现属性之间有趣的关系


四种常见的无监督学习任务包括:

  1. 聚类(Clustering):聚类任务的目标是将数据分成多个组或簇,使得同一组内的数据点彼此相似,而不同组之间的数据点差异较大。常见的聚类算法包括K均值聚类(K-Means Clustering)、层次聚类(Hierarchical Clustering)、DBSCAN等。

  2. 降维(Dimensionality Reduction):降维任务的目标是将高维数据映射到低维空间,同时尽可能保留原始数据的重要信息。常见的降维方法有主成分分析(PCA)和t-SNE等。

  3. 关联规则挖掘(Association Rule Mining):关联规则挖掘用于发现数据集中项之间的关联和频繁项集。这些规则描述了数据集中不同项之间的关联性,通常在市场篮子分析、购物推荐等方面应用广泛。

  4. 异常检测(Anomaly Detection):异常检测用于识别与大多数样本不同的罕见或异常数据点。它在检测异常事件、欺诈检测、故障检测等领域有着重要的应用。


相关文章:

1. 机器学习基本知识(5)——练习题(1)

1.7 🐦‍🔥练习题(本章重点回顾与总结) 0.回答格式约定: 对于书本内容的回答,将优先寻找书本内容作为答案进行回答。 书本内容回答完毕后,将对问题进行补充回答,上面分割线作为两个…...

vue 自定义组件image 和 input

本章主要是介绍自定义的组件:WInput:这是一个验证码输入框,自动校验,输入完成回调等;WImage:这是一个图片展示组件,集成了缩放,移动等操作。 目录 一、安装 二、引入组件 三、使用…...

系列3:基于Centos-8.6 Kubernetes使用nfs挂载pod的应用日志文件

每日禅语 古代,一位官员被革职遣返,心中苦闷无处排解,便来到一位禅师的法堂。禅师静静地听完了此人的倾诉,将他带入自己的禅房之中。禅师指着桌上的一瓶水,微笑着对官员说:​“你看这瓶水,它已经…...

Jfinal项目整合Redis

1、引入相关依赖 <!-- https://mvnrepository.com/artifact/redis.clients/jedis --> <dependency><groupId>redis.clients</groupId><artifactId>jedis</artifactId><version>2.9.0</version> </dependency><depen…...

在Ubuntu服务器上备份文件到自己的百度网盘

文章目录 概述安装bypy同步文件定时任务脚本 概述 之前自购了一台阿里云服务器&#xff0c;系统镜像为Ubuntu 22.04&#xff0c; 并且搭建了LNMP开发环境&#xff08;可以参考&#xff1a;《Ubuntu搭建PHP开发环境操作步骤(保姆级教程)》&#xff09;。由于项目运行中会产生附…...

Unity 模板测试透视效果(URP)

可以实现笼中窥梦和PicoVR中通过VST局部透视效果。 使用到的Shader: Shader "Unlit/StencilShader" {Properties{[IntRange]_Index("Stencil Index",Range(0,255))0}SubShader{Tags{"RenderType""Opaque""Queue""Geo…...

《计算机视觉证书:开启职业发展新航道》

一、引言 在当今科技飞速发展的时代&#xff0c;计算机视觉技术正以惊人的速度改变着我们的生活和工作方式。从智能手机的人脸识别解锁到自动驾驶汽车的环境感知&#xff0c;计算机视觉技术的应用无处不在。而计算机视觉证书作为这一领域的专业认证&#xff0c;其作用愈发凸显…...

.NET6 WebApi第1讲:VSCode开发.NET项目、区别.NET5框架【两个框架启动流程详解】

一、使用VSCode开发.NET项目 1、创建文件夹&#xff0c;使用VSCode打开 2、安装扩展工具 1>C# 2>安装NuGet包管理工具&#xff0c;外部dll包依靠它来加载 法1》&#xff1a;NuGet Gallery&#xff0c;注意要启动科学的工具 法2》NuGet Package Manager GUl&#xff0c…...

Git-分布式版本控制工具

目录 1. 概述 1. 1集中式版本控制工具 1.2分布式版本控制工具 2.Git 2.1 git 工作流程 1. 概述 在开发活动中&#xff0c;我们经常会遇到以下几个场景&#xff1a;备份、代码回滚、协同开发、追溯问题代码编写人和编写时间&#xff08;追责&#xff09;等。备份的话是为了…...

C++ 第10章 对文件的输入输出

https://www.bilibili.com/video/BV1cx4y1d7Ut/?p147&spm_id_from333.1007.top_right_bar_window_history.content.click&vd_sourcee8984989cddeb3ef7b7e9fd89098dbe8 &#x1f341;&#x1f341;&#x1f341;本篇为贺宏宏老师C语言视频教程文件输入输出部分笔记整理…...

【机器学习】手写数字识别的最优解:CNN+Softmax、Sigmoid与SVM的对比实战

一、基于CNNSoftmax函数进行分类 1数据集准备 2模型设计 3模型训练 4模型评估 5结果分析 二、 基于CNNsigmoid函数进行分类 1数据集准备 2模型设计 3模型训练 4模型评估 5结果分析 三、 基于CNNSVM进行分类 1数据集准备 2模型设计 3模型训练 4模型评估 5结果分…...

android 聊天界面键盘、表情切换丝滑

1、我们在聊天页面时候&#xff0c;往往会遇到&#xff0c;键盘、表情、其他选择切换时候页面会出现掉下来再弹起问题&#xff0c;这是因为&#xff0c;我们切换时候&#xff0c;键盘异步导致内容View高度变化&#xff0c;页面掉下来后&#xff0c;又被其他内容顶起这种很差视觉…...

Web项目图片视频加载缓慢/首屏加载白屏

Web项目图片视频加载缓慢/首屏加载白屏 文章目录 Web项目图片视频加载缓慢/首屏加载白屏一、原因二、 解决方案2.1、 图片和视频的优化2.1.1、压缩图片或视频2.1.2、 选择合适的图片或视频格式2.1.3、 使用图片或视频 CDN 加速2.1.4、Nginx中开启gzip 三、压缩工具推荐 一、原因…...

关于Git分支合并,跨仓库合并方式

关于Git合并代码的方式说明 文章目录 关于Git合并代码的方式说明前情提要开始合并方式一&#xff1a;git merge方式二&#xff1a;git cherry-pick方式三&#xff1a;git checkout Git跨仓库合并的准备事项前提拉取源仓库代码 前情提要 同仓库不同分支代码的合并可直接往下看文…...

[网络] UDP协议16位校验和

16位校验和是udp报头中的一个字段,绝大多数的教材和网课都会忽略这个字段,不去细究,我闲的蛋疼问了问ai,得到了一个答案,故作此文,以证明我爱学习之心惊天地泣鬼神(狗头 ai的回答 仅从作用来说,它会根据整个应用层报文进行运算,生成一个准确的数字,这个数字不能保证唯一性,但根…...

Vue 3 中的 `update:modelValue` 事件详解

在 Vue 3 中&#xff0c;update:modelValue​ 事件通常与 v-model​ 指令一起使用&#xff0c;以实现自定义组件的双向数据绑定。以下是对该事件的详细分析&#xff1a; 事件定义 首先&#xff0c;我们需要在组件中定义 update:modelValue​ 事件。可以使用 defineEmits​ 函…...

vue3+vite+ts 使用webrtc-streamer播放海康rtsp监控视频

了解webrtc-streamer webrtc-streamer 是一个使用简单机制通过 WebRTC 流式传输视频捕获设备和 RTSP 源的项目&#xff0c;它内置了一个小型的 HTTP server 来对 WebRTC需要的相关接口提供支持。相对于ffmpegflv.js的方案&#xff0c;延迟降低到了0.4秒左右&#xff0c;画面的…...

QT数据库(四):QSqlRelationalTableModel 类

关系数据库概念 例如下列departments、majors、studInfo 这 3 个数据表之间存在关系。 主键与外键 标记“**”的是主键字段&#xff0c;标记“*”的是外键字段。主键字段是一个数据表中表示记录唯一性的字段&#xff0c;例如 studInfo 数据表中的 studID 字段。外键字段是与其…...

蓝桥杯刷题——day5

蓝桥杯刷题——day5 题目一题干解题思路一代码解题思路二代码 题目二题干解题思路代码 题目一 题干 给定n个整数 a1,a2,⋯ ,an&#xff0c;求它们两两相乘再相加的和&#xff0c;即&#xff1a; 示例一&#xff1a; 输入&#xff1a; 4 1 3 6 9 输出&#xff1a; 117 题目链…...

YOLO11改进-模块-引入多尺度差异融合模块MDFM

遥感变化检测&#xff08;RSCD&#xff09;专注于识别在不同时间获取的两幅遥感图像之间发生变化的区域。近年来&#xff0c;卷积神经网络&#xff08;CNN&#xff09;在具有挑战性的 RSCD 任务中展现出了良好的效果。然而&#xff0c;这些方法未能有效地融合双时相特征&#x…...

C++实现分布式网络通信框架RPC(3)--rpc调用端

目录 一、前言 二、UserServiceRpc_Stub 三、 CallMethod方法的重写 头文件 实现 四、rpc调用端的调用 实现 五、 google::protobuf::RpcController *controller 头文件 实现 六、总结 一、前言 在前边的文章中&#xff0c;我们已经大致实现了rpc服务端的各项功能代…...

从WWDC看苹果产品发展的规律

WWDC 是苹果公司一年一度面向全球开发者的盛会&#xff0c;其主题演讲展现了苹果在产品设计、技术路线、用户体验和生态系统构建上的核心理念与演进脉络。我们借助 ChatGPT Deep Research 工具&#xff0c;对过去十年 WWDC 主题演讲内容进行了系统化分析&#xff0c;形成了这份…...

鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个医院查看报告小程序

一、开发环境准备 ​​工具安装​​&#xff1a; 下载安装DevEco Studio 4.0&#xff08;支持HarmonyOS 5&#xff09;配置HarmonyOS SDK 5.0确保Node.js版本≥14 ​​项目初始化​​&#xff1a; ohpm init harmony/hospital-report-app 二、核心功能模块实现 1. 报告列表…...

mysql已经安装,但是通过rpm -q 没有找mysql相关的已安装包

文章目录 现象&#xff1a;mysql已经安装&#xff0c;但是通过rpm -q 没有找mysql相关的已安装包遇到 rpm 命令找不到已经安装的 MySQL 包时&#xff0c;可能是因为以下几个原因&#xff1a;1.MySQL 不是通过 RPM 包安装的2.RPM 数据库损坏3.使用了不同的包名或路径4.使用其他包…...

短视频矩阵系统文案创作功能开发实践,定制化开发

在短视频行业迅猛发展的当下&#xff0c;企业和个人创作者为了扩大影响力、提升传播效果&#xff0c;纷纷采用短视频矩阵运营策略&#xff0c;同时管理多个平台、多个账号的内容发布。然而&#xff0c;频繁的文案创作需求让运营者疲于应对&#xff0c;如何高效产出高质量文案成…...

Java数值运算常见陷阱与规避方法

整数除法中的舍入问题 问题现象 当开发者预期进行浮点除法却误用整数除法时,会出现小数部分被截断的情况。典型错误模式如下: void process(int value) {double half = value / 2; // 整数除法导致截断// 使用half变量 }此时...

Vite中定义@软链接

在webpack中可以直接通过符号表示src路径&#xff0c;但是vite中默认不可以。 如何实现&#xff1a; vite中提供了resolve.alias&#xff1a;通过别名在指向一个具体的路径 在vite.config.js中 import { join } from pathexport default defineConfig({plugins: [vue()],//…...

通过 Ansible 在 Windows 2022 上安装 IIS Web 服务器

拓扑结构 这是一个用于通过 Ansible 部署 IIS Web 服务器的实验室拓扑。 前提条件&#xff1a; 在被管理的节点上安装WinRm 准备一张自签名的证书 开放防火墙入站tcp 5985 5986端口 准备自签名证书 PS C:\Users\azureuser> $cert New-SelfSignedCertificate -DnsName &…...

认识CMake并使用CMake构建自己的第一个项目

1.CMake的作用和优势 跨平台支持&#xff1a;CMake支持多种操作系统和编译器&#xff0c;使用同一份构建配置可以在不同的环境中使用 简化配置&#xff1a;通过CMakeLists.txt文件&#xff0c;用户可以定义项目结构、依赖项、编译选项等&#xff0c;无需手动编写复杂的构建脚本…...

Linux中《基础IO》详细介绍

目录 理解"文件"狭义理解广义理解文件操作的归类认知系统角度文件类别 回顾C文件接口打开文件写文件读文件稍作修改&#xff0c;实现简单cat命令 输出信息到显示器&#xff0c;你有哪些方法stdin & stdout & stderr打开文件的方式 系统⽂件I/O⼀种传递标志位…...