当前位置: 首页 > article >正文

机器学习常见面试题

常见基模型


1. 线性模型(Linear Models)

  • 特点:通过线性组合特征进行预测,适合处理线性关系。
  • 常见类型
    • 线性回归(Linear Regression)
    • 逻辑回归(Logistic Regression)
    • 岭回归(Ridge Regression)
    • Lasso 回归(Lasso Regression)
  • 适用场景:特征与目标变量之间存在线性关系,且数据维度较高时。

2. 支持向量机(Support Vector Machines, SVM)

  • 特点:通过寻找最大间隔超平面进行分类或回归。
  • 常见类型
    • 线性 SVM(Linear SVM)
    • 核 SVM(Kernel SVM,如 RBF 核、多项式核)
  • 适用场景:适合高维数据和小样本数据,尤其是分类任务。

3. 神经网络(Neural Networks)

  • 特点:通过多层非线性变换拟合复杂函数。
  • 常见类型
    • 多层感知机(MLP)
    • 卷积神经网络(CNN)
    • 循环神经网络(RNN)
    • Transformer
  • 适用场景:适合处理非线性关系和高维数据,尤其是图像、文本、语音等复杂数据。

4. 朴素贝叶斯(Naive Bayes)

  • 特点:基于贝叶斯定理,假设特征之间相互独立。
  • 常见类型
    • 高斯朴素贝叶斯(Gaussian Naive Bayes)
    • 多项式朴素贝叶斯(Multinomial Naive Bayes)
    • 伯努利朴素贝叶斯(Bernoulli Naive Bayes)
  • 适用场景:适合文本分类、垃圾邮件过滤等高维稀疏数据。

5. K 近邻(K-Nearest Neighbors, KNN)

  • 特点:基于距离度量,通过邻居的标签进行预测。
  • 适用场景:适合低维数据和小样本数据,尤其是分类任务。

6. 决策树(Decision Trees)

  • 特点:通过递归分割特征空间构建树结构。
  • 常见类型
    • CART(Classification and Regression Tree)
    • ID3(Iterative Dichotomiser 3)
    • C4.5(改进的 ID3)
  • 适用场景:适合处理非线性关系,且模型可解释性要求较高时。

7. 随机森林(Random Forest)

  • 特点:通过集成多棵决策树进行预测,减少过拟合。
  • 适用场景:适合处理高维数据和非线性关系,且对模型稳定性要求较高时。

8. 梯度提升树(Gradient Boosting Trees)

  • 特点:通过逐步添加树模型拟合残差,优化目标函数。
  • 常见类型
    • XGBoost
    • LightGBM
    • CatBoost
  • 适用场景:适合处理结构化数据,且对模型性能要求较高时。

9. 高斯过程(Gaussian Processes)

  • 特点:通过高斯分布建模目标变量的分布。
  • 适用场景:适合小样本数据和回归任务,尤其是需要不确定性估计时。

10. 贝叶斯网络(Bayesian Networks)

  • 特点:通过概率图模型表示变量之间的依赖关系。
  • 适用场景:适合处理不确定性和复杂依赖关系的数据。

11. 聚类模型(Clustering Models)

  • 特点:通过无监督学习将数据分为若干簇。
  • 常见类型
    • K-Means
    • 层次聚类(Hierarchical Clustering)
    • DBSCAN
  • 适用场景:适合无监督学习任务,如客户分群、异常检测等。

12. 主成分分析(Principal Component Analysis, PCA)

  • 特点:通过线性变换将高维数据降维。
  • 适用场景:适合数据降维和可视化,尤其是高维数据。

13. 隐马尔可夫模型(Hidden Markov Models, HMM)

  • 特点:通过状态转移和观测概率建模序列数据。
  • 适用场景:适合处理时间序列数据,如语音识别、自然语言处理等。

14. 因子分析(Factor Analysis)

  • 特点:通过潜在变量解释观测变量之间的相关性。
  • 适用场景:适合降维和探索性数据分析。

15. 混合模型(Mixture Models)

  • 特点:通过多个概率分布的混合建模数据。
  • 常见类型
    • 高斯混合模型(Gaussian Mixture Models, GMM)
    • 隐狄利克雷分布(Latent Dirichlet Allocation, LDA)
  • 适用场景:适合聚类和生成模型任务。

总结

基模型一般包括:

  1. 线性模型(如线性回归、逻辑回归)
  2. 支持向量机(SVM)
  3. 神经网络(如 MLP、CNN、RNN)
  4. 朴素贝叶斯
  5. K 近邻(KNN)
  6. 决策树(如 ID3、C4.5)
  7. 随机森林
  8. 梯度提升树(如 XGBoost、LightGBM)
  9. 高斯过程
  10. 贝叶斯网络
  11. 聚类模型(如 K-Means、DBSCAN)
  12. 主成分分析(PCA)
  13. 隐马尔可夫模型(HMM)
  14. 因子分析
  15. 混合模型(如 GMM、LDA)

决策树(Decision Tree)

决策树(Decision Tree) 是一种常用的机器学习算法,既可以用于分类任务,也可以用于回归任务。它的核心思想是通过递归地划分特征空间,构建一棵树结构来对数据进行预测。决策树因其直观、易于理解和解释的特点,被广泛应用于各种领域。


1. 决策树的基本概念

  • 树结构
    • 决策树由节点(Node)和边(Edge)组成。
    • 根节点:树的起始点,包含所有样本。
    • 内部节点:表示一个特征或属性的测试条件。
    • 叶子节点:表示最终的预测结果(分类标签或回归值)。

2. 决策树的构建过程

(1)选择最佳分裂特征
  • 决策树的核心是如何选择最佳特征进行分裂。
  • 常用的分裂准则包括:
    • 信息增益(Information Gain):选择使信息增益最大的特征。
      • 信息增益 = 父节点的熵 - 子节点的加权平均熵。
    • 信息增益比(Gain Ratio):对信息增益进行归一化,避免偏向取值较多的特征。
    • 基尼指数(Gini Index):选择使基尼指数最小的特征。
      • 基尼指数表示数据的不纯度,值越小表示纯度越高。
(2)递归分裂
  • 对每个子节点重复上述过程,直到满足停止条件。
  • 常见的停止条件包括:
    • 节点中的样本全部属于同一类。
    • 树的深度达到预设的最大值。
    • 节点中的样本数少于预设的最小值。

3. 决策树的类型

(1)分类树(Classification Tree)
  • 用于分类任务,叶子节点输出类别标签。
  • 常用算法:
    • ID3(Iterative Dichotomiser 3):使用信息增益作为分裂准则。
    • C4.5:使用信息增益比作为分裂准则。
    • CART(Classification and Regression Tree):使用基尼指数作为分裂准则。
(2)回归树(Regression Tree)
  • 用于回归任务,叶子节点输出连续值。
  • 常用算法:
    • CART:通过最小化均方误差(MSE)选择最佳分裂点。

相关文章:

机器学习常见面试题

常见基模型 1. 线性模型(Linear Models) 特点:通过线性组合特征进行预测,适合处理线性关系。常见类型: 线性回归(Linear Regression)逻辑回归(Logistic Regression)岭回…...

网络安全配置截图 网络安全i

网络安全概念及规范 1.网络安全定义 网络安全的概述和发展历史 网络安全 广义的网络安全:Cyber Security(网络空间安全) 网络空间有独立且相互依存的信息基础设施和网络组成,包括互联网、电信网、计算机系统、嵌入式处理器和控…...

k8s概念及k8s集群部署(Centos7)

Centos7部署k8s集群 部署之前,先简单说下k8s是个啥: 一、k8s简介: k8s,全称:kubernetes,它可以看作是一个分布式系统支撑平台。k8s的作用: 1、故障自愈: k8s这个玩意可以监控容器…...

Manus详细介绍,Manus核心能力介绍

文章目录 前言Manus产品定位与核心理念:Manus产品特性与未来体验战略:Manus商业价值与创新指标:Manus技术特点与竞争优势:Manus用户反馈与展望:Manus市场竞争优势与团队战略:Manus深度总结与启发: 前言 这是一篇关于Manus智能体产品的用户体验评价报告,主要介绍了M…...

Apache XTable:在数据湖仓一体中推进数据互作性

Apache XTable 通过以多种开放表格式提供对数据的访问,在增强互作性方面迈出了一大步。移动数据很困难,在过去,这意味着在为数据湖仓一体选择开放表格式时,您被锁定在该选择中。一个令人兴奋的项目当在数据堆栈的这一层引入互作性…...

Java直通车系列14【Spring MVC】(深入学习 Controller 编写)

目录 基本概念 编写 Controller 的步骤和要点 1. 定义 Controller 类 2. 映射请求 3. 处理请求参数 4. 调用业务逻辑 5. 返回响应 场景示例 1. 简单的 Hello World 示例 2. 处理路径变量和请求参数 3. 处理表单提交 4. 处理 JSON 数据 5. 异常处理 基本概念 Cont…...

36-Openwrt wifi命令工具iwconfig、iwinfo、iwpriv、iwlist

增对wifi的调试命令有很多,这边列出我们常用的命令提供参考,方便查看信息定位问题。 1、iwconfig 查看当前 WIFI 的工作信道以及工作带宽模式: root@openwrt:/# iwconfig ra0 ra0 mt7603e ESSID:"openwrt" Mode:Managed Channel:8 Access Point: DC:4B…...

tauri加载网页处理点击a链接默认浏览器打开问题

添加click事件,当点击了a标签,就阻止默认事件,然后自己处理,在自己窗口中打开这个页面。将这个js注入到页面中就可以了 const hookClick (e) > {console.log(hookClick, e)e.preventDefault()const origin e.target.closest…...

openharmony 软总线-设备发现流程

6.1 设备发现流程 6.1.1 Wi-Fi设备发现 6.1.1.1 Wi-Fi设备发现流程 Wi-Fi设备在出厂状态或者恢复出厂状态下,设备上电默认开启SoftAP模式,SoftAP的工作信道在1,6,11中随机选择,SoftAP的Beacon消息中携带的SSID eleme…...

大白话CSS 优先级计算规则的详细推导与示例

大白话CSS 优先级计算规则的详细推导与示例 答题思路 引入概念:先通俗地解释什么是 CSS 优先级,让读者明白为什么要有优先级规则,即当多个 CSS 样式规则作用于同一个元素时,需要确定哪个规则起作用。介绍优先级的分类&#xff1…...

【GoTeams】-4:为项目引入etcd

本文目录 1. 书接上回2. 引入etcddiscoverystruct{}{} resolverserver 3. 将服务注册到etcd中4. 梳理下etcd调用逻辑 1. 书接上回 本节是为项目引入etcd这个环节,然后我们来看看具体该怎么实现。 首先来谈谈为什么要引入服务发现? 动态服务注册与发现…...

DeepSeek + Kimi:高效制作PPT实战详解

在快节奏的职场环境中,制作高质量的PPT已成为许多人的日常任务。然而,从零开始构思、设计、撰写并优化一份精美的PPT往往耗时费力。幸运的是,AI技术的飞速发展为我们提供了全新的解决方案。本文将详细介绍如何利用DeepSeek与Kimi智能助手的高…...

计算机基础:二进制基础06,用八进制来计数

专栏导航 本节文章分别属于《Win32 学习笔记》和《MFC 学习笔记》两个专栏,故划分为两个专栏导航。读者可以自行选择前往哪个专栏。 (一)WIn32 专栏导航 上一篇:计算机基础:二进制基础05,八进制简介 回…...

OSCP最新备考攻略:迎接2024改版后的OSCP+认证

OSCP(Offensive Security Certified Professional)是渗透测试领域一块金字招牌,由Offensive Security打造,因其硬核实战和高门槛备受推崇。2024年11月1日,OSCP迎来了一次重量级改版,推出了OSCP认证&#xf…...

Jmeter使用介绍

文章目录 前言Jmeter简介安装与配置JDK安装与配置JMeter安装与配置 打开JMeter方式一方式二 设置Jmeter语言为中文方法一(仅一次性)方法二(永久设置成中文) Jmeter文件常用目录 元件与组件元件组件元件的作用域元件的执行顺序第一个案例添加线程组添加 H…...

hooks useModule自定义hooks (二次封装AgGridReact ag-table)自定义表头,自定义表头搜索

场景业务: 多次运用AgGridReact的table 列表 思路: 运用自定义hooks进行二次封装: 通用配置例如:传参的参数,传参的url,需要缓存的key这些键值类 定制化配置例如:需要对table 的一些定制化传…...

Android Studio 配置国内镜像源

Android Studio版本号:2022.1.1 Patch 2 1、配置gradle国内镜像,用腾讯云 镜像源地址:https\://mirrors.cloud.tencent.com/gradle 2、配置Android SDK国内镜像 地址:Index of /AndroidSDK/...

OFA:通过简单的序列到序列学习框架统一架构、任务和模态

【摘要】 摘要总结 本文介绍了一种新的统一框架OFA(One For All),旨在通过一个简单的序列到序列学习框架来实现跨模态和单模态任务的统一预训练。OFA框架支持任务无关性和模态无关性,并能实现任务全面性。OFA统一了包括图像生成、视觉定位、图像字幕、图像分类、语言建模…...

C++11新特性2.空指针nullptr

目录 一.简介 1.基本概念 2.语法 二.使用示例 示例1:初始化指针 示例2:作为函数参数 三.nullptr与NULL的区别 1.类型安全 2.函数重载问题 3.注意事项 一.简介 1.基本概念 nullptr 是一个类型安全的空指针常量,它的类型是 std::nul…...

实战案例分享:WLAN TKIP/CCMP加密组件的选择

无线接入点(AP)与终端(STA)在连接过程中涉及多种加密算法,如CCMP、TKIP等,选择合适的加密组件对于保证网络安全和兼容性至关重要。本篇我们将分析Wi-Fi加密机制、Wi-Fi加密组件的选型要点、典型问题及解决方…...

Day(19)--IO流(三)

文件加密 ps:^异或: 两边相同就是false 两边不同就是true 如果比较的是数字,那就会把它转换成为二进制,从右自左依次比较 总结:如果一个数字被异或两次,结果还是原来的数字 缓冲流 字节缓冲流 BufferedInputStream------字节缓冲输入流 BufferedOutputStream----字节…...

解锁STM32外设:开启嵌入式开发新世界

✨✨✨这里是小韩学长yyds的BLOG(喜欢作者的点个关注吧) ✨✨✨想要了解更多内容可以访问我的主页 小韩学长yyds-CSDN博客 目录 探索 STM32 强大的外设家族 初窥门径:STM32 外设开发基础 开发方式与工具 外设配置基础步骤 深入剖析:常见外设应用实例…...

SSLScan实战指南:全面检测SSL/TLS安全配置

SSLScan是一款开源的SSL/TLS安全扫描工具,用于检测服务器的加密协议、支持的加密套件、证书信息以及潜在的安全漏洞。本指南将详细介绍如何安装、使用SSLScan,并结合实战案例帮助您全面评估服务器的安全性。 一、SSLScan简介 功能特性: 检测支持的SSL/TLS协议版本(如TLS 1.…...

docker学习笔记(1)从安装docker到使用Portainer部署容器

docker学习笔记第一课 先交代背景 docker宿主机系统:阿里云ubuntu22.04 开发机系统:win11 docker镜像仓库:阿里云,此阿里云与宿主机系统没有关系,是阿里云提供的一个免费的docker仓库 代码托管平台:github&…...

基于Spring Boot的健美操评分管理系统设计与实现(LW+源码+讲解)

专注于大学生项目实战开发,讲解,毕业答疑辅导,欢迎高校老师/同行前辈交流合作✌。 技术范围:SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、安卓app、大数据、物联网、机器学习等设计与开发。 主要内容:…...

【Linux】——初识操作系统

文章目录 冯-诺依曼体系结构操作系统shell 冯-诺依曼体系结构 我们现在所使用的计算机就是冯-诺依曼体系结构。 存储器就是内存。 由下图可知,寄存器最快,为啥不用寄存器呢? 因为越快价格就最贵,冯诺依曼体系结构的诞生&#xf…...

PromQL计算gateway指标增量最佳实践及常见问题答疑

普米官方网站 普米官方帮助:Getting started | Prometheus 普米下载地址:Download | Prometheus 普米查询语法:Querying basics | Prometheus 普米函数参考:Query functions | Prometheus promql计算增量 在PromQL&#xff…...

vue使用slot时子组件的onUpdated执行问题

vue使用slot时子组件的onUpdated执行问题 在使用 Vue 的插槽 (slot) 功能时,可能会遇到一个问题:当父组件的任何状态更新时,子组件的 onUpdated 事件会被触发。这个问题在使用默认插槽时尤为明显。 为了避免这种情况,可以使用作用…...

从零到多页复用:我的WPF MVVM国际化实践

文章目录 第一步:基础实现,资源文件入门第二步:依赖属性,提升WPF体验第三步:多页面复用,减少重复代码第四步:动态化,应对更多字符串总结与反思 作为一名WPF开发者,我最近…...

C++11新特性 3.constexpr

目录 一.简介 1.基本概念 2.语法 (1)constexpr 变量 (2)constexpr 函数 二.使用示例 示例1:constexpr 修饰变量 示例2:constexpr 修饰函数 示例3:constexpr 修饰构造函数 三.注意事项 …...