当前位置: 首页 > news >正文

机器学习主要内容的思维导图

 机器学习

369ad1d974b54cb0b3ed9a3b49cf9961.jpg

机器学习:

定义:能够从经验中学习从而能够 把事情不断做好的计算机程序

人工智能的一个分支和 实现方式

理论基础:概率论 数理统计 线性代数 数学分析 数值逼近 最优化理论 计算复杂理论

核心要素:数据 算法  模型 

机器学习 ≠ 人工智能

艺术创作 金融领域 医疗领域 自然语言处理 网络安全 工业领域 娱乐行业

机器学习的一般流程: 明确分析目标、 收集数据 、数据预处理、 建模分析、 结果评估 、部署使用、 学习更新。

86ef3251263b40de8ba7927b6cada8a2.jpg

统计分析:统计学是研究如何收集资料、整理资料和进行量化分析、推断的一门学科 概念;  在科学计算、工业和金融领域有着重要的应用 ; 统计分析是机器学习的基本方法 。

高维数据降维:采用某种映射方法,降低随机变量的数量。(PCA\LDA\)

线性回归分析:

回归分析 分析一个变量与其他一个(或几 个)变量之间的相关关系的统计方法

种类

线性回归、多元回归、非线性回 归、广义线性回归(对数、possion )

主要内容

1. 确定连续变量之间的相关关系

2. 建立回归模型

3. 检验变量之间的相关程度

4. 应用回归模型对变量进行预测

69f44417b60a4132b85ad33345118273.jpg

决策树算法: 一种有监督的学习 从数据中推导函数的技术 (ID3算法、C4.5算法、CART算法)。使用于组合的算法是弱学习算法, 即分类正确率仅比随机猜测略高的 学习算法,但是组合之后的效果仍 可能高于强学习算法,即集成之后 的算法准确率和效率都很高。

集成学习(Ensemble learning): 是用多种学习方法的组合来获取比 原方法更优的结果(装袋法、提升法、随机森林)。

c7ae27d8f54247f9a70ae75dbe0ba146.jpg

聚类分析

把数据对象划分成子集  簇中对象相似  簇间对象不相似

无监督学习  无标签  数据驱动 

聚类方法分类

基于划分的方法 基于层次的方法 基于密度的方法 基于网格的方法 基于模型的方法

良好聚类算法的特征

聚类高维数据的能力 处理噪声数据的能力 良好的伸缩性 处理不同类型数据的能力 发现任意形状的聚类 易解释性和易用性 对样本顺序的不敏感性 约束条件下的表现

基于划分的聚类----K均值算法

基于划分的聚类----k-mediods算法

基于划分的聚类----k-prototype算法

基于密度的聚类方法----DBSCAN算法

基于层次的聚类----类间距离计算方法

基于模型的聚类----期望最大化算法(EM算法)

基于模型的聚类----Kohonen神经网络聚类

6eaf9fad11a04a7db8782eae6aff7cf5.jpg

文本分析的基本问题

将文本中抽取出的特征词进行向量化表示

将非结构化的文本转化为结构化信息

找出最具代表性的文本特征TF-IDF、信息增益和互信息等

采用向量空间模型(VSM)来描述文本向量

建立文本的数学模型实现对文本的计算、识别、分类等操作 

文本特征提取及表示----TF-IDF

文本特征提取及表示----信息增益

文本特征提取及表示----互信息

文本特征提取及表示----卡方统计

文本特征提取及表示----词嵌入

文本特征提取及表示----语言模型

文本特征提取及表示----向量空间模型

词法分析----文本分词

词法分析----命名实体识别

词法分析----语义消歧

句法分析----依存结构句法分析

句法分析----短语结构句法分析

dea450789e0d448ea30e82213bf61b4a.jpg

神经网络介绍

并行处理 神经元以分布式的方式处理信息

用途 1. 用神经网络模拟生物学习过程并建模 2. 获得高效的分类器 

神经网络介绍----感知机

神经网络介绍----梯度下降

神经网络介绍----批量学习

神经网络介绍----随机学习

神经网络介绍----感知机

神经网络介绍----多层感知机

神经网络介绍---- Sigmoid函数

神经网络介绍----BP神经网络

神经网络介绍----埃尔曼网络

神经网络介绍----霍普菲尔网络

c2115f9fb8a74fb7933cbfdca3ecc27e.jpg

贝叶斯网络定义 使用有向无环图来表示变量间依赖关系的概率图模型

贝叶斯网络的构建

根据问题和领域专家 知识手工构建 通过对数据进行分析得到 贝叶斯网络 结合领域专家知识和数据分 析得到贝叶斯网络 

 

38c4f5e4daa344cb8cf3e582a0a31001.jpg

支持向量机模型----线性分类器

支持向量机模型----点到超平面的距离

支持向量机模型----分类器的选择

支持向量机模型----拉格朗日乘数法

支持向量机模型----核函数

 

19aea139ceb7444289a347e7d5c73767.jpg

Holland在上世纪60年代提出了遗传算法

进化计算的一个分支

一种模拟自然界生物进化过程的随机搜索算法 遗传算法

首先对问题进行编码

然后随机初始化种群,每个个体对应一个编码

通过适应度函数以及选择函数来进行对个体的淘汰

保留优良个体基因,产生新的子代 

选择算子 根据适应值把个体按比例进行淘汰,从而提高群体的适应值

交叉算子 种群中随机选择2个个体,交换染色体部分编码,产生2个新 的子个体

变异算子 以一个很小的概率随机改变染色体上的某个基因来 增加群体的多样性

 010d82ac105c41a0a98dbf9c14611a43.jpeg

核心问题

01 如何提高各分布式任务节点之间的网络传输效率

02 如何解决参数同步问题

03 如何提高分布式环境下的容错能力 

分布式机器学习基础----参数服务器

解决分布式学习里面的一致性、扩展性和稳定性问题 作用

支撑并行训练,存储模型参数和状态 功能

高效通信、宽松一致性、灵活可扩展、容错能力强、易用

特点

灵活可扩展 训练过程中支持动态扩展节点,不需要重启训练任务就可以动 态插入新节点到集合中,可节省大量训练时间

容错能力强 在大型服务器集群中,由于节点较多,小概率故障往往常态化 需要节点恢复时间要短,不能中断训练过程

易用 为了减少学习难度,尽可能使用常用语言或将参数表示成通用的 形式,如向量、矩阵等,与现有机器学习框架无缝拼接

5fc9c97fc9e04af2ae8fdadc4e26d7ac.jpg

应用背景

推荐系统是信息过滤器 推荐系统是一种营销手段 应用背景 帮助用户快速发现有用信息的工具 提高产品销量

应用场景

电商平台  “猜你喜欢”

个性化电影网站  根据观看历史推荐

社交网络 推荐互加好友

音乐歌单 协同过滤推荐

99c70c4de1584e4087d717de4dd4ec3a.jpg

 

 

相关文章:

机器学习主要内容的思维导图

机器学习 机器学习: 定义:能够从经验中学习从而能够 把事情不断做好的计算机程序 人工智能的一个分支和 实现方式 理论基础:概率论 数理统计 线性代数 数学分析 数值逼近 最优化理论 计算复杂理论 核心要素:数据 算法 模型 机器…...

嵌套走马灯Carousel

Carousel 的应用很广泛,基础用法这里不多做阐述,感兴趣的可以去element-gui了解Carousel 组件。 今天主要是梳理嵌套走马灯的逻辑,背景如下: 需要对项目做一个展示,项目可能有一个或多个,同时一个项目可能…...

实战——缓存的使用

文章目录前言概述实践一、缓存数据一致1.更新缓存类2.删除缓存类二、项目实践(商城项目)缓存预热双缓存机制前言 对于我们日常开发的应用系统。由于MySQL等关系型数据库读写的并发量是有一定的上线的,当请求量过大时候那数据库的压力一定会上…...

2023年中职网络安全竞赛跨站脚本渗透解析-2(超详细)

跨站脚本渗透 任务环境说明:需求环境可私信博主! 服务器场景:Server2126(关闭链接)服务器场景操作系统:未知访问服务器网站目录1,根据页面信息完成条件,将获取到弹框信息作为flag提交;访问服务器网站目录2,根据页面信息完成条件,将获取到弹框信息作为flag提交;访问…...

Scala的简单使用

文章目录Scala的简单使用(一)交互模式1、命令行方式2、文件方式(二)编译模式1、创建源程序2、编译成字节码3、解释执行对象Scala的简单使用 Scala可以在交互模式和编译模式两种方式下运行 (一)交互模式 在…...

Java之前缀和算法

目录 一.前缀和 1.前缀和介绍 2.编程中的前缀和 二.一维数组的动态和 1.题目描述 2.问题分析 3.代码实现 三.除自身以外数组的乘积 1.题目描述 2.问题分析 3.代码实现 四.和为 K 的子数组 1.题目描述 2.问题分析 3.代码实现 五.形成两个异或相等数组的三元组数目…...

基于GIS计算降雨侵蚀力R因子

一、数据来源介绍 (一)行政边界数据 本文所用到的河北唐山行政边界数据来源于中国科学院资源环境科学与数据中心(https://www.resdc.cn/Default.aspx)。 (二)降水量数据 本文所用到的降水量数据来源于国家…...

大数据时代下的企业网络安全

在大数据技术迅猛发展的今天,网络安全问题已经发展成一个广受关注的热门研究方向。有人说,“大数据下,人人裸奔”,隐私保护、数据防护日益成为广大学者、企业研究的焦点。 面对这种安全威胁,企业必须实施一些有效的信…...

【跟我一起读《视觉惯性SLAM理论与源码解析》】第三章第四章 SLAM中常用的数学基础知识相机成像模型

齐次坐标能大大简化在三维空间中点、线、面表达方式和旋转、平移等操作在齐次坐标下,两个点的叉积结果可以表示一条直线l;也可以用两条直线的叉积结果表示它们的齐次坐标交点,关于叉积其实十四讲解释的还是比较清楚的,和李代数李群的关系可以…...

LeetCode 242. 有效的字母异位词

242. 有效的字母异位词 难度:easy\color{Green}{easy}easy 题目描述 给定两个字符串 sss 和 ttt ,编写一个函数来判断 ttt 是否是 sss 的字母异位词。 注意: 若 sss 和 ttt 中每个字符出现的次数都相同,则称 sss 和 ttt 互为字…...

力扣mysql刷题记录

mysql刷题记录 刷题链接https://leetcode.cn/study-plan/sql/?progressjkih0qc mysql冲!mysql刷题记录1699. 两人之间的通话次数1251. 平均售价1571. 仓库经理1445. 苹果和桔子1193. 每月交易 I1633. 各赛事的用户注册率1173. 即时食物配送 I1211. 查询结果的质量…...

Linux基础命令-lsof查看进程打开的文件

Linux基础命令-uptime查看系统负载 Linux基础命令-top实时显示系统状态 Linux基础命令-ps查看进程状态 文件目录 前言 一 命令的介绍 二 语法及参数 2.1 使用help查看命令的语法信息 2.2 常用参数 2.2.lsof命令-i参数的条件 三 命令显示内容的含义 3.1 FD 文件描述符的…...

常用电平标准

现在常用的电平标准有TTL CMOS LVTTL LVCMOS LVDS PCI等,下面简单介绍一下各自的供电电源、电平标准及注意事项数字电路中,由TTL电子元件组成电路使用的电平。电平是个电压范围。标准输出高电平(VOH): 2.4V标准输出低电平(VOL):0.4V通常输出高…...

小程序开发注意点

1.组件样式隔离注意点 2.methods方法 3.自定义组件的properties参数 4.自定义组件的事件监听 5.纯数据字段 6.插槽 单个插槽 启用多插槽 使用多个插槽 7.属性绑定实现父传子功能 例如在这里有一个组件为<one></one>&#xff0c;那么可以在组件当中传入参数 &l…...

自行车出口欧盟CE认证,新版自行车标准ISO 4210:2023与ISO 8098:2023发布

2023年1月&#xff0c;国际标准化组织ISO发布了新版“自行车以及儿童自行车的测试标准”&#xff0c;即ISO 4210&#xff1a;2023以及ISO 8098:2023&#xff0c;用于取代了SO 4210&#xff1a;2015以及ISO 8098:2015。新版标准一经发布&#xff0c;立即生效。欧盟标准化委员会C…...

2020蓝桥杯真题回文日期 C语言/C++

题目描述 2020 年春节期间&#xff0c;有一个特殊的日期引起了大家的注意&#xff1a;2020 年 2 月 2 日。因为如果将这个日期按 “yyyymmdd” 的格式写成一个 8 位数是 20200202&#xff0c;恰好是一个回文数。我们称这样的日期是回文日期。 有人表示 20200202 是 “千年一遇…...

postman入门到精通之【接口知识准备】(一)

postman入门到精通之【接口知识准备】&#xff08;一&#xff09; 目录&#xff1a;导读 前言 接口测试概念 接口测试 接口测试的原理 常用接口测试工具 接口测试基础知识 接口的定义 接口的分类 HTTP接口 Web Service接口 RESTful接口 HTTP请求 统一资源定位符&…...

【算法数据结构体系篇class07】:加强堆

一、手动改写堆&#xff08;非常重要&#xff09;&#xff01;系统提供的堆无法做到的事情&#xff1a;1&#xff09;已经入堆的元素&#xff0c;如果参与排序的指标方法变化&#xff0c;系统提供的堆无法做到时间复杂度O(logN)调整&#xff01;都是O(N)的调整&#xff01;2&am…...

Taro3.x 容易踩坑的点(阻止滚动穿透,弹框蒙层父级定位)

解决弹框滚动的时候&#xff0c;下层也会滚动问题》阻止滚动穿透(react,vue)案例描述&#xff1a;页面展示时需要滚动条才可以显示完整&#xff0c;但是当我们显示弹框的时候&#xff0c;即使不需要滚动条&#xff0c;但是页面仍然可以滚动&#xff0c;并且下层内容会随着滚动变…...

SpringBoot+ActiveMQ-发布订阅模式(消费端)

ActiveMQ消息中间件的发布订阅模式 主题 topictopic生产端案例(配合topic消费端测试)&#xff1a;SpringBootActiveMQ Topic 生产端ActiveMQ版本&#xff1a;apache-activemq-5.16.5案例源码:SpringBootActiveMQ-发布订阅DemoSpringBoot集成ActiveMQ Topic消费端的pom.xml<?…...

【OSG学习笔记】Day 18: 碰撞检测与物理交互

物理引擎&#xff08;Physics Engine&#xff09; 物理引擎 是一种通过计算机模拟物理规律&#xff08;如力学、碰撞、重力、流体动力学等&#xff09;的软件工具或库。 它的核心目标是在虚拟环境中逼真地模拟物体的运动和交互&#xff0c;广泛应用于 游戏开发、动画制作、虚…...

Python爬虫(二):爬虫完整流程

爬虫完整流程详解&#xff08;7大核心步骤实战技巧&#xff09; 一、爬虫完整工作流程 以下是爬虫开发的完整流程&#xff0c;我将结合具体技术点和实战经验展开说明&#xff1a; 1. 目标分析与前期准备 网站技术分析&#xff1a; 使用浏览器开发者工具&#xff08;F12&…...

新能源汽车智慧充电桩管理方案:新能源充电桩散热问题及消防安全监管方案

随着新能源汽车的快速普及&#xff0c;充电桩作为核心配套设施&#xff0c;其安全性与可靠性备受关注。然而&#xff0c;在高温、高负荷运行环境下&#xff0c;充电桩的散热问题与消防安全隐患日益凸显&#xff0c;成为制约行业发展的关键瓶颈。 如何通过智慧化管理手段优化散…...

Linux --进程控制

本文从以下五个方面来初步认识进程控制&#xff1a; 目录 进程创建 进程终止 进程等待 进程替换 模拟实现一个微型shell 进程创建 在Linux系统中我们可以在一个进程使用系统调用fork()来创建子进程&#xff0c;创建出来的进程就是子进程&#xff0c;原来的进程为父进程。…...

OPENCV形态学基础之二腐蚀

一.腐蚀的原理 (图1) 数学表达式&#xff1a;dst(x,y) erode(src(x,y)) min(x,y)src(xx,yy) 腐蚀也是图像形态学的基本功能之一&#xff0c;腐蚀跟膨胀属于反向操作&#xff0c;膨胀是把图像图像变大&#xff0c;而腐蚀就是把图像变小。腐蚀后的图像变小变暗淡。 腐蚀…...

让回归模型不再被异常值“带跑偏“,MSE和Cauchy损失函数在噪声数据环境下的实战对比

在机器学习的回归分析中&#xff0c;损失函数的选择对模型性能具有决定性影响。均方误差&#xff08;MSE&#xff09;作为经典的损失函数&#xff0c;在处理干净数据时表现优异&#xff0c;但在面对包含异常值的噪声数据时&#xff0c;其对大误差的二次惩罚机制往往导致模型参数…...

GitHub 趋势日报 (2025年06月06日)

&#x1f4ca; 由 TrendForge 系统生成 | &#x1f310; https://trendforge.devlive.org/ &#x1f310; 本日报中的项目描述已自动翻译为中文 &#x1f4c8; 今日获星趋势图 今日获星趋势图 590 cognee 551 onlook 399 project-based-learning 348 build-your-own-x 320 ne…...

FFmpeg:Windows系统小白安装及其使用

一、安装 1.访问官网 Download FFmpeg 2.点击版本目录 3.选择版本点击安装 注意这里选择的是【release buids】&#xff0c;注意左上角标题 例如我安装在目录 F:\FFmpeg 4.解压 5.添加环境变量 把你解压后的bin目录&#xff08;即exe所在文件夹&#xff09;加入系统变量…...

AI语音助手的Python实现

引言 语音助手(如小爱同学、Siri)通过语音识别、自然语言处理(NLP)和语音合成技术,为用户提供直观、高效的交互体验。随着人工智能的普及,Python开发者可以利用开源库和AI模型,快速构建自定义语音助手。本文由浅入深,详细介绍如何使用Python开发AI语音助手,涵盖基础功…...

pycharm 设置环境出错

pycharm 设置环境出错 pycharm 新建项目&#xff0c;设置虚拟环境&#xff0c;出错 pycharm 出错 Cannot open Local Failed to start [powershell.exe, -NoExit, -ExecutionPolicy, Bypass, -File, C:\Program Files\JetBrains\PyCharm 2024.1.3\plugins\terminal\shell-int…...