当前位置: 首页 > news >正文

机器学习主要内容的思维导图

 机器学习

369ad1d974b54cb0b3ed9a3b49cf9961.jpg

机器学习:

定义:能够从经验中学习从而能够 把事情不断做好的计算机程序

人工智能的一个分支和 实现方式

理论基础:概率论 数理统计 线性代数 数学分析 数值逼近 最优化理论 计算复杂理论

核心要素:数据 算法  模型 

机器学习 ≠ 人工智能

艺术创作 金融领域 医疗领域 自然语言处理 网络安全 工业领域 娱乐行业

机器学习的一般流程: 明确分析目标、 收集数据 、数据预处理、 建模分析、 结果评估 、部署使用、 学习更新。

86ef3251263b40de8ba7927b6cada8a2.jpg

统计分析:统计学是研究如何收集资料、整理资料和进行量化分析、推断的一门学科 概念;  在科学计算、工业和金融领域有着重要的应用 ; 统计分析是机器学习的基本方法 。

高维数据降维:采用某种映射方法,降低随机变量的数量。(PCA\LDA\)

线性回归分析:

回归分析 分析一个变量与其他一个(或几 个)变量之间的相关关系的统计方法

种类

线性回归、多元回归、非线性回 归、广义线性回归(对数、possion )

主要内容

1. 确定连续变量之间的相关关系

2. 建立回归模型

3. 检验变量之间的相关程度

4. 应用回归模型对变量进行预测

69f44417b60a4132b85ad33345118273.jpg

决策树算法: 一种有监督的学习 从数据中推导函数的技术 (ID3算法、C4.5算法、CART算法)。使用于组合的算法是弱学习算法, 即分类正确率仅比随机猜测略高的 学习算法,但是组合之后的效果仍 可能高于强学习算法,即集成之后 的算法准确率和效率都很高。

集成学习(Ensemble learning): 是用多种学习方法的组合来获取比 原方法更优的结果(装袋法、提升法、随机森林)。

c7ae27d8f54247f9a70ae75dbe0ba146.jpg

聚类分析

把数据对象划分成子集  簇中对象相似  簇间对象不相似

无监督学习  无标签  数据驱动 

聚类方法分类

基于划分的方法 基于层次的方法 基于密度的方法 基于网格的方法 基于模型的方法

良好聚类算法的特征

聚类高维数据的能力 处理噪声数据的能力 良好的伸缩性 处理不同类型数据的能力 发现任意形状的聚类 易解释性和易用性 对样本顺序的不敏感性 约束条件下的表现

基于划分的聚类----K均值算法

基于划分的聚类----k-mediods算法

基于划分的聚类----k-prototype算法

基于密度的聚类方法----DBSCAN算法

基于层次的聚类----类间距离计算方法

基于模型的聚类----期望最大化算法(EM算法)

基于模型的聚类----Kohonen神经网络聚类

6eaf9fad11a04a7db8782eae6aff7cf5.jpg

文本分析的基本问题

将文本中抽取出的特征词进行向量化表示

将非结构化的文本转化为结构化信息

找出最具代表性的文本特征TF-IDF、信息增益和互信息等

采用向量空间模型(VSM)来描述文本向量

建立文本的数学模型实现对文本的计算、识别、分类等操作 

文本特征提取及表示----TF-IDF

文本特征提取及表示----信息增益

文本特征提取及表示----互信息

文本特征提取及表示----卡方统计

文本特征提取及表示----词嵌入

文本特征提取及表示----语言模型

文本特征提取及表示----向量空间模型

词法分析----文本分词

词法分析----命名实体识别

词法分析----语义消歧

句法分析----依存结构句法分析

句法分析----短语结构句法分析

dea450789e0d448ea30e82213bf61b4a.jpg

神经网络介绍

并行处理 神经元以分布式的方式处理信息

用途 1. 用神经网络模拟生物学习过程并建模 2. 获得高效的分类器 

神经网络介绍----感知机

神经网络介绍----梯度下降

神经网络介绍----批量学习

神经网络介绍----随机学习

神经网络介绍----感知机

神经网络介绍----多层感知机

神经网络介绍---- Sigmoid函数

神经网络介绍----BP神经网络

神经网络介绍----埃尔曼网络

神经网络介绍----霍普菲尔网络

c2115f9fb8a74fb7933cbfdca3ecc27e.jpg

贝叶斯网络定义 使用有向无环图来表示变量间依赖关系的概率图模型

贝叶斯网络的构建

根据问题和领域专家 知识手工构建 通过对数据进行分析得到 贝叶斯网络 结合领域专家知识和数据分 析得到贝叶斯网络 

 

38c4f5e4daa344cb8cf3e582a0a31001.jpg

支持向量机模型----线性分类器

支持向量机模型----点到超平面的距离

支持向量机模型----分类器的选择

支持向量机模型----拉格朗日乘数法

支持向量机模型----核函数

 

19aea139ceb7444289a347e7d5c73767.jpg

Holland在上世纪60年代提出了遗传算法

进化计算的一个分支

一种模拟自然界生物进化过程的随机搜索算法 遗传算法

首先对问题进行编码

然后随机初始化种群,每个个体对应一个编码

通过适应度函数以及选择函数来进行对个体的淘汰

保留优良个体基因,产生新的子代 

选择算子 根据适应值把个体按比例进行淘汰,从而提高群体的适应值

交叉算子 种群中随机选择2个个体,交换染色体部分编码,产生2个新 的子个体

变异算子 以一个很小的概率随机改变染色体上的某个基因来 增加群体的多样性

 010d82ac105c41a0a98dbf9c14611a43.jpeg

核心问题

01 如何提高各分布式任务节点之间的网络传输效率

02 如何解决参数同步问题

03 如何提高分布式环境下的容错能力 

分布式机器学习基础----参数服务器

解决分布式学习里面的一致性、扩展性和稳定性问题 作用

支撑并行训练,存储模型参数和状态 功能

高效通信、宽松一致性、灵活可扩展、容错能力强、易用

特点

灵活可扩展 训练过程中支持动态扩展节点,不需要重启训练任务就可以动 态插入新节点到集合中,可节省大量训练时间

容错能力强 在大型服务器集群中,由于节点较多,小概率故障往往常态化 需要节点恢复时间要短,不能中断训练过程

易用 为了减少学习难度,尽可能使用常用语言或将参数表示成通用的 形式,如向量、矩阵等,与现有机器学习框架无缝拼接

5fc9c97fc9e04af2ae8fdadc4e26d7ac.jpg

应用背景

推荐系统是信息过滤器 推荐系统是一种营销手段 应用背景 帮助用户快速发现有用信息的工具 提高产品销量

应用场景

电商平台  “猜你喜欢”

个性化电影网站  根据观看历史推荐

社交网络 推荐互加好友

音乐歌单 协同过滤推荐

99c70c4de1584e4087d717de4dd4ec3a.jpg

 

 

相关文章:

机器学习主要内容的思维导图

机器学习 机器学习: 定义:能够从经验中学习从而能够 把事情不断做好的计算机程序 人工智能的一个分支和 实现方式 理论基础:概率论 数理统计 线性代数 数学分析 数值逼近 最优化理论 计算复杂理论 核心要素:数据 算法 模型 机器…...

嵌套走马灯Carousel

Carousel 的应用很广泛,基础用法这里不多做阐述,感兴趣的可以去element-gui了解Carousel 组件。 今天主要是梳理嵌套走马灯的逻辑,背景如下: 需要对项目做一个展示,项目可能有一个或多个,同时一个项目可能…...

实战——缓存的使用

文章目录前言概述实践一、缓存数据一致1.更新缓存类2.删除缓存类二、项目实践(商城项目)缓存预热双缓存机制前言 对于我们日常开发的应用系统。由于MySQL等关系型数据库读写的并发量是有一定的上线的,当请求量过大时候那数据库的压力一定会上…...

2023年中职网络安全竞赛跨站脚本渗透解析-2(超详细)

跨站脚本渗透 任务环境说明:需求环境可私信博主! 服务器场景:Server2126(关闭链接)服务器场景操作系统:未知访问服务器网站目录1,根据页面信息完成条件,将获取到弹框信息作为flag提交;访问服务器网站目录2,根据页面信息完成条件,将获取到弹框信息作为flag提交;访问…...

Scala的简单使用

文章目录Scala的简单使用(一)交互模式1、命令行方式2、文件方式(二)编译模式1、创建源程序2、编译成字节码3、解释执行对象Scala的简单使用 Scala可以在交互模式和编译模式两种方式下运行 (一)交互模式 在…...

Java之前缀和算法

目录 一.前缀和 1.前缀和介绍 2.编程中的前缀和 二.一维数组的动态和 1.题目描述 2.问题分析 3.代码实现 三.除自身以外数组的乘积 1.题目描述 2.问题分析 3.代码实现 四.和为 K 的子数组 1.题目描述 2.问题分析 3.代码实现 五.形成两个异或相等数组的三元组数目…...

基于GIS计算降雨侵蚀力R因子

一、数据来源介绍 (一)行政边界数据 本文所用到的河北唐山行政边界数据来源于中国科学院资源环境科学与数据中心(https://www.resdc.cn/Default.aspx)。 (二)降水量数据 本文所用到的降水量数据来源于国家…...

大数据时代下的企业网络安全

在大数据技术迅猛发展的今天,网络安全问题已经发展成一个广受关注的热门研究方向。有人说,“大数据下,人人裸奔”,隐私保护、数据防护日益成为广大学者、企业研究的焦点。 面对这种安全威胁,企业必须实施一些有效的信…...

【跟我一起读《视觉惯性SLAM理论与源码解析》】第三章第四章 SLAM中常用的数学基础知识相机成像模型

齐次坐标能大大简化在三维空间中点、线、面表达方式和旋转、平移等操作在齐次坐标下,两个点的叉积结果可以表示一条直线l;也可以用两条直线的叉积结果表示它们的齐次坐标交点,关于叉积其实十四讲解释的还是比较清楚的,和李代数李群的关系可以…...

LeetCode 242. 有效的字母异位词

242. 有效的字母异位词 难度:easy\color{Green}{easy}easy 题目描述 给定两个字符串 sss 和 ttt ,编写一个函数来判断 ttt 是否是 sss 的字母异位词。 注意: 若 sss 和 ttt 中每个字符出现的次数都相同,则称 sss 和 ttt 互为字…...

力扣mysql刷题记录

mysql刷题记录 刷题链接https://leetcode.cn/study-plan/sql/?progressjkih0qc mysql冲!mysql刷题记录1699. 两人之间的通话次数1251. 平均售价1571. 仓库经理1445. 苹果和桔子1193. 每月交易 I1633. 各赛事的用户注册率1173. 即时食物配送 I1211. 查询结果的质量…...

Linux基础命令-lsof查看进程打开的文件

Linux基础命令-uptime查看系统负载 Linux基础命令-top实时显示系统状态 Linux基础命令-ps查看进程状态 文件目录 前言 一 命令的介绍 二 语法及参数 2.1 使用help查看命令的语法信息 2.2 常用参数 2.2.lsof命令-i参数的条件 三 命令显示内容的含义 3.1 FD 文件描述符的…...

常用电平标准

现在常用的电平标准有TTL CMOS LVTTL LVCMOS LVDS PCI等,下面简单介绍一下各自的供电电源、电平标准及注意事项数字电路中,由TTL电子元件组成电路使用的电平。电平是个电压范围。标准输出高电平(VOH): 2.4V标准输出低电平(VOL):0.4V通常输出高…...

小程序开发注意点

1.组件样式隔离注意点 2.methods方法 3.自定义组件的properties参数 4.自定义组件的事件监听 5.纯数据字段 6.插槽 单个插槽 启用多插槽 使用多个插槽 7.属性绑定实现父传子功能 例如在这里有一个组件为<one></one>&#xff0c;那么可以在组件当中传入参数 &l…...

自行车出口欧盟CE认证,新版自行车标准ISO 4210:2023与ISO 8098:2023发布

2023年1月&#xff0c;国际标准化组织ISO发布了新版“自行车以及儿童自行车的测试标准”&#xff0c;即ISO 4210&#xff1a;2023以及ISO 8098:2023&#xff0c;用于取代了SO 4210&#xff1a;2015以及ISO 8098:2015。新版标准一经发布&#xff0c;立即生效。欧盟标准化委员会C…...

2020蓝桥杯真题回文日期 C语言/C++

题目描述 2020 年春节期间&#xff0c;有一个特殊的日期引起了大家的注意&#xff1a;2020 年 2 月 2 日。因为如果将这个日期按 “yyyymmdd” 的格式写成一个 8 位数是 20200202&#xff0c;恰好是一个回文数。我们称这样的日期是回文日期。 有人表示 20200202 是 “千年一遇…...

postman入门到精通之【接口知识准备】(一)

postman入门到精通之【接口知识准备】&#xff08;一&#xff09; 目录&#xff1a;导读 前言 接口测试概念 接口测试 接口测试的原理 常用接口测试工具 接口测试基础知识 接口的定义 接口的分类 HTTP接口 Web Service接口 RESTful接口 HTTP请求 统一资源定位符&…...

【算法数据结构体系篇class07】:加强堆

一、手动改写堆&#xff08;非常重要&#xff09;&#xff01;系统提供的堆无法做到的事情&#xff1a;1&#xff09;已经入堆的元素&#xff0c;如果参与排序的指标方法变化&#xff0c;系统提供的堆无法做到时间复杂度O(logN)调整&#xff01;都是O(N)的调整&#xff01;2&am…...

Taro3.x 容易踩坑的点(阻止滚动穿透,弹框蒙层父级定位)

解决弹框滚动的时候&#xff0c;下层也会滚动问题》阻止滚动穿透(react,vue)案例描述&#xff1a;页面展示时需要滚动条才可以显示完整&#xff0c;但是当我们显示弹框的时候&#xff0c;即使不需要滚动条&#xff0c;但是页面仍然可以滚动&#xff0c;并且下层内容会随着滚动变…...

SpringBoot+ActiveMQ-发布订阅模式(消费端)

ActiveMQ消息中间件的发布订阅模式 主题 topictopic生产端案例(配合topic消费端测试)&#xff1a;SpringBootActiveMQ Topic 生产端ActiveMQ版本&#xff1a;apache-activemq-5.16.5案例源码:SpringBootActiveMQ-发布订阅DemoSpringBoot集成ActiveMQ Topic消费端的pom.xml<?…...

调用支付宝接口响应40004 SYSTEM_ERROR问题排查

在对接支付宝API的时候&#xff0c;遇到了一些问题&#xff0c;记录一下排查过程。 Body:{"datadigital_fincloud_generalsaas_face_certify_initialize_response":{"msg":"Business Failed","code":"40004","sub_msg…...

NLP学习路线图(二十三):长短期记忆网络(LSTM)

在自然语言处理(NLP)领域,我们时刻面临着处理序列数据的核心挑战。无论是理解句子的结构、分析文本的情感,还是实现语言的翻译,都需要模型能够捕捉词语之间依时序产生的复杂依赖关系。传统的神经网络结构在处理这种序列依赖时显得力不从心,而循环神经网络(RNN) 曾被视为…...

使用 Streamlit 构建支持主流大模型与 Ollama 的轻量级统一平台

🎯 使用 Streamlit 构建支持主流大模型与 Ollama 的轻量级统一平台 📌 项目背景 随着大语言模型(LLM)的广泛应用,开发者常面临多个挑战: 各大模型(OpenAI、Claude、Gemini、Ollama)接口风格不统一;缺乏一个统一平台进行模型调用与测试;本地模型 Ollama 的集成与前…...

有限自动机到正规文法转换器v1.0

1 项目简介 这是一个功能强大的有限自动机&#xff08;Finite Automaton, FA&#xff09;到正规文法&#xff08;Regular Grammar&#xff09;转换器&#xff0c;它配备了一个直观且完整的图形用户界面&#xff0c;使用户能够轻松地进行操作和观察。该程序基于编译原理中的经典…...

安全突围:重塑内生安全体系:齐向东在2025年BCS大会的演讲

文章目录 前言第一部分&#xff1a;体系力量是突围之钥第一重困境是体系思想落地不畅。第二重困境是大小体系融合瓶颈。第三重困境是“小体系”运营梗阻。 第二部分&#xff1a;体系矛盾是突围之障一是数据孤岛的障碍。二是投入不足的障碍。三是新旧兼容难的障碍。 第三部分&am…...

STM32---外部32.768K晶振(LSE)无法起振问题

晶振是否起振主要就检查两个1、晶振与MCU是否兼容&#xff1b;2、晶振的负载电容是否匹配 目录 一、判断晶振与MCU是否兼容 二、判断负载电容是否匹配 1. 晶振负载电容&#xff08;CL&#xff09;与匹配电容&#xff08;CL1、CL2&#xff09;的关系 2. 如何选择 CL1 和 CL…...

基于单片机的宠物屋智能系统设计与实现(论文+源码)

本设计基于单片机的宠物屋智能系统核心是实现对宠物生活环境及状态的智能管理。系统以单片机为中枢&#xff0c;连接红外测温传感器&#xff0c;可实时精准捕捉宠物体温变化&#xff0c;以便及时发现健康异常&#xff1b;水位检测传感器时刻监测饮用水余量&#xff0c;防止宠物…...

客户案例 | 短视频点播企业海外视频加速与成本优化:MediaPackage+Cloudfront 技术重构实践

01技术背景与业务挑战 某短视频点播企业深耕国内用户市场&#xff0c;但其后台应用系统部署于东南亚印尼 IDC 机房。 随着业务规模扩大&#xff0c;传统架构已较难满足当前企业发展的需求&#xff0c;企业面临着三重挑战&#xff1a; ① 业务&#xff1a;国内用户访问海外服…...

Android Framework预装traceroute执行文件到system/bin下

文章目录 Android SDK中寻找traceroute代码内置traceroute到SDK中traceroute参数说明-I 参数&#xff08;使用 ICMP Echo 请求&#xff09;-T 参数&#xff08;使用 TCP SYN 包&#xff09; 相关文章 Android SDK中寻找traceroute代码 设备使用的是Android 11&#xff0c;在/s…...

[QMT量化交易小白入门]-六十二、ETF轮动中简单的评分算法如何获取历史年化收益32.7%

本专栏主要是介绍QMT的基础用法,常见函数,写策略的方法,也会分享一些量化交易的思路,大概会写100篇左右。 QMT的相关资料较少,在使用过程中不断的摸索,遇到了一些问题,记录下来和大家一起沟通,共同进步。 文章目录 相关阅读1. 策略概述2. 趋势评分模块3 代码解析4 木头…...