当前位置: 首页 > news >正文

深度学习——引言

一、机器学习的关键因素

1.1 数据

  每个数据集由一 个个样本组成,大多情况下,数据遵循独立同分布。通常每个样本由一组特征属性组成。
好的数据集 { 数据样本多 正确的数据 ( g a r b a g e i n , g a r b a g e o u t ) 好的数据集 \begin{cases} 数据样本多\\\ 正确的数据(garbage \quad in,\quad garbage \quad out) \end{cases} 好的数据集{数据样本多 正确的数据(garbagein,garbageout)

1.2 模型

  与经典机器学习算法模型相比,深度学习的模型由神经网络错综复杂地交织在一起,包含层层数据转换,模型功能更加强大。

1.3 目标函数

  在机器学习中,需要定义对模型的优劣程度的度量,并且这个度量在大多数情况下是“可优化的”,这被称为目标函数。
优化的两种思路 { 1 、损失函数,越小越好(例如:平方误差函数) 最常用的方法 2 、设计一种新的函数,优化到其最大值 优化的两种思路 \begin{cases} 1、损失函数,越小越好(例如:平方误差函数)\textcolor{red}{最常用的方法}\\ 2、设计一种新的函数,优化到其最大值 \end{cases} 优化的两种思路{1、损失函数,越小越好(例如:平方误差函数)最常用的方法2、设计一种新的函数,优化到其最大值

1.4 优化算法

  当我们获得了一些数据源及其表示、一个模型和一个合适的损失函数,接下来就需要一种算法,它能够搜索出最佳参数,以最小化损失函数。在深度学习中,大多数流行的优化算法通常基于一种基本方法,梯度下降 。梯度下降方法在每个步骤中都会检查每个参数,观察如果仅对该参数进行少量改动,训练集上的损失会朝哪个方向移动。然后,它在可以减少损失的方向上优化参数。

二、各种机器学习的问题

2.1 监督学习

  监督学习是在“给定输入特征”的情况下预测标签,每个“特征-标签”对都称为一个样本,即使标签是未知的,样本也可以指代输入特征。监督学习的目标是生成一个模型,该模型能够将任何输入特征映射到标签。
  监督学习的学习过程:
监督学习
  1、从已知大量数据样本中随机选取一个子集,为每个样本获取真实标签;
  2、选择有监督的学习算法,它将训练数据集作为输入,并输出一个“已完成学习的模型”;
  3、将之前没有见过的样本特征放到这个“已完成学习的模型”中,使用模型的输出作为相应标签的预测。
监督学习的应用 { 1 、回归问题:预测一个数值 2 、分类问题:预测是哪一类 3 、标注问题:多标签分类 4 、搜索问题:对搜索查询的结果进行筛选排序 5 、推荐系统:捕捉一个用户的偏好 6 、序列学习:如果是连续的输入,模型需要有记忆功能 监督学习的应用 \begin{cases} 1、回归问题:预测一个数值\\ 2、分类问题:预测是哪一类\\ 3、标注问题:多标签分类\\ 4、搜索问题:对搜索查询的结果进行筛选排序\\ 5、推荐系统:捕捉一个用户的偏好\\ 6、序列学习:如果是连续的输入,模型需要有记忆功能 \end{cases} 监督学习的应用 1、回归问题:预测一个数值2、分类问题:预测是哪一类3、标注问题:多标签分类4、搜索问题:对搜索查询的结果进行筛选排序5、推荐系统:捕捉一个用户的偏好6、序列学习:如果是连续的输入,模型需要有记忆功能

2.2 无监督学习

  数据样本中不含有“目标”的机器学习问题通常被称为无监督学习。
无监督学习 { 1 、聚类问题 2 、主成分分析 3 、因果关系和概率图模型 4 、生成对抗网络 无监督学习 \begin{cases} 1、聚类问题\\ 2、主成分分析\\ 3、因果关系 和概率图模型\\ 4、生成对抗网络 \end{cases} 无监督学习 1、聚类问题2、主成分分析3、因果关系和概率图模型4、生成对抗网络

2.3 强化学习强化学习

  在强化学习问题中,智能体(agent)与环境进行交互。在每个特定时间点,智能体从环境接受一些观测(observation),并且必须选择一个动作(action),然后通过某种机制将其输出回环境,最后智能体从环境获得奖励(reward),然后开始新一轮循环,智能体继续从环境中监测,选择后续动作并获得奖励,以此类推。

  强化学习的目标是产生一个好的策略(policy),强化学习智能体选择的“动作”受策略控制,即一个从环境观测映射到动作选择的功能。

  强化学习框架的通用性极强,一般来说,可以将任何监督学习问题转化为强化学习问题。一个分类问题,可以创建一个强化学习智能体,每个分类对应一个动作,创建一个环境后,该环境给与智能体奖励。这个奖励与原始监督学习问题的损失函数是一致的。

一些特殊情况下的强化学习问题:
  1、当环境可被完全观测到时,该问题被称为马尔科夫决策过程;
  2、当状态不依赖之前的动作时,该问题被称为上下文老虎机;
  3、当没有状态,只有一组最初未知奖励的可用动作时,该问题被称为多臂老虎机。

相关文章:

深度学习——引言

一、机器学习的关键因素 1.1 数据 每个数据集由一 个个样本组成,大多情况下,数据遵循独立同分布。通常每个样本由一组特征属性组成。 好的数据集 { 数据样本多 正确的数据 ( g a r b a g e i n , g a r b a g e o u t ) 好的数据集 \begin{cases} 数据…...

安装Android Studio及第一个Android工程可能遇到的问题,gradle下载过慢、sync失败?

Android Studio版本众多,电脑操作系统、电脑型号、电脑硬件也是多种多样,幸运的半个小时内可以完成安装,碰到不兼容的电脑,一天甚至更长时间都无法安装成功。 Android安装及第一个Android工程分为4个步骤,为什么放到一…...

密码学---常见的其他密码

✨费纳姆密码:加解密都需要密钥,以二进制形式表示的密码。(密钥多是一次性的,称位一次性密码本) 加密过程: char_num {A: 1000001, B: 1000010, C: 1000011, D: 1000100,E: 1000101, F: 1000110, G: 100…...

Mysql8 主从复制主从切换(超详细)

文章目录 1 主从复制1.1 实施前提1.2 主节点配置(在192.168.25.91操作)1.3 从节点配置(在192.168.25.92操作)1.4 创建用于主从同步的用户1.5 开启主从同步1.5 主从同步验证 2 主从切换2.1 实施前提2.2 主节点设置只读(在192.168.25.91操作)2.3 检查主从数据是否同步完毕(在192.…...

8月29日wpf

小语 折磨我们的往往是想象,而不是真实。 学wpf 7.07 1.vs如何创建新项目? 退出,创建新项目,点c#,windows,进入界面 2.app.config在哪里? 好像只有这个。。。 试一下,不是 我…...

Android经典实战之SurfaceView原理和实践

本文首发于公众号“AntDream”,欢迎微信搜索“AntDream”或扫描文章底部二维码关注,和我一起每天进步一点点 SurfaceView 是一个非常强大但也相对复杂的 UI 组件,特别适用于对性能要求较高的绘制任务,如视频播放、游戏等。 1. Su…...

蜜罐的识别

蜜罐技术本质上是对网络攻击方欺骗的一项技术,通过在服务上布置一些仿真的系统、网络服务、或是模拟一些物联网设备来诱惑攻击方对其实施攻击从而捕获攻击行为,分析攻击手段与方式,或是收集一些攻击者的个人信息来进行分析画像达到精准溯源的…...

传感与检测技术

感知技术 传感器基本特性 静态特性 动态特性 传感器分类 电阻式传感器 通常情况下,电阻应变传感器的灵敏系数为常数 根据测量对象不同可分为...

监控平台之nodejs模拟后端接口

github:可以下载进行实验 https://github.com/Mr-Shi-root/sdk-platform/tree/master 1.配置node环境,安装express cors body-parser babel/cors body-parser - node.js 中间件,用于处理 JSON, Raw, Text 和 URL 编码的数据。cookie-parse…...

TCP 协议详解

目录 一.定义 二.TCP 协议报文格式 三.确认应答(ACK)机制 四.捎带应答 五.连接管理机制 六.滑动窗口 七.快重传 八.拥塞控制 九.延时应答 十.面向字节流 十一.粘包问题 十二.异常情况 十三.TCP 小结 一.定义 传输控制协议(TCP,Transmissio…...

【转载】golang内存分配

Go 的分配采用了类似 tcmalloc 的结构.特点: 使用一小块一小块的连续内存页, 进行分配某个范围大小的内存需求. 比如某个连续 8KB 专门用于分配 17-24 字节,以此减少内存碎片. 线程拥有一定的 cache, 可用于无锁分配. 同时 Go 对于 GC 后回收的内存页, 并不是马上归还给操作系…...

TPM管理培训:学以致用,才是硬道理

全面生产维护(TotalProductiveMaintenance,TPM)作为一种先进的管理体系,正被越来越多的企业所采用,以期通过全员参与、全系统改善的方式,实现设备综合效率的最大化。然而,理论学习与实践应用之间往往存在鸿…...

2024年六月英语四级真题及解析PDF共9页

2024年六月英语四级真题及解析PDF共9页,真题就是最好的复习资料,希望对大家有所帮助。...

自闭症儿童语言干预

自闭症儿童的语言发展往往面临独特挑战,这不仅影响了他们的日常交流能力,也制约了其社交与认知的全面发展。因此,实施科学有效的语言干预对于促进自闭症儿童的语言能力至关重要。 语言干预应基于个性化原则,充分考虑每个孩子的兴…...

webpack基本使用(基础配置)

文章目录 概要理解 一、使用示例1.引入库2.创建config/webpack.dev.js 测试环境3.创建config/webpack.prod.js 正式环境3.创建eslintrc.js4.创建babel.config.js5.package.json5.main.js 总结 概要理解 vue或者react 通常用webpack作为打包工具,打包成浏览器识别的…...

在js渲染的dom中的事件中传递对象

在某些情况下&#xff0c;可能需要将整个对象或部分对象嵌入到 HTML 元素的属性中&#xff0c;可以将对象数据序列化为 JSON 字符串&#xff0c;存储在 data-* 自定义属性中。这样可以在事件中取出并解析对象数据&#xff1a; <!DOCTYPE html> <html lang"en&qu…...

服务器加速器如何应对大规模并行计算需求

服务器加速器&#xff0c;如GPU(图形处理单元)、FPGA(现场可编程门阵列)和TPU(张量处理单元)&#xff0c;在大规模并行计算需求中发挥着重要作用。它们通过提供高效的并行处理能力&#xff0c;大幅提升了计算性能&#xff0c;满足了许多领域对大规模并行计算的需求。下面详细介…...

C++/Qt 多媒体(续四)

一、前言 前边讲述到了Qt的两项独特的模块编程支持的另一项内容——多媒体编程,上篇文章具体讲述的包括采集和播放原始音频相关类的概述,而本章开始主要概述多媒体编程实现的功能中的最后两项:播放视频文件和通过摄像头拍照和录像。 对于上篇内容的示例全部代码,可…...

怎样把flv转换成mp4格式?8种可以推荐的视频转换方法

怎样把flv转换成mp4格式&#xff1f;MP4格式因其广泛的兼容性&#xff0c;几乎可以在所有设备和媒体播放器上顺畅播放&#xff0c;这极大地方便了用户的观看体验。与flv文件相比&#xff0c;MP4通常能更有效地压缩视频文件&#xff0c;既能保持较高的画质&#xff0c;又能显著减…...

【2024数学建模国赛赛题解析已出】原创免费分享

2024数模国赛赛题已正式发布 数模加油站初步分析评估了此次竞赛题目&#xff1a; A题&#xff1a;偏数学仿真建模&#xff0c;难度偏难&#xff0c;适合数学专业背景的同学 B题&#xff1a;评价决策类&#xff0c;自由度大&#xff0c;容易水&#xff0c;适合基础不太好的同…...

如何高效生成技术文章:方法与工具详解

如何高效生成技术文章&#xff1a;方法与工具详解 在当前科技发展迅速的时代&#xff0c;技术文章已成为工程师、开发者及技术爱好者共享知识、交流经验的重要载体。本文将为您详细介绍高效生成技术文章的具体方法与常用工具&#xff0c;助您提升写作效率与质量。 1. 明确写作主…...

Java实战系列(1):基于ShardingSphere Hint策略实现SpringBoot多数据源动态路由

1. ShardingSphere Hint策略的核心价值 在实际业务开发中&#xff0c;我们经常会遇到需要动态切换数据源的场景。比如电商系统中&#xff0c;用户数据和订单数据可能分布在不同的数据库实例&#xff1b;SaaS应用中&#xff0c;不同租户的数据需要隔离存储。传统做法是通过手动切…...

深入rust-cross:理解Rust跨编译的术语与架构原理完整指南

深入rust-cross&#xff1a;理解Rust跨编译的术语与架构原理完整指南 【免费下载链接】rust-cross Everything you need to know about cross compiling Rust programs! 项目地址: https://gitcode.com/gh_mirrors/ru/rust-cross Rust跨编译是开发者在不同架构和操作系统…...

Youtu-Parsing企业级应用:Java微服务架构下的集成与优化

Youtu-Parsing企业级应用&#xff1a;Java微服务架构下的集成与优化 最近和几个做企业级应用开发的朋友聊天&#xff0c;大家不约而同地提到了一个痛点&#xff1a;业务里需要处理大量来自视频平台的内容&#xff0c;比如解析视频信息、提取关键帧、分析字幕文本。自己从头开发…...

终极虚拟游戏控制器驱动:让你收藏的手柄重获新生

终极虚拟游戏控制器驱动&#xff1a;让你收藏的手柄重获新生 【免费下载链接】ViGEmBus Windows kernel-mode driver emulating well-known USB game controllers. 项目地址: https://gitcode.com/gh_mirrors/vi/ViGEmBus 你是否有一柜子的游戏手柄&#xff0c;却因为PC…...

Coze插件开发实战:如何将现有API快速封装并发布到扣子商店

1. 从零开始理解Coze插件开发 第一次接触Coze插件开发时&#xff0c;我也被各种概念绕得头晕。简单来说&#xff0c;这就像给手机安装APP——扣子商店是应用市场&#xff0c;插件就是里面的各种APP。而我们要做的&#xff0c;就是把自家开发的API服务打包成这样一个"APP&q…...

深入理解Strudel核心组件:从模式语法到音频处理

深入理解Strudel核心组件&#xff1a;从模式语法到音频处理 【免费下载链接】strudel MOVED TO CODEBERG - Web-based environment for live coding algorithmic patterns, incorporating a faithful port of TidalCycles to JavaScript 项目地址: https://gitcode.com/gh_mi…...

Claude Code安装和接入deepseek笔记

序言 Claude Code安装不需要注册Claude账号&#xff0c;因为https://claude.com/ 不对国内大陆地区提供服务&#xff0c;正常访问无法注册账号。不注册Claude账号只是无法使用 Claude Code提供的大模型&#xff0c;正好我也想接入deepseek来使用&#xff0c;因此在接入自己的大…...

AI 日报 - 2026年4月10日

&#x1f52c; 科技类 5 条1. Anthropic 年化收入首超 OpenAI&#xff0c;4个月从90亿飙到300亿美元这速度真的让人有点惊呆——Anthropic 的年化收入在短短4个月内从90亿美元狂飙到300亿美元&#xff0c;首次反超 OpenAI&#xff08;当前约250亿&#xff09;。更有意思的是&am…...

语音识别新选择:SenseVoice小型ONNX模型效果与性能展示

语音识别新选择&#xff1a;SenseVoice小型ONNX模型效果与性能展示 1. 引言 想象一下&#xff0c;你刚结束一场重要的线上会议&#xff0c;需要快速整理出会议纪要。面对长达一小时的录音&#xff0c;你是选择花两三个小时逐字逐句地听写&#xff0c;还是希望有一个工具能瞬间…...