当前位置：首页 > news >正文

深度学习引言

news 2025/7/7 14:59:28

动手学深度学习pytorch版-笔记

原文链接
日常生活中的机器学习
机器学习中的关键组件
- 数据
- 模型
- 目标函数
- 优化算法
各种机器学习问题
- 监督学习
- - 回归
  - 分类
  - 标记问题
  - 搜索
  - 推荐系统
  - 序列学习
- 无监督学习
- 与环境互动
- 强化学习
特点
小结

原文链接

动手学深度学习pytorch中文版

日常生活中的机器学习

参数可以被看作旋钮，旋钮的转动可以调整程序的行为。 任一调整参数后的程序被称为模型（model）。通过操作参数而生成的所有不同程序（输入-输出映射）的集合称为“模型族”。 使用数据集来选择参数的元程序被称为学习算法（learning algorithm）。

机器学习中的关键组件

可以用来学习的数据（data）；
如何转换数据的模型（model）；
一个目标函数（objective function），用来量化模型的有效性；
调整模型参数以优化目标函数的算法（algorithm）。

数据

每个数据集由一个个样本（example, sample）组成，大多时候，它们遵循独立同分布(independently and identically distributed, i.i.d.)。样本有时也叫做数据点（data point）或者数据实例（data instance），通常每个样本由一组称为特征（features，或协变量（covariates））的属性组成。机器学习模型会根据这些属性进行预测。在上面的监督学习问题中，要预测的是一个特殊的属性，它被称为标签（label，或目标（target））。

独立同分布：指随机过程中，任何时刻的取值都为随机变量，如果这些随机变量服从同一分布，并且互相独立，那么这些随机变量是独立同分布。如果随机变量X1和X2独立，是指X1的取值不影响X2的取值，X2的取值也不影响X1的取值且随机变量X1和X2服从同一分布，这意味着X1和X2具有相同的分布形状和相同的分布参数，对离散随机变量具有相同的分布律，对连续随机变量具有相同的概率密度函数，有着相同的分布函数，相同的期望、方差。如实验条件保持不变，一系列的抛硬币的正反面结果是独立同分布。

当每个样本的特征类别数量都是相同的时候，其特征向量是固定长度的，这个长度被称为数据的维数（dimensionality）。
与传统机器学习方法相比，深度学习的一个主要优势是可以处理不同长度的数据。

模型

深度学习与经典方法的区别主要在于：前者关注功能强大的模型，这些模型由神经网络错综复杂的交织在一起，包含层层数据转换，因此被称为深度学习（deep learning）。

目标函数

在机器学习中，我们需要定义模型的优劣程度的度量，这个度量在大多数情况是“可优化”的，这被称之为目标函数（objective function）。 我们通常定义一个目标函数，并希望优化它到最低点。 因为越低越好，所以这些函数有时被称为损失函数（loss function，或cost function）。
当任务在试图预测数值时，最常见的损失函数是平方误差（squared error），即预测值与实际值之差的平方。
当试图解决分类问题时，最常见的目标函数是最小化错误率，即预测与实际情况不符的样本比例。
损失函数是根据模型参数定义的，并取决于数据集。
在一个数据集上，我们可以通过最小化总损失来学习模型参数的最佳值。该数据集由一些为训练而收集的样本组成，称为训练数据集（training dataset，或称为训练集（training set））。然而，在训练数据上表现良好的模型，并不一定在“新数据集”上有同样的性能，这里的“新数据集”通常称为测试数据集（test dataset，或称为测试集（test set））。
训练数据集用于拟合模型参数，测试数据集用于评估拟合的模型。
当一个模型在训练集上表现良好，但不能推广到测试集时，这个模型被称为过拟合（overfitting）的。

优化算法

当我们获得了一些数据源及其表示、一个模型和一个合适的损失函数，接下来就需要一种算法，它能够搜索出最佳参数，以最小化损失函数。深度学习中，大多流行的优化算法通常基于一种基本方法–梯度下降（gradient descent）。简而言之，在每个步骤中，梯度下降法都会检查每个参数，看看如果仅对该参数进行少量变动，训练集损失会朝哪个方向移动。然后，它在可以减少损失的方向上优化参数。

各种机器学习问题

监督学习

监督学习（supervised learning）擅长在**“给定输入特征”的情况下预测标签**。每个“特征-标签”对都称为一个样本（example）。有时，即使标签是未知的，样本也可以指代输入特征。我们的目标是生成一个模型，能够将任何输入特征映射到标签（即预测）。
例子：假设我们需要预测患者的心脏病是否会发作，那么观察结果“心脏病发作”或“心脏病没有发作”将是样本的标签。输入特征可能是生命体征，如心率、舒张压和收缩压等。

监督学习的学习过程一般可以分为三大步骤：

从已知大量数据样本中随机选取一个子集，为每个样本获取真实标签。有时，这些样本已有标签（例如，患者是否在下一年内康复？）；有时，这些样本可能需要被人工标记（例如，图像分类）。这些输入和相应的标签一起构成了训练数据集；

选择有监督的学习算法，它将训练数据集作为输入，并输出一个“已完成学习的模型”；

将之前没有见过的样本特征放到这个“已完成学习的模型”中，使用模型的输出作为相应标签的预测。

回归

判断回归问题的一个很好的经验法则是，任何有关“有多少”的问题很可能就是回归问题。
平方误差损失函数的最小化

分类

“哪一个”的问题叫做分类（classification）问题。 分类问题希望模型能够预测样本属于哪个类别（category，正式称为类（class））

分类问题的常见损失函数被称为交叉熵（cross-entropy）

标记问题

学习预测不相互排斥的类别的问题称为多标签分类（multi-label classification）。

举个例子，人们在技术博客上贴的标签，比如“机器学习”“技术”“小工具”“编程语言”“Linux”“云计算”“AWS”。一篇典型的文章可能会用5～10个标签，因为这些概念是相互关联的。关于“云计算”的帖子可能会提到“AWS”，而关于“机器学习”的帖子也可能涉及“编程语言”。

搜索

在信息检索领域，我们希望对一组项目进行排序。以网络搜索为例，目标不是简单的“查询（query）-网页（page）”分类，而是在海量搜索结果中找到用户最需要的那部分。搜索结果的排序也十分重要，学习算法需要输出有序的元素子集。
该问题的一种可能的解决方案：首先为集合中的每个元素分配相应的相关性分数，然后检索评级最高的元素。

PageRank。谷歌依靠一个简单的相关性过滤来识别一组相关条目，然后根据PageRank对包含查询条件的结果进行排序。

搜索引擎使用机器学习和用户行为模型来获取网页相关性得分

序列学习

序列学习需要摄取输入序列或预测输出序列，或两者兼而有之。具体来说，输入和输出都是可变长度的序列，例如机器翻译和从语音中转录文本。

无监督学习

数据中不含有“目标”的机器学习问题通常被为无监督学习（unsupervised learning）

聚类（clustering）问题
主成分分析（principal component analysis）问题：我们能否找到少量的参数来准确地捕捉数据的线性相关属性？比如，一个球的运动轨迹可以用球的速度、直径和质量来描述。
因果关系（causality）和概率图模型（probabilistic graphical models）问题：我们能否描述观察到的许多数据的根本原因？
生成对抗性网络（generative adversarial networks）：为我们提供一种合成数据的方法，甚至像图像和音频这样复杂的非结构化数据。潜在的统计机制是检查真实和虚假数据是否相同的测试，它是无监督学习的另一个重要而令人兴奋的领域。

与环境互动

考虑“与真实环境互动”将打开一整套新的建模问题。以下只是几个例子。

环境还记得我们以前做过什么吗？

环境是否有助于我们建模？例如，用户将文本读入语音识别器。

环境是否想要打败模型？例如，一个对抗性的设置，如垃圾邮件过滤或玩游戏？

环境是否重要？

环境是否变化？例如，未来的数据是否总是与过去相似，还是随着时间的推移会发生变化？是自然变化还是响应我们的自动化工具而发生变化？

当训练和测试数据不同时，最后一个问题提出了分布偏移（distribution shift）的问题。

强化学习

在强化学习问题中，智能体（agent）在一系列的时间步骤上与环境交互。
在每个特定时间点，智能体从环境接收一些观察（observation），并且必须选择一个动作（action），然后通过某种机制（有时称为执行器）将其传输回环境，最后智能体从环境中获得奖励（reward）。
此后新一轮循环开始，智能体接收后续观察，并选择后续操作，依此类推。强化学习的过程在图中进行了说明。
请注意，强化学习的目标是产生一个好的策略（policy）。强化学习智能体选择的“动作”受策略控制，即一个从环境观察映射到行动的功能。

当环境可被完全观察到时，强化学习问题被称为马尔可夫决策过程（markov decision process）。
当状态不依赖于之前的操作时，我们称该问题为上下文赌博机（contextual bandit problem）。
当没有状态，只有一组最初未知回报的可用动作时，这个问题就是经典的多臂赌博机（multi-armed bandit problem）。

特点

深度学习的一个关键优势是它不仅取代了传统学习管道末端的浅层模型，而且还取代了劳动密集型的特征工程过程。
此外，通过取代大部分特定领域的预处理，深度学习消除了以前分隔计算机视觉、语音识别、自然语言处理、医学信息学和其他应用领域的许多界限，为解决各种问题提供了一套统一的工具。

除了端到端的训练，人们正在经历从参数统计描述到完全非参数模型的转变。
当数据稀缺时，人们需要依靠简化对现实的假设来获得有用的模型。
当数据丰富时，可以用更准确地拟合实际情况的非参数模型来代替。

小结

机器学习研究计算机系统如何利用经验（通常是数据）来提高特定任务的性能。它结合了统计学、数据挖掘和优化的思想。通常，它是被用作实现人工智能解决方案的一种手段。

表示学习作为机器学习的一类，其研究的重点是如何自动找到合适的数据表示方式。深度学习是通过学习多层次的转换来进行的多层次的表示学习。

深度学习不仅取代了传统机器学习的浅层模型，而且取代了劳动密集型的特征工程。

最近在深度学习方面取得的许多进展，大都是由廉价传感器和互联网规模应用所产生的大量数据，以及（通过GPU）算力的突破来触发的。

整个系统优化是获得高性能的关键环节。有效的深度学习框架的开源使得这一点的设计和实现变得非常容易。

深度学习引言

动手学深度学习pytorch版-笔记原文链接日常生活中的机器学习机器学习中的关键组件数据模型目标函数优化算法各种机器学习问题监督学习回归分类标记问题搜索推荐系统序列学习无监督学习与环境互动强化学习特点小结原文链接动手学深度学习pytorch中文版日常生活中的机器学习 …...

编程日记 2023/4/2 15:24:26

ESP32 WIFI使用介绍

ESP32 WIFI 概述 WIFI 库支持配置及监控 ESP32 WIFI 连网功能。支持配置 station 模式（即 STA 模式或 WIFI 客户端模式），此时 ESP32 连接到接入点（AP）。AP 模式（即 soft-AP 模式或接入点模式）&…...

编程日记 2023/2/25 4:31:29

JavaEE简单实例——MyBatis的一对一映射的嵌套查询的简单介绍和基础配置

简单介绍： 在前一章我们介绍了关于MyBatis的多表查询的时候的对应关系，其中有三种对应关系，分别是一对一，一对多，多对多的关系。如果忘记了这三种方式的对应形式可以去前面看看，一定要记住这三种映射关系的…...

编程日记 2023/2/25 4:30:11

详解指针（进阶版）（1）

前言：总篇章分为（1）和（2），本篇内容包括：指针数组，数组指针，&数组名与数组名的区分数组传参 ，函数指针，函数指针数组 part 1：指…...

编程日记 2023/4/2 15:25:50

【OJ】盐荒子孙

📚Description: 盐体图盐是对人类生存具有重要意义的物质之一。当中国古人从肉食为主转向谷食为主的时候，吃盐的需求就发生了，因为动物血肉里面包含有足够人体所需的盐分，而谷物本身不包含盐分。在长达几十万年的旧石器时代&…...

编程日记 2023/2/25 4:27:56

Java数据结构 —— 手写线性结构（稀疏数组、栈、队列、链表）

目录稀疏数组顺序表链表单向顺序链表双向链表双向循环链表求解约瑟夫环（Joseph） 栈顺序栈队列顺序队列顺序循环队列稀疏数组当一个数组中大部分值为0,或者相同时，可以采用稀疏数组的方式来保存，从而节约存储…...

编程日记 2023/2/25 4:26:43

docker部署gitlab过程中遇到的一些问题记录

文章目录用nginx代理docker部署的gitlab服务密码重置docker0网卡异常离线安装apt的包用nginx代理docker部署的gitlab服务一般咱们不会去暴露很多端口给外面，所以部署完gitlab后，我希望能够用nginx来代理我们的gitlab服务。 gitlab的docker部署参考这个…...

编程日记 2023/2/25 4:25:35

数组的定义与使用

文章目录数组的基本概念数组的基本用法数组与方法互操作一、数组的基本概念数组：可以看成是相同类型元素的一个集合。在内存中是一段连续的空间。注意：1. 数组中存放的元素其类型相同 2. 数组的空间是连在一起的 3. 每个空间有自己的编号&#xff0…...

编程日记 2023/4/2 15:27:17

SAP ABAP用程序删除开发KEY

在BASISI系统管理中，用户的开发Key存储在DEVACCESS表中，如果由于审计需要删除一些用户的开发Key，而系统有限制SM30, SE16 or SE16N 等事务码的使用，你就可以通过一个小程序去删除开发Key。代码如下： REPORT ZBCDEV…...

编程日记 2023/2/25 4:22:47

安卓设备TF卡概率性无法识别问题

现象使用t卡的设备出货前检测是正常的，放在仓库中或出货后再开机，有概率的机器无法识别，重新插拔或重启无效，拔下来放pc电脑上识别后再插回设备则恢复正常能识别。设备信息系统: Android 8.1.0 数量：抽检有12%的设备无法识别 TF卡：SanDisk Ultra 64GB 10 A1 microS…...

编程日记 2023/2/25 4:21:38

linux安装nodejs和微信小程序自动化部署操作

一.运行环境安装 Node.js 并且版本大于 8.0基础库版本为 2.7.3 及以上开发者工具版本为 1.02.1907232 及以上安装node.js(1).下载node包官网地址:https://nodejs.org/en/download/如果英文不好的,可以看中文网站:https://nodejs.org/zh-cn/download/点击上面的进行下载,当然,也…...

编程日记 2023/2/25 4:20:28

JavaScript高级 Proxy Reflect

1. Proxy 1. 监听对象的变化有一个对象，我们希望监听这个对象中的属性被设置或获取的过程我们可以通过 Object.defineProperty 来实现 const obj {name: "why",age: 18,height: 1.88 }// 需求: 监听对象属性的所有操作 // 监听属性的操作 // 1.针对…...

编程日记 2023/2/25 4:19:12

Eth-trunk ：LACP模式链路聚合实战

Eth-trunk : LACP模式链路聚合实战需求描述 PC1和PC3数据vlan10 ，网段为192.168.10.0 /24PC2和PC4数据vlan20 ，网段为192.168.20.0 /24确保设备之间互联互通，使用最大互联带宽并没有环路确保相同网段的PC可以互通判断交换机之间的每个端口…...

编程日记 2023/2/25 4:17:44

【第二章 - 线性表之顺序表】- 数据结构（八千字详解）

目录一、线性表的定义和特点二、线性表的顺序表示和实现 2.1 - 线性表的顺序存储表示 2.2 - 顺序表中基本操作的实现三、练习 3.1 - 移除元素 3.2 - 删除有序数组中的重复项 3.3 - BC100 有序序列合并 3.4 - 88.合并两个有序数组四、顺序表的问题及思考线性表、…...

编程日记 2023/2/25 4:16:30

【史上最全面esp32教程】RGB彩灯篇

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录rgb彩灯的介绍使用方法连线库操作彩灯变换颜色实验彩灯呼吸灯效果总结提示：以下是本篇文章正文内容，下面案例可供参考 rgb彩灯的介绍 ESP32…...

编程日记 2023/2/25 4:15:18

大规模 IoT 边缘容器集群管理的几种架构-5-总结

前文回顾大规模 IoT 边缘容器集群管理的几种架构-0-边缘容器及架构简介大规模 IoT 边缘容器集群管理的几种架构-1-RancherK3s大规模 IoT 边缘容器集群管理的几种架构-2-HashiCorp 解决方案 Nomad大规模 IoT 边缘容器集群管理的几种架构-3-Portainer大规模 IoT 边缘容器集群管…...

编程日记 2023/2/25 4:14:05

逆风翻盘拿下感知实习offer，机会总是留给有准备的人

个人背景211本，985硕，本科是计算机科学与技术专业，研究生是自学计算机视觉方向，本科主要做C和python程序设计开发，java安卓开发，研究生主要做目标检测，现在在入门目标跟踪和3d目标检测。无论文&…...

编程日记 2023/2/25 4:12:52

SpringBoot整合阿里云OSS文件上传、下载、查看、删除

SpringBoot整合阿里云OSS文件上传、下载、查看、删除1、开发准备1.1 前置知识1.2 环境参数1.3 你能学到什么2. 使用阿里云OSS2.1 创建Bucket2.2 管理文件2.3 阿里云OSS文档3. 项目初始化3.1 创建SpringBoot项目3.2 Maven依赖3.3 安装lombok插件4. 后端服务编写4.1 阿里云OSS配置…...

编程日记 2023/2/25 4:11:44

对话数字化经营新模式：第2届22客户节（22Day）年猪宴圆满结束！

2023年2月22日，由杭州电子商务研究院联合贰贰网络(集团)、TO B总监联盟等发起举办的“第二届客户节22Day”暨2022年度爱名奖 AM AWARDS颁奖及22年猪宴沙龙活动圆满结束。 （主持人：杜灵芝） 本次沙龙邀请到浙江工业大学管理学院程志…...

编程日记 2023/2/25 4:10:09

数据结构——第二章线性表（5）——双向循环链表

双向循环链表1.双向循环链表的定义2.双向循环链表的基本操作实现2.1 双向循环链表的初始化操作2.2.双向循环链表的插入操作2.3. 双向循环链表的删除操作1.双向循环链表的定义单向链表便于查询后继结点，不便于查询前驱结点。为了方便两个方向的查询，可以…...

编程日记 2023/2/25 4:08:45

观成科技：隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具，该工具基于TUN接口实现其功能，利用反向TCP/TLS连接建立一条隐蔽的通信信道，支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式，适应复杂网…...

编程新知 2025/7/7 6:04:11

论文解读：交大港大上海AI Lab开源论文 | 宇树机器人多姿态起立控制强化学习框架（一）

宇树机器人多姿态起立控制强化学习框架论文解析论文解读：交大&港大&上海AI Lab开源论文 | 宇树机器人多姿态起立控制强化学习框架（一） 论文解读：交大&港大&上海AI Lab开源论文 | 宇树机器人多姿态起立控制强化…...

编程新知 2025/7/3 22:07:42

【HTTP三个基础问题】

面试官您好！HTTP是超文本传输协议，是互联网上客户端和服务器之间传输超文本数据（比如文字、图片、音频、视频等）的核心协议，当前互联网应用最广泛的版本是HTTP1.1，它基于经典的C/S模型，也就是客…...

编程新知 2025/6/16 8:33:33

AI，如何重构理解、匹配与决策？

AI 时代，我们如何理解消费？ 作者｜王彬封面｜Unplash 人们通过信息理解世界。曾几何时，PC 与移动互联网重塑了人们的购物路径：信息变得唾手可得，商品决策变得高度依赖内容。但 AI 时代的来…...

编程新知 2025/7/6 19:16:38

MFC 抛体运动模拟：常见问题解决与界面美化

在 MFC 中开发抛体运动模拟程序时，我们常遇到轨迹残留、无效刷新、视觉单调、物理逻辑瑕疵等问题。本文将针对这些痛点，详细解析原因并提供解决方案，同时兼顾界面美化，让模拟效果更专业、更高效。问题一：历史轨迹与小球残影残留现象小球运动后，历史位置的 “残影”…...

编程新知 2025/7/2 15:32:43

基于IDIG-GAN的小样本电机轴承故障诊断

目录 🔍 核心问题一、IDIG-GAN模型原理 1. 整体架构 2. 核心创新点 (1) 梯度归一化（Gradient Normalization） (2) 判别器梯度间隙正则化（Discriminator Gradient Gap Regularization） (3) 自注意力机制（Self-Attention） 3. 完整损失函数二…...

编程新知 2025/7/7 14:29:27