当前位置：首页 > news >正文

动手学深度学习｜notebook教程

news 2026/2/10 3:30:39

D2L.AI｜《动手学深度学习》Notebooks 目录

面向中文读者的能运行、可讨论的深度学习教科书

含 PyTorch、NumPy/MXNet、TensorFlow 和 PaddlePaddle 实现

被全球 70 多个国家 500 多所大学用于教学
github
下面是整理好的，可以直接运行的notebook

0 前言
1 引言
2 预备知识
- 2.1 数据操作
- 2.2 数据预处理
- 2.3 线性代数
- 2.4 微积分
- 2.5 自动微分
- 2.6 概率
- 2.7 查阅文档
3 线性神经网络
- 3.1 线性回归
- 3.2 线性回归的从零开始实现
- 3.3 线性回归的简洁实现
- 3.4 softmax回归
- 3.5 图像分类数据集
- 3.6 softmax回归的从零开始实现
- 3.7 softmax回归的简洁实现
4 多层感知机
- 4.1 多层感知机
- 4.10 实战Kaggle比赛：预测房价
- 4.2 多层感知机的从零开始实现
- 4.3 多层感知机的简洁实现
- 4.4 模型选择、欠拟合和过拟合
- 4.5 权重衰减
- 4.6 暂退法（Dropout）
- 4.7 前向传播、反向传播和计算图
- 4.8 数值稳定性和模型初始化
- 4.9 环境和分布偏移
5 深度学习计算
- 5.1 层和块
- 5.2 参数管理
- 5.3延后初始化
- 5.4 自定义层
- 5.5 读写文件
- 5.6 GPU
6 卷积神经网络
- 6.1 从全连接层到卷积
- 6.2 图像卷积
- 6.3 填充和步幅
- 6.4 多输入多输出通道
- 6.5 汇聚层
- 6.6 卷积神经网络（LeNet）
7 现代卷积神经网络
- 7.1 深度卷积神经网络（AlexNet）
- 7.2 使用块的网络（VGG）
- 7.3 网络中的网络（NiN）
- 7.4 含并行连结的网络（GoogLeNet）
- 7.5 批量规范化
- 7.6 残差网络（ResNet）
- 7.7稠密连接网络（DenseNet）
8 循环神经网络
- 8.1 序列模型
- 8.2 文本预处理
- 8.3 语言模型和数据集
- 8.4 循环神经网络
- 8.5 循环神经网络的从零开始实现
- 8.6 循环神经网络的简洁实现
- 8.7 通过时间反向传播
9 现代循环神经网络
- 9.1 门控循环单元（GRU）
- 9.2 长短期记忆网络（LSTM）
- 9.3 深度循环神经网络
- 9.4 双向循环神经网络
- 9.5 机器翻译与数据集
- 9.6 编码器-解码器架构
- 9.7 序列到序列学习（seq2seq）
- 9.8 束搜索
10. 注意力机制
- 10.1 注意力提示
- 10.2 注意力汇聚：Nadaraya-Watson 核回归
- 10.3 注意力评分函数
- 10.4 Bahdanau 注意力
- 10.5 多头注意力
- 10.6 自注意力和位置编码
- 10.7 Transformer
11 优化算法
- 11.1 优化和深度学习
- 11.10 Adam算法
- 11.11 学习率调度器
- 11.2 凸性
- 11.3 梯度下降
- 11.4 随机梯度下降
- 11.5 小批量随机梯度下降
- 11.6 动量法
- 11.7 AdaGrad算法
- 11.8 RMSProp算法
- 11.9 Adadelta
12 计算性能
- 12.1 编译器和解释器
- 12.2异步计算
- 12.3自动并行
- 12.4硬件
- 12.5多GPU训练
- 12.6 多GPU的简洁实现
- 12.7参数服务器
13 计算机视觉
- 13.1 图像增广
- 13.2 微调
- 13.3 目标检测和边界框
- 13.4 锚框
- 13.5 多尺度目标检测
- 13.6 目标检测数据集
- 13.7 单发多框检测（SSD）
- 13.8 区域卷积神经网络（R-CNN）系列
- 13.9 语义分割和数据集
- 13.10 转置卷积
- 13.11 全卷积网络
- 13.12 风格迁移
- 13.13 实战 Kaggle 比赛：图像分类 (CIFAR-10)
- 13.14 实战Kaggle比赛：狗的品种识别（ImageNet Dogs）
14 自然语言处理：预训练
- 14.1 词嵌入（word2vec）
- 14.10 预训练BERT
- 14.2 近似训练
- 14.3 用于预训练词嵌入的数据集
- 14.4 预训练word2vec
- 14.5 全局向量的词嵌入（GloVe）
- 14.6 子词嵌入
- 14.7 词的相似性和类比任务
- 14.8 来自Transformers的双向编码器表示（BERT）
- 14.9 用于预训练BERT的数据集
15 自然语言处理：应用
- 15.1 情感分析及数据集
- 15.2 情感分析：使用循环神经网络
- 15.3 情感分析：使用卷积神经网络
- 15.4 自然语言推断与数据集
- 15.5 自然语言推断：使用注意力
- 15.6 针对序列级和词元级应用微调BERT
- 15.7 自然语言推断：微调BERT

动手学深度学习｜notebook教程

D2L.AI｜《动手学深度学习》Notebooks 目录面向中文读者的能运行、可讨论的深度学习教科书含 PyTorch、NumPy/MXNet、TensorFlow 和 PaddlePaddle 实现被全球 70 多个国家 500 多所大学用于教学 github 下面是整理好的，可以直接运行的notebook 0 前…...

编程日记 2024/3/24 8:01:06

C#面：简述 .NET Framework 类库中的“命名空间”

在 C# 中，命名空间（Namespace）是一种用于组织和管理代码的机制。它提供了一种将相关的类、接口、结构体和其他类型组织在一起的方式，以便更好地管理和维护代码。 .NET Framework类库中的命名空间是一种逻辑上的分组，它…...

编程日记 2024/3/24 8:00:05

android.os.TransactionTooLargeException解决方案，Kotlin

android.os.TransactionTooLargeException解决方案，Kotlin 首先，特意制造一个让Android发生TransactionTooLargeException的场景，一个Activity启动另外一个Activity，在Intent的Bundle里面塞入一个大的ArrayList: import android.…...

编程日记 2024/3/24 7:59:04

ChatGPT智能聊天系统源码v2.7.6全开源Vue前后端+后端PHP

测试环境：Linux系统CentOS7.6、宝塔、PHP7.4、MySQL5.6，根目录public，伪静态thinkPHP，开启ssl证书具有文章改写、广告营销文案、编程助手、办公达人、知心好友、家庭助手、出行助手、社交平台内容、视频脚本创作、AI绘画、思维导图等功能 ai通道：文心一言、MiniMax、智…...

编程日记 2024/3/24 7:48:55

汇丰：当前的美股是泡沫吗？

汇丰认为，当前的风险资产并不构成泡沫，更类似于2017年的市场环境，风险资产有望继续稳步上升。隔夜美股飙涨，标普创三个月最大周涨，纳指收盘创历史新高。结合去年以来的强劲表现，有观点认为由科技股支撑的…...

编程日记 2024/3/24 7:47:55

颠覆传统：Web3如何塑造未来的数字经济

引言近年来，随着数字化时代的到来，互联网已经成为人们生活中不可或缺的一部分。然而，随着技术的不断发展和社会的不断变迁，传统的Web2模式逐渐显露出一些弊端，如数据垄断、隐私泄露等问题，这促使人们寻求…...

编程日记 2024/3/24 7:46:53

iOS模拟器 Unable to boot the Simulator —— Ficow笔记

本文首发于 Ficow Shen’s Blog，原文地址： iOS模拟器 Unable to boot the Simulator —— Ficow笔记。内容概览前言终结模拟器进程命令行改权限清除模拟器缓存总结前言 iOS模拟器和Xcode一样不靠谱，问题也不少。😂 那就有病治…...

编程日记 2024/3/24 7:43:48

使用 Flink + Faker Connector 生成测试数据压测 MySQL

博主历时三年精心创作的《大数据平台架构与原型实现：数据中台建设实战》一书现已由知名IT图书品牌电子工业出版社博文视点出版发行，点击《重磅推荐：建大数据平台太难了！给我发个工程原型吧！》了解图书详情，…...

编程日记 2024/3/24 7:42:47

Android单片机硬件通信《GPIO通信》

一、什么是GPIO? GPIO（英语：General-purpose input/output），通用型输入输出端口，在单片机上一般是通过一个GND引脚和若干个io引脚配合工作。单片机可以配置GPIO输入输出模式,与外界环境进行通信交互。在输入环境下&…...

编程日记 2024/3/24 7:33:39

C# WPF编程-事件

C# WPF编程-路由事件路由事件概要路由事件的三种方式 WPF事件WPF最重要的5类事件：生命周期事件鼠标事件键盘事件多点触控输入原始触控路由事件概要路由事件是具有更强传播能力的事件，它们可在元素树中向上冒泡和向下隧道传播，并沿着传播…...

编程日记 2024/3/24 7:30:36

C语言预处理器注释基本案例讲解

上文程序设计语言与C语言发展我们简述了计算机语言的发展以及编程语言与指令的概念那么今天我们就来初始C语言并完成第一个C语言案例这里我们需要完成 C语言 Hello World案例以及 C语言程序举例任何编程语言开始的案例都是 Hello World 所以说 Hello World 是…...

编程日记 2024/3/24 7:19:28

Flutter学习10 - Json解析与Model使用

对于网络请求返回的 Json 数据，一般会进行如下解析： 将 Json String 解析为 Map<String, dynamic>将 Json String 解析为 Dart Model 发起一个返回 Json String 的网络请求 import package:http/http.dart as http;void main() {_doGet(); }_do…...

编程日记 2024/3/24 7:18:27

Clickhouse异常：Exception: No operation equals between Decimal(X, X) and Float64

在使用clickhouse中的Decimal类型存储数字时，使用Decimal类型字段作为查询条件时，比如： SELECT COUNT(*) AS total FROM table WHERE ( my_number10.2) 会报错如下：Exception: No operation equals between Decimal(X, X) and F…...

编程日记 2024/3/24 7:16:25

会员中心微服务

文章目录 1.环境配置1.创建会员中心模块2.检查父子模块的pom.xml1.父模块注意：如果父模块中的依赖显示not found，原因是子模块并没有引用，不用在意 2.子模块 3.pom.xml 引入相关依赖（别忘记刷新maven）4.application.ym…...

编程日记 2024/3/24 7:15:24

element el-dialog里再调用其他组件，查找不到组件的方法

需求描述：点击编辑按钮，跳出编辑弹窗，回显图片组件里面的图片问题：element el-dialog里再调用组件，打开该弹窗的瞬间找不到弹窗里调用子组件的方法原因：弹窗显示时，调用的子组件还没渲染出来所以…...

编程日记 2024/3/24 7:12:21

引入该引入的库 import torch import torch.nn as nn import matplotlib.pyplot as plt import torch.nn.functional as F import torchvision import torch.optim as optim %matplotlib inline import os import shutil import glob os.environ["KMP_DUPLICATE_LIB_OK&q…...

编程日记 2024/3/24 7:11:20

Linux文件 profile、bashrc、bash_profile区别

Linux系统中，有三种文件出现的非常频繁，那就是 profile、bash_profile、bashrc 文件。 1、profile 作用 profile，路径：/etc/profile，用于设置系统级的环境变量和启动程序，在这个文件下配置会对所有用户…...

编程日记 2024/3/24 7:08:17

blender记一下法线烘焙

这里主要记一下使用cage的方式原理看起来是从cage发射射线，打中高模了就把对应uv那个地方的rgb改成打中的点的normal的rgb 正事那么首先需要一个高模主要是几何要丰富无所谓UV 然后一个低模，既然上面提到UV，那低模就要展UV, 展完之后…...

编程日记 2024/3/24 7:06:14

【LabVIEW FPGA入门】FPGA 存储器（Memory）

可以使用内存项将数据存储在FPGA块内存中。内存项以2kb为倍数引用FPGA目标上的块内存。每个内存项引用一个单独的地址或地址块，您可以使用内存项访问FPGA上的所有可用内存。如果需要随机访问存储的数据，请使用内存项。内存项不消耗FPGA上的逻辑资源&…...

编程日记 2024/3/24 7:04:13

vue3+element Plus form 作为子组件，从父组件如何赋值？

刚开始接触vue3时，碰到一个很low的问题，将form作为子组件，在页面中给form表单项输入内容，输入框不显示值，知道问题出在哪，但因为vue3组合式api不熟悉，不知从哪下手... 效果图： 父组…...

编程日记 2024/3/24 7:00:09

浏览器访问 AWS ECS 上部署的 Docker 容器（监听 80 端口）

✅ 一、ECS 服务配置 Dockerfile 确保监听 80 端口 EXPOSE 80 CMD ["nginx", "-g", "daemon off;"]或 EXPOSE 80 CMD ["python3", "-m", "http.server", "80"]任务定义（Task Definition&…...

编程新知 2026/2/8 15:03:14

[2025CVPR]DeepVideo-R1：基于难度感知回归GRPO的视频强化微调框架详解

突破视频大语言模型推理瓶颈，在多个视频基准上实现SOTA性能一、核心问题与创新亮点 1.1 GRPO在视频任务中的两大挑战安全措施依赖问题 GRPO使用min和clip函数限制策略更新幅度，导致：梯度抑制：当新旧策略差异过大时梯度消失收敛困难：策略无法充分优化# 传统GRPO的梯…...

编程新知 2025/8/19 23:46:57

SciencePlots——绘制论文中的图片

文章目录安装一、风格二、1 资源安装 # 安装最新版 pip install githttps://github.com/garrettj403/SciencePlots.git# 安装稳定版 pip install SciencePlots一、风格简单好用的深度学习论文绘图专用工具包–Science Plot 二、 1 资源论文绘图神器来了：一行…...

编程新知 2025/9/8 13:50:07

Objective-C常用命名规范总结

【OC】常用命名规范总结文章目录【OC】常用命名规范总结1.类名（Class Name)2.协议名（Protocol Name)3.方法名（Method Name)4.属性名（Property Name）5.局部变量/实例变量（Local / Instance Variables&…...

编程新知 2025/12/14 22:33:06

涂鸦T5AI手搓语音、emoji、otto机器人从入门到实战

“🤖手搓TuyaAI语音指令 😍秒变表情包大师，让萌系Otto机器人🔥玩出智能新花样！开整！” 🤖 Otto机器人 → 直接点明主体手搓TuyaAI语音 → 强调自主编程/自定义语音控制（TuyaAI…...

编程新知 2026/1/30 16:09:53

EtherNet/IP转DeviceNet协议网关详解

一，设备主要功能疆鸿智能JH-DVN-EIP本产品是自主研发的一款EtherNet/IP从站功能的通讯网关。该产品主要功能是连接DeviceNet总线和EtherNet/IP网络，本网关连接到EtherNet/IP总线中做为从站使用，连接到DeviceNet总线中做为从站使用。在自动…...

编程新知 2026/1/31 6:53:51

高效线程安全的单例模式：Python 中的懒加载与自定义初始化参数

高效线程安全的单例模式：Python 中的懒加载与自定义初始化参数在软件开发中，单例模式（Singleton Pattern）是一种常见的设计模式，确保一个类仅有一个实例，并提供一个全局访问点。在多线程环境下，实现单例模式时需要注意线程安全问题，以防止多个线程同时创建实例，导致…...

编程新知 2025/11/25 19:50:27

return this；返回的是谁

一个审批系统的示例来演示责任链模式的实现。假设公司需要处理不同金额的采购申请，不同级别的经理有不同的审批权限： // 抽象处理者：审批者 abstract class Approver {protected Approver successor; // 下一个处理者// 设置下一个处理者pub…...

编程新知 2026/1/28 21:45:43

AGain DB和倍数增益的关系

我在设置一款索尼CMOS芯片时，Again增益0db变化为6DB，画面的变化只有2倍DN的增益，比如10变为20。这与dB和线性增益的关系以及传感器处理流程有关。以下是具体原因分析： 1. dB与线性增益的换算关系 6dB对应的理论线性增益应为&…...

编程新知 2025/9/30 16:23:57

Kafka入门-生产者

生产者生产者发送流程： 延迟时间为0ms时，也就意味着每当有数据就会直接发送异步发送API 异步发送和同步发送的不同在于：异步发送不需要等待结果，同步发送必须等待结果才能进行下一步发送。普通异步发送首先导入所需的k…...

编程新知 2026/1/26 4:49:33

动手学深度学习｜notebook教程

C#面：简述 .NET Framework 类库中的“命名空间”

android.os.TransactionTooLargeException解决方案，Kotlin

ChatGPT智能聊天系统源码v2.7.6全开源Vue前后端+后端PHP

汇丰：当前的美股是泡沫吗？

颠覆传统：Web3如何塑造未来的数字经济

iOS模拟器 Unable to boot the Simulator —— Ficow笔记

使用 Flink + Faker Connector 生成测试数据压测 MySQL

Android单片机硬件通信《GPIO通信》

C# WPF编程-事件

C语言预处理器注释基本案例讲解

Flutter学习10 - Json解析与Model使用

Clickhouse异常：Exception: No operation equals between Decimal(X, X) and Float64

会员中心微服务

element el-dialog里再调用其他组件，查找不到组件的方法

【深度学习】四种天气分类模版函数从0到1手敲版本

Linux文件 profile、bashrc、bash_profile区别

blender记一下法线烘焙

【LabVIEW FPGA入门】FPGA 存储器（Memory）

vue3+element Plus form 作为子组件，从父组件如何赋值？

浏览器访问 AWS ECS 上部署的 Docker 容器（监听 80 端口）

[2025CVPR]DeepVideo-R1：基于难度感知回归GRPO的视频强化微调框架详解

SciencePlots——绘制论文中的图片

Objective-C常用命名规范总结

涂鸦T5AI手搓语音、emoji、otto机器人从入门到实战

EtherNet/IP转DeviceNet协议网关详解

高效线程安全的单例模式：Python 中的懒加载与自定义初始化参数

return this；返回的是谁

AGain DB和倍数增益的关系

Kafka入门-生产者

动手学深度学习｜notebook教程

D2L.AI｜《动手学深度学习》Notebooks 目录

相关文章：