当前位置: 首页 > news >正文

动手学深度学习|notebook教程

D2L.AI|《动手学深度学习》Notebooks 目录

面向中文读者的能运行、可讨论的深度学习教科书

含 PyTorch、NumPy/MXNet、TensorFlow 和 PaddlePaddle 实现

被全球 70 多个国家 500 多所大学用于教学
github
下面是整理好的,可以直接运行的notebook

  • 0 前言
  • 1 引言
  • 2 预备知识
    • 2.1 数据操作
    • 2.2 数据预处理
    • 2.3 线性代数
    • 2.4 微积分
    • 2.5 自动微分
    • 2.6 概率
    • 2.7 查阅文档
  • 3 线性神经网络
    • 3.1 线性回归
    • 3.2 线性回归的从零开始实现
    • 3.3 线性回归的简洁实现
    • 3.4 softmax回归
    • 3.5 图像分类数据集
    • 3.6 softmax回归的从零开始实现
    • 3.7 softmax回归的简洁实现
  • 4 多层感知机
    • 4.1 多层感知机
    • 4.10 实战Kaggle比赛:预测房价
    • 4.2 多层感知机的从零开始实现
    • 4.3 多层感知机的简洁实现
    • 4.4 模型选择、欠拟合和过拟合
    • 4.5 权重衰减
    • 4.6 暂退法(Dropout)
    • 4.7 前向传播、反向传播和计算图
    • 4.8 数值稳定性和模型初始化
    • 4.9 环境和分布偏移
  • 5 深度学习计算
    • 5.1 层和块
    • 5.2 参数管理
    • 5.3延后初始化
    • 5.4 自定义层
    • 5.5 读写文件
    • 5.6 GPU
  • 6 卷积神经网络
    • 6.1 从全连接层到卷积
    • 6.2 图像卷积
    • 6.3 填充和步幅
    • 6.4 多输入多输出通道
    • 6.5 汇聚层
    • 6.6 卷积神经网络(LeNet)
  • 7 现代卷积神经网络
    • 7.1 深度卷积神经网络(AlexNet)
    • 7.2 使用块的网络(VGG)
    • 7.3 网络中的网络(NiN)
    • 7.4 含并行连结的网络(GoogLeNet)
    • 7.5 批量规范化
    • 7.6 残差网络(ResNet)
    • 7.7稠密连接网络(DenseNet)
  • 8 循环神经网络
    • 8.1 序列模型
    • 8.2 文本预处理
    • 8.3 语言模型和数据集
    • 8.4 循环神经网络
    • 8.5 循环神经网络的从零开始实现
    • 8.6 循环神经网络的简洁实现
    • 8.7 通过时间反向传播
  • 9 现代循环神经网络
    • 9.1 门控循环单元(GRU)
    • 9.2 长短期记忆网络(LSTM)
    • 9.3 深度循环神经网络
    • 9.4 双向循环神经网络
    • 9.5 机器翻译与数据集
    • 9.6 编码器-解码器架构
    • 9.7 序列到序列学习(seq2seq)
    • 9.8 束搜索
  • 10. 注意力机制
    • 10.1 注意力提示
    • 10.2 注意力汇聚:Nadaraya-Watson 核回归
    • 10.3 注意力评分函数
    • 10.4 Bahdanau 注意力
    • 10.5 多头注意力
    • 10.6 自注意力和位置编码
    • 10.7 Transformer
  • 11 优化算法
    • 11.1 优化和深度学习
    • 11.10 Adam算法
    • 11.11 学习率调度器
    • 11.2 凸性
    • 11.3 梯度下降
    • 11.4 随机梯度下降
    • 11.5 小批量随机梯度下降
    • 11.6 动量法
    • 11.7 AdaGrad算法
    • 11.8 RMSProp算法
    • 11.9 Adadelta
  • 12 计算性能
    • 12.1 编译器和解释器
    • 12.2异步计算
    • 12.3自动并行
    • 12.4硬件
    • 12.5多GPU训练
    • 12.6 多GPU的简洁实现
    • 12.7参数服务器
  • 13 计算机视觉
    • 13.1 图像增广
    • 13.2 微调
    • 13.3 目标检测和边界框
    • 13.4 锚框
    • 13.5 多尺度目标检测
    • 13.6 目标检测数据集
    • 13.7 单发多框检测(SSD)
    • 13.8 区域卷积神经网络(R-CNN)系列
    • 13.9 语义分割和数据集
    • 13.10 转置卷积
    • 13.11 全卷积网络
    • 13.12 风格迁移
    • 13.13 实战 Kaggle 比赛:图像分类 (CIFAR-10)
    • 13.14 实战Kaggle比赛:狗的品种识别(ImageNet Dogs)
  • 14 自然语言处理:预训练
    • 14.1 词嵌入(word2vec)
    • 14.10 预训练BERT
    • 14.2 近似训练
    • 14.3 用于预训练词嵌入的数据集
    • 14.4 预训练word2vec
    • 14.5 全局向量的词嵌入(GloVe)
    • 14.6 子词嵌入
    • 14.7 词的相似性和类比任务
    • 14.8 来自Transformers的双向编码器表示(BERT)
    • 14.9 用于预训练BERT的数据集
  • 15 自然语言处理:应用
    • 15.1 情感分析及数据集
    • 15.2 情感分析:使用循环神经网络
    • 15.3 情感分析:使用卷积神经网络
    • 15.4 自然语言推断与数据集
    • 15.5 自然语言推断:使用注意力
    • 15.6 针对序列级和词元级应用微调BERT
    • 15.7 自然语言推断:微调BERT

相关文章:

动手学深度学习|notebook教程

D2L.AI|《动手学深度学习》Notebooks 目录 面向中文读者的能运行、可讨论的深度学习教科书 含 PyTorch、NumPy/MXNet、TensorFlow 和 PaddlePaddle 实现 被全球 70 多个国家 500 多所大学用于教学 github 下面是整理好的,可以直接运行的notebook 0 前…...

C#面:简述 .NET Framework 类库中的“命名空间”

在 C# 中,命名空间(Namespace)是一种用于组织和管理代码的机制。它提供了一种将相关的类、接口、结构体和其他类型组织在一起的方式,以便更好地管理和维护代码。 .NET Framework类库中的命名空间是一种逻辑上的分组,它…...

android.os.TransactionTooLargeException解决方案,Kotlin

android.os.TransactionTooLargeException解决方案,Kotlin 首先,特意制造一个让Android发生TransactionTooLargeException的场景,一个Activity启动另外一个Activity,在Intent的Bundle里面塞入一个大的ArrayList: import android.…...

ChatGPT智能聊天系统源码v2.7.6全开源Vue前后端+后端PHP

测试环境:Linux系统CentOS7.6、宝塔、PHP7.4、MySQL5.6,根目录public,伪静态thinkPHP,开启ssl证书 具有文章改写、广告营销文案、编程助手、办公达人、知心好友、家庭助手、出行助手、社交平台内容、视频脚本创作、AI绘画、思维导图等功能 ai通道:文心一言、MiniMax、智…...

汇丰:当前的美股是泡沫吗?

汇丰认为,当前的风险资产并不构成泡沫,更类似于2017年的市场环境,风险资产有望继续稳步上升。 隔夜美股飙涨,标普创三个月最大周涨,纳指收盘创历史新高。结合去年以来的强劲表现,有观点认为由科技股支撑的…...

颠覆传统:Web3如何塑造未来的数字经济

引言 近年来,随着数字化时代的到来,互联网已经成为人们生活中不可或缺的一部分。然而,随着技术的不断发展和社会的不断变迁,传统的Web2模式逐渐显露出一些弊端,如数据垄断、隐私泄露等问题,这促使人们寻求…...

iOS模拟器 Unable to boot the Simulator —— Ficow笔记

本文首发于 Ficow Shen’s Blog,原文地址: iOS模拟器 Unable to boot the Simulator —— Ficow笔记。 内容概览 前言终结模拟器进程命令行改权限清除模拟器缓存总结 前言 iOS模拟器和Xcode一样不靠谱,问题也不少。😂 那就有病治…...

使用 Flink + Faker Connector 生成测试数据压测 MySQL

博主历时三年精心创作的《大数据平台架构与原型实现:数据中台建设实战》一书现已由知名IT图书品牌电子工业出版社博文视点出版发行,点击《重磅推荐:建大数据平台太难了!给我发个工程原型吧!》了解图书详情,…...

Android单片机硬件通信《GPIO通信》

一、什么是GPIO? GPIO(英语:General-purpose input/output),通用型输入输出端口,在单片机上一般是通过一个GND引脚和若干个io引脚配合工作。 单片机可以配置GPIO输入输出模式,与外界环境进行通信交互。在输入环境下&…...

C# WPF编程-事件

C# WPF编程-路由事件 路由事件概要路由事件的三种方式 WPF事件WPF最重要的5类事件:生命周期事件 鼠标事件键盘事件多点触控输入原始触控 路由事件概要 路由事件是具有更强传播能力的事件,它们可在元素树中向上冒泡和向下隧道传播,并沿着传播…...

C语言 预处理器 注释 基本案例讲解

上文 程序设计语言与C语言发展 我们简述了 计算机语言的发展 以及编程语言与指令的概念 那么 今天 我们就来 初始C语言 并完成 第一个C语言案例 这里 我们需要完成 C语言 Hello World案例 以及 C语言程序举例 任何编程语言 开始的案例 都是 Hello World 所以说 Hello World 是…...

Flutter学习10 - Json解析与Model使用

对于网络请求返回的 Json 数据&#xff0c;一般会进行如下解析&#xff1a; 将 Json String 解析为 Map<String, dynamic>将 Json String 解析为 Dart Model 发起一个返回 Json String 的网络请求 import package:http/http.dart as http;void main() {_doGet(); }_do…...

Clickhouse异常:Exception: No operation equals between Decimal(X, X) and Float64

在使用clickhouse中的Decimal类型存储数字时&#xff0c;使用Decimal类型字段作为查询条件时&#xff0c;比如&#xff1a; SELECT COUNT(*) AS total FROM table WHERE ( my_number10.2) 会报错如下&#xff1a;Exception: No operation equals between Decimal(X, X) and F…...

会员中心微服务

文章目录 1.环境配置1.创建会员中心模块2.检查父子模块的pom.xml1.父模块注意&#xff1a;如果父模块中的依赖显示not found&#xff0c;原因是子模块并没有引用&#xff0c;不用在意 2.子模块 3.pom.xml 引入相关依赖&#xff08;别忘记刷新maven&#xff09;4.application.ym…...

element el-dialog里再调用其他组件,查找不到组件的方法

需求描述&#xff1a;点击编辑按钮&#xff0c;跳出编辑弹窗&#xff0c;回显图片组件里面的图片问题&#xff1a;element el-dialog里再调用组件&#xff0c;打开该弹窗的瞬间找不到弹窗里调用子组件的方法原因&#xff1a;弹窗显示时&#xff0c;调用的子组件还没渲染出来所以…...

【深度学习】四种天气分类 模版函数 从0到1手敲版本

引入该引入的库 import torch import torch.nn as nn import matplotlib.pyplot as plt import torch.nn.functional as F import torchvision import torch.optim as optim %matplotlib inline import os import shutil import glob os.environ["KMP_DUPLICATE_LIB_OK&q…...

Linux文件 profile、bashrc、bash_profile区别

Linux系统中&#xff0c;有三种文件 出现的非常频繁&#xff0c;那就是 profile、bash_profile、bashrc 文件。 1、profile 作用 profile&#xff0c;路径&#xff1a;/etc/profile&#xff0c;用于设置系统级的环境变量和启动程序&#xff0c;在这个文件下配置会对所有用户…...

blender记一下法线烘焙

这里主要记一下使用cage的方式 原理 看起来是从cage发射射线&#xff0c;打中高模了就把对应uv那个地方的rgb改成打中的点的normal的rgb 正事 那么首先需要一个高模 主要是几何要丰富 无所谓UV 然后一个低模&#xff0c;既然上面提到UV&#xff0c;那低模就要展UV, 展完之后…...

【LabVIEW FPGA入门】FPGA 存储器(Memory)

可以使用内存项将数据存储在FPGA块内存中。内存项以2kb为倍数引用FPGA目标上的块内存。每个内存项引用一个单独的地址或地址块&#xff0c;您可以使用内存项访问FPGA上的所有可用内存。如果需要随机访问存储的数据&#xff0c;请使用内存项。 内存项不消耗FPGA上的逻辑资源&…...

vue3+element Plus form 作为子组件,从父组件如何赋值?

刚开始接触vue3时&#xff0c;碰到一个很low的问题&#xff0c;将form作为子组件&#xff0c;在页面中给form表单项输入内容&#xff0c;输入框不显示值&#xff0c;知道问题出在哪&#xff0c;但因为vue3组合式api不熟悉&#xff0c;不知从哪下手... 效果图&#xff1a; 父组…...

从电压比较器到超级电容:DyingGasp掉电检测电路的设计与调优

1. DyingGasp功能的核心价值与应用场景 想象一下你正在视频会议中突然断电&#xff0c;对方只会看到你突然消失的画面&#xff0c;完全不知道发生了什么。而在通信设备的世界里&#xff0c;这种"突然失联"会给整个系统带来更多麻烦。DyingGasp&#xff08;临终喘息&a…...

4个革命性的B站体验升级:Windows平台的UWP客户端解决方案

4个革命性的B站体验升级&#xff1a;Windows平台的UWP客户端解决方案 【免费下载链接】BiliBili-UWP BiliBili的UWP客户端&#xff0c;当然&#xff0c;是第三方的了 项目地址: https://gitcode.com/gh_mirrors/bi/BiliBili-UWP 一、问题诊断&#xff1a;Windows用户的B…...

Go-restful容器管理终极指南:多服务部署与负载均衡完整教程

Go-restful容器管理终极指南&#xff1a;多服务部署与负载均衡完整教程 【免费下载链接】go-restful package for building REST-style Web Services using Go 项目地址: https://gitcode.com/gh_mirrors/go/go-restful Go-restful是一个强大的Go语言RESTful Web服务框架…...

LFM2.5-1.2B-Thinking-GGUF入门必看:32K上下文轻量文本生成实操

LFM2.5-1.2B-Thinking-GGUF入门必看&#xff1a;32K上下文轻量文本生成实操 1. 模型简介与核心优势 LFM2.5-1.2B-Thinking-GGUF是Liquid AI推出的轻量级文本生成模型&#xff0c;专为低资源环境优化设计。这个1.2B参数的模型采用GGUF格式&#xff0c;配合llama.cpp运行时&…...

让 ABAP 编码更顺手:全面掌握 ADT 中的预测式代码补全

在现代 ABAP 开发里,代码补全早已不只是 Ctrl + Space 之后弹出一个候选列表那么简单。随着 SAP 在 ADT,也就是 ABAP development tools for Eclipse 中持续引入 AI 辅助能力,Predictive Code Completion 已经从传统补全的补充工具,逐步变成很多开发者日常写代码时的隐形助…...

别再手动截图了!用Java POI把商品图片和详情一键导出到Excel(附完整工具类)

电商后台自动化利器&#xff1a;Java POI实现商品图文一键导出Excel实战指南 每次运营同事催你要商品数据报表时&#xff0c;还在手工复制粘贴图片吗&#xff1f;作为经历过这种折磨的开发者&#xff0c;我深知电商系统中商品信息导出的痛点——尤其是当需要将主图、详情图等多…...

保姆级教程:在Ubuntu上为龙芯2K0300开发板配置交叉编译环境(含完整测试流程)

保姆级教程&#xff1a;在Ubuntu上为龙芯2K0300开发板配置交叉编译环境&#xff08;含完整测试流程&#xff09; 刚拿到龙芯2K0300开发板的开发者们&#xff0c;往往会在环境配置阶段遇到各种"拦路虎"。本文将手把手带你完成从工具链部署到"Hello World"验…...

STK 9.2.2 实战:手把手教你用TLE文件导入中国空间站轨道数据

STK 9.2.2 实战&#xff1a;手把手教你用TLE文件导入中国空间站轨道数据 航天仿真领域的新手们常常被一个问题困扰&#xff1a;如何在自己的STK项目中快速添加真实卫星轨道数据&#xff1f;本文将带你从零开始&#xff0c;一步步完成中国空间站轨道数据的导入&#xff0c;避开那…...

雷达信号处理所有公式整理

一、雷达基本功能与距离测量 1.1 目标距离公式 $$R = \frac{ct_0}{2} \tag{1.1}$$ 详细解释: 物理意义: 计算目标距离的基本公式,其中 $t_0$ 是雷达信号从发射到接收的双程传播时间(时延),$c$ 为光速($3 \times 10^8$ m/s)。 推导: 电磁波往返传播距离为 $2R$,传…...

Python unittest 测试用例自动发现

suite = unittest.defaultTestLoader.discover(“./”, pattern=“test*.py”) 这行代码是Python unittest 测试框架里,自动发现并加载所有测试用例的核心写法 代码作用 python 运行 import unittest# 自动发现当前目录下所有以 test 开头的 .py 文件中的测试用例 suit…...