当前位置：首页 > news >正文

动手学深度学习（Pytorch版）代码实践-深度学习基础-01基础函数的使用

news 2026/5/17 14:32:07

01基础函数的使用

主要内容

张量操作：创建和操作张量，包括重塑、填充、逐元素操作等。
数据处理：使用pandas加载和处理数据，包括处理缺失值和进行one-hot编码。
线性代数：包括矩阵运算、求和、均值、点积和各种范数计算。
自动求导：使用PyTorch的自动求导功能计算梯度，并演示梯度清除和分离计算图的操作。

import torch
import pandas as pd
import os# 创建和操作张量
# 张量表示一个数值组成的数组，这个数组可能有多个维度
x = torch.arange(12)  # 创建一个包含从0到11的向量
print("x:", x)  # 打印张量xprint("x的形状:", x.shape)  # 打印张量的形状print("x中的元素总数:", x.numel())  # 打印张量中元素的总数# 改变一个张量的形状而不改变元素数量和元素值，采用reshape
X = x.reshape(3, 4)  # 将x重塑为一个3行4列的矩阵
print("重塑后的X:", X)  # 打印重塑后的X# 创建全0，全1张量
print("全零张量:", torch.zeros((2, 3, 4)))  # 创建一个形状为(2,3,4)的全0张量
print("全一张量:", torch.ones((2, 3, 4)))  # 创建一个形状为(2,3,4)的全1张量# 使用包含数值的Python列表创建张量
t = torch.tensor([[2, 1, 4, 3], [1, 2, 3, 4], [4, 3, 2, 1]])  # 创建张量t
print("从列表创建的张量:", t)  # 打印张量t
print("张量t的形状:", t.shape)  # 打印张量t的形状# 张量操作
X = torch.arange(12, dtype=torch.float32).reshape((3, 4))  # 创建并重塑张量X
Y = torch.tensor([[2.0, 1, 4, 3], [1, 2, 3, 4], [4, 3, 2, 1]])  # 创建张量YZ = torch.zeros_like(X)  # 创建一个形状和X相同的全零张量
Z[:] = X + Y  # 计算X和Y的逐元素加法
print("Z (X + Y):", Z)  # 打印Z
print("Z的转置:", Z.T)  # 打印Z的转置# 使用pandas创建和处理数据集
# 创建一个人工数据集，并存储在CSV（逗号分隔值）文件中
os.makedirs(os.path.join('..', 'data'), exist_ok=True)  # 创建数据目录
data_file = os.path.join('..', 'data', 'house_tiny.csv')  # 定义文件路径
with open(data_file, 'w') as f:f.write('NumRooms,Alley,Price\n')  # 列名f.write('NA,Pave,127500\n')  # 每行表示一个数据样本f.write('2,NA,106000\n')f.write('4,NA,178100\n')f.write('NA,NA,140000\n')data = pd.read_csv(data_file)  # 读取CSV文件
print("从CSV加载的数据:", data)  # 打印加载的数据inputs, outputs = data.iloc[:, 0:2], data.iloc[:, 2]  # 分离输入和输出
inputs['NumRooms'] = inputs['NumRooms'].fillna(inputs['NumRooms'].mean())  # 用均值填充缺失值
print("处理后的输入数据:", inputs)  # 打印处理后的输入数据inputs = pd.get_dummies(inputs, dummy_na=True).astype('float')  # 转换类别变量并将其转换为浮点型
print("独热编码后的输入数据:", inputs)  # 打印独热编码后的输入数据X = torch.tensor(inputs.values)  # 将输入数据转换为张量
Y = torch.tensor(outputs.values)  # 将输出数据转换为张量
print("输入数据的张量X:", X)  # 打印输入数据的张量X
print("输出数据的张量Y:", Y)  # 打印输出数据的张量Y# 线性代数操作
A = torch.arange(20, dtype=torch.float32).reshape(5, 4)  # 创建并重塑张量A
B = A.clone()  # 通过分配新内存，将A的副本分配给B
print("矩阵A:", A)  # 打印矩阵A
print("矩阵A + B:", A + B)  # 矩阵加法
print("矩阵A * B:", A * B)  # 矩阵逐元素乘法a = 2
X = torch.arange(24).reshape(2, 3, 4)  # 创建并重塑张量X
print("张量X:", X)  # 打印张量X
print("a + X:", a + X)  # 标量和张量相加
print("a * X的形状:", (a * X).shape)  # 打印标量和张量相乘后的形状# 求和与均值
A_sum_axis0 = A.sum(axis=0)  # 沿着第0维度求和
print("沿第0维度求和:", A_sum_axis0, "形状:", A_sum_axis0.shape)  # 打印求和结果及其形状print("A中的元素总数:", A.numel())  # 打印A中的元素总数
print("A的均值:", A.mean())  # 打印A的均值
print("A的和除以元素总数:", A.sum() / A.numel())  # 打印A的和除以元素总数sum_A = A.sum(axis=1, keepdims=True)  # 沿第1维度求和，并保持维度
print("沿第1维度求均值，保持维度:", A.mean(axis=1, keepdim=True))  # 打印沿第1维度的均值，并保持维度
print("沿第1维度求和，保持维度:", sum_A)  # 打印沿第1维度的求和，并保持维度print("A的归一化 (A / sum_A):", A / sum_A)  # 打印归一化的Aprint("沿第0维度的累积和:", A.cumsum(axis=0))  # 打印沿第0维度的累积和# 点积
x = torch.arange(4, dtype=torch.float32)  # 创建张量x
y = torch.ones(4, dtype=torch.float32)  # 创建全1张量y
print("x和y的点积:", torch.dot(x, y))  # 打印x和y的点积
print("逐元素乘积的和:", torch.sum(x * y))  # 打印逐元素乘积的和print("矩阵A和向量x的乘积:", torch.mv(A, x))  # 打印矩阵和向量的乘积# 矩阵乘法
B = torch.ones(4, 3)  # 创建全1矩阵B
print("矩阵A:", A)  # 打印矩阵A
print("矩阵B:", B)  # 打印矩阵B
print("矩阵A和B的矩阵乘法:", torch.mm(A, B))  # 打印矩阵A和B的矩阵乘法# 各种范数
u = torch.tensor([3.0, -4.0])  # 创建张量u
print("u的L2范数:", torch.norm(u))  # 打印u的L2范数
print("u的L1范数:", torch.abs(u).sum())  # 打印u的L1范数
print("一个全1矩阵(4x9)的弗罗贝尼乌斯范数:", torch.norm(torch.ones((4, 9))))  # 打印全1矩阵的弗罗贝尼乌斯范数print("张量元素的和:", sum(torch.arange(20, dtype=torch.float32)))  # 打印张量元素的和A = torch.arange(40, dtype=torch.float32).reshape(2, 5, 4)  # 创建并重塑张量A
print("3D张量A:", A)  # 打印3D张量A
print("沿轴[1,2]求和:", A.sum(axis=[1, 2]))  # 打印沿轴[1,2]求和结果
print("沿轴[1,2]求和，保持维度:", A.sum(axis=[1, 2], keepdims=True))  # 打印沿轴[1,2]求和结果，并保持维度A = torch.ones(2, 5, 4)  # 创建全1张量A
print("3D张量A，全为1:", A)  # 打印全1张量A
print("沿轴[0,1]求和，保持维度:", A.sum(axis=[0, 1], keepdim=True))  # 打印沿轴[0,1]求和结果，并保持维度# 自动求导
x = torch.arange(4.0)  # 创建张量x
print("张量x:", x)  # 打印张量xx.requires_grad_(True)  # 开启自动求导
print("x的梯度 (初始为None):", x.grad)  # 打印x的梯度 (初始为None)y = 2 * torch.dot(x, x)  # 2 * (x · x) 求导为 4x
print("y = 2 * (x · x):", y)  # 打印yy.backward()  # 计算导数
print("backward之后x的梯度:", x.grad)  # 打印x的梯度
print("x的梯度是否等于4 * x:", x.grad == 4 * x)  # 打印x的梯度是否等于4 * x# 清除梯度
x.grad.zero_()  # 清除x的梯度
y = x.sum()
y.backward()
print("求和y并backward之后的x梯度:", x.grad)  # 打印求和y并backward之后的x梯度# 对非标量调用backward需要传入一个gradient参数
x.grad.zero_()  # 清除x的梯度
y = x * x
y.sum().backward()  # 等价于 y.backward(torch.ones(len(x)))
print("平方并求和y之后的x梯度:", x.grad)  # 打印平方并求和y之后的x梯度# 分离计算图
x.grad.zero_()  # 清除x的梯度
y = x * x
u = y.detach()  # 从计算图中分离y
print("张量y:", y)  # 打印张量y
print("从y分离的张量u:", u)  # 打印从y分离的张量uz = u * x
z.sum().backward()
print("分离u乘以x的梯度:", x.grad == u)  # 打印分离u乘以x的梯度x.grad.zero_()  # 清除x的梯度
y.sum().backward()
print("再次求和y之后的x梯度:", x.grad == 2 * x)  # 打印再次求和y之后的x梯度

动手学深度学习（Pytorch版）代码实践-深度学习基础-01基础函数的使用

01基础函数的使用主要内容张量操作：创建和操作张量，包括重塑、填充、逐元素操作等。数据处理：使用pandas加载和处理数据，包括处理缺失值和进行one-hot编码。线性代数：包括矩阵运算、求和、均值、点积和各种范数计算…...

编程日记 2024/5/31 22:10:12

vm-bhyve：bhyve虚拟机的管理系统@FreeBSD

先说情况，当前创建虚拟机后网络没有调通....不明白是最近自己点背，还是确实有难度... 缘起： 前段时间学习bhyve虚拟机，发现bvm这个虚拟机管理系统，但是实践下来发现网络方面好像有问题，至少我花了两天时间…...

编程日记 2024/5/31 22:08:10

【Java】刚刚！突然！紧急通知！垃圾回收！

【Java】刚刚！突然！紧急通知！垃圾回收！ 文章目录【Java】刚刚！突然！紧急通知！垃圾回收！从C语言的内存管理引入：手动回收Java的垃圾回收机制引用计数器循环引用问题可达…...

编程日记 2024/5/31 22:07:09

[Algorithm][动态规划][子序列问题][最长递增子序列][摆动序列]详细讲解

目录 0.子序列 vs 子数组1.最长递增子序列1.题目链接2.算法原理详解3.代码实现 2.摆动序列1.题目链接2.题目链接3.代码实现 0.子序列 vs 子数组子序列： 相对顺序是跟源字符串/数组是一致的但是元素和元素之间，在源字符串/数组中可以是不连续的一般时间…...

编程日记 2024/5/31 22:06:08

【稳定检索】2024年心理学与现代化教育、媒体国际会议(PMEM 2024)

2024年心理学与现代化教育、媒体国际会议 2024 International Conference on Psychology and Modern Education and Media 【1】会议简介 2024年心理学与现代化教育、媒体国际会议即将召开，这是一场汇聚全球心理学、教育及媒体领域精英的学术盛宴。本次会议将深入探…...

编程日记 2024/5/31 22:04:05

深入了解diffusion model

diffusion model是如何运作的会输入当时noise的严重程度，根据我们的输入来确定在第几个step，并做出不同的回应。 Denoise模组内部实际做的事情产生一张图片和产生noise难度是不一样的，若denoise 模块产生一只带噪声的猫说明这个模块已经会…...

编程日记 2024/5/31 22:02:03

TransmittableThreadLocal原理

1、原理 TransmittableThreadLocal（简称TTL）是阿里巴巴开源的一个Java库，用于解决线程池中线程本地变量传递的问题。其底层原理主要是基于Java的ThreadLocal机制并对其进行扩展，以支持在父子线程间以及线程池中任务切换时&#x…...

编程日记 2024/5/31 22:01:02

华为昇腾310B初体验，OrangePi AIpro开发板使用测评

0、写在前面很高兴收到官方的OrangePi AIpro开发板测试邀请，在过去的几年中，我在自己的博客写了一系列有关搭载嵌入式Linux系统的SBC（单板计算机）的博文，包括树莓派4系列、2K1000龙芯教育派、Radxa Rock5B、BeagleBo…...

编程日记 2024/5/31 21:59:00

GPTQ 量化大模型

GPTQ 量化大模型 GPTQ 算法 GPTQ 算法由 Frantar 等人 (2023) 提出，它从 OBQ 方法中汲取灵感，但进行了重大改进，可以将其扩展到（非常）大型的语言模型。步骤 1：任意顺序量化 OBQ 方法选择权重按特定顺序…...

编程日记 2024/5/31 21:56:58

【GD32】05 - PWM 脉冲宽度调制

PWM PWM (Pulse Width Modulation) 是一种模拟信号电平的方法，它通过使用数字信号（通常是方波）来近似地表示模拟信号。在PWM中，信号的占空比（即高电平时间占整个周期的比例）被用来控制平均输出电压或电流。…...

编程日记 2024/5/31 21:55:57

JVM思维导图

帮助我们快速整理和总结JVM相关知识，有结构化认识和整体的思维模型 JVM相关详细知识和面试题...

编程日记 2024/5/31 21:54:56

Ollama+OpenWebUI+Phi3本地大模型入门

文章目录 Ollama+OpenWebUI+Phi3本地大模型入门一、基础环境二、Ollama三、OpenWebUI + Phi3Ollama+OpenWebUI+Phi3本地大模型入门完全不懂大模型的请绕道，相信我李一舟的课程比较适合 Ollama提供大模型运行环境，OpenWebUI提供UI，Phi3就是那个大模型。当然，Ollama支持超级…...

编程日记 2024/5/31 21:53:55

实战15：bert 命名实体识别、地址解析、人名电话地址抽取系统-完整代码数据

直接看项目视频演示： bert 命名实体识别、关系抽取、人物抽取、地址解析、人名电话地址提取系统-完整代码数据_哔哩哔哩_bilibili 项目演示：代码： import re from transformers import BertTokenizer, BertForTokenClassification, pipeline import os import torch im…...

编程日记 2024/5/31 21:52:54

js 表格添加|删除一行交互

一、需求二、实现 <div style"margin-bottom: 55px"><form action"" method"post" enctype"multipart/form-data" id"reportForm" name"sjf" style"margin-left: 25px;margin-bottom: 50px;&quo…...

编程日记 2024/5/31 21:51:52

如何选择合适的服务器硬件和配置？

业务需求了解您的业务需求和负载。这将帮助您确定需要哪种类型的服务器（如文件服务器、数据库服务器、Web服务器等）以及所需的处理能力、内存、存储和网络性能。...

编程日记 2024/5/31 21:50:51

Prometheus + Grafana + Alertmanager 系统监控

PrometheusGrafana 系统监控 1. 简介1.1 Prometheus 普罗米修斯1.2 Grafana 2. 快速试用2.1 Prometheus 普罗米修斯2.2 Prometheus 配置文件2.3 Grafana 2. 使用 Docker-Compose脚本部署监控服务3. Grafana 配置3.1 配置数据源 Prometheus3.2 使用模板ID 配置监控模板3.3 使用…...

编程日记 2024/5/31 21:49:50

5.23R语言-参数假设检验

理论方差分析（ANOVA, Analysis of Variance）是统计学中用来比较多个样本均值之间差异的一种方法。它通过将总变异分解为不同来源的变异来检测因子对响应变量的影响。方差分析广泛应用于实验设计、质量控制、医学研究等领域。方差分析的基本模型方差…...

编程日记 2024/5/31 21:48:49

rnn 和lstm源码学习笔记

目录 rnn学习笔记 lstm学习笔记 rnn学习笔记 import torchdef rnn(inputs, state, params):# inputs的形状: (时间步数量, 批次大小, 词表大小)W_xh, W_hh, b_h, W_hq, b_q paramsH stateoutputs []# 遍历每个时间步for X in inputs:# 计算隐藏状态 HH torch.tanh(torch.…...

编程日记 2024/5/31 21:47:48

解析Java中1000个常用类：CharSequence类，你学会了吗？

在 Java 编程中，字符串操作是最常见的任务之一。为了提供一种灵活且统一的方式来处理不同类型的字符序列，Java 引入了 CharSequence 接口。通过实现 CharSequence 接口，各种字符序列类可以提供一致的 API，增强了代码的灵活性和可扩展性。本文将深入探讨 CharSequence 接…...

编程日记 2024/5/31 21:46:46

微服务远程调用之拦截器实战

微服务远程调用之拦截器实战前言： 在我们开发过程中，很可能是项目是从0到1开发，或者在原有基础上做二次开发，这次是根据已有代码做二次开发，需要在我们微服务一【这里方便举例，我们后面叫模版微服务】调用…...

编程日记 2024/5/31 21:45:45

颠覆性创新：为什么Upkie开源轮式双足机器人正在重新定义机器人开发范式

颠覆性创新：为什么Upkie开源轮式双足机器人正在重新定义机器人开发范式【免费下载链接】upkie Open-source wheeled biped robots 项目地址: https://gitcode.com/gh_mirrors/up/upkie 在传统机器人设计面临轮式与足式两难选择的今天，一个革命性…...

编程新知 2026/5/17 10:55:31

Adobe-GenP终极指南：5分钟破解Adobe创意套件限制的完整教程

Adobe-GenP终极指南：5分钟破解Adobe创意套件限制的完整教程【免费下载链接】Adobe-GenP Adobe CC 2019/2020/2021/2022/2023 GenP Universal Patch 3.0 项目地址: https://gitcode.com/gh_mirrors/ad/Adobe-GenP 你是否曾因为Adobe Creative Cloud高昂的订阅…...

编程新知 2026/5/17 10:37:23

ncmdumpGUI：3分钟解锁网易云音乐ncm格式，让你的音乐无处不在

ncmdumpGUI：3分钟解锁网易云音乐ncm格式，让你的音乐无处不在【免费下载链接】ncmdumpGUI C#版本网易云音乐ncm文件格式转换，Windows图形界面版本项目地址: https://gitcode.com/gh_mirrors/nc/ncmdumpGUI 还在为网易云音乐下载的nc…...

编程新知 2026/5/17 9:00:15

前端工程化实战：基于 Kelivo 模板的配置即代码与自动化工作流

1. 项目概述与核心价值最近在整理个人开发环境时，发现一个挺有意思的项目，叫Chevey339/kelivo。乍一看这个仓库名，可能有点摸不着头脑，但点进去之后，你会发现它是一个围绕特定开发工具或框架进行深度定制、优化和功能增…...

编程新知 2026/5/17 7:42:27

Qdrant客户端库实战：从向量数据库连接到生产级应用开发

1. 项目概述：从向量数据库到应用落地的桥梁如果你最近在折腾大模型应用，或者想给自己的产品加上一个“智能大脑”，那你大概率绕不开一个词：向量数据库。简单来说，它就像一个能理解“意思”的超级搜索引擎，不…...

编程新知 2026/5/17 7:38:08

AI模型部署实战：基于FastAPI与Tauri构建OpenClaw模型GUI应用

1. 项目概述与核心价值最近在AI应用开发圈里，一个名为“GrahamMiranda-AI/openclaw-model-gui”的项目引起了我的注意。乍一看这个标题，它融合了“openclaw-model”和“gui”两个关键部分，这让我立刻联想到一个典型的场景：一个已经…...

编程新知 2026/5/17 7:29:46

Kubernetes配置管理实战：基于Kustomize的结构化部署与多环境管理

1. 项目概述：一个被低估的Kubernetes配置管理利器如果你和我一样，长期在Kubernetes生态里摸爬滚打，那你一定经历过这样的场景：为了部署一个稍微复杂点的应用，需要维护一堆YAML文件——Deployment、Service、ConfigMap、…...

编程新知 2026/5/17 7:25:36

告别时间混乱：一份超全的Hive日期函数使用手册与常见错误排查

告别时间混乱：一份超全的Hive日期函数使用手册与常见错误排查在数据开发领域，时间数据处理一直是高频且易错的环节。无论是日志分析、用户行为追踪还是财务报表生成，准确的时间计算都是确保数据质量的基础。Hive作为大数据生态中广泛使用的数…...

编程新知 2026/5/17 6:41:07

探索下一代命令行界面：OpenCLI 架构设计与插件化实践

1. 项目概述：一个面向未来的命令行界面原型最近在开源社区里，我注意到一个名为sys-fairy-eve/nightly-mvp-2026-03-19-opencli的项目。这个标题信息量不小，它不像一个成熟的产品，更像是一个开发过程中的里程碑快照。sys-fairy-eve…...

编程新知 2026/5/17 6:06:25

基于LLM与视觉模型融合的智能体框架：从原理到工业质检实践

1. 项目概述：当AI学会“看”与“想”最近在探索AI与视觉结合的落地场景时，我深度体验了landing-ai/vision-agent这个项目。它不是一个简单的图像识别工具，而是一个试图让AI具备“视觉推理”能力的智能体框架。简单来说，它让AI不仅…...

编程新知 2026/5/17 6:06:19

01基础函数的使用

相关文章：