当前位置：首页 > news >正文

【pytorch】深度学习准备：基本配置

news 2026/2/9 2:52:31

深度学习中常用包

import os 
import numpy as np 
import torch
import torch.nn as nn
from torch.utils.data import Dataset, DataLoader
import torch.optim as optimizer

超参数设置
2种设置方式：将超参数直接设置在训练的代码中；用yaml、json，dict等文件来存储超参数

# 批次的大小
batch_size = 16
# 优化器的学习率
lr = 1e-4
# 训练次数
max_epochs = 100

GPU设置

# 方案一：使用os.environ，这种情况如果使用GPU不需要设置
import os
os.environ['CUDA_VISIBLE_DEVICES'] = '0,1' # 指明调用的GPU为0,1号# 方案二：使用“device”，后续对要使用GPU的变量用.to(device)即可
device = torch.device("cuda:1" if torch.cuda.is_available() else "cpu") # 指明调用的GPU为1号

使用argparse和yaml文件

argparse的使用：

import argparse
"""argparse.ArgumentParser()创建了一个对象add_argument()添加参数parse_args()将参数封装在opt内，各个参数通过.运算符调用
"""def main(opt):print(opt.num_batches)if __name__ == '__main__':parse = argparse.ArgumentParser()parse.add_argument('--num_batches', type=int, default=50, help='the num of batch')parse.add_argument('--num_window', type=int, default=5, help='the num of window')parse.add_argument('--weight', type=str, default= '../pretrain.pth', help='the path of pretrained model')opt = parse.parse_args()main(opt)

yaml文件的使用
下面是一个yaml文件的例子，参数呈现层级结构

device: 'cpu'data:train_path: 'data/train'test_path: 'test/train'num: 1000

读取yaml文件

def read_yaml(path):
"""read()读入yaml文件中的内容safe_load()加载yaml格式的内容并转换为字典
"""file = open(path, 'r', encoding='utf-8')string = file.read()file.close()dict = yaml.safe_load(string)return dictpath = 'config.yaml'
Dict = read_yaml(path)
device = Dict['device']
print(device)
train_path = Dict['data']['train_path']
print(train_path)

使用方法
在yaml文件中给全部参数设置默认值，使用argparse库设置待调参数的值

参考资料

深度学习代码中的argparse以及yaml文件的使用
datawhale的thorough-pytorch repo

【pytorch】深度学习准备：基本配置

深度学习中常用包 import os import numpy as np import torch import torch.nn as nn from torch.utils.data import Dataset, DataLoader import torch.optim as optimizer超参数设置 2种设置方式：将超参数直接设置在训练的代码中；用yaml、json&…...

编程日记 2023/10/13 7:34:44

etcd随笔

大集群大集群主要问题有 btree重平衡和分解过程中超过20Gi的性能瓶颈，是O（n）复杂度，启动耗时增大，放大expensive request的影响。其中最重要的就是最大程度地减少 expensive request。对几十万级别的对象数量来说…...

编程日记 2023/10/13 7:33:42

0基础学习VR全景平台篇第107篇：全景图调色和细节处理（上，地拍）

上课！全体起立~ 大家好，欢迎观看蛙色官方系列全景摄影课程！ 今天教给大家的课程是地拍全景图调色和细节处理，下面我们就开始吧！ 1.把照片快速导入LR软件选择【图库】模块打开软件后，点击【导入】按…...

编程日记 2023/10/13 7:32:40

Verilog功能模块——同步FIFO

前言 FIFO功能模块分两篇文章，本篇为同步FIFO，另一篇为异步FIFO，传送门： Verilog功能模块——异步FIFO-CSDN博客同步FIFO实现起来是异步FIFO的简化版，所以，本博文不再介绍FIFO实现原理，感兴趣…...

编程日记 2023/10/13 7:31:39

Unity ToLua热更框架使用教程（1）

从本篇开始将为大家讲解ToLua在unity当中的使用教程。 Tolua的框架叫LuaFramework，首先附上下载链接： https://github.com/jarjin/LuaFramework_UGUI_V2 这个地址的是UGUI的。下载完之后导入项目，首先，我们要先让这个项目跑起…...

编程日记 2023/10/13 7:29:36

车载相关名词--车载数据中心方案

车载数据中心方案参考链接：https://zhuanlan.zhihu.com/p/600031042?utm_id=0 下面这张图是小鹏汽车嵌入式系统高级专家唐黾在同ARM一起的一个演讲稿中发布的，是一张未来车载数据中心单芯片方案构想图。主要针对的是智驾域和座舱域融合方案，下面对如上图的内外部组件及…...

编程日记 2023/10/13 7:27:34

helm使用

前言类似于 Linux 的 YUM、APT，Helm 是 K8S 的包管理工具。 Helm， 一个二进制工具，用来安装、升级、卸载 K8S 中的应用程序。 Helm Chart，一个 tgz 包，类似安卓的 APK。 K8S 应用打包成 Chart，通过 He…...

编程日记 2023/10/13 7:26:32

Python in Visual Studio Code 2023年10月发布

排版：Alan Wang 我们很高兴地宣布 Visual Studio Code 的 Python 和 Jupyter 扩展于 2023 年 10 月发布！ 此版本包括以下公告： Python 调试器扩展更新弃用 Python 3.7 支持Pylint 扩展更换时的 Lint 选项Mypy 扩展报告的范围和守护程序模式G…...

编程日记 2023/10/13 7:25:30

Webmin远程命令执行漏洞复现报告

漏洞编号 CVE-2019-15107 漏洞描述 Webmin是一个基于Web的系统配置工具，用于类Unix系统。密码重置页面中存在此漏洞，允许未经身份验证的用户通过简单的 POST 请求执行任意命令。影响版本 Webmin<1.920 漏洞评级严重利用方法（利…...

编程日记 2023/10/13 7:24:28

webstorm自定义文件模板（Vue + Scss）

最终效果如下： 具体配置如下： 新增文件代码如下：  <template><div>${COMPONENT_NAME} </div> </template><script&g…...

编程日记 2023/10/13 7:23:27

楔子-写在之前

最近一年都在忙着一个项目，并且需要学习另一个领域的知识，从单片机过渡到了LINUX嵌入式，倒静不下心去写点东西。看了下之前写的东西，感觉已经过去了很久很久。现在项目快忙完了，准备把最近的心得给大家分享下。前言 …...

编程日记 2023/10/13 7:22:25

第 5 章数组和广义表（稀疏矩阵的三元组顺序表存储实现）

1. 背景说明为了节省存储空间，可以对这类矩阵进行压缩存储。所谓压缩存储是指：为多个值相同的元只分配一个存储空间，对零元不分配空间。 2. 示例代码 1)status.h /* DataStructure 预定义常量和类型头文件 */ #include <string.h>#i…...

编程日记 2023/10/13 7:20:21

【RabbitMQ 实战】11 队列的结构和惰性队列

一、队列的结构队列的组成： 队列由 rabbit_amgqueue_process 和 backing_queue两部分组成。rabbit_amqqueue_process负责协议相关的消息处理，即接收生产者发布的消息、向消费者交付消息、处理消息的确认 (包括生产端的 confirm 和消费端的 ack) 等。…...

编程日记 2023/10/13 7:19:20

Python3-批量重命名指定目录中的一组文件，更改其扩展名

Python3-批量重命名指定目录中的一组文件，更改其扩展名 1.argparse模块2.vars内置函数3.os.listdir(path)4.os.path.splitext(filepath)5.os.path.join6.os.rename7.os.path.isfile8.批量重命名指定目录中的一组文件，更改其扩展名 1.argparse模块 argpa…...

编程日记 2023/10/13 7:17:13

渗透测试KAILI系统的安装环境(第八课)

KAILI系统的安装环境(第八课) Kaili是一款基于PHP7的高性能微服务框架，其核心思想是面向服务的架构（SOA），支持http、websocket、tcp等多种通信协议，同时还提供了RPC、Service Mesh、OAuth2等功能。Kaili框架非常适合构…...

编程日记 2023/10/13 7:15:11

如何正确方便的理解双指针？力扣102 （二叉树的层序遍历）

双指针，顾名思义就是指针的指针。在此之前我们需要先理解单指针 （简称为指针）。指针很简单，直接上例子：例：现有两个变量，a10,b20. 要求：交换他们的值，输出的结果应为a20…...

编程日记 2023/10/13 7:12:04

Vue或uniapp引入自定义字体

一、为什么引入字体对于大部分APP或网站而言，字体是很重要的一部分。在前端开发中，选用合适的字体往往会极大地提升网站的视觉体验。然而，网页中默认字体的种类和风格有限，且在不同的设备、浏览器上渲染效果不尽相同。因此&…...

编程日记 2023/10/13 7:11:03

力扣：LCR 122. 路径加密题目：剑指Offer 05.替换空格（c++）

本文章代码以c为例！ 力扣：LCR 122. 路径加密题目： 代码： class Solution { public:string pathEncryption(string path) {for(int i0;i<path.size();i){if(path[i].){path[i] ;}}return path;} }; 难度升级（原…...

编程日记 2023/10/13 7:09:59

cJson堆内存释放问题

cJSON_Delete()，是用来释放json对象的，释放父JSON对象后，子JSON对象也会被释放。 CJSON_free()，是用来释放其他对象的。 int main(void) {cJSON* cjson_test NULL;cJSON* cjson_address NULL;cJSON* cjson_skill NULL;char* s…...

编程日记 2023/10/13 7:08:57

论文阅读/写作扫盲

第一节：期刊科普 JCR分区和中科院分区是用于对期刊进行分类和评估的两种常见方法。它们的存在是为了帮助学术界和研究人员更好地了解期刊的学术质量、影响力和地位。 JCR分区（Journal Citation Reports）：JCR分区是由Clarivate Ana…...

编程日记 2023/10/13 7:07:51

19c补丁后oracle属主变化，导致不能识别磁盘组

补丁后服务器重启，数据库再次无法启动 ORA01017: invalid username/password; logon denied Oracle 19c 在打上 19.23 或以上补丁版本后，存在与用户组权限相关的问题。具体表现为，Oracle 实例的运行用户（oracle）和集…...

编程新知 2026/2/8 4:37:10

云计算——弹性云计算器（ECS）

弹性云服务器：ECS 概述云计算重构了ICT系统，云计算平台厂商推出使得厂家能够主要关注应用管理而非平台管理的云平台，包含如下主要概念。 ECS（Elastic Cloud Server）：即弹性云服务器，是云计算…...

编程新知 2025/8/16 21:50:27

java 实现excel文件转pdf | 无水印 | 无限制

文章目录目录文章目录前言 1.项目远程仓库配置 2.pom文件引入相关依赖 3.代码破解二、Excel转PDF 1.代码实现 2.Aspose.License.xml 授权文件总结前言 java处理excel转pdf一直没找到什么好用的免费jar包工具，自己手写的难度，恐怕高级程序员花费一年的事件，也…...

编程新知 2025/11/5 4:10:42

Frozen-Flask ：将 Flask 应用“冻结”为静态文件

Frozen-Flask 是一个用于将 Flask 应用“冻结”为静态文件的 Python 扩展。它的核心用途是：将一个 Flask Web 应用生成成纯静态 HTML 文件，从而可以部署到静态网站托管服务上，如 GitHub Pages、Netlify 或任何支持静态文件的网站服务器。 &am…...

编程新知 2025/12/5 20:57:13

Redis数据倾斜问题解决

Redis 数据倾斜问题解析与解决方案什么是 Redis 数据倾斜 Redis 数据倾斜指的是在 Redis 集群中，部分节点存储的数据量或访问量远高于其他节点，导致这些节点负载过高，影响整体性能。数据倾斜的主要表现部分节点内存使用率远高于其他节…...

编程新知 2026/1/27 19:28:11

全面解析各类VPN技术：GRE、IPsec、L2TP、SSL与MPLS VPN对比

目录引言 VPN技术概述 GRE VPN 3.1 GRE封装结构 3.2 GRE的应用场景 GRE over IPsec 4.1 GRE over IPsec封装结构 4.2 为什么使用GRE over IPsec？ IPsec VPN 5.1 IPsec传输模式（Transport Mode） 5.2 IPsec隧道模式（Tunne…...

编程新知 2025/11/3 0:44:41

laravel8+vue3.0+element-plus搭建方法

创建 laravel8 项目 composer create-project --prefer-dist laravel/laravel laravel8 8.* 安装 laravel/ui composer require laravel/ui 修改 package.json 文件 "devDependencies": {"vue/compiler-sfc": "^3.0.7","axios": …...

编程新知 2025/10/15 0:25:46

【生成模型】视频生成论文调研

工作清单上游应用方向：控制、速度、时长、高动态、多主体驱动类型工作基础模型WAN / WAN-VACE / HunyuanVideo控制条件轨迹控制ATI~镜头控制ReCamMaster~多主体驱动Phantom~音频驱动Let Them Talk: Audio-Driven Multi-Person Conversational Video Generation速…...

编程新知 2025/9/9 8:40:47

QT3D学习笔记——圆台、圆锥

类名作用Qt3DWindow3D渲染窗口容器QEntity场景中的实体（对象或容器）QCamera控制观察视角QPointLight点光源QConeMesh圆锥几何网格QTransform控制实体的位置/旋转/缩放QPhongMaterialPhong光照材质（定义颜色、反光等）QFirstPersonC…...

编程新知 2026/1/29 5:26:37

【大模型】RankRAG：基于大模型的上下文排序与检索增强生成的统一框架

文章目录 A 论文出处B 背景B.1 背景介绍B.2 问题提出B.3 创新点 C 模型结构C.1 指令微调阶段C.2 排名与生成的总和指令微调阶段C.3 RankRAG推理：检索-重排-生成 D 实验设计E 个人总结 A 论文出处论文题目：RankRAG：Unifying Context Ranking…...

编程新知 2026/2/5 1:38:59

参考资料

相关文章：