当前位置: 首页 > article >正文

PyTorch入门-torchvision

torchvision

torchvision 是 PyTorch 的一个重要扩展库,专门针对计算机视觉任务设计。它提供了丰富的预训练模型、常用数据集、图像变换工具和计算机视觉组件,大大简化了视觉相关深度学习项目的开发流程。

我们可以在Pytorch的官网找到torchvision的文档

在这里插入图片描述

文档中提供了很多数据集

在这里插入图片描述

这里以CIFAR10为例,它是图像分类常用的数据集

CIFAR-10 数据集由 60,000 张 32x32 像素的彩色图像组成,分为 10 个类别,每个类别有 6,000 张图像。其中 50,000 张是训练图像,10,000 张是测试图像。

数据集分为五个训练批次和一个测试批次,每个批次包含 10,000 张图像。测试批次包含每个类别中随机选择的 1,000 张图像。训练批次包含剩余的图像,顺序随机,但某些训练批次可能包含一个类别的更多图像。所有训练批次加起来正好包含每个类别的 5,000 张图像。

在这里插入图片描述
在这里插入图片描述

除了数据集之外,还提供了模型torchvision.models 模块包含了一系列预训练的深度学习模型,广泛应用于图像分类、目标检测、语义分割等任务。

我们可以通过代码下载数据集

import torchvisiontrans_set = torchvision.datasets.CIFAR10(root = "./dataset",train= True,download= True)
test_set = torchvision.datasets.CIFAR10(root = "./dataset",train= False,download= True)

参数列表

  1. root (str):
    • 数据集存储的路径,数据将下载到此目录下。
  2. train (bool, optional):
    • 如果为 True,则加载训练集;如果为 False,则加载测试集。默认值为 True
  3. transform (callable, optional):
    • 一个函数/转换,用于对图像进行预处理,比如数据增强、归一化等。
  4. target_transform (callable, optional):
    • 一个函数/转换,用于对目标(标签)进行处理。
  5. download (bool, optional):
    • 如果为 True,则从网上下载数据集(如果在指定路径中不存在)。默认值为 False

下载完成后可以看到项目目录中的数据集
在这里插入图片描述

我们可以打印一下print("训练集数量:", len(trans_set)) 查看训练集数量

在这里插入图片描述

完整代码如下,可以看到我们的第一个图片是cat

import torchvision# 下载并加载CIFAR10训练数据集
trans_set = torchvision.datasets.CIFAR10(root = "./dataset", train= True, download= True)# 下载并加载CIFAR10测试数据集
test_set = torchvision.datasets.CIFAR10(root = "./dataset", train= False, download= True)# 获取测试集的第一个样本和对应的标签
img, target = test_set[0]
# 显示测试集中的类别标签
print(test_set.classes) # ['airplane', 'automobile', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck']
# 显示样本的图像数据
print(img) # <PIL.Image.Image image mode=RGB size=32x32 at 0x1BF002C7710>
# 显示样本的标签
print(target) # 3
# 根据标签索引对应的类别名称
print(test_set.classes[target]) # cat
# 显示图像
# 在这里使用PIL库的Image模块的show方法,直接在屏幕上展示图像
img.show()

这个数据集的图片都比较小(32x32 像素),放大以后虽然这个看起来并不像猫,反而像老鼠,但是它就是cat

在这里插入图片描述

上面我们得到的数据类型是PIL,我们需要转为tensor类型,我们只需要新增一个Compose然后修改dataset代码

# 定义数据集转换
dataset_transform = torchvision.transforms.Compose([# 将图像数据转换为 Tensortorchvision.transforms.ToTensor()    # 还可以对 Tensor 进行归一化,参数分别表示均值和标准差#torchvision.transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
])
# 下载并加载CIFAR10训练数据集
# 参数:
#   root: 指定数据集的保存路径
#   train: 指示是训练数据集(True)还是测试数据集(False)
#   transform: 对数据集中的每个图像应用的转换操作
#   download: 如果数据集不存在于指定路径且设置为True,则会自动下载数据集
trans_set = torchvision.datasets.CIFAR10(root = "./dataset", train= True, transform= dataset_transform,download= True)
# 下载并加载CIFAR10测试数据集,参数同上
test_set = torchvision.datasets.CIFAR10(root = "./dataset", train= False,transform= dataset_transform, download= True)

然后我们执行之后,控制台会打印图片,此时是我们想要的tensor数据类型(tensor类型图片不能使用show()

在这里插入图片描述

我们就可以显示在tensorBoard中

writer = SummaryWriter("pics")
# 获取测试集的10个样本和对应的标签
for i in range(10):img, target = test_set[i]writer.add_image("test_set", img, i)writer.close()

仔细看,能够依稀辨认出第十张图片是车
在这里插入图片描述

在这里插入图片描述

相关文章:

PyTorch入门-torchvision

torchvision torchvision 是 PyTorch 的一个重要扩展库&#xff0c;专门针对计算机视觉任务设计。它提供了丰富的预训练模型、常用数据集、图像变换工具和计算机视觉组件&#xff0c;大大简化了视觉相关深度学习项目的开发流程。 我们可以在Pytorch的官网找到torchvision的文…...

LVS负载均衡群集技术深度解析

第一章 群集技术概述与LVS基础 1.1 群集技术的核心价值与分类 随着互联网应用的复杂化&#xff0c;单台服务器在性能、可靠性、扩展性等方面逐渐成为瓶颈。群集技术&#xff08;Cluster&#xff09;通过整合多台服务器资源&#xff0c;以统一入口对外提供服务&#xff0c;成为…...

18、Python字符串全解析:Unicode支持、三种创建方式与长度计算实战

适合人群&#xff1a;零基础自学者 | 编程小白快速入门 阅读时长&#xff1a;约6分钟 文章目录 一、问题&#xff1a;Python的字符串是什么&#xff1f;1、例子1&#xff1a;多语言支持演示2、例子2&#xff1a;字符串不可变性验证3、答案&#xff1a;&#xff08;1&#xff09…...

5月27日复盘-Transformer介绍

5月27日复盘 二、层归一化 层归一化&#xff0c;Layer Normalization。 Layer Normalizatioh和Batch Normalization都是用来规范化中间特征分布&#xff0c;稳定和加速神经网络训练的&#xff0c;但它们在处理方式、应用场景和结构上有本质区别。 1. 核心区别 特征BatchNo…...

CSV数据处理全指南:从基础到实战

CSV&#xff08;Comma-Separated Values&#xff0c;逗号分隔值&#xff09; 是一种简单的文件格式&#xff0c;用于存储和交换表格数据&#xff08;如电子表格或数据库中的记录&#xff09;。其核心特点是用逗号分隔字段&#xff0c;以换行符分隔记录。 CSV 的定义与结构 基本…...

MyBatis-Plus一站式增强组件MyBatis-Plus-kit(更新2.0版本):零Controller也能生成API?

MyBatis-Plus-Kit &#x1f680; MyBatis-Plus-Kit 是基于MyBatis-Plus的增强组件&#xff0c;专注于提升开发效率&#xff0c;支持零侵入、即插即用的能力扩展。它聚焦于 免写 Controller、代码一键生成、通用响应封装 等核心场景&#xff0c;让您只需专注业务建模&#xff0…...

实时数仓flick+clickhouse启动命令

1、启动zookeeper zk.sh start 2、启动DFS&#xff0c;Hadoop集群 start-dfs.sh 3、启动yarn start-yarn.sh 4、启动kafka 启动Kafka集群 bin/kafka-server-start.sh -daemon config/server.properties 查看Kafka topic 列表 bin/kafka-topics.sh --bootstrap-server local…...

【Git】Commit Hash vs Change-Id

文章目录 1、Commit 号2、Change-Id 号3、区别与联系4、实际场景示例5、为什么需要两者&#xff1f;6、总结附录——Gerrit 在 Git 和代码审查工具&#xff08;如 Gerrit&#xff09;中&#xff0c;Commit 号&#xff08;Commit Hash&#xff09; 和 Change-Id 号 是两个不同的…...

Netty学习专栏(六):深度解析Netty核心参数——从参数配置到生产级优化

文章目录 前言一、核心参数全景解析1.1 基础网络层参数1.2 内存管理参数1.3 水位线控制1.4 高级参数与系统级优化 二、生产级优化策略2.1 高并发场景优化2.2 低延迟场景优化 总结 前言 在分布式系统和高并发场景中&#xff0c;Netty作为高性能网络通信框架的核心地位无可替代。…...

服务器磁盘按阵列划分为哪几类

以下是服务器磁盘阵列&#xff08;RAID&#xff09;的详细分类及技术解析&#xff0c;基于现行行业标准与实践应用&#xff1a; 一、主流RAID级别分类 1. ‌RAID 0&#xff08;条带化&#xff09;‌ ‌技术原理‌&#xff1a;数据分块后并行写入多块磁盘&#xff0c;无…...

在WPF中添加动画背景

在WPF中添加动画背景 在WPF中创建动画背景可以大大增强应用程序的视觉效果。以下是几种实现动画背景的方法&#xff1a; 方法1&#xff1a;使用动画ImageBrush&#xff08;图片轮播&#xff09; <Window x:Class"AnimatedBackground.MainWindow"xmlns"htt…...

【KWDB创作者计划】_KWDB分布式多模数据库智能交通应用——高并发时序处理与多模数据融合实践

导读&#xff1a;本文主要探讨了基于KWDB的分布式多模数据库智能交通应用场景&#xff0c;进行了高并发时序处理与多模数据融合实践方向的思考。探索智慧交通领域的数据实时处理与存储资源利用方面的建设思路。 本文目录 一、智能交通数据架构革命   1.1 传统架构瓶颈  …...

Android 中的 ViewModel详解

在 Android 开发中&#xff0c;ViewModel 是 Jetpack 架构组件的核心成员之一&#xff0c;专为管理与界面相关的数据而设计。它通过生命周期感知能力&#xff0c;确保数据在配置变更&#xff08;如屏幕旋转&#xff09;时持久存在&#xff0c;并将数据逻辑与 UI 控制器&#xf…...

Java集合框架与三层架构实战指南:从基础到企业级应用

一、集合框架深度解析 1. List集合的武林争霸 ArrayList&#xff1a; 数组结构&#xff1a;内存连续&#xff0c;查询效率O(1) 扩容机制&#xff1a;默认扩容1.5倍&#xff08;源码示例&#xff09; private void grow(int minCapacity) {int oldCapacity elementData.len…...

6个月Python学习计划 Day 2 - 条件判断、用户输入、格式化输出

6个月Python学习计划&#xff1a;从入门到AI实战&#xff08;前端开发者进阶指南&#xff09; Python 基础入门 & 开发环境搭建 &#x1f3af; 今日目标 学会使用 input() 获取用户输入掌握 if/else/elif 条件判断语法熟悉格式化输出方式&#xff1a;f-string、format() …...

使用docker容器部署Elasticsearch和Kibana

简介&#xff1a;&#xff08;Elasticsearch&#xff09; elasticsearch简称Es, 是位于Elastic Stack核心的分布式搜索和分析引擎。它为所有类型的数据提供近乎实时的搜索和分析。无论您拥有机构化或非结构化的文本、数字数据还是地理空间数据&#xff0c;Es都能以支持快速搜索…...

批量处理合并拆分pdf功能 OCR 准确率高 免费开源

各位 PDF 编辑小白们&#xff0c;今天咱来唠唠 PDFXEdit10_Portable 这款软件。 先说说它的核心功能和适用场景。这玩意儿是个便携式的 PDF 编辑工具&#xff0c;不用安装就能直接用&#xff0c;能改 PDF 里的文本、图片&#xff0c;还能批注、调整格式&#xff0c;老方便了。…...

Unity—lua基础语法

Lua 语言执行方式 编译型语言&#xff1a;代码在运行前需要使用编译器&#xff0c;先将程序源代码编译为可执行文件&#xff0c;再执行 C/C Java C# Go Objective-C 解释型语言&#xff08;脚本语言&#xff09; 需要提前安装编译语言解析器&#xff0c;运行时使用解析…...

目标检测 TaskAlignedAssigner 原理

文章目录 TaskAlignedAssigner 原理和代码使用示例 TaskAlignedAssigner 原理和代码 原理主要是结合预测的分类分数和边界框与真实标注的信息&#xff0c;找出与真实目标最匹配的锚点&#xff0c;为这些锚点分配对应的目标标签、边界框和分数。 TaskAlignedAssigner 是目标检…...

Qt popup窗口半透明背景

半透明弹窗需要paintEvent()接口支持 方法一&#xff1a;使用setStyleSheet设置半透明样式&#xff0c;如果是子窗口&#xff0c;则可注释构建函数内属性设置 class TranslucentWidget : public QWidget { public: explicit TranslucentWidget(QWidget *parent nullptr)…...

游戏:元梦之星游戏开发代码(谢苏)

《元梦之星》是一款轻松社交派对游戏,玩家们可以化身星宝,体验纯粹的游玩乐趣,收获简单的快乐。无论i人e人,都能轻松找到属于自己的社交方式。 《元梦之星》的快乐,可以是闯关夺冠时的激动&#xff0c;谁是狼人推理的巧妙&#xff0c;峡谷3V3打赢团战的爽感。也可以是星梦广场开…...

TCP协议原理与Java编程实战:从连接建立到断开的完整解析

1.TCP协议核心&#xff1a;面向连接的可靠通信基石 TCP&#xff08;Transmission Control Protocol&#xff0c;传输控制协议&#xff09;是互联网的“可靠信使”&#xff0c;属于传输层协议&#xff0c;其核心在于面向连接和可靠传输。它通过严谨的握手机制与数据控制逻辑&am…...

Linux的top命令使用

Linux系统中top命令详解及使用技巧 一、基础功能 top命令用于实时监控系统性能和进程活动&#xff0c;可查看以下信息&#xff1a; - CPU使用率 - 内存使用情况 - 进程状态信息 - 系统负载数据 二、使用步骤 1. 打开终端输入命令&#xff1a;top 2. 查看实时更新的数据界面&a…...

Spring Cloud Gateway 限流实践:基于 Redis 令牌桶算法的网关层流量治理

一、引言 在微服务架构中,API 网关作为流量枢纽,需对进入系统的请求进行精细化限流,以保护下游服务免受流量冲击。Spring Cloud Gateway 结合 Redis 实现的令牌桶算法,为网关层限流提供了高效、分布式的解决方案。本文将深入解析其原理、配置及实践优化。 二、技术栈与原…...

可视化大屏实现全屏或非全屏

通过点击按钮实现全屏和非全屏效果展示 代码如下&#xff1a; <template> //点击icon图片进入全屏或非全屏<img :src"screenStatus ? /src/assets/noFull.png : /src/assets/full.png" alt"" click"enterFullScreen" /> </te…...

java8函数式接口(函数式接口的匿名实现类作为某些方法的入参)

文章目录 前置介绍通过 lambda 表达式&#xff0c;使用匿名类&#xff0c;实现函数式接口函数式接口和回调函数的关系函数式接口的应用 前置介绍 是 Java 8 引入的核心概念之一&#xff0c;指的是 仅包含一个抽象方法的接口。它可以被 FunctionalInterface 注解标记&#xff0…...

linux自有服务

文章目录 [TOC](文章目录)linux自有服务概述systemctl管理服务命令CentOS 7 之前CentOS 7 常用自有服务ntpd或systemd-timesyncd时间同步服务ntp同步服务器原理ntpd时间同步操作systemd-timesyncd同步原理systemd-timesyncd时间同步操作 firewalld防火墙计划任务crontab CentOS…...

UniApp网页版集成海康视频播放器

注意&#xff1a;本人全部集成好后使用最新的海康平台下载插件进行替换后就不能预览视频 使用Uni插件进行集成&#xff1a;海康视频H5播放器组件 - DCloud 插件市场 CSDN资源下载&#xff1a;https://download.csdn.net/download/wangdaoyin2010/90910975 注意&#xff1a;初…...

Filter和Interceptor详解(一文了解执行阶段及其流程)

Filter和Interceptor的区别 Filter&#xff08;过滤器&#xff09;和 Interceptor&#xff08;拦截器&#xff09;都是用于在请求处理前后插入额外逻辑的组件&#xff0c;下面依次介绍&#xff0c;并额外介绍Spring Gateway的过滤器&#xff08;GlobalFilter/GatewayFilter&am…...

鸿蒙仓颉开发语言实战教程:实现商城应用详情页

昨天有朋友提到鸿蒙既然有了ArkTs开发语言&#xff0c;为什么还需要仓颉开发语言。其实这个不难理解&#xff0c;安卓有Java和Kotlin&#xff0c;iOS先后推出了Objective-C和Swift&#xff0c;鸿蒙有两种开发语言也就不奇怪了。而且仓颉是比ArkTs更加灵活的语言&#xff0c;虽然…...