当前位置：首页 > news >正文

深度学习pytorch之hub模块

news 2025/11/24 3:52:07

pytorchhub模块里面有很多模型
https://pytorch.org/hub/
github网址：https://github.com/pytorch/pytorch

import torch
model = torch.hub.load('pytorch/vision:v0.10.0', 'fcn_resnet50', pretrained=True)
# or
# model = torch.hub.load('pytorch/vision:v0.10.0', 'fcn_resnet101', pretrained=True)
model.eval()
All pre-trained models expect input images normalized in the same way, i.e. mini-batches of 3-channel RGB images of shape (N, 3, H, W), where N is the number of images, H and W are expected to be at least 224 pixels. The images have to be loaded in to a range of [0, 1] and then normalized using mean = [0.485, 0.456, 0.406] and std = [0.229, 0.224, 0.225].The model returns an OrderedDict with two Tensors that are of the same height and width as the input Tensor, but with 21 classes. output['out'] contains the semantic masks, and output['aux'] contains the auxillary loss values per-pixel. In inference mode, output['aux'] is not useful. So, output['out'] is of shape (N, 21, H, W). More documentation can be found here.# Download an example image from the pytorch website
import urllib
url, filename = ("https://github.com/pytorch/hub/raw/master/images/deeplab1.png", "deeplab1.png")
try: urllib.URLopener().retrieve(url, filename)
except: urllib.request.urlretrieve(url, filename)
# sample execution (requires torchvision)
from PIL import Image
from torchvision import transforms
input_image = Image.open(filename)
input_image = input_image.convert("RGB")
preprocess = transforms.Compose([transforms.ToTensor(),transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
])input_tensor = preprocess(input_image)
input_batch = input_tensor.unsqueeze(0) # create a mini-batch as expected by the model# move the input and model to GPU for speed if available
if torch.cuda.is_available():input_batch = input_batch.to('cuda')model.to('cuda')with torch.no_grad():output = model(input_batch)['out'][0]
output_predictions = output.argmax(0)
The output here is of shape (21, H, W), and at each location, there are unnormalized probabilities corresponding to the prediction of each class. To get the maximum prediction of each class, and then use it for a downstream task, you can do output_predictions = output.argmax(0).Here’s a small snippet that plots the predictions, with each color being assigned to each class (see the visualized image on the left).# create a color pallette, selecting a color for each class
palette = torch.tensor([2 ** 25 - 1, 2 ** 15 - 1, 2 ** 21 - 1])
colors = torch.as_tensor([i for i in range(21)])[:, None] * palette
colors = (colors % 255).numpy().astype("uint8")# plot the semantic segmentation predictions of 21 classes in each color
r = Image.fromarray(output_predictions.byte().cpu().numpy()).resize(input_image.size)
r.putpalette(colors)import matplotlib.pyplot as plt
plt.imshow(r)
# plt.show()
Model Description
FCN-ResNet is constructed by a Fully-Convolutional Network model, using a ResNet-50 or a ResNet-101 backbone. The pre-trained models have been trained on a subset of COCO train2017, on the 20 categories that are present in the Pasca

在这里插入图片描述

根据灰色的部分复制相应的代码

深度学习pytorch之hub模块

pytorchhub模块里面有很多模型 https://pytorch.org/hub/ github网址：https://github.com/pytorch/pytorch import torch model torch.hub.load(pytorch/vision:v0.10.0, fcn_resnet50, pretrainedTrue) # or # model torch.hub.load(pytorch/vision:v0.10.0, fc…...

编程日记 2023/11/11 13:30:47

LeetCode 2258. 逃离火灾：BFS

【LetMeFly】2258.逃离火灾力扣题目链接：https://leetcode.cn/problems/escape-the-spreading-fire/ 给你一个下标从 0 开始大小为 m x n 的二维整数数组 grid ，它表示一个网格图。每个格子为下面 3 个值之一： 0 表示草地。1 表示着火的格…...

编程日记 2023/11/11 13:28:45

C# PaddleInference.PP-HumanSeg 人像分割替换背景色

效果项目 VS2022.net4.8OpenCvSharp4Sdcb.PaddleInference 包含4个分割模型 modnet-hrnet_w18 modnet-mobilenetv2 ppmatting-hrnet_w18-human_512 ppmattingv2-stdc1-human_512 代码 using OpenCvSharp; using Sdcb.PaddleInference; using System; using System.Col…...

编程日记 2023/11/11 13:26:43

Java 变量初始化的两种方式和优缺点比较

第一种初始化方式：（优先推荐） String fileRename null; File fileToSave null; 这种方式将变量的作用域限定在循环外部，即在整个代码块中都可以使用这些变量。初始值为null表示变量在开始时没有具体的数值。这种方式更好的…...

编程日记 2023/11/11 13:25:43

15.三数之和

题目来源： leetcode题目，网址：15. 三数之和 - 力扣（LeetCode） 解题思路： 1.三重循环暴力遍历，超时原因，三重循环复杂度太高 2.双重循环哈希表，超时原因，哈…...

编程日记 2023/11/11 13:24:41

竞赛选题深度学习疲劳驾驶检测 opencv python

文章目录 0 前言1 课题背景2 实现目标3 当前市面上疲劳驾驶检测的方法4 相关数据集5 基于头部姿态的驾驶疲劳检测5.1 如何确定疲劳状态5.2 算法步骤5.3 打瞌睡判断 6 基于CNN与SVM的疲劳检测方法6.1 网络结构6.2 疲劳图像分类训练6.3 训练结果 7 最后 0 前言 🔥 优…...

编程日记 2023/11/11 13:20:38

PROFINET和UDP、MODBUS-RTU通信速度对比实验

这篇博客我们介绍PROFINET 和MODBUS-RTU通信实验时的数据刷新速度，以及这种速度不同对控制系统带来的挑战都有哪些，在介绍这篇对比实验之前大家可以参考下面的文章链接： S7-1200PLC和SMART PLC的PN智能从站通信 S7-200 SMART 和 S7-1200PLC进行PROFINET IO通信-CSDN博客文…...

编程日记 2023/11/11 13:19:37

CSS3 多媒体查询、网格布局

一、CSS3多媒体查询： CSS3 多媒体查询继承了CSS2多媒体类型的所有思想，取代了查找设备的类型。CSS3根据设置自适应显示。多媒体查询语法： media not|only mediatype and (expressions) { CSS 代码...; } not: not是用来排除掉某些特定…...

编程日记 2023/11/11 13:18:35

SpringBoot基础（九）-- 配置文件优先级

目录 1. 3种格式的配置文件的优先级 2. 案例演示小结： 3. 小技巧：自动提示功能消失解决方案...

编程日记 2023/11/11 13:15:32

C++ static关键字

C static关键字 1、概述2、重要概念解释3、分情况案例解释3.1 static在类内使用3.2 static在类外使用案例一：案例二：案例三 1、概述 static关键字分为两种情况： 1.在类内使用 2.在类外使用 2、重要概念解释 （1）翻译…...

编程日记 2023/11/11 13:14:29

Anaconda Powershell Prompt和Anaconda Prompt的区别

先说结论：主要功能应该一样。区别在于powershell支持的命令更多。比如查询路径的命令pwd和列表命令ls。 Anaconda PowerShell Prompt和Anaconda Prompt是Anaconda发行版中两个不同的命令提示符工具。 Anaconda Prompt是Anaconda发布的默认命令提示符工具&#xff0…...

编程日记 2023/11/11 13:12:27

关于tcp发送成功但对端无法接收情况的思考

用到一个http服务，但调用频率很高，每次请求都使用短连接的话，有点浪费。所以尝试复用http连接，请求的时候在头部添加Connection：Keep-alive，对端支持，但会在一定时常或一定请求次数后关闭该连接…...

编程日记 2023/11/11 13:11:26

01-解码-H264转YUV

整体方案：采集端：摄像头采集（YUV）->编码（YUV转H264）->RTMP推流客户端：RTMP拉流->解码（H264转YUV）->YUV显示（SDL2） H264码流转YUV是视频解码部分，具体的代码实现如下。 #include <stdio.h> #include <stdlib.h> #ifdef __cplusplus ext…...

编程日记 2023/11/11 13:10:25

keepalived+Nginx+邮件

实验场景： 我使用keepalived保证nginx的高可用，我想知道什么时候ip发生漂移，可以让ip发生漂移的时候我的邮箱收到消息. 如果对keepalived不了解，这有详细解释：keepalived与nginx与MySQL-CSDN博客https://blog.csdn.ne…...

编程日记 2023/11/11 13:09:24

CMakeCache.txt有什么用

2023年11月11日，周六上午 CMakeCache.txt 是由 CMake 自动生成的一个缓存文件，用于记录在配置过程中生成的各种变量和选项的值。在使用 CMake 构建项目时，CMake 会根据 CMakeLists.txt 文件中的配置和命令，解析项目的源代码并生…...

编程日记 2023/11/11 13:08:23

ZYNQ_project:key_breath

[Synth 8-327] inferring latch for variable led_breath_reg ["C:/Users/warrior/Desktop/ZYNQ/pl/key_breath/rtl/led_breath.v":66] 因为在组合逻辑中，用了非阻塞赋值的方式赋值信号。组合逻辑自己给自己赋值会产生组合回环，输出不稳定。 …...

编程日记 2023/11/11 13:06:21

设计模式（原则）

在软件开发中，为了提高软件系统的可维护性和可复用性，增加软件的可扩展性和灵活性，程序员要尽量根据6条原则来开发程序，从而提高软件开发效率、节约软件开发成本和维护成本一、开闭原则对扩展开放，对修改关闭。案…...

编程日记 2023/11/11 13:05:20

LeetCode 每日一题 2023/11/6-2023/11/12

记录了初步解题思路以及本地实现代码；并不一定为最优也希望大家能一起探讨一起进步目录 11/6 318. 最大单词长度乘积11/7 2586. 统计范围内的元音字符串数11/8 2609. 最长平衡子字符串11/9 2258. 逃离火灾11/10 2300. 咒语和药水的成功对数11/11 765. 情侣牵手1…...

编程日记 2023/11/11 13:03:18

Linux 基于 LVM 逻辑卷的磁盘管理【简明教程】

一、传统磁盘管理的弊端传统的磁盘管理：使用MBR先对硬盘分区，然后对分区进行文件系统的格式化最后再将该分区挂载上去。传统的磁盘管理当分区没有空间使用进行扩展时，操作比较麻烦。分区使用空间已经满了，不再够用了&#xff…...

编程日记 2023/11/11 13:02:17

CTFHUB-WEB-SQL注入

sql学的太不好了，回炉重造判断 Sql 注入漏洞的类型： 1.数字型当输入的参 x 为整型时，通常 abc.php 中 Sql 语句类型大致如下：select * from <表名> where id x这种类型可以使用经典的 and 11 和 and 12 来判断&#xff…...

编程日记 2023/11/11 13:01:16

观成科技：隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具，该工具基于TUN接口实现其功能，利用反向TCP/TLS连接建立一条隐蔽的通信信道，支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式，适应复杂网…...

编程新知 2025/11/23 10:14:10

应用升级/灾备测试时使用guarantee 闪回点迅速回退

1.场景应用要升级,当升级失败时,数据库回退到升级前. 要测试系统,测试完成后,数据库要回退到测试前。相对于RMAN恢复需要很长时间， 数据库闪回只需要几分钟。 2.技术实现数据库设置 2个db_recovery参数创建guarantee闪回点，不需要开启数据库闪回。…...

编程新知 2025/7/30 7:20:17

DeepSeek 赋能智慧能源：微电网优化调度的智能革新路径

目录一、智慧能源微电网优化调度概述1.1 智慧能源微电网概念1.2 优化调度的重要性1.3 目前面临的挑战二、DeepSeek 技术探秘2.1 DeepSeek 技术原理2.2 DeepSeek 独特优势2.3 DeepSeek 在 AI 领域地位三、DeepSeek 在微电网优化调度中的应用剖析3.1 数据处理与分析3.2 预测与…...

编程新知 2025/11/20 2:48:44

基于ASP.NET+ SQL Server实现（Web）医院信息管理系统

医院信息管理系统 1. 课程设计内容在 visual studio 2017 平台上，开发一个“医院信息管理系统”Web 程序。 2. 课程设计目的综合运用 c#.net 知识，在 vs 2017 平台上，进行 ASP.NET 应用程序和简易网站的开发；初步熟悉开发一…...

编程新知 2025/11/22 18:00:45

UDP(Echoserver)

网络命令 Ping 命令检测网络是否连通使用方法: ping -c 次数网址ping -c 3 www.baidu.comnetstat 命令 netstat 是一个用来查看网络状态的重要工具. 语法：netstat [选项] 功能：查看网络状态常用选项： n 拒绝显示别名&#…...

编程新知 2025/11/17 8:09:33

unix/linux，sudo，其发展历程详细时间线、由来、历史背景

sudo 的诞生和演化，本身就是一部 Unix/Linux 系统管理哲学变迁的微缩史。来，让我们拨开时间的迷雾，一同探寻 sudo 那波澜壮阔（也颇为实用主义）的发展历程。历史背景：su的时代与困境 ( 20 世纪 70 年代 - 80 年代初) 在 sudo 出现之前，Unix 系统管理员和需要特权操作的…...

编程新知 2025/11/18 21:31:41

JVM暂停（Stop-The-World，STW）的原因分类及对应排查方案

JVM暂停（Stop-The-World，STW）的完整原因分类及对应排查方案，结合JVM运行机制和常见故障场景整理而成：一、GC相关暂停 1. 安全点（Safepoint）阻塞现象：JVM暂停但无GC日志，日志显示No GCs detected。原因：JVM等待所有线程进入安全点（如…...

编程新知 2025/10/2 12:07:03

OPenCV CUDA模块图像处理-----对图像执行均值漂移滤波（Mean Shift Filtering）函数meanShiftFiltering()

操作系统：ubuntu22.04 OpenCV版本：OpenCV4.9 IDE:Visual Studio Code 编程语言：C11 算法描述在 GPU 上对图像执行均值漂移滤波（Mean Shift Filtering），用于图像分割或平滑处理。该函数将输入图像中的…...

编程新知 2025/11/18 18:57:56

USB Over IP专用硬件的5个特点

USB over IP技术通过将USB协议数据封装在标准TCP/IP网络数据包中，从根本上改变了USB连接。这允许客户端通过局域网或广域网远程访问和控制物理连接到服务器的USB设备（如专用硬件设备），从而消除了直接物理连接的需要。USB over IP的…...

编程新知 2025/11/23 12:05:47

安卓基础（aar）

重新设置java21的环境，临时设置 $env:JAVA_HOME "D:\Android Studio\jbr" 查看当前环境变量 JAVA_HOME 的值 echo $env:JAVA_HOME 构建ARR文件 ./gradlew :private-lib:assembleRelease 目录是这样的： MyApp/ ├── app/ …...

编程新知 2025/10/2 5:21:30

相关文章：