当前位置：首页 > news >正文

ImageNet使用方法（细节）自用！

news 2025/7/19 2:59:29

学习记录，自用。

1. 下载数据集

点击以下链接下载种子文件，然后使用迅雷进行下载，仅下载勾选的文件即可。

https://hyper.ai/datasets/4889/c107755f6de25ba43c190f37dd0168dbd1c0877e

2. 解压

找到下载好的ILSVRC2012_img_train.tar 和 ILSVRC2012_img_val.tar

创建两个用于放训练集和测试集的文件夹⬇️

mkdir train
mkdir val

解压文件⬇️

tar xvf ILSVRC2012_img_train.tar -C ./train
tar xvf ILSVRC2012_img_val.tar -C ./val

ILSVRC2012_img_train.tar解压后为1000个tar压缩包，对应1000类别，需要再次解压，

解压脚本（先创建txt文件，粘贴下面代码，最后保存为.sh文件）⬇️

#!/bin/bash# 遍历所有以.tar结尾的文件，进行解压
for x in *.tar
do# 获取文件名（不包括.tar后缀）filename=$(basename "$x" .tar)# 创建目录并解压文件mkdir "$filename"tar -xvf "$x" -C "$filename"
done# 删除原来的tar文件
rm *.tar

执行脚本之后，就获得了1000个文件夹（每个文件夹对应一种类别）。

目前，已经把所有的 JPEG 图片搞了出来。

3.数据标签

对于训练集，同一类别的数据在同一文件夹下；

验证集没有标签，需要进行处理，下面的步骤都是对验证集标签的处理。

验证集的标签在 Development kit（ILSVRC2012_devkit_t12.tar.gz），

解压ILSVRC2012_devkit_t12.tar.gz⬇️

tar -xvf ILSVRC2012_devkit_t12.tar.gz

解压后得到ILSVRC2012_devkit_t12文件夹，在ILSVRC2012_devkit_t12\data\ILSVRC2012_validation_ground_truth.txt找到验证集对应的标签。

之后，在imagenet目录（devkit和val的根目录下）创建并运行如下 python 脚本

from scipy import io
import os
import shutildef move_valimg(val_dir='./ILSVRC2012_img_val', devkit_dir='./ILSVRC2012_devkit_t12'):"""move valimg to correspongding folders.val_id(start from 1) -> ILSVRC_ID(start from 1) -> WINDorganize like:/val/n01440764images/n01443537images....."""# load synset, val ground truth and val images listsynset = io.loadmat(os.path.join(devkit_dir, 'data', 'meta.mat'))ground_truth = open(os.path.join(devkit_dir, 'data', 'ILSVRC2012_validation_ground_truth.txt'))lines = ground_truth.readlines()labels = [int(line[:-1]) for line in lines]root, _, filenames = next(os.walk(val_dir))for filename in filenames:# val image name -> ILSVRC ID -> WINDval_id = int(filename.split('.')[0].split('_')[-1])ILSVRC_ID = labels[val_id-1]WIND = synset['synsets'][ILSVRC_ID-1][0][1][0]print("val_id:%d, ILSVRC_ID:%d, WIND:%s" % (val_id, ILSVRC_ID, WIND))# move val imagesoutput_dir = os.path.join(root, WIND)if os.path.isdir(output_dir):passelse:os.mkdir(output_dir)shutil.move(os.path.join(root, filename), os.path.join(output_dir, filename))if __name__ == '__main__':move_valimg()

如果在运行脚本的时候报错，大概率是ILSVRC2012_img_val有非jpeg文件，将其移出即可；

我这里有两个其他文件，使用迅雷下载时产生的额外文件，我执行了一下命令将其移出。

mv .5d6d0df7ed81efd49ca99ea4737e0ae5e3a5f2e5.torrent ..
mv .5D6D0DF7ED81EFD49CA99EA4737E0AE5E3A5F2E5.js ..

如何还有其他报错，可以自行调试代码。

4.数据加载

使用 torchvision.datasets.ImageFolder() 就可以直接加载处理好的数据集

import os
import torch
import torchvision.datasets as datasetsroot = 'data/imagenet'
def get_imagenet(root, train = True, transform = None, target_transform = None):if train:root = os.path.join(root, 'train')else:root = os.path.join(root, 'val')return datasets.ImageFolder(root = root,transform = transform,target_transform = target_transform)

ImageNet使用方法（细节）自用！

学习记录，自用。 1. 下载数据集点击以下链接下载种子文件，然后使用迅雷进行下载，仅下载勾选的文件即可。 https://hyper.ai/datasets/4889/c107755f6de25ba43c190f37dd0168dbd1c0877e 2. 解压找到下载好的ILSVRC2012_img_train.tar 和…...

编程日记 2023/4/22 5:12:02

C/C++外观模式解析：简化复杂子系统的高效方法

C外观模式揭秘：简化复杂子系统的高效方法引言设计模式的重要性外观模式简介与应用场景外观模式在现代软件设计中的地位与价值外观模式基本概念外观模式的定义与核心思想提供简单接口隐藏复杂子系统设计原则与外观模式的关系外观模式实现外观模式的UML图外观模式的…...

编程日记 2023/4/22 5:07:01

追梦之旅【数据结构篇】——详解小白如何使用C语言实现堆数据结构

详解小白如何使用C语言实现堆数据结构 “痛”撕堆排序~😎 前言🙌什么是堆？堆的概念及结构堆的性质：堆的实现堆向下调整算法画图分析：堆向下调整算法源代码分享：向下调整建小堆向下调整建大堆堆向上调整算…...

编程日记 2023/4/22 5:02:00

cocoscreator性能优化4-Sprite颜色数据去除

前言 Sprite是游戏内容的一个基本组成元素，包括ui、道具、立绘等各种地方都会用到。大部分情况下美术会帮我们调好图片颜色，我们只要把图片直接放到游戏里就行了。Sprite默认的渲染顶点数据中包含了颜色数据，由于我们并不需要去修改颜色&…...

编程日记 2023/4/22 4:56:59

系统接口幂等性设计探究

前言： 刚开始工作的时候写了一个带UI页面的工具，需要设计登录功能，登录功能也很简单，输入用户名密码点击登录，触发后台查询并比对密码，如果登录成功则返回消息给前端，前端把消息弹出提示一下。…...

编程日记 2023/5/30 6:11:18

C learning_7

目录 1.for循环 1.虽然while循环和for循环本质上都可以实现循环，但是它们在使用方法和场合上还是有一些区别的。 2.while循环中存在循环的三个必须条件，但是由于风格的问题使得三个部分很可能偏离较远，这样查找修改就不够集中和方便。所以…...

编程日记 2023/5/31 1:55:15

$PR(c) = \frac{PR(A)}{2} + PR(B)$

PageRank算法介绍

互联网上有数百亿个网页，可以分为这么几类：不含有用信息的，比如垃圾邮件；少数人比较感兴趣的，但范围不是很广的，比如个人博客、婚礼公告或家庭像册；很多人感兴趣的并且十分有用的，比…...

编程日记 2023/5/31 10:27:45

springboot+vue职称评审管理系统（源码+文档）

风定落花生，歌声逐流水，大家好我是风歌，混迹在java圈的辛苦码农。今天要和大家聊的是一款基于springboot的职称评审管理系统。项目源码请联系风歌，文末附上联系信息。目前有各类成品java毕设，需要请看文末联系方式 …...

编程日记 2023/4/22 4:36:54

腾讯云4核8G轻量服务器12M支持多少访客同时在线？并发数怎么算？

腾讯云轻量4核8G12M轻量应用服务器支持多少人同时在线？通用型-4核8G-180G-2000G，2000GB月流量，系统盘为180GB SSD盘，12M公网带宽，下载速度峰值为1536KB/s，即1.5M/秒，假设网站内页平均大小为60KB…...

编程日记 2023/5/31 20:05:53

图片英文翻译成中文转换器-中文翻译英文软件

您正在准备一份重要的英文资料或文件，但是您还不是很熟练地掌握英文，需要翻译才能完成您的任务吗？哪个软件能够免费把英文文档翻译成中文？让我们带您了解如何使用我们的翻译软件来免费翻译英文文档为中文。我们的翻译软件是一款功…...

编程日记 2023/4/22 4:26:52

月薪10k和40k的程序员差距有多大？

程序员的薪资一直是大家关注的焦点，相较于其他行业，程序员的高薪也是有目共睹的，而不同等级的程序员处理问题的方式与他们的薪资直接挂钩。接下来就一起看一下月薪10k、20k、30k、40k的程序员面对问题都是怎么处理的吧！ 场景一 …...

编程日记 2023/4/22 4:21:51

gateway整合knife4j(微服务在线文档)

文章目录 knife4j 微服务整合一、微服务与单体项目文档整合的区别二、开始整合1. 搭建一个父子maven模块的微服务,并引入gateway2.开始整合文档总结 knife4j 微服务整合由于单个服务的knife4j 整合之前已经写过了,那么由于效果比较好,然后微服务的项目中也想引入,所以开始微…...

编程日记 2023/6/1 12:15:56

ASP.NET 记录 HttpRequest HttpResponse HttpServerUtility

纯属个人记录,会有错误 HttpRequest Browser是获取客户端浏览器的信息 Cookies是获取客户端的Cookies QueryString是获取客户端提交的数据 ServerVariables是获取服务器端或客户端的环境变量信息 Browser 语法格式: Request.Browser[“浏览器特性名”] 常见的特性名名称说…...

编程日记 2023/4/22 4:11:48

Python 人工智能：11~15

原文：Artificial Intelligence with Python 协议：CC BY-NC-SA 4.0 译者：飞龙本文来自【ApacheCN 深度学习译文集】，采用译后编辑（MTPE）流程来尽可能提升效率。不要担心自己的形象，只关心如何…...

编程日记 2023/5/31 20:07:34

辉煌优配|军工板块逆市上涨，16只概念股已披露一季度业绩预喜

今日，军工股逆市上涨。 4月21日，A股三大股指低开低走，半导体、AI使用、信创工业、软件等科技属性概念领跌，国防军工、食品饮料和电力设备等板块上涨。工业互联网中心工业规模超1.2万亿元据央视新闻报道，本年是《工业…...

编程日记 2023/4/22 4:01:46

看板与 Scrum：有什么区别？

看板和Scrum是项目管理方法论，以小增量完成项目任务并强调持续改进。但是他们用来实现这些目标的过程是不同的。看板以可视化任务和连续流程为中心，而Scrum更多是关于为每个交付周期实施时间表和分配设定角色。在看板和Scrum之间做出选择并不总是必要…...

编程日记 2023/4/22 3:56:45

零代码是什么？零代码平台适合谁用？

随着信息技术的发展，软件开发领域也不断发生变革，零代码（No-Code）开发模式越来越受到关注。零代码到底是什么，能不能用通俗的话来说？这就来给大家讲一讲！ 01 零代码为什么出现？ 随…...

编程日记 2023/4/22 3:51:44

CNStack 云服务云组件：打造丰富的云原生技术中台生态

作者：刘裕惺 CNStack 相关阅读： CNStack 多集群服务：基于OCM 打造完善的集群管理能力 CNStack 虚拟化服务：实现虚拟机和容器资源的共池管理 CNStack 云边协同平台：实现原生边缘竟能如此简单 01 前言 CNStack 2.0…...

编程日记 2023/4/22 3:46:42

#PythonPytorch 1.如何入门深度学习模型

我之前也写过一篇关于Keras的深度学习入门blog，#Python&Keras 1.如何从无到有在自己的数据集上实现深度学习模型（入门），里面也有介绍了一下一点点机器学习的概念和理解深度学习的输入，如果对这方面有疑惑的朋友可以…...

编程日记 2023/4/22 3:41:41

[API]节点流和处理流字节流和字符流（七）

java将流分为节点流和处理流两类： 节点流：也称为低级流，是真实连接程序和另一端的"管道"，负责实际读写数据的流，读写一定是建立在节点流的基础之上进行的。节点流好比家里的"自来水管"&#xff0c…...

编程日记 2023/4/22 3:36:40

【Python】 -- 趣味代码 - 小恐龙游戏

文章目录文章目录 00 小恐龙游戏程序设计框架代码结构和功能游戏流程总结01 小恐龙游戏程序设计02 百度网盘地址00 小恐龙游戏程序设计框架这段代码是一个基于 Pygame 的简易跑酷游戏的完整实现，玩家控制一个角色（龙）躲避障碍物（仙人掌和乌鸦）。以下是代码的详细介绍：…...

编程新知 2025/7/17 15:18:30

＜6＞-MySQL表的增删查改

目录一，create（创建表） 二，retrieve（查询表） 1，select列 2，where条件三，update（更新表） 四，delete（删除表&#xf…...

编程新知 2025/7/9 22:44:11

相机Camera日志实例分析之二：相机Camx【专业模式开启直方图拍照】单帧流程日志详解

【关注我，后续持续新增专题博文，谢谢！！！】上一篇我们讲了： 这一篇我们开始讲： 目录一、场景操作步骤二、日志基础关键字分级如下三、场景日志如下： 一、场景操作步骤操作步…...

编程新知 2025/7/10 22:40:01

Java如何权衡是使用无序的数组还是有序的数组

在 Java 中，选择有序数组还是无序数组取决于具体场景的性能需求与操作特点。以下是关键权衡因素及决策指南： ⚖️ 核心权衡维度维度有序数组无序数组查询性能二分查找 O(log n) ✅线性扫描 O(n) ❌插入/删除需移位维护顺序 O(n) ❌直接操作尾部 O(1) ✅内存开销与无序数组相…...

编程新知 2025/7/4 21:35:34

ffmpeg（四）：滤镜命令

FFmpeg 的滤镜命令是用于音视频处理中的强大工具，可以完成剪裁、缩放、加水印、调色、合成、旋转、模糊、叠加字幕等复杂的操作。其核心语法格式一般如下： ffmpeg -i input.mp4 -vf "滤镜参数" output.mp4或者带音频滤镜： ffmpeg…...

编程新知 2025/7/14 15:50:18

MySQL中【正则表达式】用法

MySQL 中正则表达式通过 REGEXP 或 RLIKE 操作符实现（两者等价），用于在 WHERE 子句中进行复杂的字符串模式匹配。以下是核心用法和示例： 一、基础语法 SELECT column_name FROM table_name WHERE column_name REGEXP pattern; …...

编程新知 2025/7/5 20:12:33

selenium学习实战【Python爬虫】

selenium学习实战【Python爬虫】文章目录 selenium学习实战【Python爬虫】一、声明二、学习目标三、安装依赖3.1 安装selenium库3.2 安装浏览器驱动3.2.1 查看Edge版本3.2.2 驱动安装四、代码讲解4.1 配置浏览器4.2 加载更多4.3 寻找内容4.4 完整代码五、报告文件爬取5.1 提…...

编程新知 2025/7/19 0:24:29