当前位置：首页 > news >正文

计算机视觉常用数据集Foggy Cityscapes的介绍、下载、转为YOLO格式进行训练

news 2025/12/15 15:48:26

我在寻找Foggy Cityscapes数据集的时候花了一番功夫，因为官网下载需要用公司或学校邮箱邮箱注册账号，等待审核通过后才能进行下载数据集。并且一开始我也并不了解Foggy Cityscapes的格式和内容是什么样的，现在我弄明白后写下这篇文章，用于记录和分享。后续我还会在这个专栏发布如何使用YOLOv5\v9\v10\v11系列进行自己数据集的训练，可以订阅一波专栏。

1、Foggy Cityscapes介绍

大雾城市景观Foggy Cityscapes (F)：Foggy Cityscapes是由 Cityscapes 生成的合成数据集，它旨在模拟和研究自动驾驶车辆在雾天条件下的性能，有三个级别的大雾天气(0.005,0.01,0.02)，从轻微的雾到浓厚的雾，分别对应于600,300和150米的能见度范围。并且Foggy Cityscapes 保留了 Cityscapes 数据集的详细标注信息；同样的，数据集中的图像分辨率为1024x2048，涵盖了30多个类别，包括车辆、行人、建筑物、道路等城市街景中常见的物体和场景；但常用8个类别：

classes = ['car', 'person', 'rider', 'truck', 'bus', 'train', 'motorcycle', 'bicycle']。

Cityscapes 的一张原图对应到foggy_cityscapes中有3张图，β=[0.005,0.01,0.02]，分别进行转换可以得到3个foggy_cityscapes数据集。

由于雾天条件下的能见度降低，图像中的许多目标会变得模糊不清，这对计算机视觉检测来说是一个挑战。Foggy Cityscapes 为研究人员提供了一个测试和改进他们算法的机会，以提高在恶劣条件下算法的鲁棒性和准确性。

2、下载

官网下载地址：Cityscapes Dataset – Semantic Understanding of Urban Street Scenes

从官网下载这个压缩包文件：leftImg8bit_trainvaltest_foggy.zip

Foggy Cityscapes数据集只有图像，没有标注信息，因为和Cityscapes的标注是一模一样的。

由于在官网下载数据集需要公司或者学校邮箱申请注册，等待审核通过后才可以下载，所以我在结尾提供了网盘数据下载方式，已经全部处理好了，可以直接用于YOLO格式的目标检测。

3、划分数据集用于YOLO目标检测

经过我的处理，将三种可见度的图片beta=(0.005,0.01,0.02)分为了三个文件夹：

以最常用的beta=0.02为例子，打开后长这样：

4、图像标签命名统一化

和Cityscapes数据集一样，图像和标签的名称是不一样的，在使用YOLO检测的时候，如果两者名称不一样，那么读取图片后就找不到对应的labels。下载数据后，重命名并将路径改为如下格式：

由于原数据集三个可见度的图片都是在一个文件夹中，比如在路径为

'D:/Deep_Learning_DataSet/Object_Detection_DataSet/Foggy_Cityscapes/leftImg8bit_trainvaltest_foggy/test'

的test文件夹下，berlin_000000_000019_leftImg8bit_foggy_beta_0.02.png、berlin_000000_000019_leftImg8bit_foggy_beta_0.01.png、berlin_000000_000019_leftImg8bit_foggy_beta_0.005.png都在一起，那么在读取数据的时候不太方便，所以将这三种不同可见度的图片分别转移到三个对应的文件夹下。

使用以下这段代码将数据集划分为三个可见度的文件夹下，记得修改自己的数据集路径，然后依次修改train、val、test就可以将原数据集中的图片转移到新文件夹下。

import os
import shutil# 定义源目录和目标目录
src_dir = 'D:/Deep_Learning_DataSet/Object_Detection_DataSet/Foggy_Cityscapes/leftImg8bit_trainvaltest_foggy/test'
dest_dir_01 = 'D:/Deep_Learning_DataSet/Object_Detection_DataSet/Foggy_Cityscapes/leftImg8bit_trainvaltest_foggy/images_beta_0.01/test'
dest_dir_02 = 'D:/Deep_Learning_DataSet/Object_Detection_DataSet/Foggy_Cityscapes/leftImg8bit_trainvaltest_foggy/images_beta_0.02/test'
dest_dir_005 = 'D:/Deep_Learning_DataSet/Object_Detection_DataSet/Foggy_Cityscapes/leftImg8bit_trainvaltest_foggy/images_beta_0.005/test'# 确保目标目录存在
os.makedirs(dest_dir_01, exist_ok=True)
os.makedirs(dest_dir_02, exist_ok=True)
os.makedirs(dest_dir_005, exist_ok=True)# 遍历源目录中的所有文件
for filename in os.listdir(src_dir):# 检查文件名是否包含beta值if 'beta_0.01' in filename:shutil.move(os.path.join(src_dir, filename), os.path.join(dest_dir_01, filename))elif 'beta_0.02' in filename:shutil.move(os.path.join(src_dir, filename), os.path.join(dest_dir_02, filename))elif 'beta_0.005' in filename:shutil.move(os.path.join(src_dir, filename), os.path.join(dest_dir_005, filename))print("Files have been moved successfully.")

然后将文件夹images_beta_0.01、images_beta_0.02、images_beta_0.005都重命名为

beta_0.01、beta_0.02、beta_0.005，这三个文件夹分别放的是图像和标签，如下图所示：

5、YOLO数据配置文件

如图，记得修改自己的数据集路径，数据路径不能有中文，否则就会报以下错误。

Dataset not found , missing paths ['D:\\\\\\\\YOLO\\images\\val'] Traceback (most recent call last): File "E:\pythonCode\ObjectDetection\yolov9-main\train_dual.py", line 644, in <module> main(opt) File "E:\pythonCode\ObjectDetection\yolov9-main\train_dual.py", line 538, in main train(opt.hyp, opt, device, callbacks) File "E:\pythonCode\ObjectDetection\yolov9-main\train_dual.py", line 97, in train data_dict = data_dict or check_dataset(data) # check if None File "E:\pythonCode\ObjectDetection\yolov9-main\utils\general.py", line 537, in check_dataset raise Exception('Dataset not found ❌') Exception: Dataset not found ❌

path: D:/Deep_Learning_DataSet/Object_Detection_DataSet/Foggy_Cityscapes/beta_0.02
train: D:/Deep_Learning_DataSet/Object_Detection_DataSet/Foggy_Cityscapes/beta_0.02/images/train
val: D:/Deep_Learning_DataSet/Object_Detection_DataSet/Foggy_Cityscapes/beta_0.02/images/val
#test: test-dev2017.txt
# Classes
names:0: car1: person2: rider3: truck4: bus5: train6: motorcycle7: bicycle

6、结果可视化

运行以下代码，将图片与对应的标注信息结合，得到带有目标边界框的图像，不要忘记修改地址

import cv2
import os# 图片路径
image_path = '../beta_0.02/images/train/aachen_000010_000019_leftImg8bit_foggy_beta_0.02.png'
# YOLO注释文件路径
annotation_path = '../beta_0.02/labels/train/aachen_000010_000019_leftImg8bit_foggy_beta_0.02.txt'# 读取YOLO注释文件
with open(annotation_path, 'r') as file:lines = file.readlines()# 读取图片
image = cv2.imread(image_path)
# 禁用窗口缩放
cv2.namedWindow('Image with Bounding Boxes', cv2.WINDOW_NORMAL)# 类别名称列表
# class_names = ['car', 'person', 'rider', 'truck', 'bus', 'train', 'motorcycle', 'bicycle']
# 类别名称与ID的映射字典
class_dict = {0: 'car', 1: 'person', 2: 'rider', 3: 'truck', 4: 'bus', 5: 'train', 6: 'motorcycle', 7: 'bicycle'}
# 绘制边界框和类别标签
for line in lines:parts = line.strip().split()class_id = int(parts[0])print(f"class_id:{class_id}")x_center = float(parts[1])y_center = float(parts[2])width = float(parts[3])height = float(parts[4])# 将归一化的坐标转换为像素坐标x_min = int((x_center - width / 2) * image.shape[1])y_min = int((y_center - height / 2) * image.shape[0])x_max = int((x_center + width / 2) * image.shape[1])y_max = int((y_center + height / 2) * image.shape[0])# 获取类别名称class_name = class_dict[class_id]# 绘制边界框cv2.rectangle(image, (x_min, y_min), (x_max, y_max), (0, 255, 0), 2)# 绘制类别标签cv2.putText(image, class_name, (x_min, y_min - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 255, 0), 2)print(image.shape)
# 显示图片
cv2.imshow('Image with Bounding Boxes', image)
cv2.waitKey(0)
cv2.destroyAllWindows()

效果如下所示：

7、使用YOLOv9-m进行训练

我的GPU是4060Laptop，8GB显存，使用YOLOv9-m，batchsize=4,刚好可以训练，再多就爆显存了。2975训练集、500验证集。

8、个人下载方式

通过百度网盘分享的文件：Foggy_Cityscapes
链接：https://pan.baidu.com/s/1NgOw9MjW3pMwEO7WAowP8Q?pwd=4ekd
提取码：4ekd

如果链接失效了，评论区告诉我一声哈。

计算机视觉常用数据集Foggy Cityscapes的介绍、下载、转为YOLO格式进行训练

我在寻找Foggy Cityscapes数据集的时候花了一番功夫，因为官网下载需要用公司或学校邮箱邮箱注册账号，等待审核通过后才能进行下载数据集。并且一开始我也并不了解Foggy Cityscapes的格式和内容是什么样的，现在我弄明白后写下这篇文章&#xf…...

编程日记 2024/11/4 10:39:35

css中的样式穿透

1. >>> 操作符 <style scoped> /* 影响子组件的样式 */ .parent >>> .child {color: red; } </style>注意：>>> 操作符在某些预处理器（如Sass）中可能无法识别，因为它不是标准的CSS语法。 …...

编程日记 2024/11/4 10:38:34

MMCA：多模态动态权重更新，视觉定位新SOTA | ACM MM‘24 Oral

来源：晓飞的算法工程笔记公众号，转载请注明出处论文: Visual Grounding with Multi-modal Conditional Adaptation 论文地址：https://arxiv.org/abs/2409.04999论文代码：https://github.com/Mr-Bigworth/MMCA 创新点提出了多模…...

编程日记 2024/11/4 10:35:30

linux同步执行命令脚本 (xcall)

linux同步执行命令脚本 (xcall) 1、在/usr/local/bin目录下创建xcall文件 vim /usr/local/bin/xcall2、输入内容 #!/bin/bash # 获取控制台指令判断指令是否为空 pcount$# if((pcount0)); thenecho "command can not be null !"exit fifor host in bigdata01 …...

编程日记 2024/11/4 10:33:29

opencv - py_imgproc - py_grabcut GrabCut 算法提取前景

文章目录使用 GrabCut 算法进行交互式前景提取目标理论演示使用 GrabCut 算法进行交互式前景提取目标在本章中我们将了解 GrabCut 算法如何提取图像中的前景我们将为此创建一个交互式应用程序。理论 GrabCut 算法由英国剑桥微软研究院的 Carsten Rother、Vladimir K…...

编程日记 2024/11/4 10:30:26

ChatGPT多模态命名实体识别

ChatGPT多模态命名实体识别 ChatGPT辅助细化知识增强！![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/025e651de3ef440a90cbe05fa9971409.png)一、研究背景二、模型结构和代码任务流程第一阶段：辅助精炼知识启发式生成第二阶段：基于…...

编程日记 2024/11/4 10:29:25

04-Dubbo的通信协议

04-Dubbo的通信协议 Dubbo 支持的通信协议 Dubbo 框架提供了自定义的高性能 RPC 通信协议： 基于 TCP 的 Dubbo2 协议基于 HTTP/2 的 Triple 协议 Dubbo 框架是不和任何通信协议绑定的，对通信协议的支持非常灵活，支持任意的第三方协议&#x…...

编程日记 2024/11/4 10:28:23

开源数据库 - mysql - innodb源码阅读 - 线程启动

线程启动源码 /** Start up the InnoDB service threads which are independent of DDL recovery.*/void srv_start_threads() {if (!srv_read_only_mode) {/* Before 8.0, it was master thread that was doing periodicalcheckpoints (every 7s). Since 8.0, it is the log …...

编程日记 2024/11/4 10:26:21

在美团外卖上抢券 Python来实现

在美团外卖上抢券的 Python 实现在如今的互联网时代，自动化脚本已经成为了许多用户生活中不可或缺的工具。尤其是在购物、抢券等场景中，自动化脚本能够帮助我们节省大量的时间和精力。今天，我们将一起探索如何使用 Python 编写一个简单的脚…...

编程日记 2024/11/4 10:25:20

【ONLYOFFICE 文档 8.2 版本深度测评】功能革新与用户体验的双重飞跃

引言在数字化办公的浪潮中，ONLYOFFICE 文档以其强大的在线协作功能和全面的办公套件解决方案，赢得了全球用户的青睐。随着 8.2 版本的发布，ONLYOFFICE 再次证明了其在办公软件领域的创新能力和技术实力。一.协作编辑 PDF：团队合…...

编程日记 2024/11/4 10:22:16

npm入门教程18：npm发布npm包

一、准备工作注册npm账号： 前往npm官网注册一个账号。注册过程中需要填写个人信息，并完成邮箱验证。安装Node.js和npm： 确保你的计算机上已安装Node.js和npm。Node.js的安装包中通常包含了npm。你可以通过运行node -v和npm -v命令来检查它…...

编程日记 2024/11/4 10:19:13

VueSSR详解 VueServerRenderer Nutx

SSR Vue中的SSR（Server-Side Rendering，服务器端渲染）是一种将页面的渲染工作从客户端转移到服务器端的技术。以下是对Vue中SSR的详细解释： 一、SSR的工作原理在传统的客户端渲染（CSR）中，页面的…...

编程日记 2024/11/4 10:18:12

构建您自己的 RAG 应用程序：使用 Ollama、Python 和 ChromaDB 在本地设置 LLM 的分步指南

在数据隐私至关重要的时代，建立自己的本地语言模型 （LLM） 为公司和个人都提供了至关重要的解决方案。本教程旨在指导您完成使用 Ollama、Python 3 和 ChromaDB 创建自定义聊天机器人的过程，所有这些机器人都托管在您的系统本地。以…...

编程日记 2024/11/4 10:17:11

谷歌浏览器安装axure插件

1.在生成静态原型页面的路径下，找到resources\chrome\axure-chrome-extension.crx，这就是需要的插件了。 2.将axure-chrome-extension.crx重命名成axure-chrome-extension.zip然后解压到指定的文件夹（这个文件夹不能删除, 例如解压到了扩展程…...

编程日记 2024/11/4 10:16:09

Java唯一键实现方案

数据唯一性 1、生成UUID1.1 代码中实现1.2 数据库中实现优点缺点 2、数据库递增主键优点 3、数据库递增序列3.1 创建序列3.2 使用序列优点缺点在Java项目开发中，对数据的唯一性要求，业务数据入库的时候保持单表只有一条记录，因此对记录中要求…...

编程日记 2024/11/4 10:15:08

opencv - py_imgproc - py_canny Canny边缘检测

文章目录 Canny 边缘检测目标理论OpenCV 中的 Canny 边缘检测其他资源 Canny 边缘检测目标在本章中，我们将学习 Canny 边缘检测的概念用于该目的的 OpenCV 函数：cv.Canny() 理论 Canny 边缘检测是一种流行的边缘检测算法。它由 John F. Canny 于1…...

编程日记 2024/11/4 10:14:07

Spring Boot 创建项目详细介绍

上篇文章简单介绍了 Spring Boot（Spring Boot 详细简介！），还没看到的读者，建议看看。下面，介绍一下如何创建一个 Spring Boot 项目，以及自动生成的目录文件作用。 Maven 构建项目访问 http…...

编程日记 2024/11/4 10:09:00

70B的模型需要多少张A10的卡可以部署成功，如果使用vLLM

部署一个 70B 的模型（如 defog/sqlcoder-70b-alpha）通常需要考虑多个因素，包括模型的内存需求和你的 GPU 配置。 1. 模型内存需求大约计算，一个 70B 参数的模型在使用 FP16 精度时大约需要 280 GB 的 GPU 内存。对于 A10 GPU&a…...

编程日记 2024/11/4 10:07:59

clickhouse配置用户角色与权限

首先找到user.xml文件，默认在/etc/clickhouse-server路径下一、配置角色找到标签定义 <aaaa><readonly>1</readonly><allow_dll>0</allow_dll> </aaaa>其中aaaa为角色名称，readonly为只读权限（0–代表…...

编程日记 2024/11/4 10:06:58

面试题整理 4

总结整理了某公司面试中值得记录的笔试和问到的问题和答案。目录 PHP传值和传引用区别？什么情况下用传值？什么情况下用传引用？ 传值传引用区别选择传值还是传引用时简述PHP的垃圾回收机制二维数组排序什么是CSRF攻击&#xff…...

编程日记 2024/11/4 10:05:56

UE5 学习系列（二）用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇，在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下： 【Note】：如果你已经完成安装等操作，可以只执行第一篇博客中 2. 新建一个空白游戏项目章节操作，重…...

编程新知 2025/12/15 0:55:08

RestClient

什么是RestClient RestClient 是 Elasticsearch 官方提供的 Java 低级 REST 客户端，它允许HTTP与Elasticsearch 集群通信，而无需处理 JSON 序列化/反序列化等底层细节。它是 Elasticsearch Java API 客户端的基础。 RestClient 主要特点轻量级&#xff…...

编程新知 2025/11/30 15:33:36

进程地址空间（比特课总结）

一、进程地址空间 1. 环境变量 1 ）⽤户级环境变量与系统级环境变量全局属性：环境变量具有全局属性，会被⼦进程继承。例如当bash启动⼦进程时，环境变量会⾃动传递给⼦进程。本地变量限制：本地变量只在当前进程(ba…...

编程新知 2025/11/15 6:48:52

Xshell远程连接Kali（默认 | 私钥）Note版

前言:xshell远程连接，私钥连接和常规默认连接任务一开启ssh服务 service ssh status //查看ssh服务状态 service ssh start //开启ssh服务 update-rc.d ssh enable //开启自启动ssh服务任务二修改配置文件 vi /etc/ssh/ssh_config //第一…...

编程新知 2025/12/12 3:26:16

循环冗余码校验CRC码算法步骤+详细实例计算

通信过程：（白话解释） 我们将原始待发送的消息称为 M M M，依据发送接收消息双方约定的生成多项式 G ( x ) G(x) G(x)（意思就是 G （ x ) G（x) G（x) 是已知的）&#xff0…...

编程新知 2025/12/15 8:24:11

基于Flask实现的医疗保险欺诈识别监测模型

基于Flask实现的医疗保险欺诈识别监测模型项目截图项目简介社会医疗保险是国家通过立法形式强制实施，由雇主和个人按一定比例缴纳保险费，建立社会医疗保险基金，支付雇员医疗费用的一种医疗保险制度， 它是促进社会文明和进步的…...

编程新知 2025/12/12 20:41:18

vscode（仍待补充）

写于2025 6.9 主包将加入vscode这个更权威的圈子 vscode的基本使用侧边栏 vscode还能连接ssh？ debug时使用的launch文件 1.task.json {"tasks": [{"type": "cppbuild","label": "C/C: gcc.exe 生成活动文件"…...

编程新知 2025/12/8 9:12:34

iPhone密码忘记了办？iPhoneUnlocker，iPhone解锁工具Aiseesoft iPhone Unlocker 高级注册版分享

平时用 iPhone 的时候，难免会碰到解锁的麻烦事。比如密码忘了、人脸识别 / 指纹识别突然不灵，或者买了二手 iPhone 却被原来的 iCloud 账号锁住，这时候就需要靠谱的解锁工具来帮忙了。Aiseesoft iPhone Unlocker 就是专门解决这些问题的软件&…...

编程新知 2025/12/14 15:09:57

1.3 VSCode安装与环境配置

进入网址Visual Studio Code - Code Editing. Redefined下载.deb文件，然后打开终端，进入下载文件夹，键入命令 sudo dpkg -i code_1.100.3-1748872405_amd64.deb 在终端键入命令code即启动vscode 需要安装插件列表 1.Chinese简化 2.ros …...

编程新知 2025/12/9 2:37:58

P3 QT项目----记事本（3.8）

3.8 记事本项目总结项目源码 1.main.cpp #include "widget.h" #include <QApplication> int main(int argc, char *argv[]) {QApplication a(argc, argv);Widget w;w.show();return a.exec(); } 2.widget.cpp #include "widget.h" #include &q…...

编程新知 2025/12/12 10:35:10