开源数据集分类汇总(医学,卫星,分割,分类,人脸,农业,姿势等)
本文汇总了医学图像、卫星图像、语义分割、自动驾驶、图像分类、人脸、农业、打架识别等多个方向的数据集资源,均附有下载链接。
该文章仅用于学习记录,禁止商业使用!
1.医学图像
疟疾细胞图像数据集
下载链接:http://suo.nz/2VQTUt
皮肤癌 MNIST:HAM10000
下载链接:http://suo.nz/33n6Xy
该数据集收集了来自不同人群的皮肤镜图像,通过不同的方式获取和存储。最终数据集包含 10015 张皮肤镜图像,可用作学术机器学习目的的训练集。案例包括色素病变领域所有重要诊断类别的代表性集合:光化性角化病和上皮内癌/鲍温氏病 (akiec)、基底细胞癌 (bcc),超过50%的病变是通过组织病理学(histo)证实的,其余病例的ground truth要么是后续检查(follow_up),要么是专家共识(consensus),要么是活体共聚焦显微镜(confocal)证实. 数据集包括具有多个图像的病变,可以通过 HAM10000_metadata 文件中的 lesion_id 列进行跟踪。
乳房组织病理学图像
下载链接:http://suo.nz/347Jt1
原始数据集包含以 40 倍扫描的 162 个完整的乳腺癌 (BCa) 标本幻灯片图像。从中提取了 277,524 个大小为 50 x 50 的补丁(198,738 个 IDC 负值和 78,786 个 IDC 正值)。每个补丁的文件名格式为:u_xX_yY_classC.png — > example 10253_idx5_x1351_y1101_class0.png。其中 u 是患者 ID (10253_idx5),X 是裁剪此补丁的 x 坐标,Y 是裁剪此补丁的 y 坐标,C 表示类,其中 0 是非 IDC 和1 是数据中心。
胸部 X 光图像(肺炎)
下载链接:http://suo.nz/3aXYPg
数据集分为 3 个文件夹(train、test、val)并包含每个图像类别(肺炎/正常)的子文件夹。有 5,863 张 X 射线图像 (JPEG) 和 2 个类别(肺炎/正常)。胸部 X 光图像(前后位)选自广州市妇女儿童医疗中心 1 至 5 岁儿科患者的回顾性队列。
白内障数据集
下载链接:http://suo.nz/2cOidH
用于白内障检测的白内障和正常眼睛图像数据集。
恶性与良性皮肤癌
下载链接:http://suo.nz/2kkvio
该数据集包含良性皮肤痣和恶性皮肤痣图像的平衡数据集。数据由两个文件夹组成,每个文件夹包含两种痣的 1800 张图片 (224x244)。
CT 医学图像
下载链接:http://suo.nz/2tQehH
该数据集旨在允许测试不同的方法来检查与使用对比度和患者年龄相关的 CT 图像数据的趋势。基本思想是识别与这些特征密切相关的图像纹理、统计模式和特征,并可能构建简单的工具,在这些图像被错误分类时自动对其进行分类(或查找可能是可疑情况、错误测量或校准不良机器的异常值)
MedMNIST医学图像分割评估
下载链接:http://suo.nz/2Bmrmo
MedMNIST,这是 10 个预处理的医学开放数据集的集合。MedMNIST 经过标准化处理,可在轻量级 28x28 图像上执行分类任务,无需背景知识。它涵盖了医学图像分析中的主要数据模式,在数据规模(从 100 到 100,000)和任务(二元/多类、序数回归和多标签)上具有多样性。MedMNIST 可用于教育目的、快速原型设计、多模式机器学习或医学图像分析中的 AutoML。此外,MedMNIST Classification Decathlon 旨在对所有 10 个数据集上的 AutoML 算法进行基准测试
多标签视网膜疾病 (MuReD) 数据集
下载链接:http://suo.nz/2ISEr5
多标签视网膜疾病(MuReD)数据集,使用从三个不同的最先进来源(即 ARIA、STARE 和 RFMiD 数据集)收集的图像,并执行一系列后处理确保图像质量的处理步骤、要分类的广泛疾病以及每个疾病标签有足够数量的样本。MuReD 数据集由 2208 张图像组成,具有 20 个不同的标签,图像质量和分辨率各不相同。同时,确保数据的最低质量,每个标签有足够数量的样本。
2.语义分割
高分二号 (GF-2) 卫星图像大型土地覆盖数据集
数据集下载地址:http://suo.nz/2dPkdv
GID 是具有高分二号 (GF-2) 卫星图像的大型土地覆盖数据集。这个新的数据集被命名为高分影像数据集(GID),由于其覆盖面大、分布广、空间分辨率高等特点,与现有的土地覆盖数据集相比具有优势。GID 由两部分组成:大规模分类集和精细土地覆盖分类集。大规模分类集包含 150 个像素级带注释的 GF-2 图像,精细分类集由 30,000 个多尺度图像块加上 10 个像素级带注释的 GF-2 图像组成。分别基于 5 个类别的训练图像和验证图像收集并重新标记 15 个类别的训练数据和验证数据。
DADA-seg
数据集下载地址:http://suo.nz/3bZ3qm
DADA-seg 是一个按像素标注的事故数据集,其中包含交通事故的各种关键场景。
Dark Zurich
数据集下载地址:http://suo.nz/34sQlF
Dark Zurich 是一个图像数据集,包含在夜间、黄昏和白天拍摄的总共 8779 张图像,以及每张图像的相机各自的 GPS 坐标。这些 GPS 注释用于构建一天中的跨时间对应关系,即,将每个夜间或黎明图像与其白天对应物相匹配。
斯坦福背景数据集
数据集下载地址:http://suo.nz/2WWDgY
斯坦福背景数据集是 Gould 等人引入的新数据集。(ICCV 2009)用于评估几何和语义场景理解的方法。该数据集包含 715 张图像,这些图像选自现有的公共数据集:LabelMe 、 MSRC、 PASCAL VOC 和Geometric Context。我们的选择标准是图像是户外场景,像素大约为 320 x 240,至少包含一个前景物体,并且地平线位于图像内(不需要可见)。
CIHP人体解析数据集
数据集下载地址:http://suo.nz/2ll7hi
Crowd Instance-level Human Parsing (CIHP) 数据集包含 38,280 张多人图像,这些图像具有精细的注释、高外观可变性和复杂性。该数据集可用于人体部分分割任务。
WoodScape自动驾驶鱼眼数据集
数据集下载地址:http://suo.nz/2sRklZ
WoodScape 包含四个环视摄像头和九项任务,包括分割、深度估计、3D 边界框检测和新型污染检测。为超过 10,000 张图像提供实例级别的 40 个类的语义注释。
3.图像分类
FruitNet水果分类/识别数据集
下载链接:http://suo.nz/2Cfo4y
需要高质量的水果图像来解决水果分类和识别问题。要构建机器学习模型,整洁干净的数据集是基本要求。为了这个目标,我们创建了名为“FruitNet”的六种流行印度水果的数据集。该数据集包含 6 种不同类别水果的 14700 多张经过处理的格式的高质量图像。图像分为 3 个子文件夹 1) 优质水果 2) 劣质水果和 3) 混合质量水果。每个子文件夹包含 6 个水果图像,即苹果、香蕉、番石榴、酸橙、橙子和石榴。使用具有高端分辨率相机的手机来捕捉图像。这些图像是在不同的背景和不同的光照条件下拍摄的。建议的数据集可用于训练,水果分类或重组模型的测试和验证。
卫星图像分类
下载链接:http://suo.nz/2D00yp
卫星图像分类数据集-RSI-CB256,该数据集有 4 个不同的类别,混合了传感器和谷歌地图快照
intel 自然风光图像分类数据集
下载链接:http://suo.nz/2KwdmY
这是世界各地自然风光的图像数据。
内容:此数据包含分布在 6 个类别下的大约 25,000 张大小为 150x150 的图像。{'建筑物'-> 0, '森林'-> 1, '冰川'-> 2, '山'-> 3, '海'-> 4, '街道'-> 5}
建筑遗产元素图像数据集
下载链接:http://suo.nz/2RmsZl
Architectural Heritage Elements Dataset (AHE) 是一个图像数据集,用于开发深度学习算法和建筑遗产图像分类中的特定技术。该数据集包含 10235 张图像,分为 10 个类别:祭坛:829 张图像;后殿:514 张图片;钟楼:1059张图片;栏目:1919张图片;圆顶(内部):616 张图像;圆顶(外部):1177 张图像;飞扶壁:407张图片;Gargoyle(和 Chimera):1571 张图像;彩色玻璃:1033 幅图像;保险库:1110 张图像。
贝壳或鹅卵石:图像分类数据集
下载链接:http://suo.nz/2YSG42
数据集包含两个类:贝壳或卵石。该数据集可用于二元分类任务,以确定某个图像是贝壳还是鹅卵石。
板球-足球-棒球分类
数据集下载链接:http://suo.nz/33juP6
该数据集包含 252 张打板球、踢足球和打棒球的图像。主文件夹中有 3 个子文件夹 (1) cricket (2) football (3) baseball (cricket-football-baseball)。
花卉数据集
数据集下载地址:http://suo.nz/2fGKVt
该数据集包含 4242 张花卉图像。数据收集基于数据flicr、google images、yandex images。此数据集可用于从照片中识别植物。数据图片会分为五类:洋甘菊、郁金香、玫瑰、向日葵、蒲公英。每个种类大约有800张照片。照片分辨率不高,约为 320x240 像素。照片不会缩小到单一尺寸,它们有不同的比例。
90种动物图像数据集
数据集下载地址:http://suo.nz/2ncY0a
在这个数据集中有 90 个不同类别的 5400 张动物图像。此数据集是从 Google 图片创建的:https://images.google.com/。所有照片将按照其所属类别存放于各自的文件夹下。动物类别包括:羚羊,獾,蝙蝠,熊,蜜蜂,甲虫,野牛,公猪,蝴蝶,猫 毛虫,黑猩猩等。该数据集中的图像大小不固定,可能需要后续的处理。
衣服数据集
数据集下载地址:http://suo.nz/2uJaOJ
衣服数据集总共收集了 20 种衣服的 5,000 张图像。该数据集是根据公共领域许可 (CC0) 发布的。我们使用了三种不同的方式来收集数据集:Toloka——众包平台;社交媒体上的网络众包计划;Tagias——一家专门从事数据收集的公司。标签是使用 IPython 小部件手动完成的,同时我们使用简单的神经网络纠正了标签错误。
数据集包含 20 个类,包括T 恤(1011 件),长袖(699 件),裤子(692 件),鞋子(431 件)衬衫(378 件),连衣裙(357 件),外套(312 件),短裤(308 件),帽子(171 件),裙子(155 件),西装外套(109 件)等。
商标数据集
数据集下载地址:http://suo.nz/2CfnTq
在这项工作中,我们构建了一个大规模的 logo 数据集 Logo-2K+,它涵盖了来自真实世界 logo 图像的各种 logo 类别。我们生成的徽标数据集包含 167,140 张图像,具有 10 个根类别和 2,341 个类别。
食物图像数据集
数据集下载地址:http://suo.nz/2D00oT
该数据集包含完整 food-101 数据的许多不同子集。为了给图像分析制作一个比 CIFAR10 或 MNIST 更简单的训练集,该数据包括图像的大规模缩小版本,以实现快速测试。数据已被重新格式化为 HDF5,特别是 Keras HDF5Matrix,这样可以轻松读取它们。
4.垃圾分类、水下垃圾/口罩垃圾/烟头垃圾检测
AquaTrash垃圾识别数据集
数据集下载链接:http://suo.nz/2CdMGi
该数据集包含 369 张用于深度学习的垃圾图像。总共有 470 个边界框。共有 4 类 {(0: glass), (1:paper), (2:metal), (3:plastic)}
口罩垃圾检测
数据集下载链接:http://suo.nz/2CYpbL
这个数据集是一个极具挑战性的集合,包含从 1200 多个城市和农村地区捕获和众包的 7000 多张原始 Masks 图像,其中每张图像都由DC Labs 的计算机视觉专业人员手动审查和验证。
数据集大小:7000+ 捕获者:超过 1200 多个众包贡献者 分辨率:99% 图像高清及以上(1920x1080 及以上) 地点:拍摄于印度 900 多个城市 多样性:各种照明条件,如白天、夜晚、不同的距离、观察点等 使用设备:2020-2021 年使用手机拍摄 用途:口罩检测、口罩隔离、垃圾口罩检测等
烟头垃圾数据集
数据集下载链接:http://suo.nz/2KuC0k
该数据集由一组 2200 张合成合成的地面香烟图像组成。它专为训练 CNN(卷积神经网络)而设计。
水下垃圾检测数据集
数据集下载链接:http://suo.nz/2RkRCH
该数据来自 J-EDI 海洋垃圾数据集。构成该数据集的视频在质量、深度、场景中的对象和使用的相机方面差异很大。它们包含许多不同类型的海洋垃圾的图像,这些图像是从现实世界环境中捕获的,提供了处于不同衰减、遮挡和过度生长状态的各种物体。此外,水的清晰度和光的质量因视频而异。这些视频经过处理以提取 5,700 张图像,这些图像构成了该数据集,所有图像都在垃圾实例、植物和动物等生物对象以及 ROV 上标有边界框。
垃圾分类数据集
数据集下载链接:http://suo.nz/2YR4Ho
该数据集包含来自 12 个不同类别的生活垃圾的 15,150 张图像;纸、纸板、生物、金属、塑料、绿色玻璃、棕色玻璃、白色玻璃、衣服、鞋子、电池和垃圾。
Kaggle 垃圾分类图片数据集
数据集下载链接:http://suo.nz/36mRLb
该数据集是图片数据,分为训练集85%(Train)和测试集15%(Test)。其中O代表Organic(有机垃圾),R代表Recycle(可回收)
生活垃圾数据集
数据集下载链接:http://suo.nz/3dT4PS
大约9000多张独特的图片。该数据集由印度国内常见垃圾对象的图像组成。图像是在各种照明条件、天气、室内和室外条件下拍摄的。该数据集可用于制作垃圾/垃圾检测模型、环保替代建议、碳足迹生成等。
垃圾溢出数据集
数据集下载链接:http://suo.nz/2fJocH
SpotGarbage垃圾识别数据集
数据集下载链接:http://suo.nz/2nfBho
图像中的垃圾(GINI)数据集是SpotGarbage引入的一个数据集,包含2561张图像,956张图像包含垃圾,其余的是在各种视觉属性方面与垃圾非常相似的非垃圾图像。
5.目标跟踪
Temple Color 128
数据集下载链接:http://suo.nz/2dKEEL
本数据集包含一大组 128 种颜色序列,带有基本事实和挑战因素注释(例如,遮挡)
NfS高帧率视频数据集
数据集下载链接:http://suo.nz/34o8df
第一个更高帧率的视频数据集(称为极品飞车 - NfS)和视觉对象跟踪基准。该数据集包含 100 个视频(380K 帧),这些视频是使用现在常见的更高帧率 (240 FPS) 摄像机从现实世界场景中捕获的。所有帧都用轴对齐的边界框进行注释,所有序列都用九个视觉属性手动标记——例如遮挡、快速运动、背景杂乱等。
VOT2020
数据集下载链接:http://suo.nz/2W7iD5
PathTrack 数据集
数据集下载链接:http://suo.nz/2OFhXy
用于多目标跟踪 (MOT)。PathTrack 数据集包含 720 个视频序列中的 15,000 多个人的轨迹。
ALOV300++跟踪数据集
数据集下载链接:http://suo.nz/2dKDTl
ALOV++,Amsterdam Library of Ordinary Videos for tracking 是一个物体追踪视频数据,旨在对不同的光线、通透度、泛着条件、背景杂乱程度、焦距下的相似物体的追踪。
6.口罩识别检测
SF-MASK
数据集下载链接:http://suo.nz/2E6ADA
从监控录像中对有面具和无面具的人脸进行分类是最困难的任务之一,数据集SF-MASK来解决这些问题,该数据集适用于小尺寸人脸、部分隐藏的人脸、各种人脸方向和各种面具类型等。SF-MASK是通过收集已经发布的面具相关数据集而构建的。同时,通过分析现有数据集中缺失的数据和补充缺失的数据,使其更加完整。
口罩检测视频数据集
数据集下载链接:http://suo.nz/2wAnAv
一个实时视频/图像数据集,其中包含在大学环境中行走的多个主题(带/不带面具)。每个带注释的帧都包含多个具有唯一标识、边界框和类/标签信息的实例(即人)。数据集和注释可用于训练、验证和测试基于深度学习和计算机视觉的口罩检测算法。以下是数据集的详细信息:视频总帧数:4357 边界框总数:21941 带遮罩的盒子 (MW):8306 不带遮罩的盒子 (NM):13635 图像帧:此文件夹包含 4357 个视频帧 (.png)。
口罩佩戴数据集
数据集下载链接:http://suo.nz/2p4avO
该Mask Wearing数据集是戴各种口罩的人和不戴口罩的人的物体检测数据集。这些图像最初由台湾伊甸社会福利基金会的 Cheng Hsun Teng 收集,并由 Roboflow 团队重新标记。
口罩检测数据集
数据集下载链接:http://suo.nz/2ojy0l
数据集由 2 个文件夹中的 7553 张 RGB 图像组成,分别是 with_mask 和 without_mask。图像被命名为标签 with_mask 和 without_mask。戴口罩的人脸图像为3725张,不戴口罩的人脸图像为3828张。
MDMFR口罩数据集
数据集下载链接:http://suo.nz/2gNkVE
MDMFR 数据集由两个主要集合组成,1) 面罩检测和 2) 蒙面面部识别。我们的 MDMFR 数据集中有 6006 张图像。面罩检测集合包含两类人脸图像,即蒙面和未蒙面。检测数据库包含 3174 个带掩码和 2832 个不带掩码(未掩码)的图像。
RMFD口罩遮挡人脸数据集
数据集下载链接:http://suo.nz/2ojy0v
7.自动驾驶
ExDark图像数据集
下载地址:http://suo.nz/2lidoI
Exclusively Dark (ExDARK) 数据集是 7,363 张从极低光环境到黄昏(即 10 种不同条件)的低光图像的集合,具有 12 个对象类(类似于 PASCAL VOC),在图像类级别和局部对象边界上进行了注释盒子。
Nexet车辆检测数据集
下载地址:http://suo.nz/2sKekn
50000张带标注的训练图片
41190张测试图片
图片来自77个国家
Udacity 自动驾驶汽车数据集
下载地址:http://suo.nz/2Agrp4
该数据集包含 11 个类别的 97,942 个标签和 15,000 张图像。有 1,720 个空样本(没有标签的图像)。
所有图像均为 1920x1200(下载大小约为 3.1 GB)。本数据集还提供了一个降采样到 512x512(下载大小约 580 MB)的版本,适用于大多数常见的机器学习模型(包括 YOLO v3、Mask R-CNN、SSD 和 mobilenet)。
WoodScape
下载地址:http://suo.nz/2HMEtL
WoodScape 包含四个环视摄像头和九项任务,包括分割、深度估计、3D 边界框检测和新型污染检测。为超过 10,000 张图像提供实例级别的 40 个类的语义注释。
BDD100K
下载地址:http://suo.nz/2OCU68
UCB的全天候全光照大型数据集,包含1,100小时的HD录像、GPS/IMU、时间戳信息,100,000张图片的2D bounding box标注,10,000张图片的语义分割和实例分割标注、驾驶决策标注和路况标注。官方推荐使用此数据集的十个自动驾驶任务:图像标注、道路检测、可行驶区域分割、交通参与物检测、语义分割、实例分割、多物体检测追踪、多物体分割追踪、域适应和模仿学习。
Linkopings交通标志数据集
下载地址:http://suo.nz/2W97aP
超过 20,000 张图像 ,其中 20% 已标记。
包含 3488个 交通标志。
从超过 350 公里的瑞典道路上 记录的公路和城市序列。
非洲地区交通标志数据集
下载地址:http://suo.nz/2WTJGi
该数据集已特别针对非洲地区进行了改进。两个开源数据集仅用于提取非洲地区使用的交通标志。该数据集包含来自所有类别的 76 个类,例如 监管、警告、指南和信息标志。该数据集总共包含 19,346 张图像和每个类别至少 200 个实例。
8.卫星图像
水体卫星图像的图像
数据集下载地址:http://suo.nz/2ksvWY
Sentinel-2 卫星拍摄的水体图像集。每张图片都带有一个黑白mask,其中白色代表水,黑色代表除水之外的其他东西。这些掩模是通过计算 NWDI(归一化水差指数)生成的,该指数经常用于检测和测量卫星图像中的植被,但使用更大的阈值来检测水体。
城市航拍图像分割数据集
数据集下载地址:http://suo.nz/2cWiSh
此数据集包含用于检查和准备航空影像分割数据集的脚本。该数据集包含一组不同的卫星图像,这些图像用目标城市的建筑物、道路和背景标签进行了注释。
游泳池和汽车卫星图像检测
数据集下载地址:http://suo.nz/3b5ZtQ
人工月球景观数据集
数据集下载地址:http://suo.nz/33zMp9
由于月球图像的稀缺性和缺乏注释,通常很难对其进行任何类型的机器学习实验。该数据集的目标是为公众提供人造而逼真的月球景观样本,可用于训练岩石检测算法。这些经过训练的算法可以在实际的月球图片或其他岩石地形图片上进行测试。该数据集目前包含 9,766 个岩石月球景观的真实渲染图,以及它们的分段等价物(3 类是天空、较小的岩石和较大的岩石)。还提供了所有较大岩石和经过处理、清理后的地面实况图像的边界框表。
马萨诸塞州道路数据集
数据集下载地址:http://suo.nz/32Pa9O
马萨诸塞州道路数据集由1171幅马萨诸塞州的航空图像组成。与建筑数据一样,每个图像的大小为1500×1500像素,占地2.25平方公里。
UC Merced Land-Use
数据集下载地址:http://suo.nz/2IXmvN
这是一个用于研究目的的 21 类土地利用图像数据集。以下每个类别都有 100 张图像:
农业 飞机 棒球钻石 海滩 建筑物 丛林 密集住宅 森林 高速公路 高尔夫球场 港口 路口 中型住宅 移动房屋公园 立交桥 停车场 河 跑道 稀疏住宅 储油罐 网球场
每个图像的尺寸为 256x256 像素。
这些图像是从美国地质勘探局国家地图城市区域图像集中针对全国各个城市地区的大图像中手动提取的。此公共领域图像的像素分辨率为 1 英尺。
Indian Pines
数据集下载地址:http://suo.nz/2JHZ1g
这一场景由AVIRIS传感器采集位于印第安纳州西北部的 Indian Pines 测试场上空,由 145×145 像素和 224 个光谱反射带组成,波长范围为 0.4–2.5 10^(-6) 米。该场景是一个较大场景的子集。印度松树场景包含三分之二的农业和三分之一的森林或其他天然多年生植被。有两条主要的双车道高速公路、一条铁路线,以及一些低密度住房、其他建筑结构和较小的道路。由于该场景是在 6 月份拍摄的,因此一些农作物(玉米、大豆)正处于生长早期阶段,覆盖率不到 5%。可用的基本事实被指定为十六个类别,并且并非全部都是相互排斥的。还通过去除覆盖吸水区域的谱带,将谱带数量减少到 200:[104-108]、[150-163]、220。
KSC
数据集下载地址:http://suo.nz/2Rec5X
KSC数据集是于1996年3月份在美国佛罗里达州肯尼迪太空中心进行成像,截取512×614大小进行标注的高光谱数据集。它是由机载可是红外成像光谱仪(AVIRIS)摄,AVIRIS的波长范围是400-2500nm。空间分辨率为18米,在去除吸水带以及低信噪比波段后,实际用于训练的波段是176个。研究区域有13中地物类型,包括Scrub、Willow swamp、Cabbage palm hammock、Slash pine等。
Washington DC
数据集下载地址:http://suo.nz/2YJZ9K
Washington DC数据集是由Hydice传感器获取的一幅华盛顿购物中心上空的航空高光谱影像,数据包含了从 0.4 -2.4 µm可见光和近红外波段范围的共191个波段,数据大小为1280×307。地物类别包括街道,草地,水,碎石小路,树木,阴影和屋顶。
BigEarthNet
数据集下载地址:https://bigearth.net/
使用Sentinel-2图像补丁构建BigEarthNet(现在称为BigEarthNet-S2,以前称为BigEarthNet),初步选择了2017年6月至2018年5月期间在欧洲10个国家(奥地利、比利时、芬兰、爱尔兰、科索沃、立陶宛、卢森堡、葡萄牙、塞尔维亚、瑞士)。所有图块均通过 Sentinel-2 Level 2A 产品生成和格式化工具 (sen2cor v2.5.5) 进行了大气校正。然后,它们被分为 590,326 个不重叠的图像块。每个图像块都由 2018 年 CORINE 土地覆盖数据库 (CLC 2018) 提供的多个土地覆盖类别(即多标签)进行注释。BigEarthNet中的标签属于2018年首次发布的标签。
9.农业相关
DeepWeeds 杂草类型分类数据集
下载链接:http://suo.nz/2OmaTQ
数据集包含 17,509 张图像,这些图像捕捉了八种原产于澳大利亚的不同杂草以及邻近的植物群。选定的杂草品种是昆士兰州牧草地的本地品种。它们包括:“中国苹果”、“蛇草”、“马缨丹”、“刺金合欢”、“暹罗草”、“白花菊”、“橡胶藤”和“帕金森属植物”。这些图像是从昆士兰以下地点的杂草侵扰中收集的:“Black River”、“Charters Towers”、“Cluden”、“Douglas”、“Hervey Range”、“Kelso”、“McKinlay”和“Paluma”。
仙人掌航拍图片数据集
下载链接:http://suo.nz/2VSnYx
在此数据集中,展示了 16,000 多个用于植物识别或分类的柱状仙人掌 (Neobuxbaumia tetetzo) 示例。
农作物图像分类(小麦、水稻、甘蔗、玉米等)
下载链接:http://suo.nz/33oB1C
数据集(作物图像)包含每种农业作物(玉米、小麦、黄麻、水稻和甘蔗)的 40 多张图像数据集(kag2)包含每类作物图像的 159 多张增强图像。增强包括水平翻转、旋转、水平平移、垂直平移。
5种不同的水稻图像数据集
下载链接:http://suo.nz/349aVN
-
使用了 Arborio、Basmati、Ipsala、Jasmine 和 Karacadag 水稻品种。
-
数据集(1) 有75K 幅图像,包括每个水稻品种的15K 幅图像。数据集(2)有 12 个形态特征、4 个形状特征和 90 个颜色特征。
玉米叶感染数据集
下载链接:http://suo.nz/3aZ0xg
收集了部分被秋粘虫等害虫感染的玉米叶片图像。有 Healthy 和 Infected 文件夹,每个文件夹都包含各自的图像。此外,还使用 VoTT 为受感染的图像准备了注释文件。
打架识别相关
监控摄像头下的打架检测
数据集下载链接:http://suo.nz/39IbxQ
该数据集是从包含打架实例的 Youtube 视频中收集的。此外,还包括一些来自常规监控摄像机视频的非打架序列。
-
总共有300个视频,150个打架+150个非打架
-
视频时长 2 秒
-
示例中仅包含与打架相关的部分
此外,由于任务是通过监控摄像头检测打斗,因此首选没有背景运动的视频作为样本。此外,还包括各种打斗场景,例如用物体撞击、踢打、拳击、摔跤。示例中的环境也各不相同,例如咖啡馆、街道、公共汽车等。
UBI-Fight异常事件检测数据集
数据集下载链接:http://suo.nz/3aoBUh
UBI-Fights 数据集是一个独特的全新大型数据集,涉及特定的异常检测并仍然在打斗场景中提供广泛的多样性,该数据集包含 80 小时的视频,在帧级别进行了完全注释。由 1000 个视频组成,其中 216 个视频包含打斗事件,784 个是正常的日常生活场景。删除所有可能干扰学习过程的不必要的视频片段(例如,视频介绍、新闻等) 。
曲棍球比赛检测数据集
数据集下载链接:http://suo.nz/2ceViI
该数据集中包含 1000 个序列,分为两组:打斗和非打斗。
打架识别图像数据集
数据集下载链接:http://suo.nz/2jL8np
该数据集是为“打斗探测器”项目创建的,该项目检测静止图像中的打斗,然后将打斗探测器移动到上下文中具有时间维度的下一级视频检测。打斗数据集是从视频数据集 HMDB51 数据集创建的。
真实街头斗殴视频数据集
数据集下载链接:http://suo.nz/2rhiQO
该数据集包含从 youtube 视频中收集的 1000 个暴力视频和 1000 个非暴力视频,数据集中的暴力视频包含多种环境和条件下的许多真实街头斗殴情况。数据集中的非暴力视频也是从许多不同的人类行为中收集的,如运动、饮食、步行等。
人脸
FePh面部表情数据集
数据集下载链接:http://suo.nz/2zIouL
手语背景下带注释的序列化面部表情数据集,其中包含从公共电视台 PHOENIX 的每日新闻和天气预报中提取的 3000 多张面部图像。与大多数当前现有的面部表情数据集不同,FePh 提供具有不同头部姿势、方向和运动的序列化半模糊面部图像。
不平衡面部表情数据集
数据集下载链接:http://suo.nz/2OKM2R
图像大小保持 96x96,并使用改进后的标签。源数据集被分成两个子集——训练和测试。train.csv 和 test.csv 文件分别包含训练和测试子集的标签到文件名的映射。类别有:愤怒、蔑视、厌恶、恐惧、快乐、中性、悲伤和惊讶。
FER-2013
数据集下载链接:http://suo.nz/2WgZ7y
数据由 48x48 像素的人脸灰度图像组成。人脸已自动注册,因此人脸或多或少居中,并且在每张图像中占据大致相同的空间训练集包含 28,709 个示例,公共测试集包含 3,589 个示例。
FANE:面部表情和情绪数据集
数据集下载链接:http://suo.nz/2X1BD1
FANE 是一个图像数据集,用于对野外图像中的面部表情和情绪进行分类。数据集中有九个类别。总共有16,913 张图片。图像是从多个来源收集的,包括其他面部表情数据集,以及主要通过网络抓取的互联网。使用手动注释和预训练模型对图像进行标记。
小鼠面部表情数据集
数据集下载链接:http://suo.nz/34xOHI
老鼠在三种情绪状态(中性、疼痛和发痒)下的面部图像。
相关文章:

开源数据集分类汇总(医学,卫星,分割,分类,人脸,农业,姿势等)
本文汇总了医学图像、卫星图像、语义分割、自动驾驶、图像分类、人脸、农业、打架识别等多个方向的数据集资源,均附有下载链接。 该文章仅用于学习记录,禁止商业使用! 1.医学图像 疟疾细胞图像数据集 下载链接:http://suo.nz/2V…...

Linux:Firewalld防火墙
目录 绪论 1、firewalld配置模式 2、预定义服务:系统自带 3端口管理 绪论 firewalld 防火墙,包过滤防火墙,工作在网络层,centos7自带的默认的防火墙 作用是为了取代iptables 1、firewalld配置模式 运行时配置 永久配置 i…...
mysql死锁;锁表排查
概述 有时候提前终止了navicat执行线程,但是实际mysql还在执行这个线程, 需要通过mysql本身去终止. mysql:8.0 三板斧第一斧 捞点网上线程现成的执行命令 1.查询是否锁表 show OPEN TABLES where In_use > 0;2.查询进程(如果您有SUP…...

YAMLException: java.nio.charset.MalformedInputException: Input length = 1
springboot项目启动的时候提示这个错误:YAMLException: java.nio.charset.MalformedInputException: Input length 1 根据异常信息提示,是YAML文件有问题。 原因是yml配置文件的编码有问题。 需要修改项目的编码格式,一般统一为UTF-8。 或…...
无需求文档,保障测试质量的可行性做法
这篇文章,内容是:无需求文档的情况下,作为一个测试人员,应该如何做 ,才能保障测试质量不出问题,以及如何不背锅 ? 001 没有需求文档3种可能情况 : 1、公司都没产品经理࿰…...
SpringBoot项目学习笔记
第一章 SpringBoot有哪些优点? Spring Boot作为Java开发的框架和工具集,具有许多优点,这些优点有助于简化开发过程并提高效率。以下是一些主要的优点: 简化配置: Spring Boot采用约定优于配置的原则,通过自…...
如何在Vue表单处理中实现表单字段的文件下载
Vue.js 是一种流行的JavaScript框架,用于构建用户界面。在Vue应用中,我们经常需要处理表单操作,其中一个常见需求是实现文件下载。以下介绍如何在Vue表单处理中实现表单字段的文件下载,大家共同交流。 一、使用HTML的a标签实现文…...
SSL证书DV和OV的区别?
SSL证书是在互联网通信中保护数据传输安全的一种加密工具。它能够确保客户端和服务器之间的通信得以加密,防止第三方窃听或篡改信息。在选择SSL证书时,常见的有DV证书和OV证书,它们在验证标准和信任级别上有所不同。那么SSL证书DV和OV的有哪些…...

计算机竞赛 GRU的 电影评论情感分析 - python 深度学习 情感分类
1 前言 🔥学长分享优质竞赛项目,今天要分享的是 🚩 GRU的 电影评论情感分析 - python 深度学习 情感分类 🥇学长这里给一个题目综合评分(每项满分5分) 难度系数:3分工作量:3分创新点:4分 这…...

论文阅读 - Neutral bots probe political bias on social media
论文链接:Neutral bots probe political bias on social media | EndNote Click 试图遏制滥用行为和错误信息的社交媒体平台被指责存在政治偏见。我们部署中立的社交机器人,它们开始关注 Twitter 上的不同新闻源,并跟踪它们以探究平台机制与用…...

Fabric系列 - 知识点整理
知识点 源码编译 主机编译 容器编译 手动部署(docker-compose) 单peer 多peer 中途加peer 多主机多peer 链码 语法, 接口 (go版) 命令行调用 ca server 在DApp中使用SDK调用 (js版) 部署的几个阶段 部署1排序和1节点, 1组织1通道 光部署能Dapp 带ca server (每个组织一个)…...

多目标优化算法之樽海鞘算法(MSSA)
樽海鞘算法的主要灵感是樽海鞘在海洋中航行和觅食时的群聚行为。相关文献表示,多目标优化之樽海鞘算法的结果表明,该算法可以逼近帕雷托最优解,收敛性和覆盖率高。 通过给SSA算法配备一个食物来源库来解决第一个问题。该存储库维护了到目前为…...

阿里云轻量应用服务器使用教程_创建配置_远程连接_网站上线
阿里云轻量应用服务器怎么使用?阿里云百科分享轻量应用服务器从选择创建、配置建站环境、轻量服务器应用服务器远程连接、开端口到网站上线全流程: 目录 阿里云轻量应用服务器使用教程 步骤一:购买一台轻量应用服务器 步骤二:…...
自监督学习的概念
Self-Supervised Learning (SSL)的主要思想是解决先验任务来学习特征提取器,在不使用标签的情况下生成有用的表示。 这里先验任务是指, 先使用原始数据和特征提取器来提取出 数据的有效表示. 对比方法(即对比学习, Contrastiv…...

C#多线程开发详解
C#多线程开发详解 持续更新中。。。。。一、为什么要使用多线程开发1.提高性能2.响应性3.资源利用4.任务分解5.并行计算6.实时处理 二、多线程开发缺点1.竞态条件2.死锁和饥饿3.调试复杂性4.上下文切换开销5.线程安全性 三、多线程开发涉及的相关概念常用概念(1)lock(2)查看当前…...

Linux 基础篇(六)sudo和添加信任用户
一、sudo 1.是什么? 给被信任的普通用户授权,让被信任的普通用户能执行root用户才能执行的命令的一个命令。 2.为什么? 很多时候我们要在被信任的普通用户下执行一些root用户才能执行的命令,如 yum… 所以需要有一个命令能给普通用…...

【Linux】程序地址空间
程序地址空间 首先引入地址空间的作用什么是地址空间为什么要有地址空间 首先引入地址空间的作用 1 #include <stdio.h>2 #include <unistd.h>3 #include <stdlib.h>4 int g_val 100;6 int main()7 {8 pid_t id fork();9 if(id 0)10 {11 int cn…...

springboot 设置自定义启动banner背景图 教程
springboot banner Spring Boot中的banner是在应用程序启动时显示的一个ASCII艺术字符或文本。它被用来给用户展示一些关于应用程序的信息,例如名称、版本号或者公司标志等。 使用Spring Boot的默认设置,如果项目中有一个名为“banner.txt”的文件放置…...

CSS的引入方式有哪些?
聚沙成塔每天进步一点点 ⭐ 专栏简介⭐ 内联样式(Inline Styles)⭐ 内部样式表(Internal Stylesheet)⭐ 外部样式表(External Stylesheet)⭐ 导入样式表(Import Stylesheet)⭐ 写在最…...

.net core的Knife4jUI,让swagger更精致
要在 .NET Core 中使用 IGeekFan.AspNetCore.Knife4jUI,您可以按照以下步骤进行配置: 首先,安装 IGeekFan.AspNetCore.Knife4jUI NuGet 包。可以通过 Visual Studio 的 NuGet 包管理器或者 .NET CLI 进行安装。 在 Startup.cs 文件的 Config…...
KubeSphere 容器平台高可用:环境搭建与可视化操作指南
Linux_k8s篇 欢迎来到Linux的世界,看笔记好好学多敲多打,每个人都是大神! 题目:KubeSphere 容器平台高可用:环境搭建与可视化操作指南 版本号: 1.0,0 作者: 老王要学习 日期: 2025.06.05 适用环境: Ubuntu22 文档说…...

前端导出带有合并单元格的列表
// 导出async function exportExcel(fileName "共识调整.xlsx") {// 所有数据const exportData await getAllMainData();// 表头内容let fitstTitleList [];const secondTitleList [];allColumns.value.forEach(column > {if (!column.children) {fitstTitleL…...
服务器硬防的应用场景都有哪些?
服务器硬防是指一种通过硬件设备层面的安全措施来防御服务器系统受到网络攻击的方式,避免服务器受到各种恶意攻击和网络威胁,那么,服务器硬防通常都会应用在哪些场景当中呢? 硬防服务器中一般会配备入侵检测系统和预防系统&#x…...

CMake 从 GitHub 下载第三方库并使用
有时我们希望直接使用 GitHub 上的开源库,而不想手动下载、编译和安装。 可以利用 CMake 提供的 FetchContent 模块来实现自动下载、构建和链接第三方库。 FetchContent 命令官方文档✅ 示例代码 我们将以 fmt 这个流行的格式化库为例,演示如何: 使用 FetchContent 从 GitH…...

AI书签管理工具开发全记录(十九):嵌入资源处理
1.前言 📝 在上一篇文章中,我们完成了书签的导入导出功能。本篇文章我们研究如何处理嵌入资源,方便后续将资源打包到一个可执行文件中。 2.embed介绍 🎯 Go 1.16 引入了革命性的 embed 包,彻底改变了静态资源管理的…...
GitHub 趋势日报 (2025年06月06日)
📊 由 TrendForge 系统生成 | 🌐 https://trendforge.devlive.org/ 🌐 本日报中的项目描述已自动翻译为中文 📈 今日获星趋势图 今日获星趋势图 590 cognee 551 onlook 399 project-based-learning 348 build-your-own-x 320 ne…...
在鸿蒙HarmonyOS 5中使用DevEco Studio实现指南针功能
指南针功能是许多位置服务应用的基础功能之一。下面我将详细介绍如何在HarmonyOS 5中使用DevEco Studio实现指南针功能。 1. 开发环境准备 确保已安装DevEco Studio 3.1或更高版本确保项目使用的是HarmonyOS 5.0 SDK在项目的module.json5中配置必要的权限 2. 权限配置 在mo…...
JS红宝书笔记 - 3.3 变量
要定义变量,可以使用var操作符,后跟变量名 ES实现变量初始化,因此可以同时定义变量并设置它的值 使用var操作符定义的变量会成为包含它的函数的局部变量。 在函数内定义变量时省略var操作符,可以创建一个全局变量 如果需要定义…...
AWS vs 阿里云:功能、服务与性能对比指南
在云计算领域,Amazon Web Services (AWS) 和阿里云 (Alibaba Cloud) 是全球领先的提供商,各自在功能范围、服务生态系统、性能表现和适用场景上具有独特优势。基于提供的引用[1]-[5],我将从功能、服务和性能三个方面进行结构化对比分析&#…...
大模型真的像人一样“思考”和“理解”吗?
Yann LeCun 新研究的核心探讨:大语言模型(LLM)的“理解”和“思考”方式与人类认知的根本差异。 核心问题:大模型真的像人一样“思考”和“理解”吗? 人类的思考方式: 你的大脑是个超级整理师。面对海量信…...