当前位置：首页 > news >正文

目标检测三大数据格式VOC,YOLO,COCO的详细介绍

news 2026/2/10 7:35:26

注：本文仅供学习，未经同意请勿转载

说明：该博客来源于xiaobai_Ry:2020年3月笔记

对应的PDF下载链接在：待上传

目标检测常见数据集总结

V0C数据集(Annotation的格式是xmI)

A. 数据集包含种类:

B. V0C2007和V0C2012的区别:

C. 数据集格式:

D. 标注信息是用xmI文件组织的如下:

E. 各文件部分展示

COCO数据集（Annotation的格式是json）

目标检测常见数据集总结

这里先总结一下,我自己看完这三个常见目标检测数据集:

V0C数据集(Annotation的格式是xmI)

A. 数据集包含种类:

一共包含了20类。一共包含了20类。Person,bird, cat, cow, dog, horse, sheep,aeroplane, bicycle, boat, bus, car, motorbike, train, bottle, chair, dining table, potted plant, sofa, tv/monitor.

B. V0C2007和V0C2012的区别:

（图片来源于某博客，忘记是哪个博客了，如果博友知道，方便告诉，我补上链接）

VOC2007中包含9963张标注过的图片，由train/val/test三部分组成，共标注出24,640个物体。

对于检测任务，VOC2012的trainval/test包含08-11年的所有对应图片。 trainval有11540张图片共27450个物体。

C. 数据集格式:

. ├── Annotations 【Annotations下存放的是xml文件,每个xml对应JPEGImage中的一张图片描述

| 了图片信息】

├── ImageSets【包含三个子文件夹 Layout、Main、Segmentation】

│ ├── Action【Action下存放的是人的动作（例如running、jumping等等）】

│ ├── Layout 【Layout下存放的是具有人体部位的数据】

│ ├── Main 【Main下存放的是图像物体识别的数据，总共分为20类。】

│ └── Segmentation 【Segmentation下存放的是可用于分割的数据】

├── JPEGImages 【主要提供的是PASCAL VOC所提供的所有的图片信息，包括训练图片，测

试图片

\| \|	这些图像就是用来进行训练和测试验证的图像数据。注：是没有标记时的原图】

├── SegmentationClass 【存放按照 class 分割的图片；目标检测不需要】

└── SegmentationObject【存放按照 object 分割的图片；目标检测不需要】

D. 标注信息是用xmI文件组织的如下:

	<annotation><folder>VOC2007</folder><filename>000001.jpg</filename>  # 文件名 <source><database>The VOC2007 Database</database><annotation>PASCAL VOC2007</annotation><image>flickr</image><flickrid>341012865</flickrid></source><owner><flickrid>Fried Camels</flickrid><name>Jinky the Fruit Bat</name></owner><size>  # 图像尺寸, 用于对 bbox 左上和右下坐标点做归一化操作<width>353</width><height>500</height><depth>3</depth></size><segmented>0</segmented>  # 是否用于分割<object><name>dog</name>  # 物体类别<pose>Left</pose>  # 拍摄角度：front, rear, left, right, unspecified <truncated>1</truncated>  # 目标是否被截断（比如在图片之外），或者被遮挡（超过15%）<difficult>0</difficult>  # 检测难易程度，这个主要是根据目标的大小，光照变化，图片质量来判断<bndbox><xmin>48</xmin><ymin>240</ymin><xmax>195</xmax><ymax>371</ymax></bndbox></object><object><name>person</name><pose>Left</pose><truncated>1</truncated><difficult>0</difficult><bndbox><xmin>8</xmin><ymin>12</ymin><xmax>352</xmax><ymax>498</ymax></bndbox></object>
</annotation>

E. 各文件部分展示

(1)JPEGImages:

(2)Annotations

COCO数据集（Annotation的格式是json）

图像来源链接：点击此处

A. 总类别:

80类

B. 文件说明:

3种标注类型，使用json文件存储，每种类型包含了训练和验证
object instances（目标实例）：也就是目标检测object detection；object keypoints（目标上的关键点）； image captions（看图说话）

C. 数据格式:

	{"info": info,"licenses": [license],"images": [image],"annotations": [annotation],}info{"year": int,"version": str,"description": str,"contributor": str,"url": str,"date_created": datetime,}license{"id": int,"name": str,"url": str,} image{"id": int,"width": int,"height": int,"file_name": str,"license": int,"flickr_url": str,"coco_url": str,"date_captured": datetime,}

D. 与Voc的区别:

和VOC相比，coco数据集，小目标多、单幅图片目标多、物体大多非中心分布、更符合日常环境，所以coco检测难度更大。

YOLO数据集（Annotation的格式是txt）

A. 数据格式:

会直接把每张图片标注的标签信息保存到一个txt文件中

B. 数据说明:

0 0.521000 0.235075 0.362000 0.450249

0 0.213000 0.645522 0.418000 0.519900

0 0.794000 0.665423 0.376000 0.470149

每一行代表标注的一个目标
第一个数代表标注目标的标签，第一目标circle_red，对应数字就是0
后面的四个数代表标注框的中心坐标和标注框的相对宽和高

注：keras版yolov3训练格式是name box class这种形式

数据集格式的转换(以上三种数据集格式:xmI,json,txt的相互转换)

A. Voc与yoIo(xmI与txt)的互转

参考的博客：

把LabelImg标注的YOLO格式标签转化为VOC格式标签_吾爱北方的母老虎-CSDN博客_voc计算公式

把LabelImg标注的YOLO格式标签转化为VOC格式标签和把VOC格式标签转化为YOLO格式标签_点亮～黑夜的博客-CSDN博客

B. 三者的互转

参考的博客：

a. 推荐博客1：

VOC、COCO、YOLOv3 的 .json .xml .txt 标签文件内容，格式转换_轮子去哪儿了-CSDN博客_去voc

VOC、COCO、YOLOv3 的 .json .xml .txt 标签文件内容，格式转换_轮子去哪儿了的博客-CSDN博客_json转xml yolov3

b. 推荐博客2：

yolo格式、voc格式、coco格式相互转换(xml，json，txt)_qq_38109843的博客-CSDN博客_yolo格式

yolo格式、voc格式、coco格式相互转换(xml，json，txt)_三寸光阴___的博客-CSDN博客

额外：

python 下json转xml、html，xml转json_weixin_42081389的博客-CSDN博客_python html转json

python 下json转xml、html，xml转json_zhaojiafu666的博客-CSDN博客

目标检测三大数据格式VOC,YOLO,COCO的详细介绍

注：本文仅供学习，未经同意请勿转载说明：该博客来源于xiaobai_Ry:2020年3月笔记对应的PDF下载链接在：待上传目录目标检测常见数据集总结 V0C数据集(Annotation的格式是xmI) A. 数据集包含种类: B. V0C2007和V0C2012的区别…...

编程日记 2023/4/1 9:35:40

SpringBoot实现统一返回接口（除AOP）

起因关于使用AOP去实现统一返回接口在之前的博客中我们已经实现了，但我突然突发奇想，SpringBoot中异常类的统一返回好像是通过RestControllerAdvice 这个注解去完成的，那我是否也可以通过这个注解去实现统一返回接口。正文这个方法主要…...

编程日记 2023/4/1 9:36:09

ChatGpt - 基于人工智能检索进行论文写作

摘要 ChatGPT 是一款由 OpenAI 训练的大型语言模型，可用于各种自然语言处理任务，包括论文写作。使用 ChatGPT 可以帮助作者提高论文的语言流畅度、增强表达能力和提高文章质量。在写作过程中，作者可以使用 ChatGPT 生成自然语言的段落、句子、单词或者短语，作为启发式的写…...

编程日记 2023/2/20 5:23:54

实例三：MATLAB APP design-多项式函数拟合

一、APP 界面设计展示注：在左侧点击数据导入，选择自己的数据表，如果数据导入成功，在右侧的空白框就会显示数据导入成功。在多项式项数右侧框中输入项数，例如2、3、4等，点击计算按钮，右侧坐标框就会显示函数图像，在平均相对误差下面的空白框显示平均相对误差。...

编程日记 2023/2/20 5:22:50

springboot动态注入bean1、创建Bean(demo)2、动态注入Bean3、通过注解注入Bean4、通过config配置注入Bean5、通过Import注解导入6、使用FactoryBean接口7、实现BeanDefinitionRegistryPostProcessor接口1、创建Bean(demo) Data public class Demo(){private String name;publi…...

编程日记 2023/2/20 5:21:44

Markdown及其语法详细介绍（全面）

文章目录一、基本语法1.标题2.段落和换行3.强调4.列表5.链接6.图片7.引用8.代码9.分割线10表格二、扩展语法1.标题锚点标题 {#anchor}2.脚注3.自动链接4.任务列表5.删除线6.表情符号7.数学公式三、Markdown 应用1.文档编辑2.博客写作3.代码笔记四、常见的工具和平台支持 Markdo…...

编程日记 2023/2/20 5:20:37

在Linux和Windows上安装sentinel-1.8.5

记录：380场景：在CentOS 7.9操作系统上，安装sentinel-1.8.5。在Windows上操作系统上，安装sentinel-1.8.5。Sentinel是面向分布式、多语言异构化服务架构的流量治理组件。版本：JDK 1.8 sentinel-1.8.5 CentOS 7.9官网地址…...

编程日记 2023/2/20 5:19:31

面试攻略，Java 基础面试 100 问（十）

StringBuffer、StringBuilder、String区别线程安全 StringBuffer：线程安全，StringBuilder：线程不安全。因为 StringBuffer 的所有公开方法都是 synchronized 修饰的，而 StringBuilder 并没有 synchronized 修饰。 StringBuf…...

编程日记 2023/2/20 5:18:24

Zero-shot（零次学习）简介

zero-shot基本概念首先通过一个例子来引入zero-shot的概念。假设我们已知驴子和马的形态特征，又已知老虎和鬣狗都是又相间条纹的动物，熊猫和企鹅是黑白相间的动物，再次的基础上，我们定义斑马是黑白条纹相间的马科动物。不看任何斑…...

编程日记 2023/2/20 5:17:18

51单片机简易电阻电感电容RLC测量仪仿真设计

51单片机简易电阻电感电容RLC测量仪仿真( proteus仿真程序讲解视频） 仿真图proteus7.8及以上程序编译器：keil 4/keil 5 编程语言：C语言设计编号：S0040 51单片机简易电阻电感电容RLC测量仪仿真51单片机最小系统的相关知识复位…...

编程日记 2023/2/20 5:16:09

[软件工程导论(第六版)]第6章详细设计（课后习题详解）

文章目录1 假设只有SEQUENCE和DO-WHILE两种控制结构，怎样利用它们完成 IF THEN ELSE操作？2 假设只允许使用SEQUENCE和IF-THEN-ELSE两种控制结构，怎样利用它们完成DO WHILE操作？3 画出下列伪码程序的程序流程图和盒图：4…...

编程日记 2023/2/20 5:15:02

【2.19】算法题2：贪心算法、动态规划、分治

题目：给你一个整数数组 nums ，请你找出一个具有最大和的连续子数组（子数组最少包含一个元素），返回其最大和。子数组是数组中的一个连续部分。方法一：贪心算法原理：若当前指针所指元素之前的和小…...

编程日记 2023/2/20 5:13:56

【Redis】Redis 发布订阅通信模式 ( 发布订阅模式 | 订阅频道 | 发布消息 | 接收消息 )

文章目录一、发布订阅模式二、订阅频道三、发布消息四、接收消息一、发布订阅模式 Redis 中存在一种发布订阅消息通信模式 : 消息发布者 : 负责发送消息 , 订阅者需要订阅该发布者频道 ;消息订阅者 : 负责接收消息 ; 订阅者先订阅发布者频道 , 当发布者发布消息时 , …...

编程日记 2023/2/20 5:12:49

VNCTF 2023复现

文章目录象棋王子电子木鱼BabyGo象棋王子签到题，直接在源码中找就ok。找到一处编码，在控制台输出。 flag为：flag{w3lc0m3_t0_VNCTF_2023~~~} 电子木鱼需要先理清代码逻辑。存在三个路由。一：/路由用来查看当前的功德数量…...

编程日记 2023/2/20 5:11:44

python基础知识有哪些需要背（记住是基础知识）我是初学者

大家好，小编来为大家解答以下问题，一个有趣的事情，一个有趣的事情，今天让我们一起来看看吧！ 1、python基础知识有哪些需要背（记住是基础知识）我是初学者或看好Python的广阔前景，或…...

编程日记 2023/2/20 5:10:39

Linux下TCP连接断开后不释放的解决办法

问题：在开发测试时发现断开与服务器端口后再次连接时拒绝连接。分析：服务器上查看端口占用情况，假设端口为8888。 netstat -anp |grep 8888 发现端口8888端口显示被占用（ip为本机ip确定是上次连接）且状态为ESTABLI…...

编程日记 2023/2/20 5:09:31

1.关于嵌入式开发软件工程师的理解

学习嵌入式软件开发，首先要学会使用工具， 包括各种语言，C语言、FPGA、C等各种工具软件，各种芯片开发的IDE环境各种操作系统，Vxworks、Linux、Freertos等计算机基础，基本的框架结构，网络通信等编…...

编程日记 2023/2/20 5:08:24

1760字，让你拿捏 [‘列表‘]

如约而至，紧接着第一篇文章，小编将会陆续把自己精心做的全套Python笔记依次发放给大家，便于大家学习Python、期末备考、巩固基础等(这几期是公众号小插曲，后期发放编程技术的话主要还是会围绕Java来展开，感谢小伙伴们的…...

编程日记 2023/2/20 5:07:18

A562基于android的养老APP

需求信息： 1：家庭信息管理,包括家庭成员基本情况、性别、年龄、关系、工作单位、联系方式（手机号码、微信等）； 2：个人健康数据管理,包括姓名、性别、年龄、关系、原工作单位、联系方式（手机号码…...

编程日记 2023/2/20 5:06:12

java面试题-并发基础

1.多线程的出现是要解决什么问题的? 本质什么?提高程序性能：单线程程序只能按照固定的顺序依次执行每个任务，无法同时处理多个任务。多线程技术可以在同一时间内执行多个任务，从而提高程序的运行效率和响应速度。提高程序的并发性&#xff…...

编程日记 2023/2/20 5:05:07

ubuntu搭建nfs服务centos挂载访问

在Ubuntu上设置NFS服务器在Ubuntu上，你可以使用apt包管理器来安装NFS服务器。打开终端并运行： sudo apt update sudo apt install nfs-kernel-server创建共享目录创建一个目录用于共享，例如/shared： sudo mkdir /shared sud…...

编程新知 2026/2/6 23:18:59

定时器任务——若依源码分析

分析util包下面的工具类schedule utils： ScheduleUtils 是若依中用于与 Quartz 框架交互的工具类，封装了定时任务的创建、更新、暂停、删除等核心逻辑。 createScheduleJob createScheduleJob 用于将任务注册到 Quartz，先构建任务的 JobD…...

编程新知 2026/1/26 14:24:46

如何将联系人从 iPhone 转移到 Android

从 iPhone 换到 Android 手机时，你可能需要保留重要的数据，例如通讯录。好在，将通讯录从 iPhone 转移到 Android 手机非常简单，你可以从本文中学习 6 种可靠的方法，确保随时保持连接，不错过任何信息。第 1…...

编程新知 2026/1/31 5:09:27

【AI学习】三、AI算法中的向量

在人工智能（AI）算法中，向量（Vector）是一种将现实世界中的数据（如图像、文本、音频等）转化为计算机可处理的数值型特征表示的工具。它是连接人类认知（如语义、视觉特征）与…...

编程新知 2026/1/1 14:01:45

C/C++ 中附加包含目录、附加库目录与附加依赖项详解

在 C/C 编程的编译和链接过程中，附加包含目录、附加库目录和附加依赖项是三个至关重要的设置，它们相互配合，确保程序能够正确引用外部资源并顺利构建。虽然在学习过程中，这些概念容易让人混淆，但深入理解它们的作用和联…...

编程新知 2026/1/26 2:22:24

spring Security对RBAC及其ABAC的支持使用

RBAC (基于角色的访问控制) RBAC (Role-Based Access Control) 是 Spring Security 中最常用的权限模型，它将权限分配给角色，再将角色分配给用户。 RBAC 核心实现 1. 数据库设计 users roles permissions ------- ------…...

编程新知 2026/2/6 14:22:43

针对药品仓库的效期管理问题，如何利用WMS系统“破局”

案例： 某医药分销企业，主要经营各类药品的批发与零售。由于药品的特殊性，效期管理至关重要，但该企业一直面临效期问题的困扰。在未使用WMS系统之前，其药品入库、存储、出库等环节的效期管理主要依赖人工记录与检查。库…...

编程新知 2026/2/5 14:06:00

数据库正常，但后端收不到数据原因及解决

从代码和日志来看，后端SQL查询确实返回了数据，但最终user对象却为null。这表明查询结果没有正确映射到User对象上。在前后端分离，并且ai辅助开发的时候，很容易出现前后端变量名不一致情况，还不报错，只是单…...

编程新知 2026/1/1 2:56:38

小智AI+MCP

什么是小智AI和MCP 如果还不清楚的先看往期文章手搓小智AI聊天机器人 MCP 深度解析：AI 的USB接口如何使用小智MCP 1.刷支持mcp的小智固件 2.下载官方MCP的示例代码 Github：https://github.com/78/mcp-calculator 安这个步骤执行其中MCP_ENDPOI…...

编程新知 2026/2/8 11:51:37

在Zenodo下载文件用到googlecolab googledrive

方法：Figshare/Zenodo上的数据/文件下载不下来？尝试利用Google Colab ：https://zhuanlan.zhihu.com/p/1898503078782674027 参考： 通过Colab&谷歌云下载Figshare数据，超级实用！！&#xff0…...

编程新知 2026/2/4 16:07:16

目标检测常见数据集总结

V0C数据集(Annotation的格式是xmI)

A. 数据集包含种类:

B. V0C2007和V0C2012的区别:

C. 数据集格式:

D. 标注信息是用xmI文件组织的如下:

E. 各文件部分展示

COCO数据集（Annotation的格式是json）

A. 总类别:

B. 文件说明:

C. 数据格式:

D. 与Voc的区别:

YOLO数据集（Annotation的格式是txt）

A. 数据格式:

B. 数据说明:

数据集格式的转换(以上三种数据集格式:xmI,json,txt的相互转换)

A. Voc与yoIo(xmI与txt)的互转

B. 三者的互转

相关文章：