当前位置：首页 > news >正文

mmdection配置-yolo转coco

news 2025/7/13 2:30:39

基础配置看我的mmsegmentation。
也可以参考b站：https://www.bilibili.com/video/BV1xA4m1c7H8/?vd_source=701421543dabde010814d3f9ea6917f6#reply248829735200

这里面最大的坑就是配置coco数据集。我一般是用yolo，这个yolo转coco格式很难搞定，mmdection需要 coco格式的！
下面展示一些 内联代码片。

import os
import json
from PIL import Image# 你的路径定义
coco_format_save_path = r'C:\Users\ZhuanZ\Desktop\mmdetection-main\mmdetection-main\co'
yolo_format_annotation_path = r'C:\Users\ZhuanZ\Desktop\mmdetection-main\mmdetection-main\co\labels\test'
img_pathDir = r'C:\Users\ZhuanZ\Desktop\mmdetection-main\mmdetection-main\co\images\test'# 类别映射和其他初始化代码  该代码相对于其他版本用户可以自定义在以下修改类别而不需要额外调用外部文件
categories_mapping = ['0',]
categories = [{'id': i + 1, 'name': label, 'supercategory': 'None'} for i, label in enumerate(categories_mapping)]write_json_context = {'info': {'description': '', 'url': '', 'version': '', 'year': 2024, 'contributor': '','date_created': '2024-02-16'},'licenses': [{'id': 1, 'name': 0, 'url': None}],'categories': categories,'images': [],'annotations': []
}imageFileList = os.listdir(img_pathDir)
for i, imageFile in enumerate(imageFileList):imagePath = os.path.join(img_pathDir, imageFile)image = Image.open(imagePath)W, H = image.sizeimg_context = {'file_name': imageFile, 'height': H, 'width': W,'date_captured': '2021-07-25', 'id': i,'license': 1, 'color_url': '', 'flickr_url': ''}write_json_context['images'].append(img_context)txtFile = os.path.splitext(imageFile)[0] + '.txt'  # 修改以正确处理文件名 获取该图片获取的txt文件  # 和其他人写的代码区别是可以保证文件被找到with open(os.path.join(yolo_format_annotation_path, txtFile), 'r') as fr:lines = fr.readlines()  # 读取txt文件的每一行数据，lines是一个列表，包含了一个图片的所有标注信息# 重新引入循环中的enumerate函数for j, line in enumerate(lines):  # 这里使用enumerate确保j被正确定义parts = line.strip().split(' ')if len(parts) >= 5:  # 确保至少有5个部分    # 这里需要注意，yolo格式添加额外的内容容易报错，所以需要你只要前面的主要信息class_id, x, y, w, h = map(float, parts[:5])  # 只读取前五个值xmin = (x - w / 2) * W  # 坐标转换ymin = (y - h / 2) * Hxmax = (x + w / 2) * Wymax = (y + h / 2) * Hbbox_width, bbox_height = w * W, h * Hbbox_dict = {'id': i * 10000 + j,  # 使用j，它现在被enumerate定义'image_id': i,'category_id': class_id + 1,  # 注意目标类别要加一'iscrowd': 0,'area': bbox_width * bbox_height,'bbox': [xmin, ymin, bbox_width, bbox_height],'segmentation': [[xmin, ymin, xmax, ymin, xmax, ymax, xmin, ymax]]}write_json_context['annotations'].append(bbox_dict)
name = os.path.join(coco_format_save_path, "test.json")    #这里改一下，是train就train.json，val就val.json
with open(name, 'w') as fw:json.dump(write_json_context, fw, indent=2)

配置环境时候一定cd到mmdection文件夹下在这里插入图片描述

pip install -v -e .

在这里插入图片描述
我创建的是configs/tood下面的。

mytood继承 base = ‘./tood_r50_fpn_1x_coco.py’ 按需配置即可，需要就配置，不需要自己会继承的！

_base_ = './tood_r50_fpn_1x_coco.py'
model = dict(bbox_head=dict(num_classes=1,   #这里要改，你识别的类别是几个，也就是yolo文件里的class。txt 文件中类别数量),)
data_root = r''
metainfo = {'classes': ('0',),  #这里就是你数据集打的标签'palette': [(220, 20, 60),   #这是边框的颜色]
}
train_dataloader = dict(batch_size=1,dataset=dict(data_root=data_root,metainfo=metainfo,ann_file=r'C:\Users\ZhuanZ\Desktop\mmdetection-main\mmdetection-main\co\train.json',  #coco的json文件data_prefix=dict(img=r'C:\Users\ZhuanZ\Desktop\mmdetection-main\mmdetection-main\co\images\train'))) #训练集图片的地址
val_dataloader = dict(dataset=dict(data_root=data_root,metainfo=metainfo,ann_file=r'C:\Users\ZhuanZ\Desktop\mmdetection-main\mmdetection-main\co\val.json',data_prefix=dict(img=r'C:\Users\ZhuanZ\Desktop\mmdetection-main\mmdetection-main\co\images\val')))
test_dataloader = dict(dataset=dict(data_root=data_root,metainfo=metainfo,ann_file=r'C:\Users\ZhuanZ\Desktop\mmdetection-main\mmdetection-main\co\test.json',data_prefix=dict(img=r'C:\Users\ZhuanZ\Desktop\mmdetection-main\mmdetection-main\co\images\test')))# 修改评价指标相关配置
val_evaluator = dict(ann_file=data_root + r'C:\Users\ZhuanZ\Desktop\mmdetection-main\mmdetection-main\co\test.json')
test_evaluator = val_evaluator
load_from=r'C:\Users\ZhuanZ\Desktop\tood_r50_fpn_1x_coco_20211210_103425-20e20746.pth'  #基层类的权重文件，官网可以下载
default_hooks = dict(
#这几个钩子文件，是在mmdetection-main/configs/_base_/default_runtime.py这里配置的，具体要什么，gpt搜一下代码功能按需配置即可。timer=dict(type='IterTimerHook'),# logger=dict(type='LoggerHook', interval=50),param_scheduler=dict(type='ParamSchedulerHook'),checkpoint=dict(type='CheckpointHook', interval=1),sampler_seed=dict(type='DistSamplerSeedHook'),visualization=dict(type='DetVisualizationHook'))

然后train.py配置
在这里插入图片描述

形参指向mytood，也就是我们自己配置的数据集。

train玩之后，会在mmdetection-main/tools/work_dirs/mytood/epoch_12.pth出现pth，目前我还不知道如何保存最优权重，这个权重就是咱们训练好的模型。

然后预测：用jupter网络编译器运行。

from mmdet.apis import DetInferencer# Choose to use a config
model_name = r"C:\Users\ZhuanZ\Desktop\mmdetection-main\mmdetection-main\configs\tood\mytood.py"
# Setup a checkpoint file to load
checkpoint = r"C:\Users\ZhuanZ\Desktop\mmdetection-main\mmdetection-main\tools\work_dirs\mytood\epoch_12.pth"# Set the device to be used for evaluation
device = 'cuda:0'# Initialize the DetInferencer
inferencer = DetInferencer(model_name, checkpoint, device)# Use the detector to do inference
img =  r"C:\Users\ZhuanZ\Desktop\1d0d5b0ea6d1c165d471d7365686be4.jpg"
result = inferencer(img, out_dir='./output')

在这里插入图片描述
执行即可预测

mmdection配置-yolo转coco

基础配置看我的mmsegmentation。也可以参考b站 ：https://www.bilibili.com/video/BV1xA4m1c7H8/?vd_source701421543dabde010814d3f9ea6917f6#reply248829735200 这里面最大的坑就是配置coco数据集。我一般是用yolo，这个yolo转coco格式很难搞定&#…...

编程日记 2024/12/6 11:10:14

聚合支付系统/官方个人免签系统/三方支付系统稳定安全高并发附教程

聚合支付系统/官方个人免签系统/三方支付系统稳定安全高并发附教程系统采用FastAdmin框架独立全新开发，安全稳定,系统支持代理、商户、码商等业务逻辑。针对最近一些JD，TB等业务定制，子账号业务逻辑API 非常详细，方便内置…...

编程日记 2024/12/6 11:09:12

力扣67. 二进制求和

给你两个二进制字符串 a 和 b ，以二进制字符串的形式返回它们的和。示例 1： 输入:a "11", b "1" 输出："100" 示例 2： 输入：a "1010", b "1011" 输出&#…...

编程日记 2024/12/6 11:08:12

网络安全中的 SOC 是什么？

当今世界，网络威胁日益增多，确保网络安全已成为各种规模企业的首要任务。网络安全讨论中经常出现的一个术语是 SOC，即安全运营中心的缩写。但网络安全中的 SOC 是什么呢？ SOC在防御网络威胁、管理安全事件和全天候监控系统方面发…...

编程日记 2024/12/6 11:06:08

16、鸿蒙学习——Visibility与（if...else）该如何选择

在鸿蒙中我们如果要控制一个组件的显示与隐藏可以设置组件的Visibility属性，也可使用（if...else）条件控制，具体我们该选择哪个？二者有什么区别呢？ 1、Visibility 名称描述Hidden隐藏，但参与布局…...

编程日记 2024/12/6 11:05:05

PH热榜 | 2024-12-05

1. Oopsie 标语：用AI和会话回放调试Flutter和React Native应用介绍：Zipy推出的Oopsie是一款你唯一需要的AI赋能移动端调试工具，它能提供▶️会话回放、🤖错误监控、💡AI生成的概要分析，以及&#x1f525…...

编程日记 2024/12/6 11:04:02

Qt Chart 模块化封装曲线图

一版本说明二完成示例此文章包含：曲线轴设置，曲线切换，单条曲线显示，坐标轴。。。三曲线图UI创建在UI界面拖放一个QWidget,然后在 Widget里面放一个 graphicsView 四代码介绍 1 头文件 #include <QString> #include <QTimer> #include <QMessa…...

编程日记 2024/12/6 11:03:01

【AI系统】MobileFormer

MobileFormer 在本文中，将介绍一种新的网络-MobileFormer，它实现了 Transformer 全局特征与 CNN 局部特征的融合，在较低的成本内，创造一个高效的网络。通过本节，让大家去了解如何将 CNN 与 Transformer 更好的结合起来…...

编程日记 2024/12/6 10:59:58

python数据分析之爬虫基础：解析

目录 1、xpath 1.1、xpath的安装以及lxml的安装 1.2、xpath的基本使用 1.3、xpath基本语法 2、JsonPath 2.1、jsonpath的安装 2.2、jsonpath的使用 2.3、jsonpath的基础语法 3、BeautifulSoup 3.1、bs4安装及创建 3.2、beautifulsoup的使用 3.3、beautifulsoup基本语…...

编程日记 2024/12/6 10:58:57

uniapp中导入uview或者uview plus

关于SCSS uview-plus依赖SCSS，您必须要安装此插件，否则无法正常运行。如果您的项目是由HBuilder X创建的，相信已经安装scss插件，如果没有，请在HX菜单的工具->插件安装中找到"scss/sass编译"插件进行安…...

编程日记 2024/12/6 10:56:54

【LeetCode】122.买卖股票的最佳时机II

文章目录题目链接：题目描述：解题思路一（贪心算法）：解体思路二（动态规划）： 题目链接： 122.买卖股票的最佳时机II 题目描述： 解题思路一（贪心算法…...

编程日记 2024/12/6 10:55:53

openGauss开源数据库实战十九

文章目录任务十九 openGauss DML 语句测试任务目标实施步骤一、准备工作二、INSERT语句三、DELETE语句四、UPDATE语句五、清理工作任务十九 openGauss DML 语句测试任务目标掌握DML语句的用法,包括INSERT语句、DELETE语句和UPDATE语句。实施步骤一、准备工作使用Li…...

编程日记 2024/12/6 10:53:51

对话 Do you like coffee? Yes, I do. Do you want a cup? Yes, please. Do you want any sugar? Yes, please. Do you want any milk? No, thank you. I don’t like milk in my coffee, I like black coffee. Do you like biscuits? Yes, I do. Do you want one? Yes, …...

编程日记 2024/12/6 10:51:46

centos 报 ping: www.baidu.com: Name or service not known

[rootlocalhost ~]$ ping www.baidu.com ping: www.baidu.com: Name or service not known解决办法： 首先要求检查特定文件（/etc/resolv.conf）内是否正确配置了 DNS sudo vim /etc/resolv.conf没有正确配置可以添加如下代码： n…...

编程日记 2024/12/6 10:50:43

Python:使用随机森林分类器进行模型评估：ROC 曲线与 AUC 指标计算

前言这段代码的目标是使用随机森林分类器（Random Forest Classifier） 来进行二分类任务，并基于每个数据子集计算 ROC 曲线（Receiver Operating Characteristic Curve）以及 AUC（Area Under Curve&#xf…...

编程日记 2024/12/6 10:49:42

数据库表约束完全指南：提升数据完整性和准确性

数据库表约束完全指南：提升数据完整性和准确性在数据库设计中，表约束是确保数据完整性和准确性的关键工具。本文将详细介绍各种类型的表约束及其使用方法，包括非空约束、唯一约束、主键约束、外键约束、默认值约束、检查约束以及自动递增约…...

编程日记 2024/12/6 10:47:39

【JavaEE】多线程（6）

一、用户态与内核态【概念】用户态是指用户程序运行时的状态，在这种状态下，CPU只能执行用户态下的指令，并且只能访问受限的内存空间内核态是操作系统内核运行时的状态，内核是计算机系统的核心部分，CPU可以执行所有…...

编程日记 2024/12/6 10:45:35

BERT和RoBERTa；双向表示与单向的简单理解

目录 BERT和RoBERTa大型预训练语言模型 BERT的原理 RoBERTa的原理举例说明双向表示与单向的简单理解除了预训练语言模型，还有什么模型一、模型类型与结构二、训练方式与数据三、应用场景与功能四、技术特点与优势 BERT和RoBERTa大型预训练语言模型 BERT（Bi…...

编程日记 2024/12/6 10:44:34

Pytorch使用手册-计算机视觉迁移学习教程（专题十三）

在本教程中，你将学习如何使用迁移学习训练一个卷积神经网络进行图像分类。更多关于迁移学习的内容可以参考 CS231n 课程笔记。引用课程笔记中的内容：实际上，很少有人从头开始训练一个完整的卷积网络（随机初始化），因为拥有足够大数据集的情况相对罕见。相反，通常会在非…...

编程日记 2024/12/6 10:43:32

Jackson - Java对象与JSON相互转换

在这篇文章中，我将向您展示如何使用Jackson-databind API来实现Java对象与JSON之间的绑定，以及如何将JSON数据转换为Java对象。对于Java开发者来说，将JSON转换为Java对象及反向操作是一个常见的任务，因此我将通过示例演示如何完…...

编程日记 2024/12/6 10:42:31

【kafka】Golang实现分布式Masscan任务调度系统

要求： 输出两个程序，一个命令行程序（命令行参数用flag）和一个服务端程序。命令行程序支持通过命令行参数配置下发IP或IP段、端口、扫描带宽，然后将消息推送到kafka里面。服务端程序： 从kafka消费者接收…...

编程新知 2025/7/12 15:48:05

MySQL 隔离级别：脏读、幻读及不可重复读的原理与示例

一、MySQL 隔离级别 MySQL 提供了四种隔离级别，用于控制事务之间的并发访问以及数据的可见性，不同隔离级别对脏读、幻读、不可重复读这几种并发数据问题有着不同的处理方式，具体如下：隔离级别脏读不可重复读幻读性能特点及锁机制读未提交（READ UNCOMMITTED）允许出现允许…...

编程新知 2025/6/17 15:33:10

解决Ubuntu22.04 VMware失败的问题 ubuntu入门之二十八

现象1 打开VMware失败 Ubuntu升级之后打开VMware上报需要安装vmmon和vmnet，点击确认后如下提示最终上报fail 解决方法内核升级导致，需要在新内核下重新下载编译安装查看版本 $ vmware -v VMware Workstation 17.5.1 build-23298084$ lsb_release…...

编程新知 2025/7/10 10:28:03

工程地质软件市场：发展现状、趋势与策略建议

一、引言在工程建设领域，准确把握地质条件是确保项目顺利推进和安全运营的关键。工程地质软件作为处理、分析、模拟和展示工程地质数据的重要工具，正发挥着日益重要的作用。它凭借强大的数据处理能力、三维建模功能、空间分析工具和可视化展示手段&…...

编程新知 2025/6/17 23:10:20

Nginx server_name 配置说明

Nginx 是一个高性能的反向代理和负载均衡服务器，其核心配置之一是 server 块中的 server_name 指令。server_name 决定了 Nginx 如何根据客户端请求的 Host 头匹配对应的虚拟主机（Virtual Host）。 1. 简介 Nginx 使用 server_name 指令来确定…...

编程新知 2025/6/17 10:29:06

HTML前端开发：JavaScript 常用事件详解

作为前端开发的核心，JavaScript 事件是用户与网页交互的基础。以下是常见事件的详细说明和用法示例： 1. onclick - 点击事件当元素被单击时触发（左键点击） button.onclick function() {alert("按钮被点击了！&…...

编程新知 2025/7/8 23:32:56

安卓基础（Java 和 Gradle 版本）

1. 设置项目的 JDK 版本方法1：通过 Project Structure File → Project Structure... (或按 CtrlAltShiftS) 左侧选择 SDK Location 在 Gradle Settings 部分，设置 Gradle JDK 方法2：通过 Settings File → Settings... (或 CtrlAltS)…...

编程新知 2025/7/10 0:32:50

go 里面的指针

指针在 Go 中，指针（pointer）是一个变量的内存地址，就像 C 语言那样： a : 10 p : &a // p 是一个指向 a 的指针 fmt.Println(*p) // 输出 10，通过指针解引用• &a 表示获取变量 a 的地址 p 表示…...

编程新知 2025/7/6 15:38:55

6个月Python学习计划 Day 16 - 面向对象编程（OOP）基础

第三周 Day 3 🎯 今日目标理解类（class）和对象（object）的关系学会定义类的属性、方法和构造函数（init）掌握对象的创建与使用初识封装、继承和多态的基本概念（预告） &a…...

编程新知 2025/7/7 9:39:54

面试高频问题

文章目录 🚀 消息队列核心技术揭秘：从入门到秒杀面试官1️⃣ Kafka为何能"吞云吐雾"？性能背后的秘密1.1 顺序写入与零拷贝：性能的双引擎1.2 分区并行：数据的"八车道高速公路"1.3 页缓存与批量处理…...

编程新知 2025/7/9 0:00:40

mmdection配置-yolo转coco

相关文章：

mmdection配置-yolo转coco

聚合支付系统/官方个人免签系统/三方支付系统稳定安全高并发附教程

力扣67. 二进制求和

网络安全中的 SOC 是什么？

16、鸿蒙学习——Visibility与（if...else）该如何选择

PH热榜 | 2024-12-05

Qt Chart 模块化封装曲线图

【AI系统】MobileFormer

python数据分析之爬虫基础：解析

uniapp中导入uview或者uview plus

【LeetCode】122.买卖股票的最佳时机II

openGauss开源数据库实战十九

恶补英语初级第18天，《询问他人的喜好（上）》

centos 报 ping: www.baidu.com: Name or service not known

Python:使用随机森林分类器进行模型评估：ROC 曲线与 AUC 指标计算

数据库表约束完全指南：提升数据完整性和准确性

【JavaEE】多线程（6）

BERT和RoBERTa；双向表示与单向的简单理解

Pytorch使用手册-计算机视觉迁移学习教程（专题十三）

Jackson - Java对象与JSON相互转换

【kafka】Golang实现分布式Masscan任务调度系统

MySQL 隔离级别：脏读、幻读及不可重复读的原理与示例

解决Ubuntu22.04 VMware失败的问题 ubuntu入门之二十八

工程地质软件市场：发展现状、趋势与策略建议

Nginx server_name 配置说明

HTML前端开发：JavaScript 常用事件详解

安卓基础（Java 和 Gradle 版本）

go 里面的指针

6个月Python学习计划 Day 16 - 面向对象编程（OOP）基础

面试高频问题