当前位置：首页 > news >正文

coco数据集转换SAM2格式

news 2026/2/8 19:56:38

coco是一个大json汇总了所有train的标签
SAM2训练一张图对应一个json标签

import json
import os
from pycocotools import mask as mask_utils
import numpy as np
import cv2def poly2mask(points, width, height):points_array = np.array(points, dtype=np.int32).reshape(-1, 2)mask = np.zeros((height, width), dtype=np.uint8)  # 注意顺序是(height, width)cv2.fillPoly(mask, [points_array], 255)  # 填充多边形区域为255return mask2rle(mask)def mask2rle(mask):"""将二值化掩码转换为RLE编码"""rle = mask_utils.encode(np.asfortranarray(mask))  # 使用pycocotools进行RLE编码rle['counts'] = rle['counts'].decode('utf-8')  # 将bytes转换为字符串return rle# 读取COCO格式JSON文件
with open('/home//Datasets/coco12cup/train.json', 'r') as f:coco_data = json.load(f)# 创建目标文件夹（如果不存在）
output_dir = '/home//Datasets/coco12cup/train'
os.makedirs(output_dir, exist_ok=True)# 遍历图像信息
for image in coco_data['images']:image_id = image['id']height = image['height']width = image['width']file_name = image['file_name']# 筛选对应图像的标注信息annotations = [anno for anno in coco_data['annotations'] if anno['image_id'] == image_id]# 转换标注格式为SAM2格式sam2_annotations = []for anno in annotations:# 检查segmentation格式segmentation = anno['segmentation']if isinstance(segmentation, list):  # 多边形格式segmentation_rle = poly2mask(segmentation[0], width, height)  # 多边形可能有多个，需要选第一个或合并else:  # 如果是RLE格式segmentation_rle = segmentationsam2_anno = {'area': anno['area'],'bbox': anno['bbox'],'id': anno['id'],'segmentation': segmentation_rle,}sam2_annotations.append(sam2_anno)# 创建SAM2格式的JSON数据sam2_data = {'annotations': sam2_annotations,'image': {'date_captured': '20241210',  # 根据实际情况修改'file_name': file_name,'height': height,'image_id': image_id,'license': 1,  # 根据实际情况修改'width': width}}# 写入单个JSON文件（使用 file_name 替换原本的 id 作为文件名）output_name = os.path.splitext(file_name)[0] + '.json'  # 替换扩展名为 .jsonoutput_path = os.path.join(output_dir, output_name)with open(output_path, 'w') as f:json.dump(sam2_data, f)

coco数据集转换SAM2格式

coco是一个大json汇总了所有train的标签 SAM2训练一张图对应一个json标签 import json import os from pycocotools import mask as mask_utils import numpy as np import cv2def poly2mask(points, width, height):points_array np.array(points, dtypenp.int32).reshape(-…...

编程日记 2024/12/12 4:37:10

【CMD、PowerShell和Bash设置代理】

【CMD、PowerShell和Bash设置代理】 1. CMD（命令提示符）临时设置代理（只对当前会话有效）：查看当前代理设置：清除临时代理设置：永久设置代理（对所有新的 CMD 会话有效）&am…...

编程日记 2024/12/12 4:24:59

22智能代码作业集合

3-2 #include <stdio.h>int main() {int a 21;int b 10;int c ;c a b;printf("Line 1 - c 的值是 %d\n", c );c a - b;printf("Line 2 - c 的值是 %d\n", c );c a * b;printf("Line 3 - c 的值是 %d\n", c );c a / b;printf("…...

编程日记 2024/12/12 4:22:57

实现一个简单的后台架子(侧边栏菜单渲染,折叠,黑白主题,组件主题色,全屏,路由快捷栏)

目录侧边栏菜单渲染侧边栏折叠黑白主题全屏切换切换组件主题色 tab快捷栏代码侧边栏菜单渲染结合ElementPlus组件库进行实现新建的Vue3项目,引入了格式化样式normalize.css和ElementPlus,并进行了全局引入并进行了全局引入设置高度为100% 粘贴ElementPlus的…...

编程日记 2024/12/12 4:19:53

vue3-canvas实现在图片上框选标记（放大，缩小，移动，删除）

双图版本（模板对比） 业务描述：模板与图片对比，只操作模板框选的位置进行色差对比，传框选坐标位置给后端，返回对比结果显示 draw.js文件： 新增了 createUuid，和求取两个数组差集的方…...

编程日记 2024/12/12 4:16:49

unity3d—demo(2d人物左右移动发射子弹)

目录人物代码示例： 子弹代码示例： 总结上面代码： 注意点： 人物代码示例： using System.Collections; using System.Collections.Generic; using UnityEngine;public class PlayerTiao : MonoBehaviour {public f…...

编程日记 2024/12/12 4:15:48

【ETCD】【源码阅读】深入解析 raftNode.start`函数：Raft 核心启动逻辑剖析

raftNode.start方法是 etcd 中 Raft 模块的核心启动点，其职责是管理 Raft 状态机的状态变迁、日志处理及集群通信等逻辑。通过对源码的逐行分析，我们将全面揭示其运行机制，探讨其设计背后的分布式系统理念。函数核心结构 raftNode.start 方…...

编程日记 2024/12/12 4:14:47

Robust Depth Enhancement via Polarization Prompt Fusion Tuning

paper：论文地址 code：github项目地址今天给大家分享一篇2024CVPR上的文章，文章是用偏振做提示学习，做深度估计的。模型架构图如下这篇博客不是讲这篇论文的内容，感兴趣的自己去看paper，主要是分享环境&…...

编程日记 2024/12/12 4:13:46

NEFTune，SFT训练阶段给Embedding加噪音

仿照CV里，数据增强的思路（给图像做旋转、反转、改变亮度等）；NLP里，SFT训练数据较少时，也可往embedding上加噪音，来增加训练数据的丰富程度。进而提升最终训练效果。前提假设：Embed…...

编程日记 2024/12/12 4:07:40

uniapp -- 实现页面滚动触底加载数据

效果首选，是在pages.json配置开启下拉刷新 {"path": "pages/my/document/officialDocument","style": {"navigationStyle":</...

编程日记 2024/12/12 4:06:38

L22.【LeetCode笔记】相交链表(新版)

目录 1.题目代码模板 2.分析编辑算法误区正确方法1 但不能通过所有的测试用例修改后提交结果正确方法2 节省代码的技巧 1.题目 https://leetcode.cn/problems/3u1WK4/description/ 给定两个单链表的头节点 headA 和 headB ，请找出并返回两个单…...

编程日记 2024/12/12 4:03:36

智能时代网络空间认知安全新观察

文章目录前言一、历史上的四次认知革命二、人工智能革命掀起认知安全新浪潮三、人工智能技术塑造认知安全新范式四、人工智能治理应对认知安全新思考前言 12月5日，在2024第三届北外滩网络安全论坛上以“智能时代网络空间认知安全新观察”为主题作主旨演讲&#x…...

编程日记 2024/12/12 4:02:34

游戏如何应对模拟器作弊

模拟器是指能在PC端模拟出安卓手机系统的软件，市面上比较常见的安卓模拟器有：雷电模拟器、MuMu模拟器、夜神模拟器等。市面上常见的模拟器模拟器既可以节省手机内存空间，避免长时间玩游戏手机发烫发热的尴尬，也可以用键盘鼠标对…...

编程日记 2024/12/12 3:58:28

c++ 判断一个 IP 地址（可能是 IPv6 或 IPv4）是否属于特定范围

在 C 中，判断一个 IP 地址（可能是 IPv6 或 IPv4）是否属于特定范围时，需要考虑两种不同的地址格式和它们的范围比较。IPv6 和 IPv4 地址结构完全不同，因此需要分别处理这两种地址类型。实现思路： 识别 IP…...

编程日记 2024/12/12 3:45:18

计算机视觉——相机标定(Camera Calibration)

文章目录 1. 简介2. 原理3. 相机模型3.1 四大坐标系3.2 坐标系间的转换关系3.2.1 世界坐标系到相机坐标系3.2.2 相机坐标系到图像坐标系3.2.3 像素坐标系转换为图像坐标系3.2.4 世界坐标转换为像素坐标 3.3 畸变3.3.1 畸变类型3.3.1.1 径向畸变（Radial Distortion&a…...

编程日记 2024/12/12 3:44:16

【qt环境配置】windows下的qt与vs工具集安装\版本对应关系

vs工具集安装通过vs的在线安装器勾选工具集即可工具包下载路径：https://www.microsoft.com/zh-cn/download/details.aspx?id40784 配置工具集在qt中可以自动扫描到《正确在 Windows 上配置 MSVC(2019) 作为 Qt 编译器》https://b3logfile.com/pdf/article/15922…...

编程日记 2024/12/12 3:41:14

GitHub使用

太久不用GitHub发现自己又有些不会了，突发奇想为何不把每次看到的有指导意义的博客收录一下以便下次查阅呢如何上传文件夹到GitHub上（配图详解）？_github上傳資料夾-CSDN博客 github上如何删除自己的仓库_github删除仓库-CSDN博…...

编程日记 2024/12/12 3:40:13

元宇宙时代的社交平台：Facebook的愿景与实践

随着科技的不断进步，元宇宙（Metaverse）这一概念逐渐走进了人们的视野。作为全球最大的社交平台之一，Facebook（现Meta）在这场元宇宙革命中扮演着重要角色。Meta不仅在不断扩展其社交平台的边界，还…...

编程日记 2024/12/12 3:38:11

vue2中各种钩子函数的总结以及使用场景

在 Vue 2 中，生命周期钩子函数是 Vue 实例在不同阶段自动调用的函数。这些钩子允许开发者在组件的创建、更新和销毁的特定时刻插入自定义逻辑。以下是 Vue 2 中的各种生命周期钩子函数的总结及其使用场景。生命周期钩子函数总结 1、beforeCreate 调用时机&#…...

编程日记 2024/12/12 3:37:09

软件架构：从传统单体到现代微服务的技术演变

1.引言在软件开发中，架构设计不仅仅是程序员的技术任务，它更是一个项目成功的关键。无论是小型应用还是大型分布式系统，软件架构都直接影响着系统的可维护性、可扩展性、性能和稳定性。理解软件架构的必要性，能够帮助开发人员做…...

编程日记 2024/12/12 3:36:08

04-初识css

一、css样式引入 1.1.内部样式 <div style"width: 100px;"></div>1.2.外部样式 1.2.1.外部样式1 <style>.aa {width: 100px;} </style> <div class"aa"></div>1.2.2.外部样式2 <!-- rel内表面引入的是style样…...

编程新知 2026/1/29 17:54:05

Caliper 配置文件解析：config.yaml

Caliper 是一个区块链性能基准测试工具，用于评估不同区块链平台的性能。下面我将详细解释你提供的 fisco-bcos.json 文件结构，并说明它与 config.yaml 文件的关系。 fisco-bcos.json 文件解析这个文件是针对 FISCO-BCOS 区块链网络的 Caliper 配置文件，主要包含以下几个部…...

编程新知 2025/8/13 13:40:18

浅谈不同二分算法的查找情况

二分算法原理比较简单，但是实际的算法模板却有很多，这一切都源于二分查找问题中的复杂情况和二分算法的边界处理，以下是博主对一些二分算法查找的情况分析。需要说明的是，以下二分算法都是基于有序序列为升序有序的情况&#xf…...

编程新知 2025/9/14 7:37:32

ArcGIS Pro制作水平横向图例+多级标注

今天介绍下载ArcGIS Pro中如何设置水平横向图例。之前我们介绍了ArcGIS的横向图例制作：ArcGIS横向、多列图例、顺序重排、符号居中、批量更改图例符号等等（ArcGIS出图图例8大技巧），那这次我们看看ArcGIS Pro如何更加快捷的操作。…...

编程新知 2026/2/4 17:18:03

Redis数据倾斜问题解决

Redis 数据倾斜问题解析与解决方案什么是 Redis 数据倾斜 Redis 数据倾斜指的是在 Redis 集群中，部分节点存储的数据量或访问量远高于其他节点，导致这些节点负载过高，影响整体性能。数据倾斜的主要表现部分节点内存使用率远高于其他节…...

编程新知 2026/1/27 19:28:11

力扣-35.搜索插入位置

题目描述给定一个排序数组和一个目标值，在数组中找到目标值，并返回其索引。如果目标值不存在于数组中，返回它将会被按顺序插入的位置。请必须使用时间复杂度为 O(log n) 的算法。 class Solution {public int searchInsert(int[] nums, …...

编程新知 2025/12/3 3:22:43

Java 二维码

Java 二维码 **技术：**谷歌 ZXing 实现首先添加依赖 <dependency><groupId>com.google.zxing</groupId><artifactId>core</artifactId><version>3.5.1</version></dependency><de…...

编程新知 2025/9/6 16:22:45

iOS性能调优实战：借助克魔(KeyMob)与常用工具深度洞察App瓶颈

在日常iOS开发过程中，性能问题往往是最令人头疼的一类Bug。尤其是在App上线前的压测阶段或是处理用户反馈的高发期，开发者往往需要面对卡顿、崩溃、能耗异常、日志混乱等一系列问题。这些问题表面上看似偶发，但背后往往隐藏着系统资源调度不当…...

编程新知 2025/9/24 12:50:07

vulnyx Blogger writeup

信息收集 arp-scan nmap 获取userFlag 上web看看一个默认的页面，gobuster扫一下目录可以看到扫出的目录中得到了一个有价值的目录/wordpress，说明目标所使用的cms是wordpress，访问http://192.168.43.213/wordpress/然后查看源码能看到这…...

编程新知 2026/1/29 5:24:50

Python Einops库：深度学习中的张量操作革命

Einops（爱因斯坦操作库）就像给张量操作戴上了一副"语义眼镜"——让你用人类能理解的方式告诉计算机如何操作多维数组。这个基于爱因斯坦求和约定的库，用类似自然语言的表达式替代了晦涩的API调用，彻底改变了深度学习工程…...

编程新知 2025/10/16 12:04:52

相关文章：