当前位置: 首页 > article >正文

RPC数据集整理与 Scalabel 标注说明

RPC数据集整理与 Scalabel 标注说明1. RPC 数据集简介RPCRetail Product Checkout Dataset是一个面向自动结算ACO, Automatic Checkout场景的大规模零售商品数据集核心目标是从结算台图像中自动识别商品并生成购物清单。RPC 的特点在于它同时包含受控环境下的单商品图像与真实结算场景下的多商品图像因此既适合做商品分类也适合做检测、计数、检索与结算场景理解。1.1 数据集关键特征根据 RPC 官方项目页与论文共包含200 个 SKU细粒度商品类别这 200 个 SKU 被组织为17 个 meta-categories元类别同时提供训练集Exemplar images单商品图验证集Checkout images多商品结算图测试集Checkout images多商品结算图Checkout 图像提供了多层级标注可用于检测、定位、分类和自动结算任务1.2 官方划分规模RPC 官方项目页给出的数据规模如下Split图像数目标数平均每图目标数平均每图类别数Training set (Exemplar images)53,73953,7391.001.00Validation set (Checkout images)6,00073,60212.276.33Test set (Checkout images)24,000294,33312.266.31另外验证集与测试集按 clutter level拥挤程度还可分为Clutter mode图像数目标数平均每图目标数平均每图类别数Easy10,00071,4967.153.81Medium10,000122,96112.306.27Hard10,000173,47817.358.872. RPC 的类别体系RPC 共有 200 个 SKU官方论文将其划分为 17 个元类别meta-categoriespuffed fooddried fruitdried foodinstant drinkinstant noodlesdessertdrinkalcoholmilkcanned foodchocolategumcandyseasonerpersonal hygienetissuestationery你当前提供的instances_val2019.json中也能看到这一结构categories中保存了id / name / supercategory例如{id: 1, name: 1_puffed_food, supercategory: puffed_food}{id: 79, name: 79_alcohol, supercategory: alcohol}{id: 200, name: 200_stationery, supercategory: stationery}此外这个 JSON 里还额外带有__raw_Chinese_name_df其中包含category_idsku_namesku_classname中文商品名clas中文大类名knowncodeshelfnum这对于后续把 RPC 转成中文目录名分类集、做可视化、或者生成 Scalabel 的类别显示名称都很有帮助。3. RPC 原始标注结构COCO 风格RPC 的常见标注文件如instances_train2019.jsoninstances_val2019.jsoninstances_test2019.json整体上是COCO 风格 JSON核心字段包括{info:{...},licenses:[...],categories:[...],images:[...],annotations:[...]}3.1images每张图像通常包含{id:123,file_name:xxx.jpg,width:800,height:800}3.2annotations每个实例通常包含{id:456,image_id:123,category_id:79,bbox:[x,y,w,h],area:12345.6,iscrowd:0}其中image_id关联到images[*].idcategory_id关联到categories[*].idbbox [x, y, w, h]左上角坐标 宽高area目标面积iscrowd是否为 crowd 实例3.3 训练 / 验证 / 测试图像语义train2019单商品图像exemplar images通常每张图对应一个商品类别val2019/test2019结算场景图像checkout images每张图有多个商品实例框因此在工程上常见两种转换方向RPC - YOLO 检测集使用val/test/train中的bbox生成检测标签RPC - YOLO 分类集train2019直接作为单商品分类样本val/test通过bbox crop裁成单商品 patch 作为分类验证/测试样本4. Scalabel 简介Scalabel 是一个开源、可扩展的视觉标注平台支持 2D/3D 标注、目标检测框、实例分割、多边形、轨迹等多种标注形式。其文档说明中Scalabel 的数据格式本质上由frame 列表组成每个 frame 可以包含图像信息和该图像上的多个 labels。对于 2D 目标检测最关键的字段是frame.nameframe.urlframe.labelslabel.idlabel.categorylabel.box2d {x1, y1, x2, y2}如果只做 RPC 商品框标注通常只需要使用2D Bounding Box子集即可。5. Scalabel 标注格式适配 RPC 的最小必要字段一个最小可用的 Scalabel 2D 检测标注文件通常可以写成一个 frame 数组[{name:20180827-10-42-32-575.jpg,url:images/20180827-10-42-32-575.jpg,videoName:,frameIndex:0,labels:[{id:ann_50196,category:187_tissue,attributes:{},manualShape:true,manualAttributes:true,box2d:{x1:120.0,y1:80.0,x2:240.0,y2:300.0}}]}]其中5.1 Frame 级字段name图像文件名url图像相对路径或绝对路径videoName图像任务一般可为空frameIndex图像任务可用索引占位labels该图像上全部标注对象5.2 Label 级字段id实例 ID可直接用 RPC 的annotation.idcategory类别名可用categories[*].name英文 SKU 名或__raw_Chinese_name_df.name中文商品名manualShape是否人工绘制框manualAttributes是否人工标注属性attributes扩展属性可为空字典box2d检测框要求是(x1, y1, x2, y2)而不是 COCO 的(x, y, w, h)6. RPC COCO - Scalabel 的字段映射RPC 原始标注是 COCO 风格而 Scalabel 检测标注更接近 frame-label 结构。二者转换关系可整理如下RPC 字段含义Scalabel 字段说明images[i].file_name图像文件名frame.name建议保留原文件名图像相对路径图像路径frame.url可填相对路径images[i].id图像 ID-作为中间关联键annotations[j].id实例 IDlabel.id建议转为字符串annotations[j].category_id类别 IDlabel.category需查categories或中文名映射annotations[j].bbox[0]xbox2d.x1左上角 xannotations[j].bbox[1]ybox2d.y1左上角 yannotations[j].bbox[0]bbox[2]xwbox2d.x2右下角 xannotations[j].bbox[1]bbox[3]yhbox2d.y2右下角 yannotations[j].iscrowdcrowd 标记attributes.iscrowd可选扩展属性categories[k].name英文类名label.category最常用__raw_Chinese_name_df.name中文商品名label.attributes.cn_name或label.category适合中文项目7. 推荐的 RPC - Scalabel 组织方式如果目标是把 RPC 转为 Scalabel 标注项目建议目录组织如下rpc_scalabel_project/ ├── images/ │ ├── val2019/ │ ├── test2019/ │ └── train2019/ ├── annotations/ │ ├── rpc_val_scalabel.json │ ├── rpc_test_scalabel.json │ └── rpc_train_scalabel.json └── meta/ ├── classes.txt ├── class_id_map.csv └── class_id_map.json其中images/存原图annotations/*.jsonScalabel 读取的 frame-label 标注文件meta/额外保存 RPC 的类别映射、中文名映射等8. RPC 转 Scalabel 的实现要点8.1 COCO bbox 转换为 Scalabel box2dRPC COCO:x,y,w,hann[bbox]Scalabel:box2d{x1:float(x),y1:float(y),x2:float(xw),y2:float(yh),}8.2 类别名选择策略推荐三种模式英文 SKU 名直接用categories[*].name如187_tissue中文商品名从__raw_Chinese_name_df根据category_id查找name如维他低糖原味豆奶250ml双语模式label.category 英文名label.attributes.cn_name 中文名最适合工具链兼容与人工核查兼顾8.3 可选属性扩展Scalabel 的attributes可扩展因此在 RPC 场景中可以加入{attributes:{category_id:103,supercategory:milk,cn_name:维他低糖原味豆奶250ml,cn_class:奶制品,known:true,code:4891028707851}}这样可以让 Scalabel 项目同时承担“可视化标注浏览器”和“零售商品元数据查看器”的角色。9. Scalabel 标注文件示例适配 RPC下面给出一个更完整的 RPC - Scalabel 示例[{name:20180827-10-42-32-575.jpg,url:images/val2019/20180827-10-42-32-575.jpg,videoName:,frameIndex:0,labels:[{id:50196,category:187_tissue,attributes:{category_id:187,supercategory:tissue,cn_name:某纸巾商品中文名,cn_class:纸品},manualShape:true,manualAttributes:true,box2d:{x1:120.0,y1:80.0,x2:240.0,y2:300.0}},{id:50197,category:79_alcohol,attributes:{category_id:79,supercategory:alcohol,cn_name:喜力啤酒500ml,cn_class:酒},manualShape:true,manualAttributes:true,box2d:{x1:260.0,y1:90.0,x2:330.0,y2:310.0}}]}]10. RPC 数据整理建议10.1 如果目标是目标检测建议保留images/instances_*.jsonclass_id_mapCOCO - YOLO / COCO - Scalabel 的转换脚本10.2 如果目标是商品分类建议整理为train/类名/*.jpgval/类名/*.jpgtest/类名/*.jpg其中val/test可由 checkout 图按 bbox 裁剪得到。10.3 如果目标是可视化审阅建议优先转成 Scalabel因为它更适合浏览每张图的所有商品框用英文/中文类名审阅扩展属性字段后续人工修订标注11. 小结RPC 是一个非常适合零售商品检测、分类与自动结算研究的数据集。它的标注原生是 COCO 风格因此非常适合做检测训练同时由于训练集为单商品图RPC 也非常适合作为细粒度商品分类数据源。若希望将 RPC 用于可视化标注管理、人工复核和后续二次修订那么将其转换为Scalabel 2D box 标注格式是一个很自然的选择。核心转换工作并不复杂重点只有两点将 COCO 的bbox [x, y, w, h]转为 Scalabel 的box2d {x1, y1, x2, y2}用category_id关联categories与__raw_Chinese_name_df生成更友好的类别显示名称与属性信息12. 参考资料RPC 官方项目页RPC: A Large-Scale and Fine-Grained Retail Product Checkout DatasetRPC 论文arXiv:1901.07249Scalabel 官方文档Scalabel Format / Quick StartRPC提供的instances_val2019.json其中包含categoriesimagesannotations__raw_Chinese_name_df

相关文章:

RPC数据集整理与 Scalabel 标注说明

RPC数据集整理与 Scalabel 标注说明 1. RPC 数据集简介 RPC(Retail Product Checkout Dataset)是一个面向自动结算(ACO, Automatic Checkout)场景的大规模零售商品数据集,核心目标是从结算台图像中自动识别商品并生成购…...

智见未来 | 融合传统视觉与深度学习的AI水位识别技术实践分享

背景在水利工程数字化转型与智能化监管的宏观背景下,实时、精准的水位监测已成为防洪排涝、水资源调配的核心支撑。近年来,国家持续推动数字化与智能化发展。2025年发布的《国民经济和社会发展第十五个五年规划建议》提出,要深入推进数字中国…...

SDMatte与数据库联动:开发一个带历史记录管理的在线抠图平台

SDMatte与数据库联动:开发一个带历史记录管理的在线抠图平台 1. 项目背景与价值 想象一下这样的场景:设计师小王每天需要处理上百张商品图片的抠图工作。传统方法要么手动操作费时费力,要么使用本地软件来回切换效率低下。如果能有一个在线…...

转行网安别死磕技术!合规才是企业刚需,运维转更易上岸

很多运维转行网安时,只关注 “技术攻击与防御”(如渗透测试、漏洞挖掘),却忽视了 “合规知识”—— 而合规是企业安全的 “底线要求”,也是网安岗位的 “刚需技能”。随着《网络安全法》《数据安全法》《个人信息保护法…...

如何配置表结构支持读写分离标记_在COMMENT中添加路由规则的架构级应用

能,但需数据库、ORM和中间件协同支持;MySQL 5.7/PostgreSQL 支持COMMENT存储路由标记,但须手动解析,且配置不当易失效。COMMENT 字段真能当路由标记用?能,但不是所有数据库都认,也不是所有 orm …...

如何在 Go 中超时终止进程及其所有子进程

本文介绍在 Go 中安全、可靠地实现进程及其整个子进程树(含孙子进程等)的超时终止,核心是利用 Unix 进程组(process group)机制配合 syscall.Kill(-pgid, sig),并规避常见陷阱(如信号传播失效、…...

还在为充气泵电压波动导致MCU复位发愁吗?CSM53系列拥有40V宽压输入配合优秀的瞬态响应,轻松抵御电机启停浪涌,配合2.5μA微功耗,让你的便携充气泵续航提升30%!

CSM53系列LDO在充气泵中的详细应用分析一、先搞懂核心:CSM53系列LDO的关键特性(适配充气泵的核心优势)在分析应用前,先明确这款芯片的核心参数,这是适配充气泵场景的基础:* 二、充气泵的系统架构与LDO的定位…...

2026最全国内外电商API接口的数据列表与采集

电商数据采集 API 主要分为 官方开放平台 API(合规、稳定)和 第三方聚合 API(多平台统一、接入快)。下面按 国内主流平台(淘宝 / 天猫、京东、1688、拼多多) 跨境平台(亚马逊、速卖通、Shopee&a…...

Claude Code API配置实战:国内可用方案与模型选型指南

Claude Code 支持多种 API 接入方式,从个人订阅直连、API Key 调用,到企业级 Amazon Bedrock、Google Vertex AI、Microsoft Foundry,以及通过 LiteLLM 等 LLM Gateway 接入任意兼容提供商。本文梳理各方案的配置步骤、适用场景和选型建议&am…...

WarcraftHelper 2024新版:经典魔兽争霸III兼容性优化工具全指南

WarcraftHelper 2024新版:经典魔兽争霸III兼容性优化工具全指南 【免费下载链接】WarcraftHelper Warcraft III Helper , support 1.20e, 1.24e, 1.26a, 1.27a, 1.27b 项目地址: https://gitcode.com/gh_mirrors/wa/WarcraftHelper 在现代电脑上重温经典游戏…...

跨境电商最最常用的接口列表与接入

跨境电商最核心、最常用的接口集中在 商品、订单、库存、物流、支付、店铺 / 授权 六大类。下面按 全球主流平台(亚马逊、Shopify、速卖通、Shopee、eBay) 给出 常用接口清单 标准接入流程 关键技术点。一、跨境电商最常用接口分类(通用&am…...

贾子哲学(Kucius Philosophy):跨文化智慧重构与AI时代的文明觉醒

贾子哲学(Kucius Philosophy):跨文化智慧重构与AI时代的文明觉醒摘要: 贾子哲学由贾龙栋(笔名贾子)于2025-2026年提出,融合东西方智慧,以“智慧三定律”区分智能与智慧,以…...

毕业设计实战:基于SSM+Vue+MySQL的超市商品管理系统设计与实现指南

毕业设计实战:基于SSMVueMySQL的超市商品管理系统设计与实现指南 在开发“基于B/S的超市商品管理系统”毕业设计时,曾因采购进货表未通过商品ID、供应商ID与采购员工ID多外键关联踩过关键坑——初期仅设计进货编号、数量等基础字段,未与商品表…...

毕业设计实战:基于SSM+JSP+MySQL私人定制旅游系统设计与实现完整版指南

毕业设计实战:基于SSMJSPMySQL私人定制旅游系统设计与实现完整版指南 在开发私人定制旅游系统本科毕业设计时,我曾因旅游路线订单表未通过用户ID与路线ID双外键关联踩过致命坑——初期仅设计订单号、价格等字段,未与用户表、旅游路线表建立关…...

毕业设计实战:基于SSM+Vue的家乡特产网上商城设计与实现指南

毕业设计实战:基于SSMVue的家乡特产网上商城设计与实现指南 在开发“基于SSMVue的家乡特产网上商城”毕业设计时,我曾因商品订单表未通过用户ID、商品ID与收货地址ID三外键关联踩过关键坑——初期设计订单表时,仅记录了订单号、购买数量、实…...

毕业设计实战:基于SSM+MySQL的校园兼职管理系统设计与实现指南

毕业设计实战:基于SSMMySQL的校园兼职管理系统设计与实现指南 在开发“基于SSMMySQL的校园兼职管理系统”毕业设计时,曾因简历投递表未通过用户ID与兼职招聘ID双外键关联踩过关键坑——初期仅设计投递编号、投递时间等基础字段,未与用户表、兼…...

HTML5 属性

HTML5 属性学习笔记 一、HTML5 新增的全局属性 1. contenteditable 作用&#xff1a;指定元素内容是否可编辑值&#xff1a;true / false / plaintext-only <div contenteditable"true">这段文字可以被编辑 </div>2. draggable 作用&#xff1a;指定…...

你还在用curl_multi?PHP原生异步HTTP客户端已上线(ext/http v4.0深度解析,仅限PHP 8.3+ LTS用户抢先体验)

第一章&#xff1a;PHP异步I/O的演进与时代意义在Web应用从单机LAMP架构迈向高并发微服务时代的进程中&#xff0c;PHP长期被贴上“同步阻塞”的标签。然而自PHP 7.0起&#xff0c;通过扩展支持、语言特性演进与生态工具迭代&#xff0c;PHP已逐步构建起完整的异步I/O能力栈——…...

3步解锁设计协作新范式:设计师与开发者的Sketch规范神器

3步解锁设计协作新范式&#xff1a;设计师与开发者的Sketch规范神器 【免费下载链接】sketch-measure Make it a fun to create spec for developers and teammates 项目地址: https://gitcode.com/gh_mirrors/sk/sketch-measure 在设计交付的过程中&#xff0c;你是否曾…...

Python AI推理性能跃迁实录(Cuvil 2.4.1深度调优全链路)

第一章&#xff1a;Cuvil 2.4.1在Python AI推理中的定位与价值跃迁Cuvil 2.4.1 是一个轻量级、高兼容性的 Python 原生 AI 推理加速框架&#xff0c;专为边缘设备与资源受限场景设计。它不依赖 CUDA 或 OpenMP 运行时&#xff0c;却能通过自适应张量分片与 JIT 编译策略&#x…...

微信协议的基本原理和实践性

微信协议相关中文文献关于微信协议的研究&#xff0c;主要集中在通信协议、安全分析、隐私保护等方面。以下是一些相关的中文文献和研究方向&#xff1a;微信通信协议分析微信使用自定义的二进制协议进行通信&#xff0c;基于TCP/IP协议栈&#xff0c;采用PB&#xff08;Protoc…...

一个简洁易用的 Delphi JSON 封装库,基于 System.JSON`单元封装,提供更直观的 API远

一、前言&#xff1a;什么是 OFA VQA 模型&#xff1f; OFA&#xff08;One For All&#xff09;是字节跳动提出的多模态预训练模型&#xff0c;支持视觉问答、图像描述、图像编辑等多种任务&#xff0c;其中视觉问答&#xff08;VQA&#xff09;是最常用的功能之一——输入一…...

2025年同等学力离散数学与组合数学---三、填空题:

2025年同等学力离散数学与组合数学 三、填空题&#xff1a; &#xff08;1&#xff09;A{1&#xff0c;2&#xff0c;3&#xff0c;4&#xff0c;5&#xff0c;6&#xff0c;7&#xff0c;8&#xff0c;9&#xff0c;10}&#xff0c;偏序关系R是A的整除关系&#xff0c;该偏序…...

台达DVP PLC与3台西门子V20变频器通讯程序 台达PLC与3台西门子变频器通讯,可靠稳定

台达DVP PLC与3台西门子V20变频器通讯程序 台达PLC与3台西门子变频器通讯&#xff0c;可靠稳定&#xff0c;同时解决西门子变频器断电重启后&#xff0c;自准备工作&#xff0c;无需人为准备。 器件&#xff1a;台达DVP 14es PLC&#xff0c;昆仑通态触摸屏&#xff0c;13台西门…...

数据中心母线槽选型指南——面向数据中心配电场景的智能母线系统

引言在数据中心供配电系统中&#xff0c;母线槽作为电力传输的关键基础设施&#xff0c;承担着将电力从变配电设备输送至各类用电设备的重要职责。随着数据中心规模扩大与供电可靠性要求提升&#xff0c;传统电缆方案在维护、监测与扩展性方面的局限日益凸显。成都高标电气有限…...

C#与Halcon联合开发的通用视觉框架:易学易用,助力视觉应用快速开发

C#联合halcon开发的通用视觉框架&#xff0c;可供初学者使用打开Visual Studio新建一个C#项目&#xff0c;拖入那个灰底黄框的HWindowControl控件&#xff0c;这玩意儿就是咱们和Halcon交互的主战场。别急着写代码&#xff0c;先想清楚视觉项目的通用套路——相机控制、图像处理…...

委托性能瓶颈终结者:C# 13 `delegate`关键字语义升级、编译器自动`[SkipLocalsInit]`注入与跨平台ABI对齐(附VS2022 v17.11实测工程模板)

第一章&#xff1a;委托性能瓶颈终结者&#xff1a;C# 13 delegate关键字语义升级、编译器自动[SkipLocalsInit]注入与跨平台ABI对齐&#xff08;附VS2022 v17.11实测工程模板&#xff09;C# 13 将 delegate 关键字从语法糖彻底升格为一等语言构造&#xff0c;编译器在生成委托…...

(27)ArcGIS Pro 范围内汇总、汇总统计数据与交集制表:空间统计三工具全攻略

点赞&#xff0b;关注送&#xff1a; 1、天地图GS&#xff08;2024&#xff09;0650号_2025.9版&#xff1b; 2、全国土地覆盖数据CLCD2025年&#xff1b; 注&#xff1a;其他数据也可私信或留言&#xff0c;看是否有 前言 在GIS项目全流程中&#xff0c;空间统计是连接数据处理…...

相同文件按优先级取唯一值

问题&#xff1a;我有三个文件&#xff0c;字段名都一样&#xff0c;如果不重复就union到一起&#xff0c;如果有重复&#xff0c;按类型优先级取唯一值&#xff0c;用python实现import pandas as pd from datetime import date import time todaystr(date.today())filepath/Us…...

QTableWidget 表格组件耙

7.1 初识三维模型 7.1.1 三维模型的数据载体 随着计算机图形技术的发展&#xff0c;我们或多或少都会见过或者听说过三维模型。笔者始终记得小时候第一次在电视上看到三维动画《变形金刚&#xff1a;超能勇士》的震撼感受&#xff1b;而现在我们已经可以在手机上玩三维游戏《王…...