当前位置: 首页 > article >正文

YOLO11实例分割教程:快速掌握数据标注、格式转换与模型训练

YOLO11实例分割教程快速掌握数据标注、格式转换与模型训练1. 准备工作与环境搭建1.1 获取YOLO11镜像YOLO11镜像提供了完整的计算机视觉开发环境包含预装好的所有依赖项。您可以通过以下两种方式使用Jupyter Notebook方式启动后访问提供的URL支持交互式开发和代码调试SSH连接方式通过终端连接适合习惯命令行操作的用户1.2 项目目录结构进入项目目录是第一步cd ultralytics-8.3.9/建议创建以下目录结构ultralytics-main/ datasets/ # 存放训练数据 weights/ # 存放预训练模型 train.py # 训练脚本 infer.py # 推理脚本2. 数据标注与格式转换2.1 使用Labelme进行标注推荐使用Labelme工具进行实例分割标注安装Labelmepip install labelme标注步骤点击Open Dir加载图像文件夹选择Create Polygon工具绘制物体轮廓保存后生成与图片同名的JSON文件2.2 转换为YOLO格式YOLO11实例分割需要特定格式的标签文件格式如下class-index x1 y1 x2 y2 ... xn yn使用以下Python代码将Labelme的JSON转换为YOLO格式import json import os def convert_labelme_to_yolo(json_file, output_dir, img_size(640,640)): with open(json_file) as f: data json.load(f) txt_path os.path.join(output_dir, f{os.path.splitext(os.path.basename(json_file))[0]}.txt) with open(txt_path, w) as txt_file: for shape in data[shapes]: points [(x/img_size[0], y/img_size[1]) for x,y in shape[points]] line f{class_mapping[shape[label]]} .join(f{p[0]:.6f} {p[1]:.6f} for p in points) txt_file.write(line \n) # 示例使用 class_mapping {person:0, car:1} # 根据实际类别修改 convert_labelme_to_yolo(example.json, labels)3. 配置训练环境3.1 数据集YAML配置在ultralytics/cfg/datasets/下创建数据集配置文件例如custom-seg.yamlpath: ./datasets/custom_seg train: images/train val: images/val names: 0: person 1: car 2: bicycle3.2 模型配置文件YOLO11提供了多种预定义的模型配置位于ultralytics/cfg/models/11/目录下。对于实例分割任务我们使用yolo11-seg.yaml# YOLO11n backbone backbone: - [-1, 1, Conv, [64, 3, 2]] # 0-P1/2 - [-1, 1, Conv, [128, 3, 2]] # 1-P2/4 # ... 其他层配置 # YOLO11n head head: - [[16, 19, 22], 1, Segment, [nc, 32, 256]] # 分割头4. 模型训练4.1 编写训练脚本创建train.py文件from ultralytics import YOLO # 加载模型 model YOLO(yolo11m-seg.yaml).load(weights/yolo11m-seg.pt) # 训练参数 train_args { data: custom-seg.yaml, epochs: 50, imgsz: 640, batch: 8, device: 0, # 使用GPU workers: 4, optimizer: AdamW, lr0: 0.001, name: custom_seg_train } # 开始训练 results model.train(**train_args)4.2 启动训练运行训练脚本python train.py训练过程中会输出如下信息Epoch GPU_mem box_loss seg_loss cls_loss dfl_loss Instances 1/50 5.23G 1.423 2.876 1.195 1.21 12 ... 50/50 5.25G 0.4153 0.5265 0.2487 0.6369 85. 模型推理与效果验证5.1 编写推理脚本创建infer.py文件from ultralytics import YOLO import cv2 # 加载训练好的模型 model YOLO(runs/segment/custom_seg_train/weights/best.pt) # 单张图片推理 results model.predict( sourcetest.jpg, conf0.5, saveTrue, showTrue ) # 视频流推理 cap cv2.VideoCapture(0) while cap.isOpened(): ret, frame cap.read() if not ret: break results model(frame) annotated_frame results[0].plot() cv2.imshow(YOLO11 Segmentation, annotated_frame) if cv2.waitKey(1) ord(q): break cap.release() cv2.destroyAllWindows()5.2 评估指标解读训练完成后主要关注以下指标mAP50: 在IoU0.5时的平均精度mAP50-95: IoU从0.5到0.95的平均精度Mask mAP: 分割掩码的精度Box/Pixel Accuracy: 检测框/像素级精度6. 常见问题解决6.1 训练问题排查Loss不下降检查学习率是否合适验证数据标注是否正确尝试减小batch size内存不足train_args { batch: 4, # 减小batch size imgsz: 512 # 减小图像尺寸 }6.2 推理效果优化调整置信度阈值results model.predict(sourceimage.jpg, conf0.3) # 降低阈值检测更多对象使用测试时增强results model.predict(sourceimage.jpg, augmentTrue)7. 总结与进阶建议通过本教程您已经掌握了YOLO11实例分割的完整流程。以下是进一步优化的建议数据增强在配置文件中增加更多数据增强选项hsv_h: 0.015 # 色相增强 hsv_s: 0.7 # 饱和度增强 flipud: 0.5 # 上下翻转概率模型微调尝试不同的预训练权重model YOLO(yolo11x-seg.pt) # 使用更大的预训练模型部署优化将模型导出为ONNX或TensorRT格式提升推理速度model.export(formatonnx) # 导出为ONNX格式获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

相关文章:

YOLO11实例分割教程:快速掌握数据标注、格式转换与模型训练

YOLO11实例分割教程:快速掌握数据标注、格式转换与模型训练 1. 准备工作与环境搭建 1.1 获取YOLO11镜像 YOLO11镜像提供了完整的计算机视觉开发环境,包含预装好的所有依赖项。您可以通过以下两种方式使用: Jupyter Notebook方式&#xff1…...

MT4跟单系统高频交易优化:如何用Pumping模式降低服务器负载50%

MT4跟单系统高频交易优化:Pumping模式实战解析与性能提升方案 外汇交易市场瞬息万变,对于专业交易团队而言,毫秒级的延迟可能意味着巨大的利润差异。在MT4跟单系统中,传统轮询方式在高频交易场景下往往成为性能瓶颈,导…...

从LED闪烁到继电器驱动:手把手用Arduino玩转NPN/PNP三极管开关电路(附代码)

从LED闪烁到继电器驱动:手把手用Arduino玩转NPN/PNP三极管开关电路(附代码) 在创客项目和物联网设备开发中,我们常常会遇到单片机IO口驱动能力不足的问题。比如当你想要控制一个高功率LED、蜂鸣器或者继电器时,Arduino…...

深度学习图像拼接新突破:USID++如何实现无监督大视差场景下的精准对齐

1. 为什么传统图像拼接技术会翻车? 想象一下你正在用手机拍摄一张全景照片,从左往右缓慢移动镜头。当你把两张照片拼在一起时,近处的树木和远处的山峦经常会出现"鬼影"或错位——这就是典型的视差问题。传统图像拼接方法在这个场景…...

双目视觉测量系统在工业检测中的精度优化策略与实践

1. 双目视觉测量系统在工业检测中的核心价值 在工业质检领域,毫米级的精度差异可能直接决定产品合格率。去年我们团队为某汽车零部件厂部署检测系统时,就遇到过螺栓螺纹检测误判的难题——传统单目相机总是把0.2mm的螺纹瑕疵漏检。换成双目系统后&#x…...

Win11 Docker Desktop 迁移虚拟硬盘文件存储位置

一、wsl虚拟硬盘文件路径 C:\Users\admin\AppData\Local\Docker\wsl C:\Users\admin\AppData\Local\Docker\wsl\disk\docker_data.vhdx C:\Users\admin\AppData\Local\Docker\wsl\main\ext4.vhdx 二、新建新的磁盘映像位置 E:\wsl2(选择这个) E:\ws…...

Sollumz:3步在Blender中制作GTA V游戏模组的完整指南

Sollumz:3步在Blender中制作GTA V游戏模组的完整指南 【免费下载链接】Sollumz Grand Theft Auto V modding suite for Blender. This add-on allows the creation of modded game assets: 3D models, maps, interiors, animations, etc. 项目地址: https://gitco…...

商务本也能跑AI!手把手教你用Ollama+Chatbox在ThinkPad上免费部署DeepSeek-R1

商务本也能跑AI!手把手教你用OllamaChatbox在ThinkPad上免费部署DeepSeek-R1 当大多数人还在为运行AI模型需要高端显卡发愁时,你可能不知道,手边的商务笔记本就能开启本地AI之旅。作为一名常年与ThinkPad X1 Carbon为伴的技术顾问&#xff0c…...

SD卡接口PCB设计实战:从引脚定义到高速信号完整性布局布线

1. SD卡接口基础:从物理结构到引脚定义 第一次接触SD卡接口设计时,我对着那排密密麻麻的引脚直发懵。后来才发现,理解SD卡物理结构是PCB设计的第一步。常见的SD卡有标准SD、microSD(TF卡)和miniSD三种规格,…...

抖音无水印下载器终极指南:三步快速获取高清内容的完整教程

抖音无水印下载器终极指南:三步快速获取高清内容的完整教程 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback …...

逆向思维看保护:我是如何用VMProtect SDK给自己的工具软件“上锁”,并防止被破解的?

逆向思维构建软件护城河:VMProtect SDK实战防御手册 当我在深夜调试自己开发的工具软件时,突然冒出一个念头:如果我是黑客,会如何破解这个软件?这个看似简单的自问,彻底改变了我对软件保护的认知方式。传统…...

【华为电脑管家】多屏协同下微软拼音输入法兼容性自动修复的终极指南

1. 多屏协同与输入法兼容性问题解析 华为电脑管家的多屏协同功能确实让跨设备办公变得无比便捷,但很多用户都遇到过这个烦人的问题:每次连接多屏协同时,微软拼音输入法的兼容性设置就会被自动修改。我自己也深受其扰,经常在重要会…...

BAAI/bge-m3实战:快速构建个人知识库与智能问答助手

BAAI/bge-m3实战:快速构建个人知识库与智能问答助手 1. 项目概述与核心价值 BAAI/bge-m3是北京智源研究院推出的开源语义嵌入模型,在MTEB(Massive Text Embedding Benchmark)榜单上表现优异。这个多语言通用嵌入模型能够将文本转…...

全球AI监管格局:合规将成为企业AI落地的核心门槛

全球AI监管现状欧盟《人工智能法案》将AI系统分为四类风险等级,禁止不可接受风险类AI(如社会评分系统),高风险类AI需满足严格合规要求(如医疗设备)。违规罚款可达全球营业额6%。美国采取分行业监管模式&…...

AI算力行业深度报告:供需格局、技术演进与投资机会

AI算力行业概述AI算力指支撑人工智能模型训练和推理所需的计算资源,核心包括芯片、服务器、数据中心等硬件设施。随着大模型技术爆发,全球算力需求呈现指数级增长,预计2030年市场规模将突破万亿美元。供需格局分析供给端芯片领域:…...

从通用到垂直:行业大模型将成为企业数字化转型的核心抓手

行业大模型的崛起背景数字化转型进入深水区,企业对AI的需求从通用场景转向垂直领域。通用大模型在特定行业中面临数据敏感性、专业知识不足、成本过高等问题,催生了行业大模型的快速发展。行业大模型的差异化优势精准性:针对行业数据训练&…...

低空经济“充电网”:原理、场景与未来布局全解析

低空经济“充电网”:原理、场景与未来布局全解析 引言:为什么说“充电桩”是低空经济的“加油站”? [外链图片转存中…(img-5rpT3Icb-1775923220357)] 随着无人机与eVTOL(电动垂直起降飞行器)从“玩具”和“概念”走向…...

Sollumz:在Blender中打造专业级GTA V游戏资产的终极指南 [特殊字符]

Sollumz:在Blender中打造专业级GTA V游戏资产的终极指南 🎮 【免费下载链接】Sollumz Grand Theft Auto V modding suite for Blender. This add-on allows the creation of modded game assets: 3D models, maps, interiors, animations, etc. 项目地…...

Input Leap架构深度解析:跨平台KVM软件的技术实现与多设备输入协同

Input Leap架构深度解析:跨平台KVM软件的技术实现与多设备输入协同 【免费下载链接】input-leap Open-source KVM software 项目地址: https://gitcode.com/gh_mirrors/in/input-leap 在现代多设备办公环境中,Input Leap作为一款开源的KVM&#x…...

高效实现分组内跨行时间戳匹配:构建 user_rejects 布尔标识列

本文介绍如何在大规模数据集(百万级行、每组15–25行)中,基于 application_id 分组,高效判断每行的 rejected_time 是否等于同组内任意其他行的 selected_time,并生成整数型布尔列 user_rejects。 本文介绍如何在…...

如何中止正在运行的RMAN备份_利用OS kill进程或SQL强杀通道会话

中止RMAN备份必须使用RMAN自身命令(如ABORT)或CtrlC,禁用kill -9;否则易致控制文件损坏,引发ORA-00205或ORA-00600错误,后续须验证v$backup_set、执行CROSSCHECK及备份控制文件。中止 RMAN 备份时&#xff…...

BepInEx插件框架实战指南:构建高效稳定的Unity游戏模组生态系统

BepInEx插件框架实战指南:构建高效稳定的Unity游戏模组生态系统 【免费下载链接】BepInEx Unity / XNA game patcher and plugin framework 项目地址: https://gitcode.com/GitHub_Trending/be/BepInEx BepInEx作为Unity Mono、IL2CPP和.NET框架游戏的强大插…...

考虑需求响应和碳交易的柔性负荷综合能源系统优化调度模型

考虑需求响应和碳交易的综合能源系统日前优化调度模型 关键词:柔性负荷 需求响应 综合能源系统 参考:私我 仿真平台:MATLAB yalmipcplex 主要内容:在冷热电综合能源系统的基础上,创新性的对用户侧资源进行了细致的划…...

基于Matlab和Cplex的微电网优化调度研究:涵盖风光热储能及多场景负荷模拟分析

考虑风光火储的微电网优化调度 软件:Matlabcplex 介绍:考虑风电、光伏、热电机组和储能优化调度,其中负荷考虑冬季或夏季两种场景,并且考虑晴天、多云、雨天、多风和少风场景,对风机考虑相应的故障概率,以火…...

一文讲清,精益管理系统是什么,精益管理系统能做什么?

很多企业都在苦苦追寻精益管理系统是什么的答案,试图通过它来解决生产现场的混乱与低效。简单来说,精益管理系统不仅仅是一套软件,更是一种融合了管理理念与数字化工具的综合体系。那么,精益管理系统能做什么呢?它能帮…...

MySQL 存储过程中字符集与排序规则不匹配导致查询性能下降的解决方案

本文详解 MySQL 存储过程中因 WHERE 子句中显式指定 COLLATE(尤其是跨字符集/排序规则)导致索引失效、查询变慢的根本原因,并提供可落地的字符集统一策略、索引优化方法及安全编码实践。 本文详解 mysql 存储过程中因 where 子句中显式指…...

mysql数据库如何配置远程连接_修改配置文件与用户权限设置

MySQL远程连接失败主因是bind-address默认为127.0.0.1、用户host不匹配、防火墙/安全组拦截、8.0认证插件不兼容,需逐一验证并配置。bind-address 默认值锁死本地连接MySQL 默认只监听 127.0.0.1,远程客户端连不上不是密码错,是根本没收到请求…...

终极指南:如何使用BOTW存档编辑器定制你的海拉鲁冒险

终极指南:如何使用BOTW存档编辑器定制你的海拉鲁冒险 【免费下载链接】BOTW-Save-Editor-GUI A Work in Progress Save Editor for BOTW 项目地址: https://gitcode.com/gh_mirrors/bo/BOTW-Save-Editor-GUI 你是否曾在《塞尔达传说:旷野之息》的…...

3步精通抖音批量下载:从零开始打造个人视频素材库

3步精通抖音批量下载:从零开始打造个人视频素材库 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback support. …...

DIY必备:用BQ24040打造你的锂电池充电器(附三种电流方案)

从零构建:基于BQ24040的智能锂电池充电系统设计与实战 在电子DIY和硬件开发领域,锂电池充电管理一直是核心挑战之一。无论是创客项目、便携设备还是物联网终端,安全高效的充电方案都直接影响产品性能和用户体验。TI公司的BQ24040系列芯片以其…...