当前位置：首页 > article >正文

YOLOv8环境搭好了，然后呢？5个实用脚本带你玩转目标检测（从预测到训练）

article 2026/3/27 16:13:20

YOLOv8环境搭好了然后呢5个实用脚本带你玩转目标检测从预测到训练刚完成YOLOv8环境配置的开发者常会遇到这样的困境跑通官方demo后面对自己的实际需求却无从下手。本文将提供五个即用型Python脚本覆盖从基础应用到自定义训练的全流程帮你快速跨越环境验证到实战落地的鸿沟。1. 批量图片检测自动化处理图像文件夹许多教程只演示单张图片预测而实际项目往往需要处理成百上千的图片。以下脚本可批量处理指定目录中的所有图像from ultralytics import YOLO import os model YOLO(yolov8n.pt) # 加载官方预训练模型 input_dir your_images_folder output_dir detection_results os.makedirs(output_dir, exist_okTrue) for filename in os.listdir(input_dir): if filename.lower().endswith((.png, .jpg, .jpeg)): img_path os.path.join(input_dir, filename) results model.predict(sourceimg_path, saveTrue, projectoutput_dir)关键参数说明saveTrue自动保存检测结果图像project指定输出目录支持常见图片格式PNG/JPG/JPEG提示添加conf0.5参数可调整检测置信度阈值平衡准确率与召回率2. 实时摄像头检测动态目标追踪方案让YOLOv8处理摄像头实时流只需稍作修改。这个脚本会打开默认摄像头并显示检测结果import cv2 from ultralytics import YOLO model YOLO(yolov8n.pt) cap cv2.VideoCapture(0) # 0表示默认摄像头 while cap.isOpened(): ret, frame cap.read() if not ret: break results model.track(frame, persistTrue) # 使用track而非predict获得持续ID annotated_frame results[0].plot() cv2.imshow(YOLOv8 Real-Time, annotated_frame) if cv2.waitKey(1) ord(q): break cap.release() cv2.destroyAllWindows()功能增强建议添加classes[0, 2]参数可只检测特定类别0代表人2代表车persistTrue启用跨帧目标ID保持使用model.track()而非predict()获得连续帧间的追踪效果3. 视频文件处理高效视频分析技巧处理视频文件与摄像头流类似但需要注意性能优化。这段代码展示了如何平衡处理速度与质量from ultralytics import YOLO import cv2 model YOLO(yolov8n.pt) video_path input_video.mp4 output_path output_video.avi cap cv2.VideoCapture(video_path) fps int(cap.get(cv2.CAP_PROP_FPS)) width int(cap.get(cv2.CAP_PROP_FRAME_WIDTH)) height int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT)) fourcc cv2.VideoWriter_fourcc(*XVID) out cv2.VideoWriter(output_path, fourcc, fps, (width, height)) while cap.isOpened(): ret, frame cap.read() if not ret: break results model.predict(frame, halfTrue) # 使用半精度提升速度 annotated_frame results[0].plot() out.write(annotated_frame) cap.release() out.release()性能优化参数对比参数作用速度提升精度影响halfTrue半精度推理30-50%轻微下降imgsz640固定输入尺寸20%依赖原始分辨率devicecuda启用GPU加速3-5倍无影响4. 结构化输出将检测结果保存为JSON/TXT实际项目中常需要结构化数据而非图像。以下脚本将检测结果导出为机器可读格式from ultralytics import YOLO import json model YOLO(yolov8n.pt) results model.predict(input_image.jpg, saveFalse) # 转换为JSON格式 detections [] for result in results: for box in result.boxes: detections.append({ class: result.names[box.cls[0].item()], confidence: box.conf[0].item(), bbox: box.xywhn[0].tolist() # 归一化坐标(x_center,y_center,width,height) }) with open(detections.json, w) as f: json.dump(detections, f, indent2) # 同时保存为YOLO格式的TXT with open(detections.txt, w) as f: for det in detections: line f{list(result.names.keys())[list(result.names.values()).index(det[class])]} \ f{ .join(map(str, det[bbox]))}\n f.write(line)输出格式选择指南JSON适合Web应用或进一步数据分析TXT(YOLO格式)便于与其他计算机视觉工具链集成CSV适合表格类数据处理可通过pandas轻松转换5. 自定义训练从数据准备到模型微调当预训练模型不满足需求时自定义训练成为必选项。完整流程包括5.1 数据准备规范YOLOv8要求特定目录结构dataset/ ├── images/ │ ├── train/ │ └── val/ └── labels/ ├── train/ └── val/标注文件要求每个图像对应一个同名的.txt文件每行格式class_id x_center y_center width height归一化数值可使用LabelImg等工具生成5.2 配置文件示例创建data.yaml定义数据集path: ./dataset train: images/train val: images/val names: 0: person 1: car 2: traffic_light5.3 启动训练脚本from ultralytics import YOLO model YOLO(yolov8n.pt) # 加载基础模型进行微调 results model.train( datadata.yaml, epochs100, imgsz640, batch16, devicecuda # 使用GPU加速 )关键训练参数解析参数典型值作用epochs50-300训练轮次patience50早停机制阈值lr00.01初始学习率weight_decay0.0005权重衰减系数训练完成后最佳模型会自动保存在runs/detect/train/weights/best.pt

YOLOv8环境搭好了，然后呢？5个实用脚本带你玩转目标检测（从预测到训练）

相关文章：

YOLOv8环境搭好了，然后呢？5个实用脚本带你玩转目标检测（从预测到训练）

避坑指南：C# ComboBox那些容易踩的坑（SelectedIndexChanged的诡异事件）

Leetcode 数据结构刷题 -＞链表1

别再纠结了！用SpringBoot实战告诉你，图片上传选FastDFS还是MinIO（附完整代码）

手把手教你用Google Cloud VPC流量监控：快速定位高费用虚拟机

80+经典游戏宽屏焕新：WidescreenFixesPack重塑怀旧体验

Web AR技术深度探秘：7个创新案例重构浏览器增强现实体验

BiliTools：全能B站资源管理工具，让离线学习与内容备份无忧

ANARCI抗体序列分析工具：从入门到精通的专业指南

计算机毕业设计springboot校园文化社区视频网站基于SpringBoot的校园文化交流短视频平台 SpringBoot框架下的高校文化分享与视频互动系统

别再混淆了！深入对比Vivado中AXI DMA IP核与PS端DMA控制器的角色与分工

深入解析Shim在跨版本API兼容中的实战应用

从苹果AirTag到国产车钥匙：拆解UWB芯片厂商格局与选型指南（附功耗实测参考）

终极风扇控制指南：如何用FanControl 264版彻底告别电脑噪音烦恼

VSCode配置STM32标准库开发环境：手把手解决core_cm3.c编译报错与头文件路径问题

Qwen3.5-4B-Claude-Opus应用场景：技术博客选题生成、文章大纲结构化输出

【独家首发】Python扩展安全成熟度模型（PESMM v1.2）：覆盖编译期/加载期/运行期的9维评分体系，仅限前500名开发者免费获取评估工具包

Gemma-3-12b-it实战教程：对接企业微信/钉钉机器人实现图文消息自动解析

小红书数据采集系统深度探索：从技术原理到实战落地

wan2.1-vae开源可部署：支持国产操作系统（麒麟/UOS）的适配方案

WebGLInput：重构Unity WebGL输入体验的革命性方案

OpenClaw自动化测试：百川2-13B驱动的前端元素定位与交互验证

Docker Compose 多服务编排实战：从零搭建微服务架构

OpenOCD入门到精通：第23章添加新的 JTAG 适配器驱动

STC89C52单片机+槽型光耦，手把手教你DIY一个低成本电机转速测量仪

B站Index-AniSora本地部署避坑指南：4张4090显卡实测+常见错误解决

OpenClaw自动化周报生成：Qwen3-32B私有镜像精准提取Git提交记录

C++ 内存分配器工作原理

数据迁移技术指南：Obsidian跨平台笔记整合解决方案

AMD显卡福音：实测ROCm7+PyTorch在Windows下跑ComfyUI，比WSL快了多少？