当前位置: 首页 > article >正文

基于 YOLOv11 的无人机航拍小目标检测系统 基于 YOLOv11 的无人机小目标检测系统,基于 VisDrone 2019 数据集,实现从模型训练、验证、推理到 PyQt6 桌面应用的完整流程。

智慧巡检-基于 YOLOv11 的无人机小目标检测系统基于 VisDrone 2019 数据集实现从模型训练、验证、推理到 PyQt6 桌面应用的完整流程。【核心亮点】1、小目标优化针对无人机航拍目标小、密集、多尺度等特点支持 1280 高分辨率、多尺度训练、mosaic 数据增强2、模型YOLO113、完整流程训练脚本train/val/predict→ 模型权重 → 桌面应用图片/视频/摄像头检测4、指标可视化训练曲线、混淆矩阵、PR 曲线、F1 曲线等自动生成并保存5、可直接演示PyQt6 桌面应用支持图片拖拽、视频逐帧、摄像头实时检测可导出结果图与 CSV6、登录与权限登录/注册 Token 校验便于答辩展示系统化设计【核心功能清单】1、训练VisDrone 数据加载、自动路径配置、多模型尺寸yolo11n/s/m/l/x、多尺度训练、早停2、检测图片识别JPG/PNG/BMP、视频识别MP4/AVI/MOV、摄像头实时检测3、管理模型路径管理、置信度/IoU 阈值配置、检测历史查看与导出4、可视化训练曲线、指标汇总、混淆矩阵、PR 曲线等图表展示【核心技术】1、深度学习框架PyTorch主流开源深度学习框架2、目标检测Ultralytics YOLO11单阶段目标检测3、GUI 框架PyQt6跨平台桌面应用开发4、图像处理OpenCV、Pillow5、数据集VisDrone 2019-DET面向无人机视角的检测基准【附】1、完整源码结构清晰便于二次开发2、训练产物模型权重、日志、指标与图表3、可运行演示训练脚本 PyQt6 桌面应用1这是一套基于YOLOv11的无人机航拍小目标检测系统完整解决方案。针对 VisDrone 数据集目标小、密集的特点我为你设计了高分辨率训练策略和 PyQt6 桌面应用架构。1. 数据集配置 (visdrone.yaml)针对无人机视角我们需要配置 VisDrone 的 10 个类别。# visdrone.yamlpath:./datasets/VisDrone2019# 数据集根目录train:./datasets/VisDrone2019/images/train# 训练集val:./datasets/VisDrone2019/images/val# 验证集test:./datasets/VisDrone2019/images/test# 测试集# VisDrone 类别定义 (10类)nc:10names:-pedestrian# 行人-people# 人群-bicycle# 自行车-car# 小汽车-van# 面包车-truck# 卡车-tricycle# 三轮车-awning-tricycle# 遮阳篷三轮车-bus# 公交车-motor# 摩托车2. 模型训练代码 (train.py)核心策略针对小目标必须开启高分辨率 (imgsz1280)和Mosaic 数据增强并适当延长训练周期。fromultralyticsimportYOLOdeftrain_visdrone():# 1. 加载 YOLOv11 模型 (n/s/m/l/x)# 推荐使用 m 或 l 版本以提取更丰富的小目标特征modelYOLO(yolo11m.pt)# 2. 开始训练resultsmodel.train(datavisdrone.yaml,# 数据集配置epochs300,# 训练轮数 (VisDrone较难建议多训)imgsz1280,# 输入尺寸 (关键小目标需高分辨率)batch8,# 批次大小 (根据显存调整1280尺寸显存消耗大)nameyolo11m_visdrone,# 任务名称projectruns/train,# 保存路径device0,# 使用 GPU 0workers4,# 数据加载线程# 针对小目标的优化参数mosaic1.0,# Mosaic 增强比例 (默认1.0增加小目标上下文)close_mosaic10,# 最后10轮关闭 Mosaic 以稳定收敛hsv_h0.015,# 色调增强 (模拟不同光照)hsv_s0.7,# 饱和度增强hsv_v0.4,# 明度增强flipud0.5,# 上下翻转 (无人机视角适用)fliplr0.5,# 左右翻转)if__name____main__:train_visdrone()3. PyQt6 桌面应用核心架构 (main_app.py)这是系统的界面部分实现了你截图中展示的图片检测、实时统计、历史记录等功能。importsysimportcv2importtorchimportnumpyasnpfromPyQt6.QtWidgetsimport(QApplication,QMainWindow,QWidget,QVBoxLayout,QHBoxLayout,QLabel,QPushButton,QTableWidget,QTableWidgetItem,QFileDialog,QMessageBox)fromPyQt6.QtGuiimportQPixmap,QImage,QIconfromPyQt6.QtCoreimportQt,QTimer,QThread,pyqtSignal# 加载训练好的模型# 确保路径指向你训练生成的 best.ptmodeltorch.hub.load(ultralytics/yolov11,custom,pathruns/train/yolo11m_visdrone/weights/best.pt)classDetectionThread(QThread):change_pixmap_signalpyqtSignal(np.ndarray)stats_signalpyqtSignal(dict)def__init__(self):super().__init__()self.runningFalseself.source0# 0 for webcamdefrun(self):capcv2.VideoCapture(self.source)self.runningTruewhileself.running:ret,framecap.read()ifret:# YOLOv11 推理resultsmodel(frame,imgsz1280,conf0.4)# 解析结果annotated_frameresults[0].plot()# 绘制边框和标签# 统计逻辑 (示例)namesresults[0].names counts{}forboxinresults[0].boxes:cls_idint(box.cls[0])namenames[cls_id]counts[name]counts.get(name,0)1self.stats_signal.emit(counts)self.change_pixmap_signal.emit(annotated_frame)else:breakcap.release()defstop(self):self.runningFalseself.wait()classMainWindow(QMainWindow):def__init__(self):super().__init__()self.setWindowTitle(无人机航拍小目标检测系统)self.setGeometry(100,100,1200,800)# 主布局central_widgetQWidget()self.setCentralWidget(central_widget)main_layoutQHBoxLayout(central_widget)# 左侧视频显示区self.video_labelQLabel(等待检测...)self.video_label.setFixedSize(800,600)self.video_label.setStyleSheet(background-color: #000; color: #fff;)main_layout.addWidget(self.video_label,3)# 右侧控制面板与统计right_layoutQVBoxLayout()# 控制按钮self.btn_startQPushButton(启动摄像头)self.btn_start.clicked.connect(self.start_detection)right_layout.addWidget(self.btn_start)self.btn_stopQPushButton(停止检测)self.btn_stop.clicked.connect(self.stop_detection)right_layout.addWidget(self.btn_stop)# 统计表格self.tableQTableWidget()self.table.setColumnCount(2)self.table.setHorizontalHeaderLabels([类别,数量])right_layout.addWidget(self.table)main_layout.addLayout(right_layout,1)# 线程初始化self.threadDetectionThread()self.thread.change_pixmap_signal.connect(self.update_image)self.thread.stats_signal.connect(self.update_stats)defstart_detection(self):ifnotself.thread.isRunning():self.thread.start()defstop_detection(self):self.thread.stop()defupdate_image(self,cv_img):将 OpenCV 图像转换为 Qt 格式并显示rgb_imagecv2.cvtColor(cv_img,cv2.COLOR_BGR2RGB)h,w,chrgb_image.shape bytes_per_linech*w convert_to_Qt_formatQImage(rgb_image.data,w,h,bytes_per_line,QImage.Format.Format_RGB888)pconvert_to_Qt_format.scaled(800,600,Qt.AspectRatioMode.KeepAspectRatio)self.video_label.setPixmap(QPixmap.fromImage(p))defupdate_stats(self,counts):更新右侧统计表self.table.setRowCount(len(counts))row0forcls,cntincounts.items():self.table.setItem(row,0,QTableWidgetItem(cls))self.table.setItem(row,1,QTableWidgetItem(str(cnt)))row1if__name____main__:appQApplication(sys.argv)windowMainWindow()window.show()sys.exit(app.exec())4. 指标可视化说明训练完成后runs/train/yolo11m_visdrone/目录下会自动生成你截图中展示的图表Loss 曲线(train/box_loss,val/box_loss)用于判断模型是否收敛是否过拟合。mAP 曲线(metrics/mAP50(B))衡量检测精度的核心指标。对于 VisDronemAP50 达到 0.45-0.55 属于正常水平。混淆矩阵(confusion_matrix.png)查看类别是否混淆例如三轮车是否被误检为摩托车。PR 曲线(results.png)精确率与召回率的平衡关系。5. 运行指南准备数据下载 VisDrone2019 数据集并解压修改visdrone.yaml中的路径。训练模型运行python train.py。等待训练结束获取best.pt。运行系统将best.pt路径填入main_app.py运行python main_app.py即可启动界面。该方案完整覆盖了你要求的训练、验证、推理及可视化全流程。

相关文章:

基于 YOLOv11 的无人机航拍小目标检测系统 基于 YOLOv11 的无人机小目标检测系统,基于 VisDrone 2019 数据集,实现从模型训练、验证、推理到 PyQt6 桌面应用的完整流程。

智慧巡检-基于 YOLOv11 的无人机小目标检测系统,基于 VisDrone 2019 数据集,实现从模型训练、验证、推理到 PyQt6 桌面应用的完整流程。【核心亮点】 1、小目标优化:针对无人机航拍目标小、密集、多尺度等特点,支持 1280 高分辨率…...

新建工程2

我们把stm32最小开发板和stlink链接好后,开始进入keil。 打开魔术棒按钮选择debug,这个调试器默认为ulink。所以我们改为stlink debug。 然后点击旁边的setting按钮,在flash Download里把reset and run这一项勾上。(勾上这项后&a…...

vulhub系列-76-02-Breakout(超详细)

免责声明:本文记录的是 02-Breakout 渗透测试靶机 的解题过程,所有操作均在 本地授权环境 中进行。内容仅供 网络安全学习与防护研究 使用,请勿用于任何非法用途。读者应遵守《网络安全法》及相关法律法规,自觉维护网络空间安全。…...

vulhub系列-74-Hackable III(超详细)

免责声明:本文记录的是 Hackable III 渗透测试靶机 的解题过程,所有操作均在 本地授权环境 中进行。内容仅供 网络安全学习与防护研究 使用,请勿用于任何非法用途。读者应遵守《网络安全法》及相关法律法规,自觉维护网络空间安全。…...

vulhub系列-73-RA1NXing Bots(超详细)

免责声明:本文记录的是 RA1NXing Bots 渗透测试靶机 的解题过程,所有操作均在 本地授权环境 中进行。内容仅供 网络安全学习与防护研究 使用,请勿用于任何非法用途。读者应遵守《网络安全法》及相关法律法规,自觉维护网络空间安全…...

知识图谱(BILSTM+CRF项目完整实现)【第六章】

一、代码架构图在data_origin中有两种类型的数据:分别是一般项目和一般项目txtoriginal一般项目中放的是部位、症状、索引;列之间用制表符隔开一般项目txtoriginal放的是原始数据;二、构建序列标注数据要把原始数据转换为目标数据:常用的方式…...

LLM应用缓存设计范式重构,Dify 2026新增Context-Aware TTL引擎与动态驱逐策略

第一章:Dify 2026缓存机制演进与核心设计哲学Dify 2026 的缓存体系并非简单沿袭传统 LRU 或 TTL 模式,而是以“语义感知”与“推理链可追溯”为双支柱重构底层数据生命周期管理。其核心设计哲学强调:缓存不是性能的临时补丁,而是推…...

NativeScript APP 开发备忘

devtools 调试断开 命令ns debug android可以开启浏览器的调试页面,非常方便。一开始使用功能非常完整,包括元素、日志、代码和网络,后来用着用着,发现元素和网络没了,剩下日志和代码可用,再后来用着用着&…...

unity mcp接入 实现一句话生成游戏!

文章目录前言一、MCP 核心包接入 Unity 编辑器1、使用Git URL 安装(可选,最新)2、Unity Asset Store 安装(可选,稳定)2、OpenUPM(可选)二、Python 3.10 与 uv 环境搭建1、安装 Pyth…...

担心2026年数字人直播系统投入过高?五款主流平台落地方案对比评测

一、引文/摘要:投入焦虑下,如何选对数字人直播系统2026年数字人直播持续升温,越来越多商家想借助数字人直播系统降本增效,但“投入高、落地难、性价比低”成为首要顾虑。不少用户困惑,如何在控制成本的同时&#xff0c…...

多态章-虚函数-重写-协变-override/final-重写覆盖隐藏的对比-纯虚函数与抽象类-多态的底层-虚函数表-动态绑定-静态绑定

使用的父类子类 基于继承下的虚函数 调用 ——代码复用。形成条件:1.必须是基类的指针或引用调用虚函数。 2.调用子类中拥有父类的虚函数的重写/覆盖。虚函数:类成员函数前加以virtual就成为了虚函数 注意:非成员函数无法加virtual修饰。cl…...

Phi-3-mini-4k-instruct-gguf多场景应用:写邮件/解题/写SQL/生成测试用例实战演示

Phi-3-mini-4k-instruct-gguf多场景应用:写邮件/解题/写SQL/生成测试用例实战演示 1. 模型简介 Phi-3-Mini-4K-Instruct是一个38亿参数的轻量级开源模型,采用GGUF格式提供。这个模型在Phi-3数据集上训练,该数据集包含合成数据和经过筛选的公…...

Java八股文实战:从原理到代码,解析Pixel Couplet Gen的Java客户端设计

Java八股文实战:从原理到代码,解析Pixel Couplet Gen的Java客户端设计 1. 为什么需要关注Java客户端设计 在分布式系统开发中,客户端设计往往是被忽视的一环。很多开发者更关注服务端实现,却忽略了客户端的健壮性和可维护性。但…...

金融评分卡‌是一种将用户信用风险量化为分数的模型工具,广泛应用于贷款审批、额度定价和风险预警等环节,分数越高代表风险越低

‌金融评分卡‌是一种将用户信用风险量化为分数的模型工具,广泛应用于贷款审批、额度定价和风险预警等环节,分数越高代表风险越低。一、评分卡的核心作用金融机构通过评分卡快速判断:是否授信(如信用卡申请)授信额度与…...

0421晨间日记

- 关键词 - 上午- 吃饭- 从五台山到大同 - 下午- 云冈石窟- 石头要好雕刻,就意味着容易损毁- 国家要统治- 人生来就是苦的,让你接受是苦的- 地主因为信佛,得到了好处的,愿意捐钱修建- 大同古城墙- 这个建立起来确实很壮观- 但是高…...

数据预处理和超范围值处理步骤 18

1 .数据预处理实验(1)导入数据操作步骤:① 从“源”面板拖入“Excel”节点。② 双击节点,选择待处理的数据文件。③ 从“输出”面板拖入“表格”节点,连接至“Excel”节点,右键运行,查看原始数据…...

辅助医生能力成长与患者个体化治疗方案生成系统(上)

摘要 本文档详细阐述了一套面向基层医疗机构的辅助医生能力成长与患者个体化治疗方案生成系统的设计与实现。系统以“规则驱动为基、数据驱动为翼”为核心思想,通过症状-疾病映射、指南依据匹配、用药禁忌筛查、个体化调整与风险预警等模块,为临床医生提供实时、可解释的决策…...

【2026最新】JDK 下载安装与环境配置全教程(Windows/Mac/Linux 三平台,零基础友好)

Java 开发的第一步,就是把 JDK 环境搭好。这一步看着简单,但不少新手会在环境变量配置上踩坑——JAVA_HOME 没设对、javac 报“不是内部或外部命令”、改完变量终端里还是不生效……这些坑我都替你踩过一遍了。 这篇文章就用最直白的方式,手…...

在 Word 中,一个公式就能看出你会不会高效排版

在 Word 中,一个公式就能看出你会不会高效排版 很多人写论文、实验报告或者技术文档时,一碰到公式就习惯打开 MathType,点来点去插入分式、求和、下标,操作不算难,但确实有点慢。 其实,对于很多常见公式&am…...

从零开始:Spring Boot + MyBatis 搭建后端接口完整教程

前言:你是否刚接触 Spring Boot,面对一堆配置不知从何下手?是否看了很多教程,却还是搞不清 Controller、Service、Mapper 到底谁先谁后?本文带你从零开始,手把手搭建一个完整的 Spring Boot MyBatis 项目。…...

当智能眼镜遇上了AI——使用灵珠搭建【镜中食谱】智能体

今天带大家沉浸式体验 Rokid 自研的 AI 开发平台——【灵珠平台】! 🌟 零代码、零门槛,手把手教你搭建一个专属的【镜中食谱】智能体,让 Rokid Glasses 解决你的吃饭难题! 本文智能体基于Rokid AI Glasses和灵珠AI平…...

Pi0视觉-语言-动作流模型科研应用:人类意图识别与机器人行为对齐研究

Pi0视觉-语言-动作流模型科研应用:人类意图识别与机器人行为对齐研究 1. 项目概述与科研价值 Pi0是一个突破性的视觉-语言-动作流模型,专门为通用机器人控制而设计。这个模型的核心价值在于它能够将人类的自然语言指令、视觉感知和机器人动作生成无缝连…...

robot_localization实现imu和odom融合

记录使用robot_localization进行融合下载地址:git clone https://gitee.com/bingshuibuliang/robot_localization.git注意:/odometry/filtered是这个节点发送的融合位姿,修改的话需要在ekf_nodelet_template.launch里,在使用robot…...

从扩频时钟到弹性缓存:一张图看懂PCIe是如何‘容忍’时钟偏差,保证数据不丢的

从水流模型到数据同步:图解PCIe时钟偏差补偿机制 想象一下城市供水系统中两个不同步的水泵——一个抽水快,一个抽水慢。如果没有调节装置,要么水管爆裂,要么用户断水。PCIe总线面临的时钟同步挑战与此惊人相似。本文将用生活化的水…...

《Spring Boot 第一个 REST API 教程》

前置知识:Java 基础、Maven 基础 最终效果:启动一个 Spring Boot 应用,通过浏览器访问 http://localhost:8080/hello 得到 {"msg":"Hello World"} 步骤 1:创建项目 推荐使用 Spring Initializr:…...

ROS2笔记2:使用Topic自定义Messages实现nodes之间通讯

1. Package规划 1.1 自定义消息接口my_interface_pkg DirCommandRequest.msg请求Topic消息 由发起node发起的Topic消息builtin_interfaces/Time stamp # 记录时间戳 string directory # 操作的目录 int8 command # 操作指令. 0:list, 1:re…...

如何3分钟解决百度网盘提取码难题:baidupankey完全指南

如何3分钟解决百度网盘提取码难题:baidupankey完全指南 【免费下载链接】baidupankey 项目地址: https://gitcode.com/gh_mirrors/ba/baidupankey 你是否曾因找不到百度网盘提取码而错过重要资源?当朋友分享学习资料、同事发送工作文件&#xff…...

2026年最新好用的WMS仓库管理系统盘点!10款国内外热门WMS系统推荐

面对仓储管理的挑战,越来越多的企业开始关注WMS系统。但在选型时,很多企业面临同样的困惑:市场上WMS系统那么多,到底哪款适合自己?本文盘点2026年国内外10款热门WMS系统,从功能特点、适用场景、性价比等维度…...

3分钟搞定百度网盘提取码:baidupankey智能工具终极指南

3分钟搞定百度网盘提取码:baidupankey智能工具终极指南 【免费下载链接】baidupankey 项目地址: https://gitcode.com/gh_mirrors/ba/baidupankey 你是否曾经遇到过这样的情况:好不容易找到了需要的资源,却被百度网盘提取码挡在门外&…...

打卡信奥刷题(3138)用C++实现信奥题 P7617 [COCI 2011/2012 #2] KOMPIĆI

P7617 [COCI 2011/2012 #2] KOMPIĆI 题目描述 给定 NNN 个正整数 A1,A2,...,ANA_1,A_2,...,A_NA1​,A2​,...,AN​&#xff0c;求有多少整数对 (i,j)(i,j)(i,j)&#xff0c;满足以下条件&#xff1a; 1≤i<j≤N1 \le i < j \le N1≤i<j≤NAiA_iAi​ 和 AjA_jAj​ 至…...