当前位置：首页 > news >正文

YOLOv8-ultralytics-8.2.103部分代码阅读笔记-predict.py

news 2026/2/11 1:22:02

predict.py

ultralytics\models\yolo\detect\predict.py

predict.py

1.所需的库和模块

2.class DetectionPredictor(BasePredictor):

1.所需的库和模块

# Ultralytics YOLO 🚀, AGPL-3.0 licensefrom ultralytics.engine.predictor import BasePredictor
from ultralytics.engine.results import Results
from ultralytics.utils import ops

2.class DetectionPredictor(BasePredictor):

# 这段代码定义了一个名为 DetectionPredictor 的类，它继承自 BasePredictor 。这个类用于目标检测任务中的预测后处理，并返回一系列结果对象。
class DetectionPredictor(BasePredictor):# 扩展 BasePredictor 类的类，用于基于检测模型进行预测。"""A class extending the BasePredictor class for prediction based on a detection model.Example:```pythonfrom ultralytics.utils import ASSETSfrom ultralytics.models.yolo.detect import DetectionPredictorargs = dict(model="yolov8n.pt", source=ASSETS)predictor = DetectionPredictor(overrides=args)predictor.predict_cli()```"""# 定义了一个名为 postprocess 的方法，它接受三个参数。# 1.preds ：模型的原始预测输出。# 2.img ：模型输入的图像张量。# 3.orig_imgs ：原始图像的张量或列表。def postprocess(self, preds, img, orig_imgs):# 后期处理预测并返回结果对象列表。"""Post-processes predictions and returns a list of Results objects."""# 调用 ops.non_max_suppression 函数对预测结果进行非极大值抑制（NMS），以去除重叠的检测框。这个函数接受以下参数。preds = ops.non_max_suppression(# 模型的预测输出。preds,# 预测的置信度阈值。self.args.conf,# 交并比（IoU）阈值。self.args.iou,# 是否执行类别无关的NMS。agnostic=self.args.agnostic_nms,# 每个图像允许的最大检测框数量。max_det=self.args.max_det,# 要检测的类别列表。classes=self.args.classes,)# 检查 orig_imgs 是否不是列表类型。if not isinstance(orig_imgs, list):  # input images are a torch.Tensor, not a list# 如果 orig_imgs 不是列表，将其从PyTorch张量转换为NumPy数组列表。# def convert_torch2numpy_batch(batch: torch.Tensor) -> np.ndarray:# -> 将 PyTorch 张量批量转换为 NumPy 数组，通常用于将模型输出的张量（例如图像数据）从 PyTorch 格式转换为 NumPy 格式，以便进行进一步处理或可视化。返回转换后的 NumPy 数组。# -> return (batch.permute(0, 2, 3, 1).contiguous() * 255).clamp(0, 255).to(torch.uint8).cpu().numpy()orig_imgs = ops.convert_torch2numpy_batch(orig_imgs)# 初始化一个空列表 results ，用于存储结果对象。results = []# 遍历 处理后的预测结果 、 原始图像 和 图像路径 。for pred, orig_img, img_path in zip(preds, orig_imgs, self.batch[0]):# 将预测的边界框从模型输入图像的空间尺度转换回原始图像的空间尺度。# def scale_boxes(img1_shape, boxes, img0_shape, ratio_pad=None, padding=True, xywh=False):# -> 用于将边界框按照一定的比例缩放并调整到原始图像的形状。使用 clip_boxes 函数将缩放后的边界框剪辑到 原始图像 的形状内，并返回结果。# -> return clip_boxes(boxes, img0_shape)pred[:, :4] = ops.scale_boxes(img.shape[2:], pred[:, :4], orig_img.shape)# 创建一个 Results 对象，包含 原始图像 、 图像路径 、 类别名称 和 预测的边界框 ，然后添加到 results 列表中。# class Results(SimpleClass):# -> Results 类的目的是封装检测或分割模型的输出结果，包括原始图像、检测框、掩码、概率、关键点、方向边界框（Oriented Bounding Box，简称 OBB）和速度信息。# -> def __init__(self, orig_img, path, names, boxes=None, masks=None, probs=None, keypoints=None, obb=None, speed=None) -> None:results.append(Results(orig_img, path=img_path, names=self.model.names, boxes=pred))# 返回包含结果对象的列表。return results# 这个方法的主要功能是对模型的预测结果进行后处理，包括应用NMS、尺度转换和创建结果对象。这些结果对象可以用于进一步的分析、可视化或保存预测结果。

YOLOv8-ultralytics-8.2.103部分代码阅读笔记-predict.py

predict.py ultralytics\models\yolo\detect\predict.py 目录 predict.py 1.所需的库和模块 2.class DetectionPredictor(BasePredictor): 1.所需的库和模块 # Ultralytics YOLO 🚀, AGPL-3.0 licensefrom ultralytics.engine.predictor import BasePredicto…...

编程日记 2024/12/15 20:57:30

细说Flash存储芯片W25Q128FW和W25Q16BV

目录一、Flash存储芯片W25Q128FW 1、W25Q128硬件接口和连接 2、存储空间划分 3、数据读写的原则 4、操作指令 （1）“写使能”指令 （2）“读数据”指令 （3）“写数据”指令 5、状态寄存器SR1 二、Fl…...

编程日记 2024/12/15 20:55:27

python爬虫--小白篇【爬取B站视频】

目录一、任务分析二、网页分析三、任务实现一、任务分析将B站视频爬取并保存到本地，经过分析可知可以分为四个步骤，分别是： 爬取视频页的网页源代码；提取视频和音频的播放地址；下载并保存视频和音频&#x…...

编程日记 2024/12/15 20:53:23

Three.js入门-模型加载

Three.js 支持多种 3D 模型格式，每种格式有其独特的优势和适用场景。根据项目的需求，选择合适的格式可以提高开发效率和用户体验。下面将详细介绍几种常见的模型格式及其特点，并补充每种格式的典型使用场景。支持的模型类型及特点 Three.j…...

编程日记 2024/12/15 20:51:20

ECharts实现数据可视化入门详解

文章目录 ECharts实现数据可视化入门详解一、引言二、基础配置1.1、代码示例三、动态数据与交互2.1、代码示例四、高级用法1、多图表组合1.1、在同一容器中绘制多个图表1.2、创建多个容器并分别初始化 ECharts 实例1.3、实现多图联动五、总结 ECharts实现数据可视化入门详解…...

编程日记 2024/12/15 20:50:19

C++(举例说明类的实例化方式)

太多的信息会让你抓不住重点，下面通过间短的举例说明了类的几种实例化方式，熟悉以后再阅读代码的时候就能减少疑惑。 1.直接实例化：使用类名直接实例化对象 MyClass obj; 2.使用 new 关键字动态分配内存：使用 new 关键字来在堆上…...

编程日记 2024/12/15 20:48:14

LeetCode32. 最长有效括号（2024冬季每日一题 32）

给你一个只包含 ( 和 ) 的字符串，找出最长有效（格式正确且连续）括号子串的长度。示例 1： 输入：s “(()” 输出：2 解释：最长有效括号子串是 “()” 示例 2： 输入：s “…...

编程日记 2024/12/15 20:47:13

Textfocals ——基于大言模型的用户驱动型文本改进工具让用户在审阅自己的写作时对其进行修改

概述论文地址：https://arxiv.org/abs/2403.01055 大规模语言模型可以生成媲美专业作家撰写的文本。目前使用的对话技术主要有两种：一种是交互式（如 OpenAI 的 ChatGPT 和 Google 的 Gemini），另一种是预测性文本补全&…...

编程日记 2024/12/15 20:46:12

docker 部署 redis

docker 部署 redis 1. 下载 redis 镜像 # docker images | grep redis bitnami/redis 7.2.4-debian-11-r5 45de196aef7e 10 months ago 95.2MB2. docker-compose 部署 version: "3" services:redis:image: bitnami/redis:7.2.4-debian-11-…...

编程日记 2024/12/15 20:45:11

微信小程序横屏页面跳转后，自定义navbar样式跑了？

文章目录问题原因：解决方案： 今天刚遇到的问题，横屏的页面完成操作后跳转页面后，自定义的tabbar样式乱了，跑到最顶了，真机调试后发现navbar跑到手机状态栏了，它正常应该跟右边胶囊一行。知道问…...

编程日记 2024/12/15 20:44:07

回归预测 | MATLAB实现BiGRU(双向门控循环单元)多输入单输出

回归预测 | MATLAB实现BiGRU(双向门控循环单元)多输入单输出文章目录回归预测 | MATLAB实现BiGRU(双向门控循环单元)多输入单输出预测效果基本介绍程序设计参考资料致谢预测效果基本介绍 BiGRU（双向门控循环单元）多输入单输出模型是一种结合了双向门控循环单元（BiGRU）的…...

编程日记 2024/12/15 20:41:59

智能时代的基石：神经网络

智能时代的基石：神经网络第一节：神经网络简介课程目标本节课程旨在全面介绍神经网络的基本概念、结构以及其在历史发展中的重要里程碑。通过深入理解神经网络的工作原理和演变过程，学员将能够掌握神经网络在现实世界中的多种应用&#…...

编程日记 2024/12/15 20:37:52

红与黑,,

有一间长方形的房子，地上铺了红色、黑色两种颜色的正方形瓷砖。你站在其中一块黑色的瓷砖上，只能向相邻（上下左右四个方向）的黑色瓷砖移动。请写一个程序，计算你总共能够到达多少块黑色的瓷砖。输入格式输入包…...

编程日记 2024/12/15 20:34:48

嵌入式驱动开发详解16（音频驱动开发）

文章目录前言WM8960简介I2S协议接口说明 SAI音频接口简介驱动框架简介设备树配置内核使能声卡设置与测试后续参考文献前言该专栏主要是讲解嵌入式相关的驱动开发，但是由于ALSA驱动框架过于复杂，实现音频编解码芯片的驱动不是一个人能完成的&#xf…...

编程日记 2024/12/15 20:32:46

【嵌入式软件】跑开发板的前置服务配置

在嵌入式开发中，通常需要在开发板和主机之间共享、传输和挂载文件。这篇文章是关于如何在 Ubuntu 中配置 Samba、TFTP 和 NFS 协议的详细步骤。这些协议分别用于远程文件共享、文件传输和内核挂载文件系统。如何安装协议: 参考:ubuntu18配置：详细的内容我手写了一份文档。…...

编程日记 2024/12/15 20:30:44

如何高效实现进程间通信

实现进程间通信（IPC）有多种高效的方法，以下是一些常见的技术及其简要说明： 1. 共享内存： 共享内存是一种高效的进程间通信机制，允许多个进程共享同一块内存区域以实现快速的数据交换。与其他IPC机制相比&a…...

编程日记 2024/12/15 20:29:42

scala基础学习_变量

文章目录 scala中的变量常量 val（不可变变量）变量 var变量声明多变量声明匿名变量 _ 声明变量类型声明变量命名规范 scala中的变量常量 val（不可变变量） 使用val关键字声明变量是不可变的，一旦赋值后不能被修改对…...

编程日记 2024/12/15 20:28:41

Java 身份证校验工具类（15位校验、18位校验与15转18）

文章目录身份证简介（一）身份证号码的组成（二）一代和二代身份证一代身份证二代身份证检验思路分析（一）15位身份证号码（二）18位身份证号码（三）校验算法示例&a…...

编程日记 2024/12/15 20:27:40

HTML+CSS+Vue3的静态网页，免费开源，可当作作业使用

拿走请吱一声，点个关注吧，代码如下，网页有移动端适配 HTML <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width…...

编程日记 2024/12/15 20:25:33

【FAQ】HarmonyOS SDK 闭源开放能力 —Push Kit（8）

1.问题描述： 在AGC中，推送服务的消息回执新建成功后，有一个有效期 1，这个有效期是什么意思，过期后，会影响什么呢？ 2，这个有效期是否可以修改成一直不过期？ 解决方案&…...

编程日记 2024/12/15 20:23:30

零门槛NAS搭建：WinNAS如何让普通电脑秒变私有云？

一、核心优势：专为Windows用户设计的极简NAS WinNAS由深圳耘想存储科技开发，是一款收费低廉但功能全面的Windows NAS工具，主打“无学习成本部署” 。与其他NAS软件相比，其优势在于： 无需硬件改造：将任意W…...

编程新知 2026/1/2 23:01:24

大话软工笔记—需求分析概述

需求分析，就是要对需求调研收集到的资料信息逐个地进行拆分、研究，从大量的不确定“需求”中确定出哪些需求最终要转换为确定的“功能需求”。需求分析的作用非常重要，后续设计的依据主要来自于需求分析的成果，包括: 项目的目的…...

编程新知 2026/1/28 10:58:50

DAY 47

三、通道注意力 3.1 通道注意力的定义 # 新增：通道注意力模块（SE模块） class ChannelAttention(nn.Module):"""通道注意力模块(Squeeze-and-Excitation)"""def __init__(self, in_channels, reduction_rat…...

编程新知 2026/2/4 23:29:22

Golang dig框架与GraphQL的完美结合

将 Go 的 Dig 依赖注入框架与 GraphQL 结合使用，可以显著提升应用程序的可维护性、可测试性以及灵活性。 Dig 是一个强大的依赖注入容器，能够帮助开发者更好地管理复杂的依赖关系，而 GraphQL 则是一种用于 API 的查询语言，能够提…...

编程新知 2025/12/31 8:38:23

【2025年】解决Burpsuite抓不到https包的问题

环境：windows11 burpsuite:2025.5 在抓取https网站时，burpsuite抓取不到https数据包，只显示： 解决该问题只需如下三个步骤： 1、浏览器中访问 http://burp 2、下载 CA certificate 证书 3、在设置--隐私与安全--…...

编程新知 2026/1/28 3:43:20

Matlab | matlab常用命令总结

常用命令一、基础操作与环境二、矩阵与数组操作（核心）三、绘图与可视化四、编程与控制流五、符号计算 (Symbolic Math Toolbox)六、文件与数据 I/O七、常用函数类别重要提示这是一份 MATLAB 常用命令和功能的总结，涵盖了基础操作、矩阵运算、绘图、编程和文件处理等…...

编程新知 2025/8/11 1:05:59

MySQL中【正则表达式】用法

MySQL 中正则表达式通过 REGEXP 或 RLIKE 操作符实现（两者等价），用于在 WHERE 子句中进行复杂的字符串模式匹配。以下是核心用法和示例： 一、基础语法 SELECT column_name FROM table_name WHERE column_name REGEXP pattern; …...

编程新知 2025/11/21 22:02:37

Android 之 kotlin 语言学习笔记三（Kotlin-Java 互操作）

参考官方文档：https://developer.android.google.cn/kotlin/interop?hlzh-cn 一、Java（供 Kotlin 使用） 1、不得使用硬关键字不要使用 Kotlin 的任何硬关键字作为方法的名称或字段。允许使用 Kotlin 的软关键字、修饰符关键字和特殊标识…...

编程新知 2026/2/8 0:33:04

使用 Streamlit 构建支持主流大模型与 Ollama 的轻量级统一平台

🎯 使用 Streamlit 构建支持主流大模型与 Ollama 的轻量级统一平台 📌 项目背景随着大语言模型（LLM）的广泛应用，开发者常面临多个挑战：各大模型（OpenAI、Claude、Gemini、Ollama）接口风格不统一；缺乏一个统一平台进行模型调用与测试；本地模型 Ollama 的集成与前…...

编程新知 2026/1/25 3:31:07

重启Eureka集群中的节点，对已经注册的服务有什么影响

先看答案，如果正确地操作，重启Eureka集群中的节点，对已经注册的服务影响非常小，甚至可以做到无感知。但如果操作不当，可能会引发短暂的服务发现问题。下面我们从Eureka的核心工作原理来详细分析这个问题。 Eureka的…...

编程新知 2025/9/24 3:38:34

predict.py

1.所需的库和模块

2.class DetectionPredictor(BasePredictor):

相关文章：