YOLO中mode.predict()参数详解
Inference arguments:
| Argument | Type | Default | Description |
|---|---|---|---|
| source | str | ‘ultralytics/assets’ | 指定推理的数据源。可以是图像路径、视频文件、目录、URL 或实时源的设备 ID。支持多种格式和数据源,可在不同类型的输入中灵活应用。 |
| conf | float | 0.25 | 设置检测的最小置信度阈值。置信度低于此阈值的检测对象将被忽略。调整此值有助于减少误报。 |
| iou | float | 0.7 | 非极大值抑制 (NMS) 的交并比 (IoU) 阈值。较低的值会通过消除重叠框来减少检测数量,有助于减少重复检测。 |
| imgsz | int or tuple | 640 | 定义推理的图像大小。可以是用于正方形调整大小的单个整数 640,也可以是一个 (高度, 宽度) 元组。适当的大小调整可以提高检测精度和处理速度。 |
| half | bool | False | 启用半精度 (FP16) 推理,这可以在对精度影响最小的情况下加快支持的 GPU 上的模型推理速度。 |
| device | str | None | 指定推理的设备(例如,cpu、cuda:0 或 0)。允许用户在 CPU、特定 GPU 或其他计算设备之间进行选择以执行模型。 |
| batch | int | 1 | 指定推理的批量大小(仅当源是目录、视频文件或 .txt 文件时有效)。更大的批量大小可以提供更高的吞吐量,缩短推理所需的总时间。 |
| max_det | int | 300 | 每个图像允许的最大检测数量。限制模型在单次推理中可以检测到的对象总数,防止在密集场景中出现过多的输出。 |
| vid_stride | int | 1 | 视频输入的帧步长。允许跳过视频中的帧以加快处理速度,但会降低时间分辨率。值为 1 时处理每一帧,更高的值会跳过帧。 |
| stream_buffer | bool | False | 确定是否为视频流排队传入的帧。如果为 False,旧帧将被丢弃以容纳新帧(针对实时应用进行了优化)。如果为 True,将新帧排队到缓冲区中,确保不会跳过任何帧,但如果推理帧率低于流帧率,则会导致延迟。 |
| visualize | bool | False | 在推理期间激活模型特征的可视化,提供对模型 “看到” 的内容的洞察。对调试和模型解释很有用。 |
| augment | bool | False | 为预测启用测试时增强 (TTA),有可能以推理速度为代价提高检测的鲁棒性。 |
| agnostic_nms | bool | False | 启用类无关的非极大值抑制 (NMS),它会合并不同类别的重叠框。在类重叠常见的多类检测场景中很有用。 |
| classes | list[int] | None | 将预测结果过滤为一组类别 ID。仅返回属于指定类别的检测结果。在多类检测任务中,对于专注于相关对象很有用。 |
| retina_masks | bool | False | 返回高分辨率的分割掩码。如果启用,返回的掩码(masks.data)将与原始图像大小匹配。如果禁用,它们将具有推理期间使用的图像大小。 |
| embed | list[int] | None | 指定从中提取特征向量或嵌入的层。对聚类或相似性搜索等下游任务很有用。 |
| project | str | None | 如果启用保存功能,则为保存预测输出的项目目录名称。 |
| name | str | None | 预测运行的名称。用于在项目文件夹中创建一个子目录,如果启用保存功能,则将预测输出存储在该子目录中。 |
| stream | bool | False | 通过返回 Results 对象的生成器而不是一次性将所有帧加载到内存中,实现对长视频或大量图像的内存高效处理。 |
| verbose | bool | True | 控制是否在终端中显示详细的推理日志,提供有关预测过程的实时反馈。 |
Visualization arguments:
| Argument | Type | Default | Description |
|---|---|---|---|
| show | bool | False | 如果为 True,则在窗口中显示带注释的图像或视频。在开发或测试过程中,对于即时获得视觉反馈很有用。 |
| save | bool | False 或 True | 启用将带注释的图像或视频保存到文件。对于记录、进一步分析或共享结果很有用。使用命令行界面 (CLI) 时默认值为 True,在 Python 中使用时默认值为 False。 |
| save_frames | bool | False | 在处理视频时,将单个帧保存为图像。对于提取特定帧或进行详细的逐帧分析很有用。 |
| save_txt | bool | False | 按照 [class] [x_center] [y_center] [width] [height] [confidence] 的格式将检测结果保存到文本文件中。对于与其他分析工具集成很有用。 |
| save_conf | bool | False | 在保存的文本文件中包含置信度分数。增强了可用于后期处理和分析的详细程度。 |
| save_crop | bool | False | 保存检测到的对象的裁剪图像。对于数据集增强、分析或为特定对象创建聚焦的数据集很有用。 |
| show_labels | bool | True | 在可视化输出中为每个检测显示标签。可让人立即了解检测到的对象。 |
| show_conf | bool | True | 在标签旁边为每个检测显示置信度分数。深入了解模型对每个检测的确定程度。 |
| show_boxes | bool | True | 在检测到的对象周围绘制边界框。对于在图像或视频帧中直观识别和定位对象至关重要。 |
| line_width | None 或 int | None | 指定边界框的线宽。如果为 None,则线宽会根据图像大小自动调整。为了清晰起见,提供了可视化自定义功能。 |
| font_size | float | None | 注释的文本字体大小。如果设置为 None,则会根据图像大小自动缩放。 |
| font | str | ‘Arial.ttf’ | 可视化中文本注释的字体名称或路径。 |
| pil | bool | False | 返回 PIL Image 对象形式的图像,而不是 numpy 数组。 |
| kpt_radius | int | 5 | 在可视化姿态估计结果时,关键点的半径。 |
| kpt_line | bool | True | 在可视化姿态估计时,用线条连接关键点。 |
| masks | bool | True | 在可视化输出中显示分割掩码。 |
| probs | bool | True | 在可视化中包含分类概率。 |
| filename | str | None | 当 save=True 时,保存带注释图像的路径和文件名。 |
| color_mode | str | ‘class’ | 指定可视化的着色模式,例如,‘instance’ 或 ‘class’。 |
| txt_color | tuple[int, int, int] | (255, 255, 255) | 分类任务注释的 RGB 文本颜色。 |
相关文章:
YOLO中mode.predict()参数详解
Inference arguments: ArgumentTypeDefaultDescriptionsourcestr‘ultralytics/assets’指定推理的数据源。可以是图像路径、视频文件、目录、URL 或实时源的设备 ID。支持多种格式和数据源,可在不同类型的输入中灵活应用。conffloat0.25设置检测的最小置信度阈值。…...
收敛算法有多少?
收敛算法是指在迭代计算过程中,能够使序列或函数逐渐逼近某个极限值或最优解的算法。常见的收敛算法有以下几种: 梯度下降法(Gradient Descent) 原理:通过沿着目标函数的负梯度方向更新参数,使得目标函数…...
在亚马逊云科技上使用n8n快速构建个人AI NEWS助理
前言: N8n 是一个强大的工作流自动化工具,它允许您连接不同的应用程序、服务和系统,以创建自动化工作流程,并且采用了开源MIT协议,可以放心使用,他的官方网站也提供了很多的工作流,大家有兴趣的…...
STM32单片机入门学习——第27节: [9-3] USART串口发送串口发送+接收
写这个文章是用来学习的,记录一下我的学习过程。希望我能一直坚持下去,我只是一个小白,只是想好好学习,我知道这会很难,但我还是想去做! 本文写于:2025.04.08 STM32开发板学习——第27节: [9-3] USART串口发送&串口发送接收 前言开发板说…...
python 3.9 随机生成 以UTF-8 编码 的随机中文
理论实践 因为python3的默认编码为UTF-8,我们将‘浪’的utf8\u6d6a进行打印测试 print(\u6d6a) >>浪 中文匹配范围有两种 [\u4e00-\u9fa5]和[\u2E80-\u9FFF],后者包括了日韩地区的汉字 由于utf采用16进制,则需要进行一个进制的变换&a…...
数字电子技术基础(四十)——使用Digital软件和Multisim软件模拟显示译码器
目录 1 使用Digital软件模拟显示译码器 1.1 原理介绍 1.2 器件选择 1.3 电路运行 1.4 结果分析 2 使用Multisim软件模拟显示译码器 2.1 器件选择 2.2 电路运行 1 使用Digital软件模拟显示译码器 1.1 原理介绍 7448常用于驱动7段显示译码器。如下所示为7448驱动BS201A…...
第十四届蓝桥杯大赛软件赛国赛C/C++研究生组
研究生C国赛软件大赛 题一:混乘数字题二:钉板上的正方形题三:整数变换题四:躲炮弹题五:最大区间 题一:混乘数字 有一点像哈希表: 首先定义两个数组,拆分ab和n 然后令n a*b 查看两个…...
innodb如何实现mvcc的
InnoDB 实现 MVCC(多版本并发控制)的机制主要依赖于 Undo Log(回滚日志)、Read View(读视图) 和 隐藏的事务字段。以下是具体实现步骤和原理: 1. 核心数据结构 InnoDB 的每一行数据(…...
多模态大语言模型arxiv论文略读(四)
A Survey on Multimodal Large Language Models ➡️ 论文标题:A Survey on Multimodal Large Language Models ➡️ 论文作者:Shukang Yin, Chaoyou Fu, Sirui Zhao, Ke Li, Xing Sun, Tong Xu, Enhong Chen ➡️ 研究机构: 中国科学技术大学、腾讯优图…...
空对象模式(Null Object Pattern)在C#中的实现详解
一 、什么是空对象模式 空对象模模是靠”空对孔象式是书丯一种引施丼文行为,行凌,凌万成,个默疤"空象象象象来飞䛿引用用用用电从延盈盈甘仙丿引用用用职从延务在仅代砷易行行 」这种燕式亲如要目的片片 也说媚平父如如 核心思烟 定义一个人 派一个 � 创建…...
在kotlin的安卓项目中使用dagger
在 Kotlin 的 Android 项目中使用 Dagger(特别是 Dagger Hilt,官方推荐的简化版)进行依赖注入(DI)可以大幅提升代码的可测试性和模块化程度。 1. 配置 Dagger Hilt 1.1 添加依赖 在 bu…...
(三)链式工作流构建——打造智能对话的强大引擎
上一篇:(二)输入输出处理——打造智能对话的灵魂 在前两个阶段,我们已经搭建了一个基础的智能对话,并深入探讨了输入输出处理的细节。今天,我们将进入智能对话的高级阶段——链式工作流构建。这一阶段的目…...
python三大库之---pandas(二)
python三大库之—pandas(二) 文章目录 python三大库之---pandas(二)六,函数6.1、常用的统计学函数6.2重置索引6.3 遍历6.3.1DataFrame 遍历6.3.2 itertuples()6.3.3 使用属性遍历 6.4 排序6.4.1 sort_index6.4.2 sort_…...
php7.4.3连接MSsql server方法
需要下载安装Microsoft Drivers for PHP for SQL Server驱动, https://download.csdn.net/download/tjsoft/90568178 实操Win2008IISphp7.4.3连接SqlServer2008数据库所有安装包资源-CSDN文库 适用于 SQL Server 的 PHP 的 Microsoft 驱动程序支持与 SQL Server …...
Flask返回文件方法详解
在 Flask 中返回文件可以通过 send_file 或 send_from_directory 方法实现。以下是详细方法和示例: 1. 使用 send_file 返回文件 这是最直接的方法,适用于返回任意路径的文件。 from flask import Flask, send_fileapp = Flask(__name__)@app.route("/download")…...
JS中的Promise对象
基本概念 Promise 是 JavaScript 中用于处理异步操作的对象。它代表一个异步操作的最终完成及其结果值。Promise 提供了一种更优雅的方式来处理异步代码,避免了传统的回调地狱。 Promise 有三种状态 Pending(等待中):初始状态&…...
macOS设置定时播放眼保健操
文章目录 1. ✅方法一:直接基于日历2. 方法二:基于脚本2.1 音乐文件获取(ncm转mp3)2.2 创建播放音乐任务2.3 脚本实现定时播放 1. ✅方法一:直接基于日历 左侧新建一个日历,不然会和其他日历混淆,看起来会有点乱 然后…...
Python 小练习系列 | Vol.14:掌握偏函数 partial,用函数更丝滑!
🧩 Python 小练习系列 | Vol.14:掌握偏函数 partial,用函数更丝滑! 本节的 Python 小练习系列我们将聚焦一个 冷门但高能 的工具 —— functools.partial。它的作用类似于“函数的预设模板”,能帮你写出更加灵活、优雅…...
记录学习的第二十三天
老样子,每日一题开胃。 我一开始还想着暴力解一下试试呢,结果不太行😂 接着两道动态规划。 这道题我本来是想用最长递增子序列来做的,不过实在是太麻烦了,实在做不下去了。 然后看了题解,发现可以倒着数。 …...
Web品质 - 重要的HTML元素
Web品质 - 重要的HTML元素 在构建一个优秀的Web页面时,HTML元素的选择和运用至关重要。这些元素不仅影响页面的结构,还直接关系到页面的可用性、可访问性和SEO表现。本文将深入探讨一些关键的HTML元素,并解释它们在提升Web品质方面的重要性。 1. <html> 根元素 HTM…...
SpringBoot整合sa-token,Redis:解决重启项目丢失登录态问题
SpringBoot整合sa-token,Redis:解决重启项目丢失登录态问题 🔥1. 痛点直击:为什么登录状态会消失?2.实现方案2.1.导入依赖2.2.新增yml配置文件 3.效果图4.结语 😀大家好!我是向阳🌞&…...
Python 字典和集合(子类化UserDict)
本章内容的大纲如下: 常见的字典方法 如何处理查找不到的键 标准库中 dict 类型的变种set 和 frozenset 类型 散列表的工作原理 散列表带来的潜在影响(什么样的数据类型可作为键、不可预知的 顺序,等等) 子类化UserDict 就创造自…...
npm fund 命令的作用
运行别人的项目遇到这个问题: npm fund 命令的作用 npm fund 是 npm 提供的命令,用于显示项目依赖中哪些包需要资金支持。这些信息来自包的 package.json 中定义的 funding 字段,目的是帮助开发者了解如何支持开源维护者。 典型场景示例 假…...
ES:账号、索引、ILM
目录 笔记1:账号权限查看、查看账号、创建账号等查看所有用户查看特定用户验证权限修改用户权限删除用户 笔记2:索引状态和内容的查看等查看所有索引查看特定索引内容查看索引映射查看索引设置查看索引统计信息查看ILM策略 笔记1:账号权限查看…...
哈希表(开散列)的实现
目录 引入 开散列的底层实现 哈希表的定义 哈希表的扩容 哈希表的插入 哈希表查找 哈希表的删除 引入 接上一篇,我们使用了闭散列的方法解决了哈希冲突,此篇文章将会使用开散列的方式解决哈希冲突,后面对unordered_set和unordered_map的…...
#在docker中启动mysql之类的容器时,没有挂载的数据...在后期怎么把数据导出外部
如果要导出 Docker 容器内的 整个目录(包含所有文件及子目录),可以使用以下几种方法: 方法 1:使用 docker cp 直接复制目录到宿主机 适用场景:容器正在运行或已停止(但未删除)。 命…...
[蓝桥杯] 挖矿(CC++双语版)
题目链接 P10904 [蓝桥杯 2024 省 C] 挖矿 - 洛谷 题目理解 我们可以将这道题中矿洞的位置理解成为一个坐标轴,以题目样例绘出坐标轴: 样例: 输入的5为矿洞数量,4为可走的步数。第二行输入是5个矿洞的坐标。输出结果为在要求步数…...
Johnson算法 流水线问题 java实现
某印刷厂有 6项加工任务J1,J2,J3,J4,J5,J6,需要在两台机器Mi和M2上完 成。 在机器Mi上各任务所需时间为5,1,8,5,3,4单位; 在机器M2上各任务所需时间为7,2,2,4,7,4单位。 即时间矩阵为: T1 {5, …...
远程监控系统项目里练习
1、项目目标 设备端: (1)基于stm32mp157开发板,裁剪linux5.10.10,完成ov5640摄像头移植; (2)完成用户层程序,完成对摄像头的控制及与云端服务的数据交互。 云端&…...
安装并配置Maven
如图所示,解压安装包,配置环境变量,在bin目录那个界面新建文件夹repository,写上安装路径的坐标,修改Maven仓库镜像,输入cmd验证是否安装成功 <mirror><id>alimaven</id><mirrorOf>…...
