当前位置: 首页 > news >正文

Yolo-World初步使用

Yolo v8目前已经支持Yolo-World,整理一下初步使用步骤。

使用步骤

1 先下载Yolo-World的pt文件,下载地址:GitHub - AILab-CVC/YOLO-World: [CVPR 2024] Real-Time Open-Vocabulary Object Detection

官网应该是点这里(有个笑脸)下载,我一直刷不出来界面,所以不确定:

我自己用的是在其他网友提供的地址下载的,应该是V1版本(yolov8-world.pt),目前已经出了V2版本。

2 新建一个python脚本,叫testYolo-World.py,这里我们使用Yolo v8自带的bus.jpg进行测试。

from ultralytics import YOLOWorld# 目标检测
# Load a model
model = YOLOWorld('data/yolov8s-world.pt')  # load a pretrained model# Define custom classes
model.set_classes(['glasses'])#model.save("data/yolov8s-world2.pt")# Run inference on 'bus.jpg' with arguments
results = model.predict('data/bus.jpg',save=True, imgsz=640)

运行过程中,会提示缺失CLIP库,然后等待一会,会自动安装。安装成功后,再次运行一遍,会出结果,能检测到glasses.

但是尝试了其他类别,'tree' 'window' 'clothes' 'shoes',除了'shoes',其他都检测不出来,不知道V2效果会不会好一点。

如果注释掉设置类别这句话,能检测到的类别和Yolo v8自带的pt文件检测类别基本一致,置信度很高,但是有一个错误,多检测出来一个person。

相关文章:

Yolo-World初步使用

Yolo v8目前已经支持Yolo-World,整理一下初步使用步骤。 使用步骤 1 先下载Yolo-World的pt文件,下载地址:GitHub - AILab-CVC/YOLO-World: [CVPR 2024] Real-Time Open-Vocabulary Object Detection 官网应该是点这里(有个笑脸…...

Navicat Premium使用

文章目录 Navicat Premium 16的使用连接MySQL建立数据库并构建表导入数据 Navicat Premium 16是一款功能强大的数据库管理工具,它允许用户从单一应用程序中同时连接多种数据库,提供了极其便捷和高效的管理和开发环境,对于 MySQL 用户来说&…...

LLC数字控制TMS320F28034,4-DSP的epwm配置介绍

LLC数字控制TMS320F28034,4-DSP的epwm配置介绍 1 TMS320F280341.1 概述1.2 PWM详细介绍 2 TMS320F28034 PWM功能框图2.1 ePWM功能模块2.2 ePWM功能寄存器框图 3 TMS320F28034 PWM初始化流程4 结合项目设计5 代码设计5.1 PWM初始化程序5.2 工程代码 6 总结 配套代码示…...

MongoDB学习记录

1、初识Mongo 概述:与关系型数据库不同,MongoDB 的数据以类似于 JSON 格式的二进制文档存储,通常称这种格式为Bson,Bson不仅支持JSON中已有的数据类型,还增加了一些额外的数据类型,例如日期和二进制数据&a…...

vlunstack-2(复现红日安全-ATT CK实战)

环境搭建 配置信息 DC IP:10.10.10.10 OS:Windows 2012(64) 应用:AD域 WEB IP1:10.10.10.80 IP2:192.168.47.131 OS:Windows 2008(64) 应用:Weblogic 10.3.6MSSQL 2008 PC IP1:10.10…...

【生信入门】预览快速体验Linux-重生之小明闯Linux

生信少走弯路,快试试生信云专用服务器。新用户注册免费体验5小时。https://www.tebteb.cc 一.故事 小明的Linux冒险 在一片混沌的黑暗中,小明睁开了眼睛。他感到头痛欲裂,四周一片漆黑,只有一行闪烁的字符映入眼帘: [xiaomingu…...

用.net core简易搭建webapi托管到IIS

1、从官网下载.NET Core 托管捆绑包 https://learn.microsoft.com/zh-cn/aspnet/core/tutorials/publish-to-iis?viewaspnetcore-8.0&tabsvisual-studio 2、新建ASP.NET Core WEB API项目 新建控制器TestController并生成GetInfo方法 3、发布 目标路径选择 2)显示所有…...

【计算机网络---OSI七层模型】

一、OSI的基本概念及原则 OSI是Open System Interconnect的缩写,意为开放式系统互联。各个层次的划分遵循以下原则: 1. 同一层的各网络节点都有相同的层次结构,具有同样的功能; 2. 同一节点的内相邻层之间通过接口进行通信&…...

Error updating database. Cause: org.apache.shiro.UnavailableSecurity

mybtisplus查看MetaObjectHandler是否有自定义获取用户信息填充用户的方法...

【网络安全】本地文件包含及远程文件包含漏洞详解

一、文件包含漏洞概述 1.1 什么是文件包含 开发人员将需要重复调用的函数写入一个文件,对该文件进行包含时产生的操作。这样编写代码能减少冗余,降低代码后期维护难度。 保证网站整体风格统一:导航栏、底部footer栏等,把这些不…...

redis启动的三种方式

默认启动: # 默认的启动指令 redis-server 默认启动属于前台启动,会阻塞整个会话窗口,窗口关闭或者按下CTRL C则Redis停止。不推荐使用。 //查看云服务器是否安装过redis redis-server -v//检查安装目录 which redis-server//查看redis进…...

手机怎么远程控制电脑屏幕?手机远程控制电脑方法分享

手机与电脑之间的互联互通变得越来越便捷。 无论是工作还是学习,有时我们需要在手机上远程控制电脑屏幕,以完成一些复杂的操作或查看电脑上的文件。 本文将详细介绍几种实用的手机远程控制电脑屏幕的方法,帮助读者轻松实现这一目标。 一、使…...

NET的全称、主要功能以及在计算机网络中的作用?

.NET是一个广泛的、全方位的平台,应用于开发网站、应用程式、网页应用程式和网络服务。以下是.NET的全称、主要功能以及在计算机网络中的作用: .NET的全称 .NET的全称实际上是Microsoft .NET Framework。它是微软公司推出的一种面向网络的开发框架&…...

LLM - 使用 HuggingFace + Ollama 部署最新大模型 (GGUF 格式 与 Llama 3.1)

欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/141028040 免责声明:本文来源于个人知识与公开资料,仅用于学术交流,欢迎讨论,不支持转载。 Ollama…...

如何实现Redis和Mysql中数据双写一致性

在我们的实际开发中,我们用到了redis缓存一些常用的数据(如热点数据)用来提高系统的吞吐量。 但是不可以避免的出现了数据的修改场景,这就导致了数据库中的数据和Redis中出现不一致性的情况。如何保证数据一致性就显得非常重要了&…...

three.js 模型高亮效果实现说明(结合react)

three.js react 实现鼠标移入模型高亮选中效果 使用EffectComposer和其附加的渲染效果Passes(如RenderPass和OutlinePass)来实现高级渲染效果。首先创建EffectComposer实例,并添加RenderPass和OutlinePass,最后在渲染循环中调用…...

入营测评题解

第一题&#xff1a;first 第二题&#xff1a;chengji 打擂台&#xff0c;每个数跟当前最大、最小值比较&#xff0c;维护当前最值即可。 #include<bits/stdc.h> using lllong long; using namespace std;const int N1e610;int n; int x;//1e9, ll最大9e18 ll maxn0,minn…...

制造知识普及(十)-- 常见的工业软件介绍

「 1. ERP」 企业资源计划&#xff08;enterprise resource planning&#xff0c;ERP&#xff09;是制造企业的核心管理软件。ERP系统的基本思想是以销定产&#xff0c;协同管控企业的产、供、销、人、财、物等资源&#xff0c;帮助企业按照销售订单&#xff0c;基于产品的制造…...

Windows系统设置网络IPv4和IPv6优先访问级

Windows系统设置网络IPv4和IPv6优先访问级 资源宝整理分享&#xff1a;www.httple.net 在数字化的世界中&#xff0c;我们离不开互联网&#xff0c;而互联网协议&#xff08;IP协议&#xff09;则扮演着至关重要的角色。IPv4曾是互联网的主要标准&#xff0c;但随着IP地址枯竭问…...

yolov8 剪枝 - DepGraph

2024年8月5 5000张图片&#xff0c;2个类别。 yolov8n 初始&#xff1a; 185 layers, 3151904 parameters, 31936 gradients, 8.7 GFLOPs 经过三次finetune后&#xff1a; 185 layers, 2327024 parameters, 31936 gradients, 6.6 GFLOPs 经过第四次fintune后&#xff1a; …...

RMBG-2.0在数字人项目中的应用:实时抠像→驱动虚拟形象→直播推流

RMBG-2.0在数字人项目中的应用&#xff1a;实时抠像→驱动虚拟形象→直播推流 1. 项目背景与核心价值 想象一下&#xff0c;你正在准备一场线上直播&#xff0c;但背景杂乱&#xff0c;或者你希望以一个虚拟形象出现在观众面前。传统的绿幕抠像方案不仅需要专门的物理空间和灯…...

OpenClaw安全指南:Qwen3.5-9B执行权限管控与操作审计

OpenClaw安全指南&#xff1a;Qwen3.5-9B执行权限管控与操作审计 1. 为什么需要OpenClaw安全防护 上周我在调试一个自动整理财务报表的OpenClaw任务时&#xff0c;差点酿成大祸。当时AI助手误将包含客户隐私的临时文件同步到了公开目录&#xff0c;幸亏我提前配置了文件操作审…...

SecGPT-14B知识库更新:让OpenClaw掌握最新CVE漏洞检测能力

SecGPT-14B知识库更新&#xff1a;让OpenClaw掌握最新CVE漏洞检测能力 1. 为什么需要持续更新漏洞知识库 去年我在用OpenClaw做自动化安全扫描时&#xff0c;发现一个尴尬现象&#xff1a;虽然它能完美识别2022年前的常见漏洞特征&#xff0c;但对新曝光的CVE漏洞却总是"…...

CVPR 2023 TKSA注意力机制实战:手把手教你用PyTorch实现Top-K稀疏注意力模块

CVPR 2023 TKSA注意力机制实战&#xff1a;手把手教你用PyTorch实现Top-K稀疏注意力模块 在计算机视觉领域&#xff0c;注意力机制已经成为提升模型性能的关键组件。然而&#xff0c;传统注意力机制的计算开销和内存消耗常常成为制约模型效率的瓶颈。CVPR 2023提出的Top-K稀疏注…...

MAX31865驱动PT100温度测量全栈指南

1. MAX31865高精度PT100 RTD温度传感器接口芯片深度解析 MAX31865是Maxim Integrated&#xff08;现属Analog Devices&#xff09;推出的专用RTD&#xff08;Resistance Temperature Detector&#xff0c;热电阻&#xff09;数字转换器&#xff0c;专为工业级铂电阻温度测量而设…...

HCSR04超声波测距库底层实现与嵌入式工程实践

1. HCSR04超声波测距库深度解析&#xff1a;面向嵌入式工程师的底层实现与工程实践1.1 库定位与工程价值HCSR04超声波传感器是嵌入式系统中成本最低、部署最便捷的距离感知方案之一&#xff0c;广泛应用于智能小车避障、液位监测、工业物位检测及IoT环境感知等场景。其核心优势…...

python enum

## Python 中的 Any&#xff1a;一个被低估的类型注解工具 在 Python 的类型注解体系里&#xff0c;Any 是一个看似简单&#xff0c;却常常引发误解的特殊类型。很多开发者第一次见到它时&#xff0c;可能会觉得这不过是个“万金油”式的占位符&#xff0c;用来应付那些暂时不想…...

STM32开发必备的C语言核心技巧与实战解析

1. STM32开发中的C语言核心知识点解析作为一名嵌入式开发者&#xff0c;我经常遇到初学者询问如何快速掌握STM32开发所需的C语言知识。今天我就结合自己多年的实战经验&#xff0c;整理出一份STM32开发中最关键的C语言知识点指南。这些内容不仅适合初学者系统学习&#xff0c;也…...

Redis 全量主从同步和增量主从同步详解

Redis 主从同步:全量同步与增量同步详解 Redis 主从复制是实现高可用、读写分离和数据冗余的基础。复制过程分为全量同步和增量同步两种模式。理解它们的工作原理、触发条件及配置优化,是系统分析师设计高可用 Redis 架构的关键。 📌 一、主从复制基本概念 主节点(Master…...

5分钟搞定GLM-4.7-Flash:Web界面+API调用,小白也能轻松上手

5分钟搞定GLM-4.7-Flash&#xff1a;Web界面API调用&#xff0c;小白也能轻松上手 1. 前言&#xff1a;为什么选择GLM-4.7-Flash 如果你正在寻找一个强大且易于使用的中文大语言模型&#xff0c;GLM-4.7-Flash绝对值得考虑。作为智谱AI最新推出的开源模型&#xff0c;它采用了…...