当前位置：首页 > news >正文

yolov8 bytetrack onnx模型推理

news 2025/12/30 22:45:12

原文：yolov8 bytetrack onnx模型推理 - 知乎 (zhihu.com)

一、pt模型转onnx

from ultralytics import YOLO# Load a model
model = YOLO('weights/yolov8s.pt')  # load an official model
# model = YOLO('path/to/best.pt')  # load a custom trained# Export the model
model.export(format='onnx')

二、模型预测

import onnxruntime as rt
import numpy as np
import cv2
import matplotlib.pyplot as pltfrom utils.visualize import plot_tracking
from tracker.byte_tracker import BYTETracker
from tracking_utils.timer import TimerCLASSES = ['person', 'bicycle', 'car', 'motorcycle', 'airplane', 'bus', 'train', 'truck', 'boat', 'traffic light','fire hydrant', 'stop sign', 'parking meter', 'bench', 'bird', 'cat', 'dog', 'horse', 'sheep', 'cow','elephant', 'bear', 'zebra', 'giraffe', 'backpack', 'umbrella', 'handbag', 'tie', 'suitcase', 'frisbee','skis', 'snowboard', 'sports ball', 'kite', 'baseball bat', 'baseball glove', 'skateboard', 'surfboard','tennis racket', 'bottle', 'wine glass', 'cup', 'fork', 'knife', 'spoon', 'bowl', 'banana', 'apple','sandwich', 'orange', 'broccoli', 'carrot', 'hot dog', 'pizza', 'donut', 'cake', 'chair', 'couch','potted plant', 'bed', 'dining table', 'toilet', 'tv', 'laptop', 'mouse', 'remote', 'keyboard', 'cell phone','microwave', 'oven', 'toaster', 'sink', 'refrigerator', 'book', 'clock', 'vase', 'scissors', 'teddy bear','hair drier', 'toothbrush']def nms(pred, conf_thres, iou_thres):conf = pred[..., 4] > conf_thresbox = pred[conf == True]cls_conf = box[..., 5:]cls = []for i in range(len(cls_conf)):cls.append(int(np.argmax(cls_conf[i])))total_cls = list(set(cls))output_box = []for i in range(len(total_cls)):clss = total_cls[i]cls_box = []for j in range(len(cls)):if cls[j] == clss:box[j][5] = clsscls_box.append(box[j][:6])cls_box = np.array(cls_box)box_conf = cls_box[..., 4]box_conf_sort = np.argsort(box_conf)max_conf_box = cls_box[box_conf_sort[len(box_conf) - 1]]output_box.append(max_conf_box)cls_box = np.delete(cls_box, 0, 0)while len(cls_box) > 0:max_conf_box = output_box[len(output_box) - 1]del_index = []for j in range(len(cls_box)):current_box = cls_box[j]interArea = getInter(max_conf_box, current_box)iou = getIou(max_conf_box, current_box, interArea)if iou > iou_thres:del_index.append(j)cls_box = np.delete(cls_box, del_index, 0)if len(cls_box) > 0:output_box.append(cls_box[0])cls_box = np.delete(cls_box, 0, 0)return output_boxdef getIou(box1, box2, inter_area):box1_area = box1[2] * box1[3]box2_area = box2[2] * box2[3]union = box1_area + box2_area - inter_areaiou = inter_area / unionreturn ioudef getInter(box1, box2):box1_x1, box1_y1, box1_x2, box1_y2 = box1[0] - box1[2] / 2, box1[1] - box1[3] / 2, \box1[0] + box1[2] / 2, box1[1] + box1[3] / 2box2_x1, box2_y1, box2_x2, box2_y2 = box2[0] - box2[2] / 2, box2[1] - box1[3] / 2, \box2[0] + box2[2] / 2, box2[1] + box2[3] / 2if box1_x1 > box2_x2 or box1_x2 < box2_x1:return 0if box1_y1 > box2_y2 or box1_y2 < box2_y1:return 0x_list = [box1_x1, box1_x2, box2_x1, box2_x2]x_list = np.sort(x_list)x_inter = x_list[2] - x_list[1]y_list = [box1_y1, box1_y2, box2_y1, box2_y2]y_list = np.sort(y_list)y_inter = y_list[2] - y_list[1]inter = x_inter * y_interreturn interdef draw(img, xscale, yscale, pred):# img_ = img.copy()if len(pred):for detect in pred:box = [int((detect[0] - detect[2] / 2) * xscale), int((detect[1] - detect[3] / 2) * yscale),int((detect[0] + detect[2] / 2) * xscale), int((detect[1] + detect[3] / 2) * yscale)]cv2.rectangle(img, (box[0], box[1]), (box[2], box[3]), (0, 255, 0), 1)font = cv2.FONT_HERSHEY_SCRIPT_SIMPLEXcv2.putText(img, 'class: {}, conf: {:.2f}'.format( CLASSES[int(detect[5])], detect[4]), (box[0], box[1]),font, 0.7, (255, 0, 0), 2)return imgif __name__ == '__main__':height, width = 640, 640cap = cv2.VideoCapture('../../demo/test_person.mp4')while True:# t0 = time.time()# if frame_id % 20 == 0:#     logger.info('Processing frame {} ({:.2f} fps)'.format(frame_id, 1. / max(1e-5, timer.average_time)))ret_val, frame = cap.read()if ret_val:# img0 = cv2.imread('test.jpg')img0 = framex_scale = img0.shape[1] / widthy_scale = img0.shape[0] / heightimg = img0 / 255.img = cv2.resize(img, (width, height))img = np.transpose(img, (2, 0, 1))data = np.expand_dims(img, axis=0)print(data.shape)sess = rt.InferenceSession('weights/yolov8n.onnx')input_name = sess.get_inputs()[0].namelabel_name = sess.get_outputs()[0].nameprint(input_name, label_name)# print(sess.run([label_name], {input_name: data.astype(np.float32)}))pred = sess.run([label_name], {input_name: data.astype(np.float32)})[0]# print(pred.shape)  # (1, 84, 8400)pred = np.squeeze(pred)pred = np.transpose(pred, (1, 0))pred_class = pred[..., 4:]# print(pred_class)pred_conf = np.max(pred_class, axis=-1)pred = np.insert(pred, 4, pred_conf, axis=-1)result = nms(pred, 0.3, 0.45)# print(result[0].shape)# bboxes = []# scores = []## # print(result)## for detect in result:#     box = [int((detect[0] - detect[2] / 2) * x_scale), int((detect[1] - detect[3] / 2) * y_scale),#            int((detect[0] + detect[2] / 2) * x_scale), int((detect[1] + detect[3] / 2) * y_scale)]##     bboxes.append(box)#     score = detect[4]#     scores.append(score)# print(result)ret_img = draw(img0, x_scale, y_scale, result)# ret_img = ret_img[:, :, ::-1]# plt.imshow(ret_img)# plt.show()cv2.imshow("frame", ret_img)# vid_writer.write(online_im)ch = cv2.waitKey(1)if ch == 27 or ch == ord("q") or ch == ord("Q"):break# online_targets = tracker.update(bboxes, scores)# online_tlwhs = []# online_ids = []# online_scores = []# for i, t in enumerate(online_targets):#     # tlwh = t.tlwh#     tlwh = t.tlwh_yolox#     tid = t.track_id#     # vertical = tlwh[2] / tlwh[3] > args.aspect_ratio_thresh#     # if tlwh[2] * tlwh[3] > args.min_box_area and not vertical:#     if tlwh[2] * tlwh[3] > args.min_box_area:#         online_tlwhs.append(tlwh)#         online_ids.append(tid)#         online_scores.append(t.score)#         results.append(#             f"{frame_id},{tid},{tlwh[0]:.2f},{tlwh[1]:.2f},{tlwh[2]:.2f},{tlwh[3]:.2f},{t.score:.2f},-1,-1,-1\n"#         )# t1 = time.time()# time_ = (t1 - t0) * 1000## online_im = plot_tracking(frame, online_tlwhs, online_ids, frame_id=frame_id + 1,#                           fps=1000. / time_)## cv2.imshow("frame", online_im)## # vid_writer.write(online_im)# ch = cv2.waitKey(1)# if ch == 27 or ch == ord("q") or ch == ord("Q"):#     breakelse:break# frame_id += 1

视频见原文。

yolov8 bytetrack onnx模型推理

原文：yolov8 bytetrack onnx模型推理 - 知乎 (zhihu.com) 一、pt模型转onnx from ultralytics import YOLO# Load a model model YOLO(weights/yolov8s.pt) # load an official model # model YOLO(path/to/best.pt) # load a custom trained# Export the mod…...

编程日记 2024/8/6 9:09:03

ImageNet数据集和CIFAR-10数据集

一、为什么需要大量数据集人工智能其实就是大数据的时代，无论是目标检测、图像分类、还是现在植入我们生活的推荐系统，“喂入”神经网络的数据越多，则识别效果越好、分类越准确。因此开源大型数据集的研究团队为人工智能的发展做了大量贡献…...

编程日记 2024/8/6 9:07:01

Go语言编程大全，web微服务数据库十大专题精讲

本课程主要从数据结构、Go Module 依赖管理、IO编程、数据库编程、消息队列、加密技术与网络安全、爬虫与反爬虫、web开发、微服务通用技术、Kitex框架等方面讲解~ 链接：https://pan.quark.cn/s/d65337a0e60d...

编程日记 2024/8/6 9:05:59

【LabVIEW学习篇 - 13】：队列

文章目录队列队列队列通常情况下是一种先入先出（FIFO：First in First out）的数据结构，常用作数据缓存，通过队列结构可以保证数据有序的传递，避免竞争和冲突。案例：利用队列，模…...

编程日记 2024/8/6 9:04:57

大语言模型综述泛读之Large Language Models: A Survey

摘要这篇文章主要回顾了一些最突出的LLMs（GPT, LLaMA, PaLM）并讨论了它们的特点、贡献和局限性，就如何构建增强LLMs做了一个技术概述，然后调研了为LLM训练、微调和评估而准备的N多种流行数据集，审查了使用的LLM评价指标，在一组有代表性的基准上比较了几个流行的LLMs；最…...

编程日记 2024/8/6 9:01:54

奇偶函数的性质及运算

目录定义注意特征运算拓展定义设函数f(x)的定义域D； 如果对于函数定义域D内的任意一个x，都有f(-x)－f（x），那么函数f（x）就叫做奇函数。如果对于函数定义域D内的任意一个x…...

编程日记 2024/8/6 8:59:51

代码随想录 day 32 动态规划

第九章动态规划part01 今天正式开始动态规划！ 理论基础无论大家之前对动态规划学到什么程度，一定要先看我讲的动态规划理论基础。如果没做过动态规划的题目，看我讲的理论基础，会有感觉是不是简单题想复杂了？ …...

编程日记 2024/8/6 8:58:50

支持目标检测的框架有哪些

目标检测是计算机视觉领域的一个重要任务，许多深度学习框架都提供了对目标检测的支持。以下是一些广泛使用的支持目标检测的深度学习框架： 1. TensorFlow TensorFlow 是一个广泛使用的开源深度学习框架，由Google开发。它提供了TensorFlow O…...

编程日记 2024/8/6 8:57:49

原神自定义倒计时

<!DOCTYPE html> <html lang"zh-CN"><head><meta charset"UTF-8"><title>原神倒计时</title><style>* {margin: 0;padding: 0;box-sizing: border-box;user-select: none;body {background: #0b1b2c;}}header {…...

编程日记 2024/8/6 8:53:44

top命令实时监测Linux进程

top命令可以动态实时显示Linux进程信息，方便观察频繁换进换出的内存的进程变化。 top命令执行示例如下： 其中，第一行表示系统当前时间、系统的运行时间、登录的用户数目、系统的平均负载（最近1分钟，最近5分钟&#xff…...

编程日记 2024/8/6 8:52:44

Rust 所有权

所有权 Rust的核心特性就是所有权所有程序在运行时都必须管理他们使用计算机内存的方式有些语言有垃圾收集机制，在程序运行时，他们会不断地寻找不再使用的内存在其他语言中，程序员必须显式的分配和释放内存 Rust采用了第三种方式&#xff1…...

编程日记 2024/8/6 8:51:42

Python面试题：结合Python技术，如何使用PyTorch进行动态计算图构建

PyTorch 是一个流行的深度学习框架，它通过动态计算图（Dynamic Computation Graphs）来支持自动微分（Autograd）。动态计算图的特点是每次前向传播时都会构建新的计算图，这使得它非常灵活，适合处理…...

编程日记 2024/8/6 8:50:41

基于RHEL7的服务器批量安装

目录一、项目要求二、实验环境三、生成kickstart自动化安装脚本四、搭建dhcp服务并测试kickstart脚本五、搭建pxe网络安装环境实现服务器自动部署编辑六、测试一、项目要求 1.使用kickstart编写自动化安装脚本 2.搭建dhcp服务并测试kickstart脚本 3.搭建px…...

编程日记 2024/8/6 8:48:40

C. Light Switches

文章目录 C. Light Switches题意：解题思路：解题代码： C. Light Switches 原题链接题意： 房间的灯最初均为关闭状态，安装芯片后，它会每隔k分钟改变一次房间的灯光状态，即会打开灯光k分钟&…...

编程日记 2024/8/6 8:46:37

LabVIEW机器人神经网络运动控制系统

LabVIEW机器人神经网络运动控制系统介绍了如何使用LabVIEW软件和中枢模式发生器(CPG)神经网络实现对舵机驱动爬壁机器人的精准运动控制。通过结合仿生控制理念与高级程序设计，本项目旨在开发一种能自动完成复杂墙面移动任务的机器人。项目背景现代机器人技术中…...

编程日记 2024/8/6 8:44:35

Qt WebEngine播放DRM音视频

Qt WebEngine播放DRM受保护视频，前提是Qt WebEngine开启音视频编码器，能够支持网页上普通视频的播放。开启音视频编码器需要自己编译源码，这里不做介绍。什么是DRM音视频 DRM视频是指数字版权管理（Digital Rights Management&a…...

编程日记 2024/8/6 8:43:35

渗透小游戏，各个关卡的渗透实例

Less-1 首先，可以看见该界面，该关卡主要是SQL注入，由于对用户的输入没有做过滤，使查询语句进入到了数据库中，查询到了本不应该查询到的数据首先，如果想要进入内部，就要绕过，首先是用…...

编程日记 2024/8/6 8:40:32

SpringBoot集成阿里百炼大模型（初始demo）原子的学习日记Day01

文章目录概要下一章SpringBoot集成阿里百炼大模型（多轮对话） 原子的学习日记Day02 整体架构流程技术名词解释集成步骤1，选择大模型以及获取自己的api-key（前面还有一步开通服务就没有展示啦！）2&#xff0c…...

编程日记 2024/8/6 8:39:31

高级java每日一道面试题-2024年8月06日-web篇-cookie,session,token有什么区别?

如果有遗漏,评论区告诉我进行补充面试官: cookie,session,token有什么区别? 我回答: 在Web开发中，cookie、session和token是三种常见的用于用户身份验证和会话管理的技术。它们各自有不同的用途和优缺点，下面将详细解释： 1. Cookie 定…...

编程日记 2024/8/6 8:37:29

Python 图文：小白也能轻松生成精美 PDF 报告！

摘要: 还在为枯燥的数据报表发愁吗？想让你的 Python 项目报告瞬间高大上？本文将带你学习如何使用 Python 生成图文并茂的 PDF 文件，从此告别单调，让你的数据“活”起来！ 一、引言想象一下，你正在为公司…...

编程日记 2024/8/6 8:36:28

Python爬虫实战：研究MechanicalSoup库相关技术

一、MechanicalSoup 库概述 1.1 库简介 MechanicalSoup 是一个 Python 库，专为自动化交互网站而设计。它结合了 requests 的 HTTP 请求能力和 BeautifulSoup 的 HTML 解析能力，提供了直观的 API，让我们可以像人类用户一样浏览网页、填写表单和提交请求。 1.2 主要功能特点…...

编程新知 2025/10/10 18:13:55

未来机器人的大脑：如何用神经网络模拟器实现更智能的决策？

编辑：陈萍萍的公主一点人工一点智能未来机器人的大脑：如何用神经网络模拟器实现更智能的决策？RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战，在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…...

编程新知 2025/12/30 8:16:26

大话软工笔记—需求分析概述

需求分析，就是要对需求调研收集到的资料信息逐个地进行拆分、研究，从大量的不确定“需求”中确定出哪些需求最终要转换为确定的“功能需求”。需求分析的作用非常重要，后续设计的依据主要来自于需求分析的成果，包括: 项目的目的…...

编程新知 2025/12/23 9:42:29

Admin.Net中的消息通信SignalR解释

定义集线器接口 IOnlineUserHub public interface IOnlineUserHub {/// 在线用户列表Task OnlineUserList(OnlineUserList context);/// 强制下线Task ForceOffline(object context);/// 发布站内消息Task PublicNotice(SysNotice context);/// 接收消息Task ReceiveMessage(…...

编程新知 2025/9/10 5:36:56

Python实现prophet 理论及参数优化

文章目录 Prophet理论及模型参数介绍Python代码完整实现prophet 添加外部数据进行模型优化之前初步学习prophet的时候，写过一篇简单实现，后期随着对该模型的深入研究，本次记录涉及到prophet 的公式以及参数调优，从公式可以更直观…...

编程新知 2025/12/27 15:22:46

基础测试工具使用经验

背景 vtune，perf, nsight system等基础测试工具，都是用过的，但是没有记录，都逐渐忘了。所以写这篇博客总结记录一下，只要以后发现新的用法，就记得来编辑补充一下 perf 比较基础的用法： 先改这…...

编程新知 2025/11/22 7:38:58

ElasticSearch搜索引擎之倒排索引及其底层算法

文章目录一、搜索引擎1、什么是搜索引擎？2、搜索引擎的分类3、常用的搜索引擎4、搜索引擎的特点二、倒排索引1、简介2、为什么倒排索引不用B+树1.创建时间长，文件大。2.其次，树深，IO次数可怕。3.索引可能会失效。4.精准度差。三. 倒排索引四、算法1、Term Index的算法2、 …...

编程新知 2025/12/15 22:07:34

让AI看见世界：MCP协议与服务器的工作原理

让AI看见世界：MCP协议与服务器的工作原理 MCP（Model Context Protocol）是一种创新的通信协议，旨在让大型语言模型能够安全、高效地与外部资源进行交互。在AI技术快速发展的今天，MCP正成为连接AI与现实世界的重要桥梁。…...

编程新知 2025/12/12 7:41:41

多种风格导航菜单 HTML 实现（附源码）

下面我将为您展示 6 种不同风格的导航菜单实现，每种都包含完整 HTML、CSS 和 JavaScript 代码。 1. 简约水平导航栏 <!DOCTYPE html> <html lang"zh-CN"> <head><meta charset"UTF-8"><meta name"viewport&qu…...

编程新知 2025/12/17 14:12:41

Fabric V2.5 通用溯源系统——增加图片上传与下载功能

fabric-trace项目在发布一年后，部署量已突破1000次，为支持更多场景，现新增支持图片信息上链，本文对图片上传、下载功能代码进行梳理，包含智能合约、后端、前端部分。一、智能合约修改为了增加图片信息上链溯源，需要对底层数据结构进行修改，在此对智能合约中的农产品数…...

编程新知 2025/9/27 12:03:43

相关文章：