当前位置：首页 > news >正文

YOLOv11实时目标检测 | 摄像头视频图片文件检测

news 2026/2/9 18:40:50

在上篇文章中YOLO11环境部署 || 从检测到训练https://blog.csdn.net/2301_79442295/article/details/145414103#comments_36164492，我们详细探讨了YOLO11的部署以及推理训练，但是评论区的观众老爷就说了：“博主博主，你这个只能推理只能推理图片，还要将图片放在文件夹下，有没有更简单方便的推理方法？” 有的兄弟，有的，像这样更简单的方法还有10086个，下面我挑一个用于流式视频文件检测。

摄像头视频图片文件检测

视频文件
图片文件
效果如下
- 视频与摄像头
- 图片文件

视频文件

对于视频或者摄像头等输入，可以将以下代码复制到predict_camera.py运行检测：

from ultralytics import YOLO
import cv2
import torch
from pathlib import Path
import sys
import os
import tkinter as tk
from tkinter import filedialogdef choose_input_source():print("请选择输入来源：")print("[1] 摄像头")print("[2] 视频文件")choice = input("请输入数字 (1 或 2): ").strip()if choice == "1":return 0, "摄像头"elif choice == "2":#选择视频文件root = tk.Tk()root.withdraw()video_path = filedialog.askopenfilename(title="选择视频文件",filetypes=[("视频文件", "*.mp4;*.avi;*.mkv;*.mov"), ("所有文件", "*.*")])if not video_path:print("未选择视频文件，程序退出")sys.exit(0)return video_path, video_pathelse:print("无效的输入，程序退出")sys.exit(1)def detect_media():# ======================= 配置区 =======================# 模型配置model_config = {'model_path': r'E:\git-project\YOLOV11\ultralytics-main\weights\yolo11n.pt',  # 本地模型路径，注意配置！！！！！！！！！！！！！！！！！！！！！！！'download_url': 'https://github.com/ultralytics/assets/releases/download/v8.3.0/yolo11n.pt'  # 如果没有模型文件下载URL}# 推理参数predict_config = {'conf_thres': 0.25,     # 置信度阈值'iou_thres': 0.45,      # IoU阈值'imgsz': 640,           # 输入分辨率'line_width': 2,        # 检测框线宽'device': 'cuda:0' if torch.cuda.is_available() else 'cpu'  # 自动选择设备}# ====================== 配置结束 ======================try:# 选择输入来源input_source, source_desc = choose_input_source()# 初始化视频源cap = cv2.VideoCapture(input_source)if isinstance(input_source, int):# 如果使用摄像头，设置分辨率cap.set(cv2.CAP_PROP_FRAME_WIDTH, 720)cap.set(cv2.CAP_PROP_FRAME_HEIGHT, 720)if not cap.isOpened():raise IOError(f"无法打开视频源 ({source_desc})，请检查设备连接或文件路径。")# 询问是否保存推理出的视频文件save_video = Falsevideo_writer = Noneoutput_path = Noneanswer = input("是否保存推理出的视频文件？(y/n): ").strip().lower()if answer == "y":save_video = True# 创建保存目录：代码文件所在目录下的 predict 文件夹save_dir = os.path.join(os.getcwd(), "predict")os.makedirs(save_dir, exist_ok=True)# 获取视频属性（宽度、高度、fps）frame_width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))frame_height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))fps = cap.get(cv2.CAP_PROP_FPS)if fps == 0 or fps is None:fps = 25  # 如果无法获取fps，设定默认值# 构造输出视频文件路径output_path = os.path.join(save_dir, "output_inference.mp4")fourcc = cv2.VideoWriter_fourcc(*"mp4v")video_writer = cv2.VideoWriter(output_path, fourcc, fps, (frame_width, frame_height))print(f"推理视频将保存至: {output_path}")# 加载模型（带异常捕获）if not Path(model_config['model_path']).exists():if model_config['download_url']:print("开始下载模型...")YOLO(model_config['download_url']).download(model_config['model_path'])else:raise FileNotFoundError(f"模型文件不存在: {model_config['model_path']}")# 初始化模型model = YOLO(model_config['model_path']).to(predict_config['device'])print(f"✅ 模型加载成功 | 设备: {predict_config['device'].upper()}")print(f"输入来源: {source_desc}")# 实时检测循环while True:ret, frame = cap.read()if not ret:print("视频流结束或中断")break# 执行推理results = model.predict(source=frame,stream=True,  # 流式推理verbose=False,conf=predict_config['conf_thres'],iou=predict_config['iou_thres'],imgsz=predict_config['imgsz'],device=predict_config['device'])# 遍历生成器获取结果（取第一个结果）for result in results:annotated_frame = result.plot(line_width=predict_config['line_width'])break# 摄像头模式下显示FPSif isinstance(input_source, int):fps = cap.get(cv2.CAP_PROP_FPS)cv2.putText(annotated_frame, f'FPS: {fps:.2f}', (10, 30),cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2)# 显示实时画面cv2.imshow('YOLO Real-time Detection', annotated_frame)# 如保存视频，写入视频文件if save_video and video_writer is not None:video_writer.write(annotated_frame)# 按键退出qif cv2.waitKey(1) & 0xFF == ord('q'):break# 释放资源cap.release()if video_writer is not None:video_writer.release()cv2.destroyAllWindows()print("✅ 检测结束")if save_video and output_path is not None:print(f"推理结果视频已保存至: {output_path}")except Exception as e:print(f"\n❌ 发生错误: {str(e)}")print("问题排查建议：")print("1. 检查视频源是否正确连接或文件路径是否正确")print("2. 确认模型文件路径正确")print("3. 检查CUDA是否可用（如需GPU加速）")print("4. 尝试降低分辨率设置")if __name__ == "__main__":detect_media()

需要更改的参数：
1.model_path：模型文件位置，默认使用的是yolo11n.pt
2.predict_config下置信度等
3.分辨率等
需要注意的是退出按q，点击视频框的×是无法退出的，当然也可以使用Ctrl+C方式退出，退出不会造成摄像头不保存推理文件，文件保存在代码所在文件夹下predict文件夹内。

图片文件

对于图片文件，将图片放在picture文件夹下太麻烦，同样采用选择图片进行检测，同时可以框选多个图片，可以将以下代码复制到predict_images.py运行检测：

from ultralytics import YOLO
import cv2
import torch
from pathlib import Path
import os
import tkinter as tk
from tkinter import filedialogdef choose_input_files():root = tk.Tk()root.withdraw()  # 隐藏主窗口image_paths = filedialog.askopenfilenames(title="选择图片文件",filetypes=[("图片文件", "*.jpg;*.jpeg;*.png;*.bmp;*.tiff;*.gif"), ("所有文件", "*.*")])if not image_paths:print("未选择任何图片文件，程序退出")exit(0)return image_pathsdef detect_images():# ======================= 配置区 =======================# 模型配置model_config = {'model_path': r'E:\git-project\YOLOV11\ultralytics-main\weights\yolo11n.pt',  # 本地模型路径'download_url': 'https://github.com/ultralytics/assets/releases/download/v8.3.0/yolo11n.pt'  # 如果没有模型文件可在此处添加下载URL}# 推理参数predict_config = {'conf_thres': 0.25,     # 置信度阈值'iou_thres': 0.45,      # IoU阈值'imgsz': 640,           # 输入分辨率'line_width': 2,        # 检测框线宽'device': 'cuda:0' if torch.cuda.is_available() else 'cpu'  # 自动选择设备}# ====================== 配置结束 ======================try:# 选择图片文件image_paths = choose_input_files()# 创建保存目录：代码文件所在目录下的 predict 文件夹save_dir = os.path.join(os.getcwd(), "predict", "exp")os.makedirs(save_dir, exist_ok=True)if os.path.exists(save_dir):i = 1while os.path.exists(f"{save_dir}{i}"):i += 1save_dir = f"{save_dir}{i}"os.makedirs(save_dir)# 加载模型（带异常捕获）if not Path(model_config['model_path']).exists():if model_config['download_url']:print("开始下载模型...")YOLO(model_config['download_url']).download(model_config['model_path'])else:raise FileNotFoundError(f"模型文件不存在: {model_config['model_path']}")# 初始化模型model = YOLO(model_config['model_path']).to(predict_config['device'])print(f"✅ 模型加载成功 | 设备: {predict_config['device'].upper()}")# 处理每个选定的图片文件for image_path in image_paths:print(f"正在处理图片: {image_path}")img = cv2.imread(image_path)if img is None:print(f"无法读取图片: {image_path}")continue# 执行推理results = model.predict(source=img,  # 输入图片stream=False,  # 禁用流模式verbose=False,conf=predict_config['conf_thres'],iou=predict_config['iou_thres'],imgsz=predict_config['imgsz'],device=predict_config['device'])# 解析并绘制结果（取第一个结果）for result in results:annotated_img = result.plot(line_width=predict_config['line_width'])break# 保存推理结果图像到文件output_image_path = os.path.join(save_dir, f"output_{os.path.basename(image_path)}")cv2.imwrite(output_image_path, annotated_img)print(f"推理结果已保存至: {output_image_path}")# 显示实时画面，取消下面注释就会边检测边弹出结果# cv2.imshow('YOLO Real-time Detection', annotated_img)# 等待按键退出当前图片查看if cv2.waitKey(0) & 0xFF == ord('q') :breakcv2.destroyAllWindows()print("✅ 检测结束")except Exception as e:print(f"\n❌ 发生错误: {str(e)}")print("问题排查建议：")print("1. 检查图片文件路径是否正确")print("2. 确认模型文件路径正确")print("3. 检查CUDA是否可用（如需GPU加速）")print("4. 尝试降低分辨率设置")if __name__ == "__main__":detect_images()

同样需要更改模型文件地址、置信度等，图片文件保存在代码文件夹的predict文件夹下exp中，如果想要检测时就查看图片，可以将这段代码取消注释：

            # 显示实时画面cv2.imshow('YOLO Real-time Detection', annotated_img)

效果如下

视频与摄像头

在这里插入图片描述

图片文件

在这里插入图片描述

所有推理出的文件都会在代码同级的predict目录下，按q退出。

YOLOv11实时目标检测 | 摄像头视频图片文件检测

在上篇文章中YOLO11环境部署 || 从检测到训练https://blog.csdn.net/2301_79442295/article/details/145414103#comments_36164492，我们详细探讨了YOLO11的部署以及推理训练，但是评论区的观众老爷就说了：“博主博主，你这个只能推理…...

编程日记 2025/2/6 11:00:54

Node.js学习指南

一、模块化规范 nodejs使用的模块化规范叫做 common.js 规范: 每一个模块都有独立的作用域代码在各自模块中执行不会造成全局污染每一个模块都是一个独立的文件（module对象） 模块可以被多次加载（module.exports 属性） 但是仅…...

编程日记 2025/2/6 10:58:52

2.5学习总结

今天看了二叉树，看的一脸懵，写了两道题 P4913：二叉树深度 #include <stdio.h> #include <stdlib.h> struct hly {int left;int right; }tree[1000005]; int hulingyun(int x) {if(x0)return 0;return 1max(hulingyun(tree[x].le…...

编程日记 2025/2/6 10:55:48

java进阶文章链接

java 泛型：java 泛型详解-绝对是对泛型方法讲解最详细的，没有之一 Java 泛型，你了解类型擦除吗？ java 注解：深入理解Java注解类型秒懂，Java 注解 （Annotation）你可以这样学 jav…...

编程日记 2025/2/6 10:52:45

vue2+vue3 HMCXY基础入门

vue2vue3 HMCXY基础入门一、Vue2.x技术精讲1.Vue快速上手（1）Vue概念（2）创建实例（3）插值表达式（4）响应式特性（5）开发者工具 2.Vue指令二、Vue3.x技术精讲一、…...

编程日记 2025/2/6 10:48:41

一次线程数超限导致的hive写入hbase作业失败分析

1.集群配置操作系统：SuSe操作系统集群节点：100台相同配置的服务器单台：核心112Core，内存396G 2.问题现象现象1：跑单个入库任务报错，批量提交任务后出现OOM异常执行12个hivesql,将数据写入hbase.hbase入库有近一半的任务报错。每次报错的任务不是同一个，hivesql…...

编程日记 2025/2/6 10:47:38

ip属地是手机号还是手机位置？一文理清

在数字化和网络化的今天，IP属地这一概念逐渐成为了人们关注的焦点。特别是在社交媒体和在线平台上，IP属地的显示往往让人联想到用户的地理位置。然而，关于IP属地到底与手机号还是手机位置有关，却存在着不少误解和混淆。本文将深入…...

编程日记 2025/2/6 10:45:36

查看设备uuid

在大多数操作系统中，可以通过不同的方式来查看设备的 UUID（Universally Unique Identifier）。以下是一些常见的方法： 在Linux系统中，可以使用命令行工具blkid或lsblk来查看设备的 UUID。例如，执行以下命令…...

编程日记 2025/2/6 10:43:34

C_C++输入输出（下）

C_C输入输出（下） 用两次循环的问题： 1.一次循环决定打印几行，一次循环决定打印几项 cin是>> cout是<< 字典序是根据字符在字母表中的顺序来比较和排列字符串的（字典序的大小就是字符串的大小）…...

编程日记 2025/2/6 10:41:32

All in one 的 AI tool Chain “Halomate”

这不算广告啊，就是真好用，虽然是我哥们儿的产品比如你定了个gpt的plus 订阅，你发现好像有挺多功能 1- chat，这个自不必说，必须的功能 2- 高级语音现在变成学英语的了，实时视频也就是我过年给姑婶介绍是…...

编程日记 2025/2/6 10:40:31

crewai框架第三方API使用官方RAG工具(pdf，csv，json)

最近在研究调用官方的工具，但官方文档的说明是在是太少了，后来在一个视频里看到了如何配置，记录一下以PDF RAG Search工具举例，官方文档对于自定义模型的说明如下： 默认情况下，该工具使用 OpenAI 进行嵌…...

编程日记 2025/2/6 10:38:28

脉冲信号傅里叶变换与频域分析：从计算到理解

摘要本文聚焦于脉冲信号的傅里叶变换，详细推导了矩形脉冲信号和单边指数信号的傅里叶变换过程，深入解释了傅里叶变换结果 F ( ω ) F(\omega) F(ω) 的内涵，包括其定义、物理意义、包含的信息以及在实际应用中的重要性。旨在帮助读者全面掌…...

编程日记 2025/2/6 10:37:27

6.【BUUCTF】[SUCTF 2019]CheckIn

打开题目页面如下看样子是一道有关文件上传的题上传一句话木马显示：非法后缀！ 看来.php后缀被过滤了上传一张带有木马的照片在文件地址处输入cmd 输入以下代码执行 copy 1.jpg/b4.php/a 5.jpg 最后一行有一句话木马上传带有木马的图片但其实…...

编程日记 2025/2/6 10:36:25

基于springboot的体质测试数据分析及可视化设计

作者：学姐开发技术：SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等文末获取“源码数据库万字文档PPT”，支持远程部署调试、运行安装。项目包含： 完整源码数据库功能演示视频万字文档PPT 项目编码&#xff1…...

编程日记 2025/2/6 10:33:22

孟加拉国_行政边界省市边界arcgis数据shp格式wgs84坐标

这篇内容将深入探讨孟加拉国的行政边界省市边界数据，该数据是以arcgis的shp格式提供的，并采用WGS84坐标系统。ArcGIS是一款广泛应用于地理信息系统（GIS）的专业软件，它允许用户处理、分析和展示地理空间数据。在GIS领域…...

编程日记 2025/2/6 10:30:19

目录内参外参转换可视化相机pose colmap形式的相机内参外参内参外参转换 def visualize_cameras(cameras, images):fig plt.figure()ax fig.add_subplot(111, projection3d)for image_id, image_data in images.items():qvec image_data[qvec]tvec image_data[tvec]#…...

编程日记 2025/2/6 10:29:18

数据结构树2

文章目录前言一，二叉搜索树的高度二，广度优先VS深度优先三，广度优先的代码实现四，深度优先代码实现五，判断是否为二叉搜索树六，删除一个节点七，二叉收索树的中序后续节点总结 …...

编程日记 2025/2/6 10:26:14

GB/T 44721-2024 与 L3 自动驾驶：自动驾驶新时代的基石与指引

1.前言在智能网联汽车飞速发展的当下，自动驾驶技术成为了行业变革的核心驱动力。从最初的辅助驾驶功能，到如今不断迈向高度自动化的征程，每一步都凝聚着技术的创新与突破。而在这一进程中，标准的制定与完善对于自动驾驶技术的规…...

编程日记 2025/2/6 10:24:09

AURIX TC275学习笔记3 官方例程 (UART LED WDT)

文章目录参考资料1. ASCLIN_UART_12. GPIO_LED_Button_13. WDT (Watch Dog Timer) 参考资料 AURIX TC275学习笔记1 资料收集Getting Started with AURIX™ Development Studio 官方帮助文档happy hacking for TC275! 硬件平台使用AURIX™ TC275 Lite 套件，按照参…...

编程日记 2025/2/6 10:22:06

Vim的基础命令

移动光标 H(左) J(上) K(下) L(右) $ 表示移动到光标所在行的行尾， ^ 表示移动到光标所在行的行首的第一个非空白字符。 0 表示移动到光标所在行的行首。 W 光标向前跳转一个单词 w光标向前跳转一个单词 B光标向后跳转一个单词 b光标向后跳转一个单词 G 移动光标到…...

编程日记 2025/2/6 10:18:01

（转）什么是DockerCompose?它有什么作用？

一、什么是DockerCompose? DockerCompose可以基于Compose文件帮我们快速的部署分布式应用，而无需手动一个个创建和运行容器。 Compose文件是一个文本文件，通过指令定义集群中的每个容器如何运行。 DockerCompose就是把DockerFile转换成指令去运行。 …...

编程新知 2026/1/31 22:59:12

高防服务器能够抵御哪些网络攻击呢？

高防服务器作为一种有着高度防御能力的服务器，可以帮助网站应对分布式拒绝服务攻击，有效识别和清理一些恶意的网络流量，为用户提供安全且稳定的网络环境，那么，高防服务器一般都可以抵御哪些网络攻击呢？下面…...

编程新知 2025/9/3 19:14:38

JVM 内存结构详解

内存结构运行时数据区： Java虚拟机在运行Java程序过程中管理的内存区域。程序计数器： 线程私有，程序控制流的指示器，分支、循环、跳转、异常处理、线程恢复等基础功能都依赖这个计数器完成。每个线程都有一个程序计数…...

编程新知 2026/2/6 3:24:58

人工智能（大型语言模型 LLMs）对不同学科的影响以及由此产生的新学习方式

今天是关于AI如何在教学中增强学生的学习体验，我把重要信息标红了。人文学科的价值被低估了 ⬇️ 转型与必要性人工智能正在深刻地改变教育，这并非炒作，而是已经发生的巨大变革。教育机构和教育者不能忽视它，试图简单地禁止学生使…...

编程新知 2026/2/9 10:58:49

Go 并发编程基础：通道（Channel）的使用

在 Go 中，Channel 是 Goroutine 之间通信的核心机制。它提供了一个线程安全的通信方式，用于在多个 Goroutine 之间传递数据，从而实现高效的并发编程。本章将介绍 Channel 的基本概念、用法、缓冲、关闭机制以及 select 的使用。一、Channel…...

编程新知 2025/12/4 8:54:35

MySQL JOIN 表过多的优化思路

当 MySQL 查询涉及大量表 JOIN 时，性能会显著下降。以下是优化思路和简易实现方法： 一、核心优化思路减少 JOIN 数量数据冗余：添加必要的冗余字段（如订单表直接存储用户名）合并表：将频繁关联的小表合并成…...

编程新知 2026/1/11 6:22:16

CRMEB 中 PHP 短信扩展开发：涵盖一号通、阿里云、腾讯云、创蓝

目前已有一号通短信、阿里云短信、腾讯云短信扩展扩展入口文件文件目录 crmeb\services\sms\Sms.php 默认驱动类型为：一号通 namespace crmeb\services\sms;use crmeb\basic\BaseManager; use crmeb\services\AccessTokenServeService; use crmeb\services\sms\…...

编程新知 2025/10/5 5:38:24

探索Selenium：自动化测试的神奇钥匙

目录一、Selenium 是什么1.1 定义与概念1.2 发展历程1.3 功能概述二、Selenium 工作原理剖析2.1 架构组成2.2 工作流程2.3 通信机制三、Selenium 的优势3.1 跨浏览器与平台支持3.2 丰富的语言支持3.3 强大的社区支持四、Selenium 的应用场景4.1 Web 应用自动化测试4.2 数据…...

编程新知 2025/11/19 18:06:51