当前位置: 首页 > news >正文

【Python Opencv】图片与视频的操作

文章目录

  • 前言
  • 一、opencv图片
    • 1.1 读取图像
    • 1.2 显示图像
    • 1.3 写入图像
    • 1.4 示例代码
  • 二、Opencv视频
    • 2.1 从相机捕获视频
      • 获取摄像头
      • 一帧一帧读取
      • 显示图片
      • VideoCapture 中的get和set函数
      • 示例代码
    • 2.2 从文件播放视频
      • 示例代码
    • 2.3 保存视频
      • 示例代码
  • 总结


前言

在计算机视觉和图像处理中,使用OpenCV库可以进行各种强大的图片和视频操作。无论是简单的图像加载和显示,还是复杂的视频处理和分析,OpenCV提供了丰富的工具和函数。本文将介绍如何使用Python和OpenCV进行图片和视频的基本操作,包括读取、显示、保存以及视频的处理等。


一、opencv图片

目标
在这里,您将学习如何阅读图像、如何显示图像以及如何将其保存回来
您将学习以下函数:cv2.imread(), cv2.imshow() , cv2.imwrite()

1.1 读取图像

使用函数 cv.imread() 读取图像。图像应位于工作目录中,或者应提供图像的完整路径。

第一个参数是图片名称
第二个参数是一个标志,它指定了图像的读取方式。

cv.IMREAD_COLOR :加载彩色图像。图像的任何透明度都将被忽略。它是默认标志。
cv.IMREAD_GRAYSCALE:以灰度模式加载图像
cv.IMREAD_UNCHANGED : 加载图像,包括 alpha 通道

注意
除了这三个标志,您可以分别传递整数 1、0 或 -1。

import cv2
import numpy as npimg = cv2.imread("./opencv.jpg",cv2.IMREAD_UNCHANGED)

在这里插入图片描述

警告

即使图像路径错误,它也不会抛出任何错误,但会给您print imgNone

1.2 显示图像

使用函数 cv.imshow()在窗口中显示图像。窗口会自动适应图像大小。

第一个参数是一个窗口名称,它是一个字符串。第二个论点是我们的形象。您可以根据需要创建任意数量的窗口,但使用不同的窗口名称。

cv2.imshow("opencv",img)cv2.waitKey(0)
cv2.destroyAllWindows()

在这里插入图片描述

cv.waitKey()是一个键盘绑定函数。它的论点是以毫秒为单位的时间。该函数等待任何键盘事件的指定毫秒。如果在这段时间内按任意键,程序将继续。如果传递 0,它将无限期地等待击键。它还可以设置为检测特定的击键,例如,如果按下了 a 键等,我们将在下面讨论。

注意
除了绑定键盘事件外,此函数还处理许多其他 GUI 事件,因此您必须使用它来实际显示图像。

destroyAllWindows就是把全部的窗口都释放内存。

cv.destroyAllWindows() 只是销毁我们创建的所有窗口。如果要销毁任何特定窗口,请使用函数 cv.destroyWindow(),在其中传递确切的窗口名称作为参数。

注意
在特殊情况下,您可以创建一个空窗口,稍后将图像加载到其中。在这种情况下,您可以指定窗口是否可调整大小。它是通过函数 cv.namedWindow() 完成的。默认情况下,该标志为 cv.WINDOW_AUTOSIZE。但是,如果指定要cv.WINDOW_NORMAL的标志,则可以调整窗口大小。当图像尺寸过大以及向窗口添加跟踪栏时,这将很有帮助。

1.3 写入图像

使用函数 cv.imwrite() 保存图像。

第一个参数是文件名,第二个参数是要保存的图像。

cv.imwrite('messigray.png',img)

在这里插入图片描述

这会将图像以 PNG 格式保存在工作目录中。

1.4 示例代码

示例代码的要求为读取一个图像,以灰度图的方式读取,且写入图像到文件夹下

import cv2
import numpy as npimg = cv2.imread("./opencv.jpg",cv2.IMREAD_GRAYSCALE)cv2.imshow("opencv",img)cv2.imwrite("./opencv-gray.jpg",img)cv2.waitKey(0)
cv2.destroyAllWindows()

在这里插入图片描述

二、Opencv视频

2.1 从相机捕获视频

通常,我们必须使用相机捕获实时流。OpenCV 为此提供了一个非常简单的接口。让我们从相机中捕获视频,将其转换为灰度视频并显示。只需一个简单的任务即可开始。

若要捕获视频,需要创建 VideoCapture 对象。其参数可以是设备索引,也可以是视频文件的名称。设备索引只是指定哪个相机的数字。通常会连接一个摄像头(就像我的情况一样)。所以我只是传递 0(或 -1)。您可以通过传递 1 来选择第二个相机,依此类推。之后,您可以逐帧捕获。但最后,不要忘记释放捕获。

获取摄像头

首先,我们先要获取摄像头对象

cap = cv.VideoCapture(0)

在这里插入图片描述

他的参数就是你要获取的摄像头的编号

接下来我们需要判断摄像头是否打开:

if not cap.isOpened():print("Cannot open camera")exit()

在这里插入图片描述

一帧一帧读取

然后我们就要去一帧一帧读取图片了

# Capture frame-by-frame
ret, frame = cap.read()

在这里插入图片描述

使用read()函数可以读取一帧
返回值一为是否读取成功,返回值二为读取到的东西

接下来我们去判断ret是否有图片:

if not ret:print("Can't receive frame (stream end?). Exiting ...")break

在这里插入图片描述

显示图片

接下来我们直接显示即可

cv.imshow('frame', frame)

在这里插入图片描述

在最后,不要忘记了释放资源:

# When everything done, release the capture
cap.release()
cv.destroyAllWindows()

在这里插入图片描述

VideoCapture 中的get和set函数

您还可以使用 cap.get(propId) 方法访问此视频的某些功能,其中 propId 是 0 到 18 之间的数字。每个数字表示视频的一个属性(如果它适用于该视频),完整的详细信息可以在这里看到:cv::VideoCapture::get()。其中一些值可以使用 cap.set(propId, value) 进行修改。Value 是所需的新值。

例如,我可以通过 和 检查框架宽度和高度。默认情况下,它给我 640x480。但我想将其修改为 320x240。只需使用和.cap.get(cv.CAP_PROP_FRAME_WIDTH)cap.get(cv.CAP_PROP_FRAME_HEIGHT)ret = cap.set(cv.CAP_PROP_FRAME_WIDTH,320)ret = cap.set(cv.CAP_PROP_FRAME_HEIGHT,240)

注意
如果出现错误,请确保使用任何其他相机应用程序(如 Linux 中的 Cheese)相机工作正常。

示例代码

import numpy as np
import cv2 as cv
cap = cv.VideoCapture(0)
if not cap.isOpened():print("Cannot open camera")exit()
while True:# Capture frame-by-frameret, frame = cap.read()# if frame is read correctly ret is Trueif not ret:print("Can't receive frame (stream end?). Exiting ...")breakcv.imshow('frame', frame )if cv.waitKey(1) == ord('q'):break
# When everything done, release the capture
cap.release()
cv.destroyAllWindows()

在这里插入图片描述

2.2 从文件播放视频

它与从相机捕获相同,只需使用视频文件名更改相机索引即可。此外,在显示框架时,请为.如果太少,视频会非常快,如果太高,视频会很慢(嗯,这就是你如何以慢动作显示视频)。在正常情况下,25 毫秒是可以的。cv2.waitKey()

示例代码

import numpy as np
import cv2 as cv
cap = cv.VideoCapture('vtest.avi')
while cap.isOpened():ret, frame = cap.read()# if frame is read correctly ret is Trueif not ret:print("Can't receive frame (stream end?). Exiting ...")breakgray = cv.cvtColor(frame, cv.COLOR_BGR2GRAY)cv.imshow('frame', gray)if cv.waitKey(1) == ord('q'):break
cap.release()
cv.destroyAllWindows()

在这里插入图片描述

直接在读取摄像头的这个VideoCapture对象里面写路径即可。

注意
确保安装了正确版本的 ffmpeg 或 gstreamer。有时,使用Video Capture是一件令人头疼的事情,主要是由于ffmpeg / gstreamer的错误安装。

2.3 保存视频

因此,我们捕获视频,逐帧处理,然后保存该视频。对于图像,它非常简单,只需使用 .这里需要更多的工作。cv.imwrite()

这一次,我们创建一个 VideoWriter 对象。我们应该指定输出文件名(例如:output.avi)。然后我们应该指定 FourCC 代码(详见下一段)。然后应传递每秒帧数 (fps) 和帧大小。最后一个是isColor标志。如果是,编码器需要彩色帧,否则它适用于灰度帧。True

FourCC 是用于指定视频编解码器的 4 字节代码。可用代码列表可在 fourcc.org 中找到。它依赖于平台。遵循编解码器对我来说效果很好。

在 Fedora 中:DIVX、XVID、MJPG、X264、WMV1、WMV2。(XVID 更可取。MJPG 产生高尺寸视频。X264 提供非常小尺寸的视频)
在 Windows 中:DIVX(更多待测试和添加)
在OSX中:MJPG(.mp4),DIVX(.avi),X264(.mkv)。
对于MJPG,FourCC代码以’cv.VideoWriter_fourcc(‘M’,‘J’,‘P’,‘G’)cv.VideoWriter_fourcc(*‘MJPG’)'的形式传递。or

在从相机捕获的代码下方,在垂直方向上翻转每一帧并保存。

示例代码

import numpy as np
import cv2 as cv
cap = cv.VideoCapture(0)
# Define the codec and create VideoWriter object
fourcc = cv.VideoWriter_fourcc(*'XVID')
out = cv.VideoWriter('output.avi', fourcc, 20.0, (640,  480))
while cap.isOpened():ret, frame = cap.read()if not ret:print("Can't receive frame (stream end?). Exiting ...")breakframe = cv.flip(frame, 0)# write the flipped frameout.write(frame)cv.imshow('frame', frame)if cv.waitKey(1) == ord('q'):break
# Release everything if job is finished
cap.release()
out.release()
cv.destroyAllWindows()

在这里插入图片描述


总结

通过使用OpenCV,我们可以轻松进行图片和视频的各种操作。从基本的读取和显示到保存和处理视频,OpenCV提供了简单而强大的接口。图片和视频的处理是计算机视觉领域中的基础,而OpenCV为开发者提供了一个灵活而高效的工具集,使得这些任务变得更加容易实现。通过结合Python的简洁性和OpenCV的强大功能,我们可以在图像和视频处理的领域中取得令人瞩目的成果。希望这篇文章能够为你提供一个良好的入门,让你更好地理解和应用OpenCV。

相关文章:

【Python Opencv】图片与视频的操作

文章目录 前言一、opencv图片1.1 读取图像1.2 显示图像1.3 写入图像1.4 示例代码 二、Opencv视频2.1 从相机捕获视频获取摄像头一帧一帧读取显示图片VideoCapture 中的get和set函数示例代码 2.2 从文件播放视频示例代码 2.3 保存视频示例代码 总结 前言 在计算机视觉和图像处理…...

【从入门到起飞】JavaAPI—System,Runtime,Object,Objects类

🎊专栏【JavaSE】 🍔喜欢的诗句:更喜岷山千里雪 三军过后尽开颜。 🎆音乐分享【如愿】 🎄欢迎并且感谢大家指出小吉的问题🥰 文章目录 🍔System类⭐exit()⭐currentTimeMillis()🎄用…...

【Git】的分支和标签的讲解及实际应用场景

目录 讲解 环境讲述 分支标签的区别 分支 命令 场景应用 标签 命令 标签规范 讲解 环境讲述 当软件从开发到正式环境部署的过程中,不同环境的作用 开发环境:用于开发人员进行软件开发、测试和调试。在这个环境中,开发人员可以快速地…...

修改django开发环境runserver命令默认的端口

runserver默认8000端口 虽然python manage.py runserver 8080 可以指定端口,但不想每次runserver都添加8080这个参数 可以通过修改manage.py进行修改,只需要加三行: from django.core.management.commands.runserver import Command as Ru…...

kubeadm安装k8s高可用集群

目录 一、环境规划 二、注意事项: 三、环境准备: 1. 关闭防火墙规则,关闭selinux,关闭swap交换: 2. 修改主机名 3. 所有节点修改hosts文件: 4. 所有节点时间同步: 5. 所有节点实现Linux的资…...

来看看电脑上有哪些不为人知的小众软件?

​ 电脑上的各类软件有很多,除了那些常见的大众化软件,还有很多不为人知的小众软件,专注于实用功能,简洁干净、功能强悍。 1.桌面停靠栏工具——BitDock ​ BitDock是一款运行在Windows系统中的桌面停靠栏工具,功能实…...

一个进程最多可以创建多少个线程?

前言 话不多说,先来张脑图~ linux 虚拟内存知识回顾 虚拟内存空间长啥样 在 Linux 操作系统中,虚拟地址空间的内部又被分为内核空间和用户空间两部分,不同位数的系统,地址空间的范围也不同。比如最常见的 32 位和 64 位系统&am…...

ElasticSearch文档分析

ElasticSearch文档分析 包含下面的过程: 将一块文本分成适合于倒排索引的独立的 词条将这些词条统一化为标准格式以提高它们的“可搜索性”,或者 recall 分析器执行上面的工作。分析器实际上是将三个功能封装到了一个包里: 字符过滤器 首先&a…...

Xilinx FPGA平台DDR3设计详解(一):DDR SDRAM系统框架

DDR SDRAM(双倍速率同步动态随机存储器)是一种内存技术,它可以在时钟信号的上升沿和下降沿都传输数据,从而提高数据传输的速率。DDR SDRAM已经发展了多代,包括DDR、DDR2、DDR3、DDR4和DDR5,每一代都有不同的…...

Spring Data JPA方法名命名规则

最近巩固一下JPA,网上看到这些资料,这里记录巩固一下。 一、Spring Data Jpa方法定义的规则 简单条件查询 简单条件查询:查询某一个实体类或者集合。 按照Spring Data的规范的规定,查询方法以find | read | get开头&…...

【Leetcode Sheet】Weekly Practice 15

Leetcode Test 2586 统计范围内的元音字符串数(11.7) 给你一个下标从 0 开始的字符串数组 words 和两个整数:left 和 right 。 如果字符串以元音字母开头并以元音字母结尾,那么该字符串就是一个 元音字符串 ,其中元音字母是 a、e、i、o、u…...

人力资源社会保障部办公厅关于推行专业技术人员职业资格电子证书的通知

(人社厅发〔2021〕97号) 各省、自治区、直辖市及新疆生产建设兵团人力资源社会保障厅(局),中共海南省委人才发展局,国务院有关部门、直属机构人事部门,有关协会、学会: 为贯彻落实…...

什么是光电耦合器?如何选择型号及种类

光电耦合器(英文缩写为OC)亦称光电隔离器,简称光耦;以光为媒介传输电信号;它对输入、输出电信号有良好的隔离作用,是目前种类最多、用途最广的光电器件之一;所以,它在各种电路中得到广泛的应用。 光耦合器…...

hive里因为列名用了关键字导致建表失败

代码 现象 ParseException line 6:4 cannot recognize input near percent String COMMENT in column name or primary key or foreign key 23/11/13 11:52:57 ERROR org.apache.hadoop.hive.ql.Driver: FAILED: ParseException line 6:4 cannot recognize input near percent …...

MySQL 报错 incorrect datetime value ‘0000-00-00 00:00:00‘ for column

使用navicat导入数据时报错: MySQL 报错 incorrect datetime value ‘0000-00-00 00:00:00’ for column 这是因为当前的MySQL不支持datetime为0的情况。 MySQL报incorrect datetime value ‘0000-00-00 00:00:00’ for column错误原因,是由于在MySQL5.7…...

Jira Data Center(非集群)升级操作

一、升级准备 Jira 管理界面执行升级检查下载升级包,使用原操作方式相同的方式安装。我这里原来的版本是通过./atlassian-jira-software-9.11.2-x64.bin安装的,接下来下载atlassian-jira-software-9.11.3-x64.bin的安装文件停止 Jira,bin/st…...

Spring IOC - BeanDefinition解析

1. BeanDefinition的属性 BeanDefinition作为接口定义了属性的get、set方法。这些属性基本定义在其直接实现类AbstractBeanDefinition中,各属性的含义如下表所示: 类型 名称 含义 常量 SCOPE_DEFAULT 默认作用域:单例模式 AUT…...

ds前后台博客系统

源码私信或者公众号java大师获取 博客简介:本博客采用Spring Boot LayUI做为基础,进行的博客系统开发,与bootvue相比,更为适合开发简单的系统,并且更容易上手,简单!高效!更易上手&a…...

算法leetcode|88. 合并两个有序数组(rust重拳出击)

文章目录 88. 合并两个有序数组:样例 1:样例 2:样例 3:提示: 分析:题解:rust:go:c:python:java: 88. 合并两个有序数组: …...

GoLong的学习之路,进阶,语法之并发(并发错误处理)补充并发三部曲

这篇文章主要讲的是如何去处理并发的错误。 在Go语言中十分便捷地开启goroutine去并发地执行任务,但是如何有效的处理并发过程中的错误则是一个很棘手的问题。 文章目录 recovererrgroup recover 哦对,似乎没写错误处理的文章。后面补上。 首先&…...

Chapter03-Authentication vulnerabilities

文章目录 1. 身份验证简介1.1 What is authentication1.2 difference between authentication and authorization1.3 身份验证机制失效的原因1.4 身份验证机制失效的影响 2. 基于登录功能的漏洞2.1 密码爆破2.2 用户名枚举2.3 有缺陷的暴力破解防护2.3.1 如果用户登录尝试失败次…...

Spark 之 入门讲解详细版(1)

1、简介 1.1 Spark简介 Spark是加州大学伯克利分校AMP实验室(Algorithms, Machines, and People Lab)开发通用内存并行计算框架。Spark在2013年6月进入Apache成为孵化项目,8个月后成为Apache顶级项目,速度之快足见过人之处&…...

3.3.1_1 检错编码(奇偶校验码)

从这节课开始,我们会探讨数据链路层的差错控制功能,差错控制功能的主要目标是要发现并且解决一个帧内部的位错误,我们需要使用特殊的编码技术去发现帧内部的位错误,当我们发现位错误之后,通常来说有两种解决方案。第一…...

汽车生产虚拟实训中的技能提升与生产优化​

在制造业蓬勃发展的大背景下,虚拟教学实训宛如一颗璀璨的新星,正发挥着不可或缺且日益凸显的关键作用,源源不断地为企业的稳健前行与创新发展注入磅礴强大的动力。就以汽车制造企业这一极具代表性的行业主体为例,汽车生产线上各类…...

el-switch文字内置

el-switch文字内置 效果 vue <div style"color:#ffffff;font-size:14px;float:left;margin-bottom:5px;margin-right:5px;">自动加载</div> <el-switch v-model"value" active-color"#3E99FB" inactive-color"#DCDFE6"…...

Frozen-Flask :将 Flask 应用“冻结”为静态文件

Frozen-Flask 是一个用于将 Flask 应用“冻结”为静态文件的 Python 扩展。它的核心用途是&#xff1a;将一个 Flask Web 应用生成成纯静态 HTML 文件&#xff0c;从而可以部署到静态网站托管服务上&#xff0c;如 GitHub Pages、Netlify 或任何支持静态文件的网站服务器。 &am…...

Keil 中设置 STM32 Flash 和 RAM 地址详解

文章目录 Keil 中设置 STM32 Flash 和 RAM 地址详解一、Flash 和 RAM 配置界面(Target 选项卡)1. IROM1(用于配置 Flash)2. IRAM1(用于配置 RAM)二、链接器设置界面(Linker 选项卡)1. 勾选“Use Memory Layout from Target Dialog”2. 查看链接器参数(如果没有勾选上面…...

QT: `long long` 类型转换为 `QString` 2025.6.5

在 Qt 中&#xff0c;将 long long 类型转换为 QString 可以通过以下两种常用方法实现&#xff1a; 方法 1&#xff1a;使用 QString::number() 直接调用 QString 的静态方法 number()&#xff0c;将数值转换为字符串&#xff1a; long long value 1234567890123456789LL; …...

【开发技术】.Net使用FFmpeg视频特定帧上绘制内容

目录 一、目的 二、解决方案 2.1 什么是FFmpeg 2.2 FFmpeg主要功能 2.3 使用Xabe.FFmpeg调用FFmpeg功能 2.4 使用 FFmpeg 的 drawbox 滤镜来绘制 ROI 三、总结 一、目的 当前市场上有很多目标检测智能识别的相关算法&#xff0c;当前调用一个医疗行业的AI识别算法后返回…...

力扣-35.搜索插入位置

题目描述 给定一个排序数组和一个目标值&#xff0c;在数组中找到目标值&#xff0c;并返回其索引。如果目标值不存在于数组中&#xff0c;返回它将会被按顺序插入的位置。 请必须使用时间复杂度为 O(log n) 的算法。 class Solution {public int searchInsert(int[] nums, …...