当前位置：首页 > news >正文

【python】OpenCV—Rectangle, Circle, Selective Search（1.2）

news 2025/7/13 1:57:25

在这里插入图片描述

文章目录

1 画框画圈
- 1.1 画矩形框
- 1.2 画圆 / 点
- 1.3 椭圆
2 Selective Search
3 Resize

1 画框画圈

1.1 画矩形框

# Copy the image
img_rgb_copy = img_rgb.copy()# Draw a rectangle
cv2.rectangle(img_rgb_copy, pt1 = (405, 90), pt2 =(740, 510),color = (255, 0, 0), thickness = 5)
plt.axis("off")
plt.imshow(img_rgb_copy)

pt1 是左上角坐标，pt2 是右下角坐标，坐标可以用电脑自带的画图工具获取，直接 copy 过来就行！

在这里插入图片描述

补充1：如果要画成 mask 块，也即全填充的形式，则把 thickness 参数设置为 -1 即可

补充2：如果要把区域裁剪出来，可以借助 numpy 的切片操作，例如

import cv2img_pth = "/file2/yanmeng/human/ocean3_115/images/ocean_17_55034.jpg"
img = cv2.imread(img_pth)box = (606, 182, 682, 360)  # (x0, y0, x1, y1)crop_img = img[box[1]:box[3], box[0]:box[2]]  # [y0:y1, x0:x1]cv2.imshow("1", img)
cv2.imshow("2", crop_img)
cv2.waitKey(10000)
cv2.destroyAllWindows() # 释放所有由 Opencv 创建的窗口

waitKey() 的参数为等待键盘触发的时间，单位为 ms，返回值为 -1（表示没有键被按下）或者 ASCII 码

在这里插入图片描述

复制 RoI 区域

import cv2
img = cv2.imread("1.jpg")
bag = img[840:1004, 830:1032]
img[840:1004, 830+200:1032+200] = bag
cv2.imwrite("2.jpg", img)

请添加图片描述
快乐加倍！！！

1.2 画圆 / 点

void cvCircle( CvArr* img, CvPoint center, int radius, CvScalar color,int thickness=1, int line_type=8, int shift=0 );

img：图像。
center：圆心坐标。
radius：圆形的半径。
color：线条的颜色。
t- hickness：如果是正数，表示组成圆的线条的粗细程度。否则，表示圆是否被填充。
line_type：线条的类型。见 cvLine 的描述
shift：圆心坐标点和半径值的小数点位数。

img_rgb_copy = img_rgb.copy()
# Draw a circle
cv2.circle(img_rgb_copy, center = (200, 280), radius =80,color = (0,0,255), thickness = 5)
plt.axis("off")
plt.imshow(img_rgb_copy)

在这里插入图片描述
一起画，哈哈哈，我也是周伯通了，左手画圆，右手画框！

1.3 椭圆

绘制椭圆
在这里插入图片描述

import cv2
import numpy as np
from matplotlib import pyplot as plt
img = np.zeros((512,512,3),np.uint8)#生成一个空彩色图像
cv2.ellipse(img=img,center=(256,256),axes=(150,100),angle=30,startAngle=45,endAngle=180,color=(0,0,255),thickness=-1)
#注意最后一个参数-1，表示对图像进行填充，默认是不填充的，如果去掉，只有椭圆轮廓了
cv2.imshow("1", img)
cv2.waitKey(0)

在这里插入图片描述

2 Selective Search

RCNN 和 Fast RCNN 都用的是 SS，目前被主流的 Faster RCNN 的 Region Proposal Network 替代！我们重温下经典！

我用的 jupyter notebook，所以要克服下 opencv 的 cv2.imshow() 问题，参考
opencv如何在jupyter notebook中显示图片

import cv2
import matplotlib.pyplot as plt
if __name__ == '__main__':cv2.setUseOptimized(True);cv2.setNumThreads(4);# read imageim = cv2.imread('/root/userfolder/Experiment/1.png')# resize imagenewHeight = 200newWidth = int(im.shape[1] * 200 / im.shape[0])im = cv2.resize(im, (newWidth, newHeight))#cv2.imshow("input", im)  # jupyter notebook #img = im[:,:,::-1] # 必须为 ::-1#plt.imshow(im)# 创建算法+设置输入图像ss = cv2.ximgproc.segmentation.createSelectiveSearchSegmentation()ss.setBaseImage(im)# 使用SS快速版本ss.switchToSelectiveSearchFast()# 执行SSrects = ss.process()print('Total Number of Region Proposals: {}'.format(len(rects)))# 推荐100个ROInumShowRects = 100imOut = im.copy()# 显示前100个区域外接矩形框for i, rect in enumerate(rects):if i < numShowRects:x, y, w, h = rectcv2.rectangle(imOut, (x, y), (x + w, y + h), (0, 255, 0), 1, cv2.LINE_AA)else:break# show output"""cv2.imshow("SS-Demo", imOut)cv2.waitKey(0)cv2.destroyAllWindows()"""# jupyter notebookimg = imOut[:,:,::-1] # 必须为 ::-1plt.xticks(())plt.yticks(())plt.imshow(img)

处理前
在这里插入图片描述
处理后

3 Resize

cv2.resize(InputArray src, OutputArray dst, Size, fx, fy, interpolation)

InputArray src：输入图片
OutputArray dst ：输出图片
Size：输出图片尺寸——(w,h)
fx, fy：沿 x 轴，y 轴的缩放系数
interpolation：插入方式

在这里插入图片描述
来自 opencv: 图像缩放(cv2.resize)

【python】OpenCV—Rectangle, Circle, Selective Search（1.2）

文章目录 1 画框画圈1.1 画矩形框1.2 画圆 / 点1.3 椭圆 2 Selective Search3 Resize 1 画框画圈 1.1 画矩形框 # Copy the image img_rgb_copy img_rgb.copy()# Draw a rectangle cv2.rectangle(img_rgb_copy, pt1 (405, 90), pt2 (740, 510),color (255, 0, 0), thickne…...

编程日记 2023/11/16 19:51:45

MongoDB是一个NoSQL数据库，有着多种不同的命令和操作。以下是一些常见的MongoDB命令：

show dbs：列出所有数据库use db_name：切换到指定的数据库db.dropDatabase()：删除当前数据库db.createCollection("collection_name")：创建集合db.collection_name.insert(document)：向指定集合插入数据db.co…...

编程日记 2023/11/16 19:50:43

网络运维Day19

文章目录环境准备数据备份为什么要备份什么是备份备份到哪里什么时候备份如何备份完整备份物理备份逻辑备份测试恢复所有库构建MySQL服务xtrabackup完全备份与恢复完全备份完全恢复增量备份增量恢复总结环境准备 IP地址采用自动分配，以自己的为准可以将之前的…...

编程日记 2023/11/16 19:49:42

颜色标记txt和多根走线【Cadance进阶】

文章目录前言颜色标记txt多根走线前言今天来介绍个基础操作中不常见的，但是非常实用的技巧。第一个是颜色标记，它是与text文件结合，根据text文件中的网络来染色标记的，致力于找出那些特定的走线，或者是查询出现问题…...

编程日记 2023/11/16 19:48:40

你是想被ChatGPT改变，还是改变软件开发的未来？丨IDCF

人工智能技术的发展，正在深刻地改变着我们的生活和工作方式。在软件工程领域，ChatGPT作为一种新兴的人工智能技术，正在逐渐地被应用到软件开发的各个环节中。那么，ChatGPT对每个人的影响是什么呢？ 一、对软件开发人员…...

编程日记 2023/11/16 19:47:38

Homography详解在MVSNet中的应用

Homography（单应性变换）是计算机视觉中的一个重要概念，用于描述两个平面之间的透视关系。在图像处理和计算机视觉中，Homography通常表示两个平面之间的投影关系，这种关系可以通过一个3x3的矩阵来表示。在数学上&…...

编程日记 2023/11/16 19:46:37

linux parted给磁盘分区

概述通常我们用的比较多的分区工具是fdisk命令，但由于fdisk只支持MBR分区，MBR分区表最大支撑2T的磁盘，所以无法划分大于2T的分区。而parted工具可以划分单个分区大于2T的GPT格式的分区，也可以划分普通的MBR分区。 1.查看磁盘大小…...

编程日记 2023/11/16 19:45:36

大数据毕业设计选题推荐-机房信息大数据平台-Hadoop-Spark-Hive

✨作者主页：IT研究室✨ 个人简介：曾从事计算机专业培训教学，擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。 ☑文末获取源码☑ 精彩专栏推荐⬇⬇⬇ Java项目 Python…...

编程日记 2023/11/16 19:44:35

使用 PYTORCH 进行图像风格迁移

一、介绍本教程介绍如何实现由 Leon A. Gatys、Alexander S. Ecker 和 Matthias Bethge 开发的神经风格算法。神经风格或神经传输允许您拍摄图像并以新的艺术风格再现它。该算法采用三幅图像，即输入图像、内容图像和风格图像，并将输入更改为类似于内容…...

编程日记 2023/11/16 19:43:34

vscode使用flake8设置单行最长字符限制设置失败的问题

vscode使用flake8设置单行最长字符限制设置失败的问题问题描述解决方案问题描述如图所示，使用flake8单行字数过长，就会有有红色底的波浪线一般情况下很多教程都会让你在setting.json里面设置但是我打开我的setting.json，发现我已经进…...

编程日记 2023/11/16 19:42:33

SAP KO22内部订单预算BAPI与BDC

KO22可以为内部订单预先维护预算，以便在后续成本实际产生时进行控制。使用BAPI进行创建：KBPP_EXTERN_UPDATE_CO SAP note 625613中对该BAPI的使用方式有详细介绍，使用时可进行参考。年度预算：e_gjahr传值、e_ges置空&#xff…...

编程日记 2023/11/16 19:41:32

K8S篇之实现利用Prometheus监控pod的实时数据指标

一、监控部署 1、将k8s集群中kube-state-metrics指标进行收集，服务进行部署 1.1 pod性能指标（k8s集群组件自动集成） k8s组件本身提供组件自身运行的监控指标以及容器相关的监控指标。通过cAdvisor 是一个开源的分析容器资源使用率和性能特性的…...

编程日记 2023/11/16 19:40:31

智能巡检软件怎么选？企业设备管理需要做什么？

在当今竞争激烈的企业运营环境中，巡检管理的重要性不言而喻。然而，许多企业在执行巡检任务时面临着诸多挑战，如员工执行不到位、缺乏有效的人员监管、漏检误检、安全隐患以及数据整理困难等问题。这些问题如果不能得到妥善解决，不…...

编程日记 2023/11/16 19:39:29

【python】Django——连接mysql数据库

笔记为自我总结整理的学习笔记，若有错误欢迎指出哟~ 【Django专栏】 Django——django简介、django安装、创建项目、快速上手 Django——templates模板、静态文件、django模板语法、请求和响应 Django——连接mysql数据库 Django——连接mysql数据库连接MySQL数据库…...

编程日记 2023/11/16 19:38:27

北京君正客户应用案例：掌静脉3D人脸猫眼视屏智能锁

凯迪仕在今年4月发布了智能锁旗舰新品K70 Pro Max掌静脉3D人脸猫眼视屏智能锁，随即这款新品也成了行业热议的焦点。凯迪仕每次新品都力求突破精益求精，不仅追求科技感、高级感与品质感，而且赋予科技温度，带来人文化的关怀。K70 Pr…...

编程日记 2023/11/16 19:37:26

人工智能+游戏会带来什么

“人工智能游戏” 写在前面随着人类生活水平的日益提高，游戏正在为越来越多的人们带去欢乐。同时，作为21世纪新兴科学技术的人工智能，也正在研究人员的努力下不断向前突破。那么，这两列高速前进的“火车”能否接轨并行呢&#…...

编程日记 2023/11/16 19:34:23

人工智能基础_机器学习030_ElasticNet弹性网络_弹性回归的使用---人工智能工作笔记0070

然后我们再来看elastic-net弹性网络,之所以叫弹性是因为,他融合了L1和L2正则,可以看到他的公式公式中有L1正则和L2正则两个都在这个公式中可以看到弹性网络,在很多特征互相联系的时候,非常有用,比如, 相关性,如果数学好,那么物理也好,如果语文好,那么英语也好这种联系正…...

编程日记 2023/11/16 19:33:22

Python算法——平衡二叉树（AVL）

Python中的平衡二叉搜索树（AVL树）算法详解平衡二叉搜索树（AVL树）是一种自平衡的二叉搜索树，它通过在插入或删除节点时进行旋转操作来保持树的平衡性。在AVL树中，任何节点的两个子树的高度差（平…...

编程日记 2023/11/16 19:32:21

公开可用的API 合集

这是一个开源项目列表，收录了一些公开可用、无需注册或认证即可使用的API接口。这个项目解决了开发者们在寻找合适的API时遇到的各种困难，如无法快速定位、难以筛选等问题，为他们提供了便捷的一站式查询服务。项目是“public-apis”&…...

编程日记 2023/11/16 19:31:20

单片机编程原则

多任务编程的概念方式一：实时操作系统（不建议新手使用） 方式二 ：裸机多任务模型逻辑多任务的基本原理把三个任务分别分为一个一个的片段然后先执行任务一的第一个切片执行第二个任务的第一个片段执行第三个任务的第一个片…...

编程日记 2023/11/16 19:30:19

RestClient

什么是RestClient RestClient 是 Elasticsearch 官方提供的 Java 低级 REST 客户端，它允许HTTP与Elasticsearch 集群通信，而无需处理 JSON 序列化/反序列化等底层细节。它是 Elasticsearch Java API 客户端的基础。 RestClient 主要特点轻量级&#xff…...

编程新知 2025/6/23 4:26:10

调用支付宝接口响应40004 SYSTEM_ERROR问题排查

在对接支付宝API的时候，遇到了一些问题，记录一下排查过程。 Body:{"datadigital_fincloud_generalsaas_face_certify_initialize_response":{"msg":"Business Failed","code":"40004","sub_msg…...

编程新知 2025/7/12 23:31:12

java_网络服务相关_gateway_nacos_feign区别联系

1. spring-cloud-starter-gateway 作用：作为微服务架构的网关，统一入口，处理所有外部请求。核心能力： 路由转发（基于路径、服务名等）过滤器（鉴权、限流、日志、Header 处理）支持负…...

编程新知 2025/7/8 20:58:51

基于FPGA的PID算法学习———实现PID比例控制算法

基于FPGA的PID算法学习前言一、PID算法分析二、PID仿真分析1. PID代码2.PI代码3.P代码4.顶层5.测试文件6.仿真波形总结前言学习内容：参考网站： PID算法控制 PID即：Proportional（比例）、Integral（积分&…...

编程新知 2025/7/10 19:38:30

基于ASP.NET+ SQL Server实现（Web）医院信息管理系统

医院信息管理系统 1. 课程设计内容在 visual studio 2017 平台上，开发一个“医院信息管理系统”Web 程序。 2. 课程设计目的综合运用 c#.net 知识，在 vs 2017 平台上，进行 ASP.NET 应用程序和简易网站的开发；初步熟悉开发一…...

编程新知 2025/7/11 13:57:01

理解 MCP 工作流：使用 Ollama 和 LangChain 构建本地 MCP 客户端

🌟 什么是 MCP？ 模型控制协议 (MCP) 是一种创新的协议，旨在无缝连接 AI 模型与应用程序。 MCP 是一个开源协议，它标准化了我们的 LLM 应用程序连接所需工具和数据源并与之协作的方式。可以把它想象成你的 AI 模型和想要使用它…...

编程新知 2025/7/9 11:27:28

为什么需要建设工程项目管理？工程项目管理有哪些亮点功能？

在建筑行业，项目管理的重要性不言而喻。随着工程规模的扩大、技术复杂度的提升，传统的管理模式已经难以满足现代工程的需求。过去，许多企业依赖手工记录、口头沟通和分散的信息管理，导致效率低下、成本失控、风险频发。例如&#…...

编程新知 2025/7/12 7:59:26

大数据学习（132）-HIve数据分析

🍋🍋大数据学习🍋🍋 🔥系列专栏： 👑哲学语录: 用力所能及，改变世界。 💖如果觉得博主的文章还不错的话，请点赞👍收藏⭐️留言&#x1f4…...

编程新知 2025/6/25 7:35:04

人机融合智能 | “人智交互”跨学科新领域

本文系统地提出基于“以人为中心AI(HCAI)”理念的人-人工智能交互(人智交互)这一跨学科新领域及框架,定义人智交互领域的理念、基本理论和关键问题、方法、开发流程和参与团队等,阐述提出人智交互新领域的意义。然后,提出人智交互研究的三种新范式取向以及它们的意义。最后,总结…...

编程新知 2025/7/12 16:22:49

LLMs 系列实操科普（1）

写在前面： 本期内容我们继续 Andrej Karpathy 的《How I use LLMs》讲座内容，原视频时长 ~130 分钟，以实操演示主流的一些 LLMs 的使用，由于涉及到实操，实际上并不适合以文字整理，但还是决定尽量整理一份笔…...

编程新知 2025/7/11 12:12:33

文章目录

1 画框画圈

1.1 画矩形框

1.2 画圆 / 点

1.3 椭圆

2 Selective Search

3 Resize

相关文章：