OpenCV图像处理进阶教程:几何变换与频域分析全解析
OpenCV图像处理进阶教程:几何变换与频域分析全解析
📚 本文提供了OpenCV图像处理的核心操作详解,从基础的几何变换到高级的频域分析,代码示例清晰易懂,实用性强。完整代码已开源至GitHub:https://github.com/Despacito0o/opencv
学习内容
- 掌握图像几何变换技术,学习图像平移的实现方法及边界处理,理解不同插值方法(最近邻、双线性、双三次)的特点与应用场景。
- 学习图像缩放的实现过程,掌握图像尺寸变换中的质量控制。
- 掌握频域变换技术,学习二维离散傅里叶变换的原理与应用。理解离散余弦变换,学习二维离散余弦变换的原理,掌握从变换系数重建图像的方法。
实验环境准备
- Python 3.8+
- OpenCV 4.5.0+
- NumPy 1.19.0+
# 安装必要的库
pip install opencv-python numpy
实验内容
1. 图像平移操作
平移是最基础的图像几何变换之一,通过仿射变换矩阵可以精确控制平移方向和距离。本实验中,我们将图像向右平移50像素,向下平移30像素,并使用最近邻插值法处理边界。
核心原理:平移变换矩阵形式为 [[1, 0, tx], [0, 1, ty]],其中tx和ty分别表示水平和垂直方向的平移量。
import cv2
import numpy as np
# 读取图像
image_path = r'C:\Users\Administrator\Desktop\1.jpg'
image = cv2.imread(image_path)
# 检查图像是否成功读取
if image is None:print("无法读取图像,请检查图像路径是否正确。")
else:# 定义平移矩阵translation_matrix = np.float32([[1, 0, 50], [0, 1, 30]])# 获取图像的高度和宽度height, width = image.shape[:2]# 执行平移操作,使用最近邻插值法translated_image = cv2.warpAffine(image, translation_matrix, (width, height), flags=cv2.INTER_NEAREST)# 显示原始图像和平移后的图像cv2.imshow('Original Image', image)cv2.imshow('Translated Image', translated_image)# 等待按键关闭窗口cv2.waitKey(0)cv2.destroyAllWindows()
效果展示:

💡 技术要点:
cv2.warpAffine中的flags参数决定了边界插值方式,cv2.INTER_NEAREST是计算最快但质量最低的插值方法,适合处理图标、掩码等不需要平滑过渡的图像。
2. 图像水平镜像与缩放
镜像和缩放是视觉应用中常用的预处理操作,通过组合这些基本变换可以实现数据增强、特征标准化等功能。
核心原理:
- 水平镜像:将图像沿垂直轴翻转,实现方程为
dst(x,y) = src(width-1-x,y) - 双线性插值:根据源图像中4个最近邻点的加权平均计算目标像素值,平滑度好于最近邻插值
import cv2
# 读取图像
image_path = r'C:\Users\Administrator\Desktop\1.jpg'
image = cv2.imread(image_path)
# 检查图像是否成功读取
if image is None:print("无法读取图像,请检查图像路径是否正确。")
else:# 进行水平镜像mirrored_image = cv2.flip(image, 1) # 参数1表示水平翻转,0表示垂直翻转,-1表示同时水平垂直翻转# 将镜像后的图像缩小为原来的一半大小,使用双线性插值height, width = mirrored_image.shape[:2]shrunk_image = cv2.resize(mirrored_image, (width // 2, height // 2), interpolation=cv2.INTER_LINEAR)# 显示原始图像和处理后的图像cv2.imshow('Original Image', image)cv2.imshow('Processed Image', shrunk_image)# 等待按键关闭窗口cv2.waitKey(0)cv2.destroyAllWindows()
效果展示:

📝 优化技巧:对于大型图像的缩放操作,如果目标是减小尺寸,先进行高斯模糊再缩放可以减少锯齿和摩尔纹,特别是缩放比例大于2时效果明显。
3. 图像旋转与转置
旋转和转置是高级几何变换,在图像配准、特征对齐和方向标准化中有广泛应用。
核心原理:
- 旋转变换:通过旋转中心、角度和缩放因子确定变换矩阵
- 双三次插值:使用16个邻近像素点的加权平均计算目标像素值,质量最高但计算量也最大
- 转置操作:行列互换,等价于沿着主对角线的镜像
import cv2
import numpy as np
# 读取图像
image_path = r'C:\Users\Administrator\Desktop\1.jpg'
image = cv2.imread(image_path)
# 检查图像是否成功读取
if image is None:print("无法读取图像,请检查图像路径是否正确。")
else:# 获取图像尺寸height, width = image.shape[:2]# 逆时针旋转45度,使用双三次插值# 旋转中心设为图像中心,不缩放(scale=1)rotation_matrix = cv2.getRotationMatrix2D((width / 2, height / 2), 45, 1)rotated_image = cv2.warpAffine(image, rotation_matrix, (width, height), flags=cv2.INTER_CUBIC)# 对旋转后的图像进行转置操作(行列交换)transposed_image = cv2.transpose(rotated_image)# 显示原始图像、旋转后的图像和转置后的图像cv2.imshow('Original Image', image)cv2.imshow('Rotated Image', rotated_image)cv2.imshow('Transposed Image', transposed_image)# 等待按键关闭窗口cv2.waitKey(0)cv2.destroyAllWindows()
效果展示:

⚠️ 注意事项:旋转操作后图像四角可能出现黑色区域,这是因为原图内容在旋转后超出了目标图像边界。如需保留完整内容,应计算旋转后的新尺寸并相应调整
warpAffine的输出尺寸参数。
4. 图像剪切与频域变换
从空间域到频域的转换是图像处理的重要技术,频域分析能够揭示图像中不易察觉的周期性特征和纹理信息。
核心原理:
- 二维离散傅里叶变换(DFT):将图像从空间域转换到频域
- 频谱可视化:通过对数变换增强低频和高频成分的可见度
- 频移操作:将频谱中的直流分量移至中心位置,便于观察
import cv2
import numpy as np
# 读取图像
image_path = r'C:\Users\Administrator\Desktop\1.jpg'
image = cv2.imread(image_path)# 检查图像是否成功读取
if image is None:print("无法读取图像,请检查图像路径是否正确。")
else:# 剪切图像的中心区域(大小为原图的1/4)h, w = image.shape[:2]start_h = h // 4start_w = w // 4end_h = start_h + h // 2end_w = start_w + w // 2cropped_image = image[start_h:end_h, start_w:end_w]# 转换为灰度图(频域分析通常在灰度图上进行)gray_cropped = cv2.cvtColor(cropped_image, cv2.COLOR_BGR2GRAY)# 进行二维离散傅里叶变换f = np.fft.fft2(gray_cropped) # 快速傅里叶变换fshift = np.fft.fftshift(f) # 将直流分量移至中心# 计算幅度谱(取对数增强可视化效果)magnitude_spectrum = 20 * np.log(np.abs(fshift) + 1) # 加1避免log(0)# 归一化到0-255范围以便显示normalized_spectrum = cv2.normalize(magnitude_spectrum, None, 0, 255, cv2.NORM_MINMAX)# 显示原始图像、剪切图像和频域幅度谱cv2.imshow('Original Image', image)cv2.imshow('Cropped Image', cropped_image)cv2.imshow('Magnitude Spectrum', normalized_spectrum.astype(np.uint8))# 等待按键关闭窗口cv2.waitKey(0)cv2.destroyAllWindows()
效果展示:

🔍 分析提示:频谱中心亮点代表图像中的低频成分(缓慢变化区域),而远离中心的点代表高频成分(边缘和细节)。水平或垂直的亮线表明图像中存在相应方向的重复模式。
5. 二维离散余弦变换与逆变换
离散余弦变换(DCT)是JPEG压缩的核心技术,它将图像变换到频域中,实现能量集中,便于数据压缩。
核心原理:
- DCT变换:将图像从空间域转换到频域,但只使用余弦函数(实数变换)
- 能量集中:DCT后图像的能量主要集中在左上角低频区域
- 逆DCT:通过DCT系数重建原始图像
import cv2
import numpy as np
# 读取图像
image_path = r'C:\Users\Administrator\Desktop\1.jpg'
image = cv2.imread(image_path)
# 检查图像是否成功读取
if image is None:print("无法读取图像,请检查图像路径是否正确。")
else:# 转换为灰度图gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)# 为获得更好的DCT效果,将图像裁剪为8的倍数尺寸h, w = gray_image.shape[:2]h_new, w_new = h - h % 8, w - w % 8gray_image = gray_image[:h_new, :w_new]# 进行二维离散余弦变换dct = cv2.dct(np.float32(gray_image))# DCT系数可视化(取对数并归一化增强可见度)dct_log = np.log(np.abs(dct) + 1)dct_visual = np.uint8(cv2.normalize(dct_log, None, 0, 255, cv2.NORM_MINMAX))# 进行二维离散余弦逆变换重建图像idct = cv2.idct(dct)idct = np.uint8(np.clip(idct, 0, 255)) # 确保像素值在有效范围内# 计算重建图像与原图的误差(理论上应该非常小)error = cv2.absdiff(gray_image, idct)# 显示原始图像、DCT系数和IDCT恢复的图像cv2.imshow('Original Grayscale', gray_image)cv2.imshow('DCT Coefficients', dct_visual)cv2.imshow('Restored Image (IDCT)', idct)cv2.imshow('Reconstruction Error', error)# 等待按键关闭窗口cv2.waitKey(0)cv2.destroyAllWindows()
效果展示:

🔧 实用技巧:在图像压缩应用中,可以通过保留DCT系数中的前N%(例如10%)的主要系数,丢弃其余系数,然后进行IDCT重建,可以实现高压缩率且视觉质量损失小的图像压缩。
总结与进阶
通过本文的实验,我们系统学习了OpenCV中的几何变换和频域分析技术,这些是计算机视觉中不可或缺的基础工具。从简单的平移到复杂的频域变换,每种技术都有其特定的应用场景和优势。
关键技术点总结
| 变换类型 | 主要函数 | 应用场景 | 注意事项 |
|---|---|---|---|
| 平移 | cv2.warpAffine | 图像对齐、ROI提取 | 注意边界处理方式 |
| 缩放 | cv2.resize | 金字塔分析、预处理 | 不同插值方法影响质量和速度 |
| 旋转 | cv2.getRotationMatrix2D + cv2.warpAffine | 方向归一化、姿态校正 | 旋转后尺寸变化 |
| 傅里叶变换 | np.fft.fft2 | 频域滤波、周期模式检测 | 复数结果需特殊处理 |
| 离散余弦变换 | cv2.dct | 图像压缩、特征提取 | 能量集中在左上角 |
进阶学习方向
- 图像配准技术:结合特征提取和几何变换,实现不同图像间的精确对齐
- 频域滤波:学习使用傅里叶变换实现低通、高通和带通滤波
- 小波变换:比傅里叶变换更适合处理图像的多分辨率分析
- 深度学习在图像变换中的应用:如超分辨率重建、图像风格迁移等
🚀 更多高级教程和完整代码:请访问我的GitHub仓库 https://github.com/Despacito0o/opencv,持续更新OpenCV图像处理的最佳实践和实用技巧!
如果本文对你有所帮助,别忘了点赞、收藏和关注,你的支持是我创作的最大动力!如有疑问,欢迎在评论区留言交流。
相关文章:
OpenCV图像处理进阶教程:几何变换与频域分析全解析
OpenCV图像处理进阶教程:几何变换与频域分析全解析 📚 本文提供了OpenCV图像处理的核心操作详解,从基础的几何变换到高级的频域分析,代码示例清晰易懂,实用性强。完整代码已开源至GitHub:https://github.co…...
AJAX与Axios基础
目录 一、AJAX 核心概念解析 1.1 AJAX 的核心概念 1.2 AJAX 工作原理 1.3 AJAX 局限性 二、axios 库介绍 2.1 Axios 核心特性 2.2 快速上手 2.3 核心配置项 2.4 错误处理标准方案 三、Axios 核心配置项 3.1 常用核心配置项 1. url 2. method 3. params 4. data …...
[OS] vDSO + vvar(频繁调用的处理) | 存储:寄存器(高效)和栈(空间大)| ELF标准包装规范(加速程序加载)
vDSO vvar 一、社区公告板系统(类比 vDSO vvar) 想象你住在一个大型社区,管理员(内核)需要向居民(用户程序)提供实时信息(如天气预报、社区活动时间等)。直接让每个居…...
Sentinel源码—1.使用演示和简介二
大纲 1.Sentinel流量治理框架简介 2.Sentinel源码编译及Demo演示 3.Dashboard功能介绍 4.流控规则使用演示 5.熔断规则使用演示 6.热点规则使用演示 7.授权规则使用演示 8.系统规则使用演示 9.集群流控使用演示 5.熔断规则使用演示 (1)案例说明熔断和降级 (2)Sentin…...
IDEA的常用设置(更新中......)
文章目录 1. 自动导包2. 忽略大小写3. 设置项目文件编码格式4. 设置方法之间分割线5. 设置字体大小6. 设置IDEA默认不打开项目持续更新中...... 1. 自动导包 File->Settings->Editor->General>Auto Import 2. 忽略大小写 File->Editor->General->Code…...
SQL注入之时间盲注攻击流程详解
目录 一、时间盲注原理 二、完整攻击流程 1. 注入点确认 2. 基础条件判断 3. 系统信息收集 (1)获取数据库版本 (2)获取当前数据库名 4. 数据提取技术 (1)表名枚举 (2)列名猜…...
【ROS2】行为树 BehaviorTree(三):异步操作
【ROS】郭老二博文之:ROS目录 1、简述 前面的例子中,使用过同步节点 SyncActionNode,当调用到该节点时,成功返回SUCCESS,失败返回FAILURE,并且线程会等待该节点执行完毕。 如果需要异步操作,比如节点执行需要很长时间,不能立刻返回结果,可以先去执行其它任务,等该…...
比特币不是solidity编写吗,比特币不是基于 Solidity
对!你这个问题问得非常精准——比特币不是基于 Solidity 的,而且它和以太坊智能合约的设计思路也完全不同。我们来讲清楚👇 ❌ 比特币不是 Solidity 的! 📌 原因如下: 项目智能合约语言说明比特币&#x…...
c# Kestrel
Kestrel 是 .NET 中用于 ASP.NET Core 应用程序的跨平台 Web 服务器。它是轻量级且高性能的,能够处理大量并发连接,常被用作 ASP.NET Core 应用的默认服务器。以下为你介绍 Kestrel 的基本使用和配置: 基本使用 创建一个简单的 ASP.NET Cor…...
x86 保护模式中的GDT表是什么?
GDT(全局描述符表,Global Descriptor Table)是 x86 保护模式下用于描述不同类型内存段的一个重要数据结构。在保护模式下,GDT 用于管理和保护系统内存,它通过提供一组段描述符来定义内存的访问权限、大小、类型等属性 …...
筛选条件在on和where中的区别(基于hivesql)
理解筛选条件在on和where中的区别,最好先理解sql的执行顺序,尽管实际执行时不同的物理执行引擎可能会有特定的优化,但是逻辑执行顺序必须遵循: 1)from:确定数据源是什么,from后可以是单表&#…...
自然语言处理Hugging Face Transformers
Hugging Face Transformers 是一个基于 PyTorch 和 TensorFlow 的开源库,专注于 最先进的自然语言处理(NLP)模型,如 BERT、GPT、RoBERTa、T5 等。它提供了 预训练模型、微调工具和推理 API,广泛应用于文本分类、机器翻…...
vue3+vite+ts使用daisyui/tailwindcss
vite创建vue3脚手架 npm init vitelatest myVue3 – --template vue cd .\myVue3\ npm i npm run dev 安装tailwindcss/daisyui 依赖安装 npm install -D tailwindcss postcss autoprefixer daisyui npx tailwindcss init -p 这条命令将生成postcss.config.js(因为加了…...
Android常见界面控件、程序活动单元Activity练习
第3章 Android常见界面控件、第4章程序活动单元Activity 一. 填空题 1. (填空题)Activity的启动模式包括standard、singleTop、singleTask和_________。 正确答案: (1) singleInstance 2. (填空题)启动一个新的Activity并且获取这个Activity的返回数据ÿ…...
大模型在直肠癌诊疗全流程预测及应用研究报告
目录 一、引言 1.1 研究背景与目的 1.2 国内外研究现状 1.3 研究方法与创新点 二、大模型预测直肠癌的原理与技术基础 2.1 大模型技术概述 2.2 用于直肠癌预测的数据来源 2.3 模型构建与训练过程 三、术前预测 3.1 肿瘤分期预测 3.1.1 基于影像组学的 T 分期预测模型…...
大联盟(特别版)双端互动平台完整套件分享:含多模块源码+本地部署环境
这是一套结构清晰、功能完整的互动平台组件,适合有开发经验的技术人员进行模块参考、结构研究或本地部署实验使用。 该平台覆盖前端展示、后端服务、移动端资源以及完整数据库,采用模块化架构,整体部署流程简单清晰,适合自研团队参…...
设计模式:迪米特法则 - 最少依赖,实现高内聚低耦合
一、迪米特法则简介 迪米特法则(Law of Demeter,简称 LoD),也称为“最少知识法则”,核心思想是:一个对象应当对其他对象有最少的了解,仅与直接相关的对象交互。通过减少对象之间的耦合度&#…...
Spark-SQL
Spark-SQL 概述 Spark SQL 是 Spark 用于结构化数据(structured data)处理的 Spark 模块 Shark 是伯克利实验室 Spark 生态环境的组件之一,是基于 Hive 所开发的工具,它修改了内存管理、物理计划、执行三个模块,并使之能运行在 Spark 引擎上…...
多任务响应2(Qt)
多任务响应2 扩展方案1. 设计思路2. 示例代码3. 说明 在多任务响应1的基础上,当任务响应比较复杂时,需要整合多个模块的信息。 扩展方案 利用【中介者模式】或【系统上下文】来整合多个模块的信息,并在命令对象中通过依赖注入(D…...
【MySQL】MVCC工作原理、事务隔离机制、undo log回滚日志、间隙锁
一、什么是MVCC? MVCC,即 Multiversion Concurrency Control(多版本并发控制),它是数据库实现并发控制的一种方式。 MVCC 的核心思想是: 为每个事务提供数据的“快照”版本,从而避免加锁&…...
无人机气动-结构耦合技术要点与难点
一、技术要点 1. 多学科耦合建模 气动载荷与结构响应的双向耦合:气动力(如升力、阻力、力矩)导致结构变形,而变形改变气动外形,进一步影响气流分布,形成闭环反馈。 建模方法: 高精度C…...
七大数据库全面对比:ClickHouse、ES、MySQL等特性、优缺点及使用场景
七大数据库全面对比:ClickHouse、ES、MySQL等特性、优缺点及使用场景 引言 在数字化时代,数据库的选择对于业务的成功至关重要。本文将通过表格形式,对ClickHouse、Elasticsearch(ES)、MySQL、SQL Server、MongoDB、HBase、Cassandra这七大数据库进行特性、优缺点及使用…...
element-ui plus 中 filter-method 函数多次触发问题解决
前情提要 点进这个文章的小伙伴,应该都是为了解决一个需求,把原本的前端过滤改为后端过滤,但是将filter-method修改为后端取数据后,发现其触发了很多次。博主也是在修改表格过滤时用到了这个坑,本篇文章为大家解决一下…...
基于【Lang Chain】构建智能问答系统的实战指南
🐇明明跟你说过:个人主页 🏅个人专栏:《深度探秘:AI界的007》 🏅 🔖行路有良友,便是天堂🔖 目录 一、引言 1、什么是Lang Chain 2、LangChain在问答系统中的核心优…...
idea的快捷键使用以及相关设置
文章目录 快捷键常用设置 快捷键 快捷键作用ctrlshift/注释选中内容Ctrl /注释一行/** Enter文档注释ALT SHIFT ↑, ALT SHIFT ↓上下移动当前代码Ctrl ALT L格式化代码Ctrl X删除所在行并复制该行Ctrl D复制当前行数据到下一行main/psvm快速生成入口程序soutSystem.o…...
TestHubo安装及入门指南
TestHubo是一款开源免费的测试管理工具,提供一站式测试解决方案,涵盖功能测试、接口测试、性能测试以及 Web 和 App 测试等多个维度。TestHubo 整合了全面的测试能力,使团队可以在一个平台内完成所有测试需求。本文将介绍如何快速安装配置及入…...
react tailwindcss最简单的开始
参考教程: Install Tailwind CSS with Vite - TailwindCSS中文文档 | TailwindCSS中文网https://www.tailwindcss.cn/docs/guides/vite操作过程: Microsoft Windows [版本 10.0.26100.3476] (c) Microsoft Corporation。保留所有权利。D:\gitee\tailwi…...
openGauss新特性 | 自动参数化执行计划缓存
目录 自动化参数执行计划缓存简介 SQL参数化及约束条件 一般常量参数化示例 总结 自动化参数执行计划缓存简介 执行计划缓存用于减少执行计划的生成次数。openGauss数据库会缓存之前生成的执行计划,以便在下次执行该SQL时直接使用,可…...
3、组件:魔法傀儡的诞生——React 19 组件化开发全解析
一、开篇:魔法傀儡的觉醒 "每个React组件都像一具魔法傀儡,"邓布利多校长挥动魔杖,空中浮现出闪烁的代码字符,"它们能自主思考、协同工作,甚至能跨越时空(服务器与客户端)执行任…...
使用Python实现矢量路径的压缩、解压与可视化
引言 在图形设计和Web开发中,矢量路径数据的高效存储与传输至关重要。本文将通过一个Python示例,展示如何将复杂的矢量路径命令序列压缩为JSON格式,再将其解压还原,并通过matplotlib进行可视化。这一过程可应用于字体设计、矢量图…...
