当前位置: 首页 > news >正文

基于OpenCV的图像处理案例之图像矫正(Python)

Index 目录索引

  • 写在前面
  • 解决思路
  • 参考

写在前面

本文通过一个案例介绍如何使用OpenCV将倾斜的扫描文档图像进行水平矫正。

解决思路

因为扫描图像中的大部分文字倾斜后,同一行文字也在同一条直线,所以可以通过拟合直线来计算文本倾斜角度,接着对这些倾斜角度进行排序,选择其中值作为最终的旋转角度,通过旋转来实现倾斜图像的水平矫正1。本文在参考文档的基础上,进行了中值筛选,从而更好地对倾斜图像进行矫正。

废话不多说,直接上代码:

import numpy as np
import os
import cv2
import math
from scipy import misc, ndimagedef getMedianAngle(lines):angles = []for line in lines:x1, y1, x2, y2 = line[0]# 计算直线的斜率if x1 != x2:  # 避免除以零错误slope = (y2 - y1) / (x2 - x1)# 计算斜率对应的角度angle = np.degrees(math.atan(slope))angles.append(angle)# 计算角度的中位数median_angle = np.median(angles)return median_angledef rotate(image, angle, center=None, scale=1.0):(w, h) = image.shape[0:2]if center is None:center = (w // 2, h // 2)wrapMat = cv2.getRotationMatrix2D(center, angle, scale)return cv2.warpAffine(image, wrapMat, (h, w))# 使用霍夫变换
def getCorrect2():# 读取图片,灰度化src = cv2.imread('./text_correct/640.png')showAndWaitKey("src", src)gray = cv2.cvtColor(src, cv2.COLOR_BGR2GRAY)showAndWaitKey("gray", gray)# 腐蚀、膨胀kernel = np.ones((5, 5), np.uint8)erode_Img = cv2.erode(gray, kernel)eroDil = cv2.dilate(erode_Img, kernel)showAndWaitKey("eroDil", eroDil)# 边缘检测canny = cv2.Canny(eroDil, 50, 150)showAndWaitKey("canny", canny)# 霍夫变换得到线条lines = cv2.HoughLinesP(canny, 0.8, np.pi / 180, 90, minLineLength=100, maxLineGap=10)# 求得拟合图像倾斜角度的中位数median_angle = getMedianAngle(lines)print("Median Angle:", median_angle)drawing = np.zeros(src.shape[:], dtype=np.uint8)# 画出线条for line in lines:x1, y1, x2, y2 = line[0]cv2.line(drawing, (x1, y1), (x2, y2), (0, 255, 0), 1, lineType=cv2.LINE_AA)showAndWaitKey("houghP", drawing)"""旋转角度大于0,则逆时针旋转,否则顺时针旋转"""rotateImg = rotate(src, median_angle)cv2.imshow("rotateImg", rotateImg)cv2.waitKey()cv2.destroyAllWindows()cv2.imwrite('./text_correct/result.jpg', rotateImg)def showAndWaitKey(winName, img):cv2.imshow(winName, img)cv2.waitKey()if __name__ == "__main__":getCorrect2()

原图和结果图分别如下:

原图
原图
矫正后的图像
结果图


如果我的这篇文章帮助到了你,那我也会感到很高兴,一个人能走多远,在于与谁同行


参考


  1. 实战 | OpenCV实现扫描文本矫正应用与实现详解(附源码) ↩︎

相关文章:

基于OpenCV的图像处理案例之图像矫正(Python)

Index 目录索引 写在前面解决思路参考 写在前面 本文通过一个案例介绍如何使用OpenCV将倾斜的扫描文档图像进行水平矫正。 解决思路 因为扫描图像中的大部分文字倾斜后,同一行文字也在同一条直线,所以可以通过拟合直线来计算文本倾斜角度,…...

创建linux虚拟机系统:(安装Ubuntu镜像文件,包含语言设置、中文输入法、时间设置)

我下载的是清华大写开源软件镜像站中的ubuntu-20.04.6-desktop-amd64.iso这个镜像文件, 这个文件我下载完成之后没有解压,直接在创建虚拟机的时候选择的压缩包。 地址为:Index of /ubuntu-releases/20.04/ | 清华大学开源软件镜像站 | Tsin…...

3.0 V-22V 宽输入电压,高效率异步升压芯片-ZCC5429

一、产品综述 ZCC5429 芯片是一款自动调频、最高 600KHz工作频率、高效率、宽输入电压范围的电流模式异 步升压(BOOST)芯片,且可调输入限流功能。用户可灵活地通过外部补偿建立动态环路,获得在所有条件下最优瞬态性能。 ZCC542…...

Sphinx + Readthedocs 避坑速通指南

博主在学习使用 Sphinx 和 Read the docs 的过程中, 碰到了许多奇葩的 bug, 使得很简单的任务花费了很长的时间才解决,现在在这里做一个分享,帮助大家用更少的时间高效上线文档的内容。 总的来说, 任务分为两个部分: …...

IPP-7010 表面贴装 90 度混合耦合器

IPP-7010 表面贴装 90 度混合耦合器 IPP-7010 是一款表面贴装 90 度混合耦合器,工作频率为 800 至 2500 MHz(0.8 至 2.5 GHz),平均额定功率为 200 瓦。IPP-7010 采用 0.40 x 1.80 英寸表面贴装封装。IPP-7010的幅度平衡小于0.6dB&…...

25.2 微服务Dubbo

25.2 微服务Dubbo 1. Dubbo简介2. RPC3. Dubbo工作原理4. 代码实操4.1 父项目1. 依赖4.2 服务提供者1. 依赖2. 配置文件3. 启动类4. 业务类4.3 服务消费者1. 依赖2. 配置文件3. 消费者启动类4. 业务:实现远程调用...

CI/CD环境搭建

服务简介 Gitlab 官网:https://about.gitlab.com/ GitLab 是一个用于仓库管理系统的开源项目,使用Git作为代码管理工具,并在此基础上搭建起来的Web服务。安装方法是参考GitLab在GitHub上的Wiki页面。Gitlab是被广泛使用的基于git的开源代码管…...

API调试管理工具Postman下载及操作介绍

1.下载安装postman地址:https://www.getpostman.com/downloads/ 2.创建项目 3.创建请求API 然后点击save保存api 4.用一个变量保存主域名,方便后续操作 就类似下面的baseurl 5.创建新环境 6.添加变量(如添加本地测试环境url——ba…...

vue集成百度地图,实现关键字搜索并自定义覆盖物,保存成静态图片

vue集成百度地图&#xff0c;实现关键字搜索并自定义覆盖物 index.html引入百度地图js <script type"text/javascript" src"https://api.map.baidu.com/api?v2.0&typewebgl&akxxxxxxwMprS7jIfPt354VdgP"></script>vue页面代码 <…...

Java中的Stream流

一、介绍 1. Stream流的作用 结合了Lambda表达式&#xff0c;简化集合、数组的操作。 2. Stream流的使用步骤 ①先得到一条Stream流&#xff0c;并把数据放上去&#xff1b; 获取方式方法名说明单列集合default Stream<E> stream()Collection中的默认方法双列集合无无…...

前端UI怎么防止用户反复提交?

方法1&#xff1a;禁用按钮 用户点击“xxx”按钮后&#xff0c;先禁用按钮&#xff0c;防止用户多次点击&#xff1b;待请求完成后&#xff0c;再解禁按钮。 方法2&#xff1a;防抖&#xff08;Debouncing&#xff09; 防抖是一种技术&#xff0c;它可以延迟执行函数&#xff0…...

OpenHarmony游戏应用程序-实现的一个手柄游戏

介绍 本篇Codelab是基于TS扩展的声明式开发范式编程语言&#xff0c;以及OpenHarmony的分布式能力实现的一个手柄游戏。 说明&#xff1a; 本示例涉及使用系统接口&#xff0c;需要手动替换Full SDK才能编译通过。 完成本篇Codelab需要两台开发板&#xff0c;一台开发板作为游…...

Redis+Lua脚本+SpringAOP实现接口限流

提到限流,常规情况,可以通过spring-cloud-starter-alibaba-sentinel 或者 resilience4j-ratelimiter 组件完成,但是如果不借助现有组件让我们自己开发一套限流工作应该如何应对呢? 本次我们通过Redis + Lua 脚本来实现一个限流组件。 首先创建项目:redis-limit <?xml…...

【wpf应用8】如何让WPF Grid控件根据屏幕尺寸自动调整

简介&#xff1a; 在Windows Presentation Foundation&#xff08;WPF&#xff09;中&#xff0c;Grid控件是一个强大的布局工具&#xff0c;它允许开发者创建复杂且响应迅速的用户界面。在不同的设备和屏幕尺寸上保持良好的布局一致性是一个挑战。本文将介绍如何让Grid控件根据…...

掌握ChatGPT:如何用AI撰写高质量论文

ChatGPT无限次数:点击直达 掌握ChatGPT&#xff1a;如何用AI撰写高质量论文 在当今信息爆炸的时代&#xff0c;人们不仅需要大量信息&#xff0c;还需要这些信息的整理与创新。人工智能技术正是我们在这个信息化时代最强大的助手之一。ChatGPT是一款基于大型神经网络的语言生成…...

平衡隐私与效率,Partisia Blockchain 解锁数字安全新时代

原文&#xff1a;https://cointelegraph.com/news/exploring-multiparty-computations-role-in-the-future-of-blockchain-privacy&#xff1b; https://medium.com/partisia-blockchain/unlocking-tomorrow-outlook-for-mpc-in-2024-and-beyond-cb170e3ec567 编译&#xff1…...

【JavaScript】NPM常用指令指南

河水清清弯又长 姑娘水边浣霓裳 清风卷过白云旁 飞鸟载来春花香 河水清清弯又长 姑娘水边浣霓裳 清风卷过白云旁 朝霞换夕阳 重逢是梦乡 春潮悠悠送波浪 石桥湾下小舟荡 此去经年谁如常 难得人间笑一场 春潮悠悠送波浪 石桥湾下小舟荡 此去经年谁如常 故人心头上 地久天又长 …...

k8s-多容器Pod、容器保护策略、宽限期、最大生命周期、嵌入式脚本、多容器Pod、资源监控工具

资源对象文件 一、模板与帮助信息 1、资源对象文件优势 命令无法实现高级复杂的功能某些资源对象使用命令无法创建方便管理、保存、追溯历史 2、如何生成资源对象模板 资源对象 Pod 模板使用 run 生成 [rootmaster ~]# kubectl run myweb --imagemyos:nginx --dry-runcli…...

机器学习——线性回归(头歌实训)

头歌机器学习实训代码、答案&#xff0c;如果能够帮到您&#xff0c;希望可以点个赞&#xff01;&#xff01;&#xff01; 如果有问题可以csdn私聊或评论&#xff01;&#xff01;&#xff01;感谢您的支持 目录 第1关&#xff1a;简单线性回归与多元线性回归 第2关&#…...

Echarts 利用多X轴实现未来15天天气预报

Echarts 利用多X轴实现未来15天天气预报 UI 设计图 Echarts 实现效果 代码实现 代码分解 echarts 图表上下均显示数据 通过设置 grid.top 和 grid.bottom 设置白天和夜间天气展示区域 grid: {top: 36%,bottom: 36%,left: 5%,right: 5%}, 天气图标的设置 由于 axisLabel 的…...

MiniCPM-V 4.5本地部署指南:从环境配置到图片视频推理全流程(附常见错误排查)

MiniCPM-V 4.5本地部署实战&#xff1a;从零搭建到多模态推理全攻略 在人工智能技术日新月异的今天&#xff0c;能够处理图片、视频等多模态数据的模型正变得越来越重要。MiniCPM-V 4.5作为一款轻量级但功能强大的多模态大语言模型&#xff0c;凭借其仅80亿参数却能达到超越GPT…...

ShutUp10++ vs 其他隐私工具:实测对比哪款更适合你的Windows系统优化需求

ShutUp10 vs 其他隐私工具&#xff1a;实测对比哪款更适合你的Windows系统优化需求 在数字时代&#xff0c;隐私保护已成为每个Windows用户不可忽视的重要议题。面对系统内置的各种数据收集功能&#xff0c;第三方隐私工具应运而生&#xff0c;它们承诺能帮助我们重新掌控自己的…...

DDD难落地?就让AI干吧! - cleanddd-skills介绍绽

AI训练存储选型的演进路线 第一阶段&#xff1a;单机直连时代 早期的深度学习数据集较小&#xff0c;模型训练通常在单台服务器或单张GPU卡上完成。此时直接将数据存储在训练机器的本地NVMe SSD/HDD上。 其优势在于IO延迟最低&#xff0c;吞吐量极高&#xff0c;也就是“数据…...

高性能无人机飞控系统源码:基于Cesium+Vue3+Vite的三维可视化平台

温馨提示&#xff1a;文末有联系方式1. 基于CesiumVue3Vite的现代化前端架构 采用轻量高效的技术栈构建——CesiumJS提供高精度地理空间渲染能力&#xff0c;Vue3带来响应式数据绑定与组合式API优势&#xff0c;Vite作为极速构建工具显著提升开发与部署体验&#xff0c;确保平台…...

OpenClaw 大结局——接入个人微信厮

本课概览 Microsoft Agent Framework (MAF) 提供了一套强大的 Workflow&#xff08;工作流&#xff09; 框架&#xff0c;用于编排和协调多个智能体&#xff08;Agent&#xff09;或处理组件的执行流程。 本课将以通俗易懂的方式&#xff0c;帮助你理解 MAF Workflow 的核心概念…...

突破付费墙限制:从技术原理到个性化解决方案的完整指南

突破付费墙限制&#xff1a;从技术原理到个性化解决方案的完整指南 当你在研究某个专业领域的前沿动态时&#xff0c;是否曾因遇到"订阅后阅读全文"的提示而被迫中断探索&#xff1f;在信息获取成本日益增加的今天&#xff0c;如何合法合规地突破内容访问限制&#x…...

医疗器械软件生命周期管理注意事项

医疗器械软件生命周期管理注意事项 医疗器械软件生命周期管理需遵循严格的法规要求和质量控制标准&#xff0c;确保软件的安全性、有效性和合规性。以下是关键注意事项&#xff1a; 法规与标准合规 确保符合所在地区的法规要求&#xff0c;如FDA的21 CFR Part 820&#xff08;美…...

从YOLO到餐桌:构建校园食堂智能结算系统的实战指南

1. 为什么选择YOLO做食堂智能结算&#xff1f; 在校园食堂这种特殊场景下&#xff0c;菜品识别面临着诸多挑战&#xff1a;餐盘堆叠造成的遮挡、反光餐具带来的光线干扰、相似菜品的细微差异&#xff08;比如青椒炒肉和土豆炒肉&#xff09;。传统图像处理方法需要针对每种菜品…...

BiliTools哔哩哔哩工具箱:2026年终极跨平台B站资源管理解决方案

BiliTools哔哩哔哩工具箱&#xff1a;2026年终极跨平台B站资源管理解决方案 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱&#xff0c;支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliToo…...

5分钟让Windows 11焕然一新:极速系统加速与性能优化终极指南

5分钟让Windows 11焕然一新&#xff1a;极速系统加速与性能优化终极指南 【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other changes to declutter …...