当前位置：首页 > news >正文

OCR图片矫正、表格检测及裁剪综合实践

news 2026/2/9 4:24:40

问题描述

实际工程中，我们经常需要对图片进行预处理，比如：

1、图片是倾斜的

2、图片背景需要处理掉

3、图片的公章需要剔除

4、图片过暗，过亮

5、图片表格检测

6、图片表格版面分析

。。。。。。等等各种情况。

结果展示

本文以表格图片为例，介绍如何进行矫正、表格检测及裁剪保存图片。

原始图片

矫正之后

表格检测

裁剪之后

代码详解

图片矫正

通过多次旋转计算最佳旋转角度并应用旋转矩阵矫正图片

#coding=utf-8
import cv2
import numpy as np
def rotate_image(image, angle):(h, w) = image.shape[: 2]center = (w // 2, h // 2)M = cv2.getRotationMatrix2D(center, angle, 1.0)corrected = cv2.warpAffine(image, M, (w, h), flags = cv2.INTER_CUBIC, \borderMode = cv2.BORDER_REPLICATE)return correcteddef determine_score(arr):histogram = np.sum(arr, axis = 2, dtype = float)score = np.sum((histogram[..., 1 :] - histogram[..., : -1]) ** 2, \axis = 1, dtype = float)return scoredef correct_skew(image, delta = 0.05, limit = 10):thresh = cv2.threshold(image, 0, 255, cv2.THRESH_BINARY_INV + \cv2.THRESH_OTSU)[1]angles = np.arange(-limit, limit + delta, delta)img_stack = np.stack([rotate_image(thresh, angle) for angle \in angles], axis = 0)scores = determine_score(img_stack)best_angle = angles[np.argmax(scores)]corrected = rotate_image(image, best_angle)return best_angle, corrected
if __name__ == "__main__":batch_folder = r'D:\temp\pics'out_folder = r'D:\temp\picsout/'for root, dirs, files in os.walk(batch_folder):for file in files:file_path = os.path.join(root, file)file_path = file_path.replace('\\', '/')img = cv2.imread(file_path, 0)angle, corrected = correct_skew(img)print(angle,file_path)cv2.imwrite(out_folder + file_path.split('/')[-1], corrected)

表格识别

通过微软的table-transformer-detection进行表格，该模型可在Hugging Face 官网下载。

图片裁剪

通过PIL里的Image的crop方法对指定的let_top,right_bottom进行裁剪。

OCR图片矫正、表格检测及裁剪综合实践

问题描述实际工程中，我们经常需要对图片进行预处理，比如： 1、图片是倾斜的 2、图片背景需要处理掉 3、图片的公章需要剔除 4、图片过暗，过亮 5、图片表格检测 6、图片表格版面分析。。。。。。等等各种情况。结果展示…...

编程日记 2024/8/5 7:20:24

c++ 容器 vector

vector的意思就是向量，就是一个顺序表的意思，这个顺序表可以存任意的类型，因为其线性的内存特点，所以在stl里是经常被使用的存在。 vector vector既然要能储存任意的变量，那么就必须使用模板: 这里的T就是变量类型&a…...

编程日记 2024/8/5 7:19:23

零基础部署Minecraft到云服务器上教程

零基础部署Minecraft到云服务器上教程温馨提示温馨提示本教程是由博主个人飞书上直接复制下来，观感较差，请下载本教程对应的pdf资源文件进行查看（在最顶端，不过恳请各位留下一个赞再走吧）。本教程不包含云服务的购…...

编程日记 2024/8/5 7:14:18

常见cms漏洞之dedecms

DedeCMS是织梦团队开发PHP 网站管理系统，它以简单、易用、高效为特色，组建出各种各样各具特色的网站，如地方门户、行业门户、政府及企事业站点等。下载地址请网上自行寻找搭建方式选择php study 首先搭建环境 #前台http://localhost/dedecm…...

编程日记 2024/8/5 7:13:17

深入探究Liunx服务器内存：模拟程序实际占用与缓存占用内存

文章目录深入探究Liunx服务器内存：模拟程序实际占用与缓存占用内存实际内存占用：使用 memtester安装 memtester下载和编译安装 memtester 使用 memtester 缓存占用：使用虚拟内存构造内存消耗创建虚拟内存目录挂载虚拟内存创建大文件以消耗内…...

编程日记 2024/8/5 7:12:16

《Milvus Cloud向量数据库指南》——Zilliz Cloud 高可用性深度解析：赋能GenAI应用，引领非结构化数据新纪元

在人工智能与大数据技术日新月异的今天，非结构化数据的处理与分析已成为推动行业智能化转型的关键驱动力。Zilliz Cloud，作为基于开源向量数据库Milvus构建的全托管解决方案，不仅革新了非结构化数据的存储与查询方式，更以其卓越的高可用性设计，为开发人员构建高效、可靠的…...

编程日记 2024/8/5 7:09:12

2024/8/4 维高-STD60N驱动器（伺服）---客户反馈：电机异响

步进电机 MHS1A86-60B85B ，额定电流6A 步骤一：设置额定电流 std60n驱动器拔码全部为off（后台设置），伺服后台连上后设置h00-11按电机铭牌进行设置下额定电流步骤二：最好设置峰值电流一…...

编程日记 2024/8/5 7:07:11

驾驭RESTful海洋：在PyCharm中配置和使用REST客户端全攻略

标题：驾驭RESTful海洋：在PyCharm中配置和使用REST客户端全攻略引言在当今的软件开发中，REST（Representational State Transfer）API已成为前后端分离架构的核心组成部分。PyCharm，作为业界领先的集成开发…...

编程日记 2024/8/5 7:03:05

策略模式的一次应用

项目的需求是将一组图像按照相似度分类。采用了模板匹配计算相似度的实现方式。 #include <opencv2/core.hpp> #include <openev2/core/utility.hpp> #include <opencv2/highqui.hpp> #include <openav2/imgproc.hpp> cv::Mat image matched; double …...

编程日记 2024/8/5 7:02:04

探索PyCharm的C/C++支持：一站式配置指南

探索PyCharm的C/C支持：一站式配置指南引言 PyCharm，作为JetBrains家族中的一个强大IDE，以其对Python的卓越支持而闻名。然而，PyCharm的多语言支持同样不容小觑。本文将带领你了解如何在PyCharm中配置C/C环境，让你在…...

编程日记 2024/8/5 7:01:03

手机三要素接口怎么对接呢？（一）

一、什么是手机三要素？ 手机三要素又叫运营商三要素，运营商实名认证，运营商实名核验，手机三要素实名验证，手机三要素实名核验，每个人的称呼都不同，但是入参和出参是一样的。输入姓名、身份证…...

编程日记 2024/8/5 7:00:02

状态同步帧同步

帧同步： 有明确的逻辑帧概念，按照固定的逻辑帧间隔同步帧数据原理锁帧：mmo那种游戏，服务器需要收到第k帧所有客户端的指令，就算没有操作也发个空指令上去（相对来说回合制卡牌这类就简单很多&#xff0…...

编程日记 2024/8/5 6:59:01

Flink 开发语言选择 —— Java vs Scala

引言 Apache Flink 是一个用于处理无界和有界数据流的开源分布式计算框架。随着 Flink 的日益流行，越来越多的开发者开始考虑使用哪种编程语言来进行 Flink 应用程序的开发。本文将探讨在 Flink 中使用 Java 和 Scala 的优缺点，并帮助你做出更明智的选择…...

编程日记 2024/8/5 6:57:59

如何在 Apache Web 服务器中安装、配置和使用模块

前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。 ## 状态：已弃用本文涵盖的是不再受支持的 Ubuntu 版本。如果您目前正在运行 Ubuntu 12.04 服务器，我们强烈建议升…...

编程日记 2024/8/5 6:56:57

海信聚好看的DBDocter软件使用心得

在墨天轮大会看到这个软件,好称是内核级别的诊断工具, 工作空闲下载免费看看结果要1.7GB还TAR. DBdoctor是一款内核级数据库性能诊断软件。可以对数据库做细粒度的扫描，帮助您一分钟内找到数据库性能问题，实现性能诊断百倍提效。针对数据库性能诊断门…...

编程日记 2024/8/5 6:55:56

dfs深搜

Problem - C - Codeforces 无向图,判断是否是子叶....

编程日记 2024/8/5 6:54:55

【React】详解 index.js 文件

文章目录一、index.js文件的基本结构1. 引入必要的模块2. 渲染根组件3. 注册服务工作者（可选） 二、index.js文件的详细解析1. ReactDOM.render的作用2. 为什么使用React.StrictMode3. 服务工作者的注册三、index.js文件的最佳实践1. 使用模块化引入2. …...

编程日记 2024/8/5 6:53:54

Android NDK/JNI面试题大全及参考答案（3万字长文）

目录什么是NDK？它主要用来做什么？为什么在Android开发中使用NDK？描述一下NDK和JDK之间的关系举出一些使用NDK开发的应用场景什么是JNI？它如何与NDK配合使用？如何安装和配置Android NDK？在Android Studio中如何配置NDK路径？描述一下NDK工具链中的主要工具…...

编程日记 2024/8/5 6:52:53

从根儿上学习spring一之杂谈

相信学做Java开发的同学从开始工作时就被问及什么是spring的依赖注入，以及切面编程。今天我们简单再聊聊这两个概念。依赖注入这里的依赖不是动词依赖依靠的意思，而是名词。可以把这两个词翻过来读下”注入依赖“，所谓的依赖可以理解成一…...

编程日记 2024/8/5 6:50:51

AI智能名片小程序在促销性内容营销中的创新应用与策略分析

摘要：在数字化时代，企业营销手段日益丰富多元，促销性内容作为吸引顾客、促进消费的关键手段之一，其形式与效率不断被革新。随着人工智能（AI）技术的飞速发展，AI智能名片小程序作为一种新兴的营销…...

编程日记 2024/8/5 6:49:50

【git】把本地更改提交远程新分支feature_g

创建并切换新分支 git checkout -b feature_g 添加并提交更改 git add . git commit -m “实现图片上传功能” 推送到远程 git push -u origin feature_g...

编程新知 2025/12/13 4:20:30

ArcGIS Pro制作水平横向图例+多级标注

今天介绍下载ArcGIS Pro中如何设置水平横向图例。之前我们介绍了ArcGIS的横向图例制作：ArcGIS横向、多列图例、顺序重排、符号居中、批量更改图例符号等等（ArcGIS出图图例8大技巧），那这次我们看看ArcGIS Pro如何更加快捷的操作。…...

编程新知 2026/2/4 17:18:03

Swagger和OpenApi的前世今生

Swagger与OpenAPI的关系演进是API标准化进程中的重要篇章，二者共同塑造了现代RESTful API的开发范式。本期就扒一扒其技术演进的关键节点与核心逻辑： 🔄 一、起源与初创期：Swagger的诞生（2010-2014） 核心…...

编程新知 2026/1/25 9:08:41

学校时钟系统，标准考场时钟系统，AI亮相2025高考，赛思时钟系统为教育公平筑起“精准防线”

2025年#高考将在近日拉开帷幕，#AI 监考一度冲上热搜。当AI深度融入高考，#时间同步不再是辅助功能，而是决定AI监考系统成败的“生命线”。 AI亮相2025高考，40种异常行为0.5秒精准识别 2025年高考即将拉开帷幕，江西、…...

编程新知 2026/2/8 22:07:52

Unsafe Fileupload篇补充-木马的详细教程与木马分享（中国蚁剑方式）

在之前的皮卡丘靶场第九期Unsafe Fileupload篇中我们学习了木马的原理并且学了一个简单的木马文件本期内容是为了更好的为大家解释木马（服务器方面的）的原理，连接，以及各种木马及连接工具的分享文件木马：https://w…...

编程新知 2026/1/25 10:13:29

技术栈RabbitMq的介绍和使用

目录 1. 什么是消息队列？2. 消息队列的优点3. RabbitMQ 消息队列概述4. RabbitMQ 安装5. Exchange 四种类型5.1 direct 精准匹配5.2 fanout 广播5.3 topic 正则匹配 6. RabbitMQ 队列模式6.1 简单队列模式6.2 工作队列模式6.3 发布/订阅模式6.4 路由模式6.5 主题模式…...

编程新知 2026/1/23 10:10:53

RabbitMQ入门4.1.0版本（基于java、SpringBoot操作）

RabbitMQ 一、RabbitMQ概述 RabbitMQ RabbitMQ最初由LShift和CohesiveFT于2007年开发，后来由Pivotal Software Inc.（现为VMware子公司）接管。RabbitMQ 是一个开源的消息代理和队列服务器，用 Erlang 语言编写。广泛应用于各种分布…...

编程新知 2026/1/31 3:52:49