当前位置：首页 > news >正文

Mac 上使用 Tesseract OCR 识别图片文本

news 2026/5/17 23:28:47

Tesseract OCR 引擎：Tesseract是一个开源的OCR引擎，你需要先安装它。可以从Tesseract官方网站（https://github.com/tesseract-ocr/tesseract）下载适用于你的操作系统的安装程序或源代码，并按照官方文档进行安装。

Tesseract OCR 对于低分辨率或模糊的图片可能无法准确识别。尝试使用更高分辨率和清晰度的图片来提高识别结果的准确性。对于 Mac 上的截图，一般都是很清晰的，所以这个缺点影响不大。

在 Mac 上，使用官网推荐的方式安装：

brew install tesseract

The tesseract directory can then be found using brew info tesseract, e.g.

/usr/local/Cellar/tesseract/5.3.2/bin/tesseract

demo:

import pytesseract
from PIL import Image# 可以写一个函数 crop_picture 将原图裁剪一下，只保留想要识别文本的部分，这样识别更加准确一些。
def crop_picture(picture_path, crop_box: list):"""crap picture with crop_box:param picture_path: picture to be crapped:param crop_box: crop region, eg: [100, 200, 300, 350]:return: path of crapped picture"""dirname = os.path.dirname(picture_path)basename = os.path.basename(picture_path)new_basename = ''.join([basename.split('.')[0], '_new.', basename.split('.')[1]])picture_origin = Image.open(picture_path)picture_origin_size = picture_origin.sizeif crop_box[2] is None:crop_box[2] = picture_origin_size[0]if crop_box[3] is None:crop_box[3] = picture_origin_size[1]picture_new = picture_origin.crop(tuple(crop_box))picture_new_path = os.path.join(dirname, new_basename)picture_new.save(picture_new_path)return picture_new_pathdef get_text_from_picture(picture_path, crop_box: list):"""get text from picture:param picture_path: picture to be crapped:param crop_box: crop region, eg: [100, 200, 300, 350]:return: text"""pytesseract.pytesseract.tesseract_cmd = r'/usr/local/Cellar/tesseract/5.3.2/bin/tesseract'picture_new_path = crop_picture(picture_path, crop_box=crop_box)image = Image.open(picture_new_path)text = pytesseract.image_to_string(image, lang='eng')print(text)return textif __name__ == '__main__':get_text_from_picture('my_picture_path', crop_box=[585, 360, None, 800])

Mac 上使用 Tesseract OCR 识别图片文本

Tesseract OCR 引擎：Tesseract是一个开源的OCR引擎，你需要先安装它。可以从Tesseract官方网站（https://github.com/tesseract-ocr/tesseract）下载适用于你的操作系统的安装程序或源代码，并按照官方文档进行安装。 Tes…...

编程日记 2023/8/1 6:44:26

《MapboxGL 基础知识点》- 放大/缩小/定位/级别

中心点 getCenter：获取中心点 const {lng, lat} map.getCenter(); setCenter：设置中心点 // lng, lat map.setCenter([134, 28]); 缩放级别 getZoom：获取当前缩放级别 map.getZoom(); setZoom：设置缩放级别 map.setZoom(5…...

编程日记 2023/8/1 6:43:25

VScode的简单使用

一、VScode的安装 Visual Studio Code简称VS Code，是一款跨平台的、免费且开源的现代轻量级代码编辑器，支持几乎主流开发语言的语法高亮、智能代码补全、自定义快捷键、括号匹配和颜色区分、代码片段提示、代码对比等特性，也拥有对git的开箱…...

编程日记 2023/8/1 6:42:23

# Unity 如何获取Texture 的内存大小

Unity 如何获取Texture 的内存大小在Unity中，要获取Texture的内存文件大小，可以使用UnityEditor.TextureUtil类中的一些函数。这些函数提供了获取存储内存大小和运行时内存大小的方法。由于UnityEditor.TextureUtil是一个内部类，我们需要使…...

编程日记 2023/8/1 6:41:19

dolphinscheduler switch+传参无坑版

dolphinscheduler 的前后传参有较多的坑，即便是3.0.5版本仍然有一些bug 下面是目前能无坑在3.0.5版本上使用的操作前置任务在界面上设置变量和参数名称跟官方网站不一样，注意最后一行一定使用echo ${setValue(key$query)}的方式，注意引…...

编程日记 2023/8/1 6:40:18

VINS-fusion中用的opencv3，如果安装的opencv4要做一系列替换 VINS-Mono在opencv4环境下的安装问题和解决方法 https://zhuanlan.zhihu.com/p/548140724 Vins-Fusion安装记录 https://zhuanlan.zhihu.com/p/432167383 CV_FONT_HERSHEY_SIMPLEX -> cv::FONT_HER…...

编程日记 2023/8/1 6:39:16

智慧消防：如何基于视频与智能分析技术搭建可视化风险预警平台？

一、背景分析消防安全是一个重要的话题，涉及到每个人的生活和安全。每年都会发生大量的火灾，给人们带来极大的危害，摧毁了大量的财产，甚至造成了可怕的人员伤亡。而消防安全监督管理部门人员有限，消防安全监管缺乏有…...

编程日记 2023/8/1 6:38:14

selenium定位元素的方法

Selenium可以驱动浏览器完成各种操作，比如模拟点击等。要想操作一个元素，首先应该识别这个元素。人有各种的特征（属性），我们可以通过其特征找到人，如通过身份证号、姓名、家庭住址。同理，一个元…...

编程日记 2023/8/1 6:37:10

RISC-V特权级别

特权级别 RISC-V共有6个特权级别： 机器模式（M模式） M模式全称为Machine mode（机器模式）运行在这个模式下的程序为最高权限，它属于RISC-V里的最高权限模式，它具有访问所有资源的权限&#xff…...

编程日记 2023/8/1 6:36:07

RISC-V 指令集介绍

1. 背景介绍指令集从本质上可以分为复杂指令集（Complex Instruction Set Computer，CISC）和精简指令集（Reduced Instruction Set Computer，RISC）两种。复杂指令集的特点是能够在一条指令内完成很多事情。指…...

编程日记 2023/8/1 6:33:59

操作系统5

设备管理 I/O设备什么是？--- 将数据Input/Output（输入/输出）计算机的外部设备。分类： 按使用特性：人机交互类外设、存储设备、网络通信设备； 按传输速度：低速、中速、高速设备&#xff1…...

编程日记 2023/8/1 6:32:57

K8S系列文章之 Docker常用命令

一、镜像基础命令： $ docker info # 查看docker信息 $ docker system df # 查看镜像/容器/数据卷所占的空间。 $ ip addr #查看容器内部网络地址。 $ docker images # 查看镜像 $ docker search 镜像名称 # 搜索镜像 --limit :只列出N个镜像，默认为25个…...

编程日记 2023/8/1 6:31:56

谷歌：安卓补丁漏洞让 N-days 与 0-days 同样危险

近日，谷歌发布了年度零日漏洞报告，展示了 2022 年的野外漏洞统计数据，并强调了 Android 平台中长期存在的问题，该问题在很长一段时间内提高了已披露漏洞的价值和使用。更具体地说，谷歌的报告强调了安卓系统中的 &quo…...

编程日记 2023/8/1 6:30:54

linux 学成之路（基础篇）（二十三）MySQL服务（下）

目录一、用户权限管理概述二、用户权限类型三、用户赋予权限四、删除权限五、删除用户一、用户权限管理概述数据库用户权限管理是数据库系统中非常重要的一个方面，它用于控制不同用户访问和操作数据库的权限范围。数据库用户权限管理可以保护敏感数据和…...

编程日记 2023/8/1 6:29:52

MySQL初探

Background 通过阅读小林coding，大致了解了mysql数据库的种种特点，与之前学的数据库实现大体思路相同，感觉学习不能停留在理论层面，要调研生产级别的中间件实现。一条代码运行在mysql上的流程 1. 连接的过程需要先经过 TCP 三次…...

编程日记 2023/8/1 6:28:51

blender 用蒙版添加材质

一、添加材质常规方法选择物体新建材质，shift a 新建图像纹理，此时会发现添加上的纹理会有接缝，shift a 新建映射纹理坐标，纹理坐标选择生成，此时，之前的接缝便会消失； 如何快捷添加纹理坐…...

编程日记 2023/8/1 6:27:50

前端面试的性能优化部分（2）每篇10题

1. 常见的图片格式及使用场景常见的图片格式有 JPEG、PNG、GIF、WebP 和 SVG，它们各有适用的使用场景： JPEG (Joint Photographic Experts Group)： 使用场景：适用于照片和真实场景的图片，特别是色彩丰富和渐变丰富的…...

编程日记 2023/8/1 6:26:46

Spring——Spring是什么？IoC容器是什么？

文章目录前言一、Spring是什么1.IoC 容器 —— 容器2.IoC 容器 —— IoC传统程序开发控制反转式程序开发 3.Spring IoC 二、DI是什么总结前言本人是一个普通程序猿!分享一点自己的见解,如果有错误的地方欢迎各位大佬莅临指导,如果你也对编程感兴趣的话，互关一下…...

编程日记 2023/8/1 6:25:45

【CNN-BiLSTM-attention】基于高斯混合模型聚类的风电场短期功率预测方法（Pythonmatlab代码实现）

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势：🌞🌞🌞博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。 ⛳️座右铭&a…...

编程日记 2023/8/1 6:24:43

golang深刻剖析——channel

文章目录 1 概念2 分类3 操作3.1 channel 的创建3.1.1 无缓冲channel3.1.1 带缓冲channel 3.2 channel的读写3.3 channel的关闭3.4 channel 和 select 4 channel 底层原理 1 概念 channel 是一个通道，用于端到端的数据传输，这有点像我们平常使用的消息队…...

编程日记 2023/8/1 6:23:43

proxy-doctor：自动化诊断与修复开发工具代理配置的利器

1. 项目概述与核心价值最近在折腾一些需要稳定网络连接的项目时，遇到了一个老生常谈但又极其恼人的问题：代理配置。无论是开发环境里的包管理工具，还是日常使用的命令行工具，一旦涉及到网络请求，代理设置不对&#xff…...

编程新知 2026/5/17 10:42:01

探索Windows HEIC缩略图：跨平台照片管理深度解析

探索Windows HEIC缩略图：跨平台照片管理深度解析【免费下载链接】windows-heic-thumbnails Enable Windows Explorer to display thumbnails for HEIC/HEIF files 项目地址: https://gitcode.com/gh_mirrors/wi/windows-heic-thumbnails Windows HEIC缩略图…...

编程新知 2026/5/17 10:16:11

编程统计公司内部资料查阅使用数据，优化资料分类存储方式。提升职场员工工作查阅办事效率。

构建一个公司内部资料查阅使用统计与资料分类存储优化的商务智能示例项目，去营销化、中立化，仅用于学习与工程实践参考。一、实际应用场景描述在中大型企业中，内部资料（制度、流程文档、技术手册、项目档案）数量庞大&a…...

编程新知 2026/5/17 9:57:16

如何用nmrpflash拯救你的Netgear路由器：从“变砖“到重生的完整指南

如何用nmrpflash拯救你的Netgear路由器：从"变砖"到重生的完整指南【免费下载链接】nmrpflash Netgear Unbrick Utility 项目地址: https://gitcode.com/gh_mirrors/nmr/nmrpflash 当你的Netgear路由器固件升级失败、意外断电或系统崩溃后无法启动…...

编程新知 2026/5/17 9:38:38

为开源项目OpenClaw配置Taotoken作为后端模型供应商

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度为开源项目OpenClaw配置Taotoken作为后端模型供应商 OpenClaw是一个功能强大的开源智能体（Agent）框架&…...

编程新知 2026/5/17 9:24:51

Hitboxer终极指南：专业级游戏键盘重映射与SOCD清理工具完全教程

Hitboxer终极指南：专业级游戏键盘重映射与SOCD清理工具完全教程【免费下载链接】socd Key remapper for epic gamers 项目地址: https://gitcode.com/gh_mirrors/so/socd Hitboxer是一款专为竞技游戏玩家设计的专业级键盘按键重映射和SOCD清理工具&#xff…...

编程新知 2026/5/17 9:24:51

Boss直聘职位数据自动化采集：Python爬虫架构设计与工程实践

1. 项目概述与核心价值最近在技术社区里，看到不少朋友在讨论一个叫longsizhuo/BossZhiPin_Job_Search的项目。光看名字，你大概就能猜到，这是一个跟“Boss直聘”和“职位搜索”相关的自动化工具。作为一个在招聘数据分析和自动化领域摸爬滚打了…...

编程新知 2026/5/17 9:14:34

Java 大厂面试 200 题完整版含答案解析

前言本文整理了近两年从阿里、腾讯、字节、美团、京东、拼多多等大厂面试中高频出现的 200 道 Java 面试题，覆盖 Java 基础、集合、并发、JVM、Spring、MySQL、Redis、消息队列、分布式、场景设计等核心模块，每题都附有简明扼要的答案解析，助…...

编程新知 2026/5/17 8:58:15

ViGEmBus终极指南：Windows游戏手柄模拟驱动的完整解决方案

ViGEmBus终极指南：Windows游戏手柄模拟驱动的完整解决方案【免费下载链接】ViGEmBus Windows kernel-mode driver emulating well-known USB game controllers. 项目地址: https://gitcode.com/gh_mirrors/vi/ViGEmBus 你是否曾经遇到过这样的情况&#xff…...

编程新知 2026/5/17 8:56:13

Unlock Music Electron：3步解锁你的加密音乐文件，重获音乐自由终极指南

Unlock Music Electron：3步解锁你的加密音乐文件，重获音乐自由终极指南【免费下载链接】unlock-music-electron Unlock Music Project - Electron Edition 在Electron构建的桌面应用中解锁各种加密的音乐文件项目地址: https://gitcode.com/gh_mirro…...

编程新知 2026/5/17 8:23:51

Mac 上使用 Tesseract OCR 识别图片文本

相关文章：

Mac 上使用 Tesseract OCR 识别图片文本

《MapboxGL 基础知识点》- 放大/缩小/定位/级别

VScode的简单使用

# Unity 如何获取Texture 的内存大小

dolphinscheduler switch+传参无坑版

VINS-fusion安装

智慧消防：如何基于视频与智能分析技术搭建可视化风险预警平台？

selenium定位元素的方法

RISC-V特权级别

RISC-V 指令集介绍

操作系统5

K8S系列文章之 Docker常用命令

谷歌：安卓补丁漏洞让 N-days 与 0-days 同样危险

linux 学成之路（基础篇）（二十三）MySQL服务（下）

MySQL初探

blender 用蒙版添加材质

前端面试的性能优化部分（2）每篇10题

Spring——Spring是什么？IoC容器是什么？

【CNN-BiLSTM-attention】基于高斯混合模型聚类的风电场短期功率预测方法（Pythonmatlab代码实现）

golang深刻剖析——channel

proxy-doctor：自动化诊断与修复开发工具代理配置的利器

探索Windows HEIC缩略图：跨平台照片管理深度解析

编程统计公司内部资料查阅使用数据，优化资料分类存储方式。提升职场员工工作查阅办事效率。

如何用nmrpflash拯救你的Netgear路由器：从“变砖“到重生的完整指南

为开源项目OpenClaw配置Taotoken作为后端模型供应商

Hitboxer终极指南：专业级游戏键盘重映射与SOCD清理工具完全教程

Boss直聘职位数据自动化采集：Python爬虫架构设计与工程实践

Java 大厂面试 200 题完整版含答案解析

ViGEmBus终极指南：Windows游戏手柄模拟驱动的完整解决方案

Unlock Music Electron：3步解锁你的加密音乐文件，重获音乐自由终极指南