当前位置：首页 > news >正文

cheese安卓版纯本地离线文字识别插件

news 2026/5/13 18:25:27

目的

cheese自动化平台是一款可以模拟鼠标和键盘操作的自动化工具。它可以帮助用户自动完成一些重复的、繁琐的任务，节省大量人工操作的时间。可以采用Vscode、IDEA编写，支持Java、Python、nodejs、GO、Rust、Lua。cheese也包含图色功能，识别屏幕上的图像，根据图像的变化自动执行相应的操作。本篇文章主要讲解下更优秀的cheese平台TomatoOCR纯本地离线文字识别插件如何使用和集成。

准备工作

1、搭建cheese的idea开发环境：

2、下载TomatoOCR纯本地离线文字识别插件

目前插件支持中英文、繁体字、日语、韩语识别；
支持小图、区域图和单行文字识别，准确率高达99%；
支持多种返回格式，json\文本\数字\自定义；
支持增强版二值化；
支持找字返回坐标并点击；
超高的稳定性，速度快；
不联网、不联网、不联网；

插件集成

1、打开idea开发工具，新建项目，在工程assets目录下添加文字识别插件

下载插件后，先改名为TomatoOCR.apk

2、拷贝js中的代码

注意：loadDex("TomatoOCR.apk"); //该行必须写在main方法下，否则无非正常加载

// ********************************************************************************************
// ********欢迎使用TomatoOCR文字识别插件，加入群【469843332】可获取最新版本！！！************
// ********************************************************************************************import core from 'cheese-core';const base = core.base;
const assets = core.assets;
const recordscreen = core.recordScreen;
const plugins = core.plugins;
const cls = core.cls;var tomato_ocr;
let rec_type = "ch-3.0";
// 注：ch、ch-2.0、ch-3.0版可切换使用，对部分场景可适当调整
// "ch"：普通中英文识别，1.0版模型
// "ch-2.0"：普通中英文识别，2.0版模型
// "ch-3.0"：普通中英文识别，3.0版模型
// "cht"：繁体，"japan"：日语，"korean"：韩语function ocr_image() {tomato_ocr.setRecType(rec_type) // 如果需要切换语言，直接在这里设置即可tomato_ocr.setDetBoxType("rect")  // 调整检测模型检测文本参数- 默认"rect": 由于手机上截图文本均为矩形文本，从该版本之后均改为rect，"quad"：可准确检测倾斜文本tomato_ocr.setDetUnclipRatio(1.9)  // 调整检测模型检测文本参数 - 默认1.9: 值范围1.8-2.5之间，可调整文本检测框大小tomato_ocr.setRecScoreThreshold(0.3)  // 识别得分过滤 - 默认0.1，值范围0.1-0.9之间tomato_ocr.setReturnType("json")// 返回类型 - 默认"json": 包含得分、坐标和文字；//"text"：纯文字；//"num"：纯数字；//自定义输入想要返回的文本：".￥1234567890"，仅只返回这些内容let type = 3;// type 可传可不传// type=0 : 只检测// type=1 : 方向分类 + 识别// type=2 : 只识别// type=3 : 检测 + 识别// 只检测文字位置：type=0// 全屏识别: type=3或者不传type// 截取单行文字识别：type=1或者type=2// 注意：注意：注意：识别不到时，返回的是""空字符串，请加上 if (result != "") 进行判断// returnType为“json”时，返回的是json字符串，需要使用JSON.parse进行解析// 例子一let result1 = tomato_ocr.ocrFile("/storage/emulated/0/test.png", type);console.log(result1);// 例子二let bitmap = recordscreen.captureScreen(3, 0, 0, 300, 300)let result2 = tomato_ocr.ocrBitmap(bitmap, type);console.log(result2);// 找字返回坐标，没有找到字返回“”空字符串，返回的是“百度”的中心点坐标var point = tomato_ocr.findTapPoint("百度")if (point != "") {var json_point = JSON.parse(point)var center_x = json_point[0] + x1var center_y = json_point[1] + y1}
}function run() {if (recordscreen.requestPermission(3)) {console.log("请求成功")}if (assets.copy("TomatoOCR.apk", "/storage/emulated/0/TomatoOCR.apk")) {console.log("复制成功");} else {console.log("复制失败");}if (plugins.install("/storage/emulated/0/TomatoOCR.apk")) {plugins.loadLibrary("ocr")var tmo = cls.findClass("com.tomato.ocr.cheese.OCRApi")tomato_ocr = tmo.new().objtomato_ocr.init(plugins.createContext(), rec_type)// 试用版license从群中获取或者网盘中获取var flag = tomato_ocr.setLicense("")// flag= -1: 无效license// flag= 0 : 过期license// flag= 1 或 到期日期 : 试用license或正式licenseconsole.log(flag);console.log("插件加载成功")}ocr_image();
}run()

3、其中的方法说明如下

方法名	说明
init	初始化
setRecType	设置识别语言，默认ch-3.0： ch、ch-2.0、ch-3.0版可切换使用，对部分场景可适当调整 "ch"：普通中英文识别，1.0版模型 "ch-2.0"：普通中英文识别，2.0版模型 "ch-3.0"：普通中英文识别，3.0版模型 "cht"：繁体，"japan"：日语，"korean"：韩语
setDetBoxType	调整检测模型检测文本参数-，默认"rect": 由于手机上截图文本均为矩形文本，从该版本之后均改为rect，"quad"：可准确检测倾斜文本
setDetUnclipRatio	调整检测模型检测文本参数，默认1.9：值范围1.6-2.5之间，如果文字的检测框太小，可调整改参数，一般往大调整
setRecScoreThreshold	设置识别得分过滤，默认0.1：值范围0.1-0.9之间
setReturnType	设置返回类型，默认"json"，包含得分、坐标和文字； "text"：纯文字； "num"：纯数字；自定义输入想要返回的文本：".￥1234567890"，仅只返回这些内容
setBinaryThresh	对图片进行二值化处理，非必须，正常情况下可以不用写
ocrFile	两个参数，图片路径和类型，一般类型传3: type=-1 : 检测 + 方向分类 + 识别 type=0 : 只检测 type=1 : 方向分类 + 识别 type=2 : 只识别（单行识别） type=3 : 检测 + 识别只检测文字位置：type=0 全屏识别: type=3或者不传type 截取单行文字识别：type=1或者type=2 如果识别为不到时，返回的数据为“”字符串
findTapPoint	找字，返回传入字的中心点坐标，方便进行点击，找不到字时，返回“”空字符串
end	释放插件，只需要在停止脚本的时候调用

4、识别结果

以上就是所有的运行情况。

完毕

相对来说，在cheese进行插件开发还是比较困难的，需要会原生安卓开发，本地识别全屏会相对较慢，区域识别还是非常快，相比部署在服务器上，还可以减少了很多资源占用情况，更加方便便捷。

cheese安卓版纯本地离线文字识别插件

目的 cheese自动化平台是一款可以模拟鼠标和键盘操作的自动化工具。它可以帮助用户自动完成一些重复的、繁琐的任务，节省大量人工操作的时间。可以采用Vscode、IDEA编写，支持Java、Python、nodejs、GO、Rust、Lua。cheese也包含图色功能，识别…...

编程日记 2024/10/4 5:11:09

【C++】多肽

目录一多肽定义 1. 多肽的构成条件 1 例一 2 例二 2. 虚函数 3. 虚函数重写的两个意外 1 协变 2 析构函数的重写二关键字override 和 final 1. final 2.override 三三重对比 1. 练习四多肽的原理 1. 多肽调用和普通调用 2.虚函数表 3. 分析 4. 原理 …...

编程日记 2024/10/4 5:10:08

Linux下Socket编程

1. Socket简介 Socket是什么？ Socket是一种进程间通信的机制，通过它应用程序可以通过网络进行数据传输。Socket提供了一种跨平台的接口，使得同样的代码可以在不同的操作系统上运行。Socket类型流式套接字（SOCK_STREAM&#xff0…...

编程日记 2024/10/4 5:09:07

Scrapy 爬虫的大模型支持

使用 Scrapy 时，你可以轻松使用大型语言模型 (LLM) 来自动化或增强你的 Web 解析。有多种使用 LLM 来帮助进行 Web 抓取的方法。在本指南中，我们将在每个页面上调用一个 LLM，从中抽取我们定义的一组属性，而无需编写任何选择器或…...

编程日记 2024/10/4 5:07:05

数据仓库简介（一）

数据仓库概述 1. 什么是数据仓库？ 数据仓库（Data Warehouse，简称 DW）是由 Bill Inmon 于 1990 年提出的一种用于数据分析和挖掘的系统。它的主要目标是通过分析和挖掘数据，为不同层级的决策提供支持，构成…...

编程日记 2024/10/4 5:05:02

Kafka和RabbitMQ区别

RabbitMQ的消息延迟是微秒级，Kafka是毫秒级（1毫秒1000微秒） 延迟消息是指生产者发送消息发送消息后，不能立刻被消费者消费，需要等待指定的时间后才可以被消费。 Kafka的单机呑吐量是十万级，RabbitMQ是万级…...

编程日记 2024/10/4 5:04:01

go-zero学习

go-zero官网： https://go-zero.dev/docs/tasks 好文： https://blog.csdn.net/m0_63629756/article/details/136599547 视频： https://www.bilibili.com/video/BV18JxUeyECg 微服务基础根目录下，一个文件夹就是一个微服务。如果微…...

编程日记 2024/10/4 5:00:58

python如何查询函数

1、通用的帮助函数help() 使用help()函数来查看函数的帮助信息。如： import requests help(requests) 会有类似如下输出： 2、查询函数信息 ★查看模块下的所有函数： dir(module_name) #module_name是要查询的函数名如： i…...

编程日记 2024/10/4 4:59:57

计算机视觉与深度学习 | 从激光雷达数据中提取地面点和非地面点（附matlab代码）

===================================================== github：https://github.com/MichaelBeechan CSDN：https://blog.csdn.net/u011344545 ===================================================== 激光雷达数据使用velodyneFileReader函数从P...

编程日记 2024/10/4 4:58:56

vulnhub-wakanda 1靶机

vulnhub：wakanda: 1 ~ VulnHub 导入靶机，放在kali同网段，扫描靶机在192.168.81.5，扫描端口四个端口，详细扫描一下似乎没什么值得注意的，先看网站就这一个页面，点按钮也没反应，扫…...

编程日记 2024/10/4 4:56:54

Bilibili视频如何保存到本地

Bilibili(哔哩哔哩)作为中国领先的视频分享平台之一，汇聚了大量的优质内容，从搞笑动画、综艺节目到专业教程，应有尽有。许多用户时常会遇到这样的需求：希望将视频保存到本地，方便离线观看或者保存珍藏。由于版权保护等…...

编程日记 2024/10/4 4:54:52

C++之多线程

前言多线程和多进程是并发编程的两个核心概念，它们在现代计算中都非常重要，尤其是在需要处理大量数据、提高程序性能和响应能力的场景中。多线程的重要性：资源利用率：多线程可以在单个进程中同时执行多个任务，这可以更有效地利用CPU资源，特别是在多核处理器上。性…...

编程日记 2024/10/4 4:52:50

《C++音频降噪秘籍：让声音纯净如初》

在音频处理领域，降噪是一项至关重要的任务。无论是录制音乐、语音通话还是音频后期制作，都需要有效地去除背景噪声，以获得清晰、纯净的音频效果。在 C中实现高效的音频降噪处理，可以为音频应用带来更高的质量和更好的用户体验。本…...

编程日记 2024/10/4 4:51:48

C（十）for循环 --- 黑神话情景

前言： "踏过三界宝刹，阅过四洲繁华。笑过五蕴痴缠，舍过六根牵挂。怕什么欲念不休，怕什么浪迹天涯。步履不停，便是得救之法。" 国际惯例，开篇先喝碗鸡汤。今天，杰哥写的 for 循环相…...

编程日记 2024/10/4 4:48:44

记录一次docker报错无法访问文件夹，权限错误问题

记录一次docker报错无法访问文件夹，权限错误问题 1. 背景使用docker安装photoview，为其分配了一个cache目录，用户其缓存数据。在运行过程中，扫描文件后显示如下错误 could not make album image cache directory: mkdir /app/c…...

编程日记 2024/10/4 4:47:43

react crash course 2024(8) useEffect

引入 import { useEffect } from react; useEffect – React 中文文档useEffect 是一个 React Hook，它允许你将组件与外部系统同步。有些组件需要与网络、某些浏览器 API 或第三方库保持连接，当它们显示在页面上时。这些系统不受 React 控制&#xff0…...

编程日记 2024/10/4 4:46:42

GEE开发之Modis_NDWI数据分析和获取

GEE开发之Modis_NDWI数据分析和获取 0 数据介绍NDWI介绍MOD09GA介绍 1 NDWI天数据下载2 NDWI月数据下载3 NDWI年数据下载前言：本文主要介绍Modis下的NDWI数据集的获取。归一化差异水指数 (NDWI) 对植被冠层液态水含量的变化很敏感。它来自近红外波段和第二个红外波…...

编程日记 2024/10/4 4:45:40

netty之NettyClient半包粘包处理、编码解码处理、收发数据方式

前言 Netty开发中，客户端与服务端需要保持同样的；半包粘包处理，编码解码处理、收发数据方式，这样才能保证数据通信正常。在前面NettyServer的章节中我们也同样处理了；半包粘包、编码解码等，为此在本章节我们…...

编程日记 2024/10/4 4:44:39

Linux：文件描述符介绍

文章目录速览 1、虚拟地址空间(1)What（什么是虚拟地址空间）(2)Why（为什么需要虚拟地址空间） 2、文件描述符(1)What（什么是文件描述符）(2)文件描述符表 1、虚拟地址空间 (1)What（什么是虚拟地址…...

编程日记 2024/10/4 4:43:38

stm32f103调试，程序与定时器同步设置

在调试定时器相关代码时，注意到定时器的中断位总是置1，怀疑代码有问题，经过增大定时器的中断时间，发现定时器与代码调试并不同步，这一点对于调试涉及定时器的代码是非常不利的，这里给出keil调试stm32使定时…...

编程日记 2024/10/4 4:42:37

HoRain云--Lua元表：解锁高级编程技巧

🎬 HoRain云小助手：个人主页 🔥 个人专栏: 《Linux 系列教程》《c语言教程》 ⛺️生活的理想，就是为了理想的生活! ⛳️ 推荐前些天发现了一个超棒的服务器购买网站，性价比超高，大内存超划算！…...

编程新知 2026/5/13 16:07:43

Windows更新修复终极指南：Script-Reset-Windows-Update-Tool完全解析

Windows更新修复终极指南：Script-Reset-Windows-Update-Tool完全解析【免费下载链接】Script-Reset-Windows-Update-Tool This script reset the Windows Update Components. 项目地址: https://gitcode.com/gh_mirrors/sc/Script-Reset-Windows-Update-Tool …...

编程新知 2026/5/13 15:20:31

Illustrator脚本革命：7个必备工具彻底改变你的设计工作流

Illustrator脚本革命：7个必备工具彻底改变你的设计工作流【免费下载链接】illustrator-scripts Adobe Illustrator scripts 项目地址: https://gitcode.com/gh_mirrors/il/illustrator-scripts 你是否还在Adobe Illustrator中重复着枯燥的手工操作&#xff…...

编程新知 2026/5/13 14:47:08

告别照片管理烦恼：ExifToolGUI帮你3步搞定批量元数据处理

告别照片管理烦恼：ExifToolGUI帮你3步搞定批量元数据处理【免费下载链接】ExifToolGui A GUI for ExifTool 项目地址: https://gitcode.com/gh_mirrors/ex/ExifToolGui 你是否曾为数百张旅行照片的整理而头疼？拍摄时间需要统一调整，版…...

编程新知 2026/5/13 14:35:02

禅论技术分析插件：通达信量化交易系统的架构与实践

禅论技术分析插件：通达信量化交易系统的架构与实践【免费下载链接】Indicator 通达信缠论可视化分析插件项目地址: https://gitcode.com/gh_mirrors/ind/Indicator 禅论作为中国特色的技术分析理论，其严谨的数学结构和逻辑体系为市场分析提供了…...

编程新知 2026/5/13 14:15:09

从零部署noVNC：一次完整的远程桌面服务搭建与排错实录

1. 为什么选择noVNC？ 最近在帮朋友部署远程桌面服务时，发现很多传统VNC方案都需要安装客户端，操作复杂不说，兼容性还差。直到发现了noVNC这个神器，它直接用浏览器就能访问远程桌面，彻底解决了跨平台访问的痛…...

编程新知 2026/5/13 13:13:27

Pearcleaner：彻底清理Mac应用的终极免费开源解决方案

Pearcleaner：彻底清理Mac应用的终极免费开源解决方案【免费下载链接】Pearcleaner A free, source-available and fair-code licensed mac app cleaner 项目地址: https://gitcode.com/gh_mirrors/pe/Pearcleaner 在Mac系统中卸载应用程序后，你是…...

编程新知 2026/5/13 13:05:03