当前位置：首页 > news >正文

懒人精灵安卓版纯本地离线文字识别插件

news 2026/5/15 7:34:17

目的

懒人精灵是一款可以模拟鼠标和键盘操作的自动化工具。它可以帮助用户自动完成一些重复的、繁琐的任务，节省大量人工操作的时间。懒人精灵也包含图色功能，识别屏幕上的图像，根据图像的变化自动执行相应的操作。本篇文章主要讲解下更优秀的懒人精灵TomatoOCR纯本地离线文字识别插件如何使用和集成。

目前懒人精灵推出的普通版和高级版，对应的文字识别插件也分普通版和高级版。

准备工作

1、下载懒人精灵手机助手开发工具：懒人精灵官网，网站中只能下载高级版的编辑器，普通版的编辑器需在官方群中获取。

2、下载TomatoOCR纯本地离线文字识别插件

目前插件支持中英文、繁体字、日语、韩语识别；
支持小图、区域图和单行文字识别，准确率高达99%；
支持多种返回格式，json\文本\数字\自定义；
支持增强版二值化；
支持找字返回坐标并点击；
超高的稳定性，速度快；
不联网、不联网、不联网；

插件集成

普通版和高级版的用法大同小异，下面以高级版用法为例：

1、打开懒人精灵，新建项目，双击资源.rc文件，添加文字识别插件

下载插件后，先改名为TomatoOCR.apk

2、记事本打开调用说明文件，并拷贝到项目的lua文件中，

-- ********************************************************************************************
-- ********欢迎使用TomatoOCR文字识别插件，加入群【469843332】可获取最新版本！！！************
-- ********************************************************************************************import('java.io.File')
import('java.lang.*')
import('java.util.Arrays')
import('android.content.Context')
import('android.hardware.Sensor')
import('android.hardware.SensorEvent')
import('android.hardware.SensorEventListener')
import('android.hardware.SensorManager')
import('com.nx.assist.lua.LuaEngine')-- 推荐方式一，稳定；方式二，懒人精灵软件不怎么稳定，慎用，按方式一测试完成，可用方式二打包
-------------------------引入方式-------------------------
-- 方式一 根据实际情况选择适当的apk包，放在手机目录中，例子是放在了根目录并重命名为TomatoOCR
--local loader = LuaEngine.loadApk("/storage/emulated/0/TomatoOCR.apk")
-- 方式二 PC端左侧展开项目，找到资源目录，双击.rc文件，然后添加文件就可以了
local loader = LuaEngine.loadApk("TomatoOCR.apk")
-------------------------引入方式-------------------------local OCR = loader.loadClass("com.tomato.ocr.lr.OCRApi")local rec_type = "ch-3.0";
-- 注：ch、ch-2.0、ch-3.0版可切换使用，对部分场景可适当调整
-- "ch"：普通中英文识别，1.0版模型
-- "ch-2.0"：普通中英文识别，2.0版模型
-- "ch-3.0"：普通中英文识别，3.0版模型
-- "cht"：繁体，"japan"：日语，"korean"：韩语
local ocr = OCR.init(LuaEngine.getContext(), rec_type)-- license从群中获取或者网盘中获取
local license = ""
local flag = ocr.setLicense(license);-- ----------------------------注：以上代码全局只需写一次-------------------------------ocr.setRecType(rec_type) -- 如果需要切换语言，直接在这里设置即可
ocr.setDetBoxType("rect")  -- 调整检测模型检测文本参数- 默认"rect": 由于手机上截图文本均为矩形文本，从该版本之后均改为rect，"quad"：可准确检测倾斜文本
ocr.setDetUnclipRatio(1.9)  -- 调整检测模型检测文本参数 - 默认1.9: 值范围1.6-2.5之间
ocr.setRecScoreThreshold(0.3)  -- 识别得分过滤 - 默认0.1，值范围0.1-0.9之间
ocr.setReturnType("json")
-- 返回类型 - 默认"json": 包含得分、坐标和文字；
-- "text"：纯文字；
-- "num"：纯数字；
-- 自定义输入想要返回的文本：".￥1234567890"，仅只返回这些内容-- ocr.setBinaryThresh(135) -- 二值化设定0-255，非必须，常规情况下不需要设置，可配合群中【测试应用.apk】使用local type = 3;
-- type 可传可不传
-- type=0 : 只检测
-- type=1 : 方向分类 + 识别
-- type=2 : 只识别
-- type=3 : 检测 + 识别-- 只检测文字位置：type=0
-- 全屏识别: type=3或者不传type
-- 截取单行文字识别：type=1或者type=2-- 注意：注意：注意：识别不到时，返回的是""空字符串，请加上 if result ~="" then
-- 例子一
snapShot("/mnt/sdcard/test.png",0,0,300,100)
local result1 = ocr.ocrFile("/mnt/sdcard/test.png", type)
printEx(result1);-- 例子二
local bitmap = LuaEngine.snapShot(0,0,300,100)
local result2 = ocr.ocrBitmap(bitmap, type)
printEx(result2);-- 找字返回坐标，没有找到字返回“”空字符串，返回的是“百度”的中心点坐标
local point = ocr.findTapPoint("百度")
if point ~="" thenlocal json_point = jsonLib.decode(point)local center_x = json_point[1] + x1local center_y = json_point[2] + y1
end-- 释放
ocr.release()

3、其中的方法说明如下

方法名	说明
init	初始化
setRecType	设置识别语言，默认ch-3.0： ch、ch-2.0、ch-3.0版可切换使用，对部分场景可适当调整 "ch"：普通中英文识别，1.0版模型 "ch-2.0"：普通中英文识别，2.0版模型 "ch-3.0"：普通中英文识别，3.0版模型 "cht"：繁体，"japan"：日语，"korean"：韩语
setDetBoxType	调整检测模型检测文本参数-，默认"rect": 由于手机上截图文本均为矩形文本，从该版本之后均改为rect，"quad"：可准确检测倾斜文本
setDetUnclipRatio	调整检测模型检测文本参数，默认1.9：值范围1.6-2.5之间，如果文字的检测框太小，可调整改参数，一般往大调整
setRecScoreThreshold	设置识别得分过滤，默认0.1：值范围0.1-0.9之间
setReturnType	设置返回类型，默认"json"，包含得分、坐标和文字； "text"：纯文字； "num"：纯数字；自定义输入想要返回的文本：".￥1234567890"，仅只返回这些内容
setBinaryThresh	对图片进行二值化处理，非必须，正常情况下可以不用写
ocrFile	两个参数，图片路径和类型，一般类型传3: type=-1 : 检测 + 方向分类 + 识别 type=0 : 只检测 type=1 : 方向分类 + 识别 type=2 : 只识别（单行识别） type=3 : 检测 + 识别只检测文字位置：type=0 全屏识别: type=3或者不传type 截取单行文字识别：type=1或者type=2 如果识别为不到时，返回的数据为“”字符串
findTapPoint	找字，返回传入字的中心点坐标，方便进行点击，找不到字时，返回[-1,-1]
release	释放插件，只需要在停止脚本的时候调用

4、识别结果

以上就是所有的运行情况。

注意：高级版需要将“脚本运行在最高权限环境中”的勾去掉

完毕

相对来说，在懒人精灵进行插件开发还是比较困难的，需要会原生安卓开发，本地识别全屏会相对较慢，区域识别还是非常快，相比部署在服务器上，还可以减少了很多资源占用情况，更加方便便捷。

懒人精灵安卓版纯本地离线文字识别插件

目的懒人精灵是一款可以模拟鼠标和键盘操作的自动化工具。它可以帮助用户自动完成一些重复的、繁琐的任务，节省大量人工操作的时间。懒人精灵也包含图色功能，识别屏幕上的图像，根据图像的变化自动执行相应的操作。本篇文章主要讲解下更优秀的…...

编程日记 2024/7/27 17:01:20

在线教育数仓项目(数据采集部分1)

文章目录数据仓库概念项目需求及架构设计项目需求分析系统数据流程设计框架版本选型集群规模估算集群资源规划设计数据生成模块目标数据页面事件曝光启动播放错误数据埋点主流埋点方式（了解）埋点数据上报时机埋点数据日志结构服务器和JDK准备服务器准…...

编程日记 2024/7/27 16:57:16

帕金森病（PD）诊断：三种基于语音的深度学习方法

帕金森病（Parkinson’s disease, PD）是世界上第二大流行的神经退行性疾病，全球影响着超过1000万人，仅次于阿尔茨海默症。人们通常在65岁左右被诊断出患有此病。PD的一些症状包括震颤、肌肉僵硬和运动迟缓。这些症状往往出现在较晚…...

编程日记 2024/7/27 16:50:09

【资料分享】2024钉钉杯大数据挑战赛A题思路解析+代码演示

2024第三届钉钉杯大学生大数据挑战赛今天已经开赛，【A题】思路解析代码，资料预览：...

编程日记 2024/7/27 16:48:05

【优质精选】12节大模型系列教学课程之二：RAG 原理与应用

课程二：RAG 原理与应用 12节大模型系列教学课程之二：RAG 原理与应用课程详细内容RAG 技术的基础知识RAG 的工作原理RAG 提高生成质量和准确性的原理RAG 在问答系统中的应用RAG 在文本创作中的应用RAG 在其他领域的应用探索RAG 技术的挑战与应对策略RAG …...

编程日记 2024/7/27 16:47:04

vue3前端开发-小兔鲜项目-产品详情基础数据渲染

vue3前端开发-小兔鲜项目-产品详情基础数据渲染！这一次内容比较多，我们分开写。第一步先完成详情页面的基础数据的渲染。然后再去做一下右侧的热门产品的列表内容。第一步，还是老规矩，先准备好接口函数。方便我们的页面组件拿到对…...

编程日记 2024/7/27 16:46:03

Docker入门指南：Linux系统下的完整安装步骤与常见问题解答

本文以centos7演示。 Docker安装可参考官方安装文档：Install Docker Engine on CentOS | Docker Docs 一图流： # 移除旧版本docker sudo yum remove docker \docker-client \docker-client-latest \docker-common \docker-latest \docker-latest-logro…...

编程日记 2024/7/27 16:38:55

Netty实现数据上下行

Netty实现数据上下行使用LVSNGinxNetty实现数据接入在数据上行的时候，通过使用车辆唯一标识码（vin）和连接通道绑定 Netty一些配置参数如下: #netty项目使用的端口 server.port8017 #使用启用epoll（在Linux上拥有更好的传输性…...

编程日记 2024/7/27 16:37:54

【React】事件绑定：深入解析高效处理用户交互的最佳实践

文章目录一、什么是事件绑定？二、基本事件绑定三、绑定 this 上下文四、传递参数五、事件对象六、事件委托七、常见事件处理八、优化事件处理 React 是现代前端开发中最受欢迎的框架之一，其组件化和高效的状态管理能力使得构建复杂的用户界面变得更加容…...

编程日记 2024/7/27 16:36:53

SpringCloud：使用OpenFeign优化前面的Nacos实现高效购物车商品信息处理

在现代电商系统中，购物车的性能直接影响用户的购物体验。为了提升系统性能和用户满意度，我们可以使用Spring Cloud的OpenFeign和负载均衡器来高效地处理购物车中的商品信息。本文将详细介绍如何在Spring Cloud中集成这些组件，并实现一个高效的…...

编程日记 2024/7/27 16:35:52

计算机三级嵌入式笔记（二）——嵌入式处理器

目录考点1 嵌入式处理器的结构类型考点2 嵌入式处理器简介考点3 ARM处理器概述考点4 处理器和处理器核考点5 ARM 处理器的分类考点6 经典 ARM 处理器考点7 ARM Cortex 嵌入式处理器考点8 ARM Cortex实时嵌入式处理器考点9 ARM Cortex 应用处理器考点10 AR…...

编程日记 2024/7/27 16:33:51

【GoLang】Golang 快速入门（第一篇）

目录 1.简介： 2.设计初衷： 3.Go语言的特点 4.应用领域: 5.用go语言的公司： 6. 开发工具介绍以及环境搭建 1.工具介绍: 2.VSCode的安装: 3.安装过程： 4.Windows下搭建Go开发环境--安装和配置SDK 1.搭建Go开发环境 - 安装…...

编程日记 2024/7/27 16:31:49

Linux中的三类读写函数

文件IO和标准IO的区别遵循标准： 文件IO遵循POSIX标准，主要在类UNIX环境下使用。标准IO遵循ANSI标准，具有更好的可移植性，可以在不同的操作系统上重新编译后运行。可移植性： 文件IO的可移植性相对较差，因为…...

编程日记 2024/7/27 16:30:48

MATLAB基础应用精讲-【数模应用】二元Probit回归分析

目录前言知识储备二元Logistic模型和Probit模型 Logistic模型的形式 Probit模型优势比（OR）准二项分布族算法原理数学模型二元因变量和线性概率模型 probit和logit回归 logit和probit模型的估计和推断稳健性检验二元logit回归分析全流程一、案例数…...

编程日记 2024/7/27 16:29:47

找工作准备刷题Day10 回溯算法 (卡尔41期训练营 7.24）

回溯算法今天这几个题目做过，晚上有面试，今天水一水。第一题：Leetcode77. 组合题目描述解题思路从题目示例来看，k个数是不能重合的，但是题目没有明确说明这一点。使用回溯算法解决此问题，利用树形…...

编程日记 2024/7/27 16:27:45

如何有效的进行小程序的优化

如今小程序已经成为了许多开发者开展业务，提供服务的重要平台。所以如何有效的优化小程序成为了开发者关注的首要问题，以下是一份详细的小程序优化方案： 一、目标设定明确小程序优化的主要目标，例如提高用户留存率、增加用户活…...

编程日记 2024/7/27 16:26:44

FPGA-ROM IP核的使用（2）

前言接着昨天的进行一个小的实验验证ROM IP核。实验效果读取上一期生成的IP核中的数据，并将其显示在数码管上。具体流程 ROM IP核存放数据0~255，之后每隔0.2s，从0的地址开始读数据，并显示在数码管上；接着先后…...

编程日记 2024/7/27 16:25:43

Manticore Search(es轻量级替代)

概念： Manticore Search 是一个使用 C 开发的高性能搜索引擎，创建于 2017 年，其前身是 Sphinx Search 。Manticore Search 充分利用了 Sphinx，显着改进了它的功能，修复了数百个错误，几乎完全重写了代码并保…...

编程日记 2024/7/27 16:18:38

测试开发面试题---计算机网络

计算机网络模型 OSI模型：七层模型物理层：定义电气特征，机械特征等功能规范，传递实际比特流数据链路层：物理地址寻址（MAC），帧的传输，错误检测和纠正网络层：…...

编程日记 2024/7/27 16:15:35

Wonder3D 论文学习

论文链接：https://arxiv.org/abs/2310.15008 代码链接：https://github.com/xxlong0/Wonder3D 解决了什么问题？ 随着扩散模型的提出，3D 生成领域取得了长足进步。从单张图片重建出 3D 几何是计算机图形学和 3D 视觉的基础任务&am…...

编程日记 2024/7/27 16:12:32

脉动阵列架构与DNN加速：FORTALESA容错设计解析

1. 脉动阵列架构与DNN加速基础在深度学习硬件加速领域，脉动阵列(Systolic Array)因其规则的并行计算结构而成为主流选择。这种架构最早由H.T.Kung在1982年提出，其核心思想是通过数据的有节奏流动（如同心脏的收缩舒张）实现高效的矩…...

编程新知 2026/5/15 7:31:49

基于FlowAI框架的AI应用开发：从LLM工具调用到生产级工作流编排

1. 项目概述与核心价值最近在折腾AI应用开发，特别是想把大语言模型（LLM）的能力真正“用起来”，嵌入到具体的业务流程里。相信很多开发者都遇到过类似的困境：模型本身能力很强，但怎么让它稳定、可靠、低成本…...

编程新知 2026/5/15 7:18:47

告别提取码焦虑：百度网盘资源获取的智能革命

告别提取码焦虑：百度网盘资源获取的智能革命【免费下载链接】baidupankey 项目地址: https://gitcode.com/gh_mirrors/ba/baidupankey 你是否曾经面对百度网盘分享链接却束手无策？那个神秘的提取码就像一道无形的屏障，让你在资源海洋…...

编程新知 2026/5/15 7:11:01

Trae IDE 实战：打造“创建完美智能体助手”（交互式+自动生成+模板删减，新手无脑上手）

Trae IDE 实战：打造“创建完美智能体助手”（交互式+自动生成+模板删减，新手无脑上手）前言：在AI研发提效浪潮中，Trae IDE的自定义Agent已成为开发者的核心协作工具。本文聚焦「创建完美智能体助手」的打造，全程贴合Trae原生能力，主打“交互式引导、全自动文件生成、模…...

编程新知 2026/5/15 6:43:24

ESP32-S3电源管理与CircuitPython开发实战：从硬件设计到低功耗优化

1. ESP32-S3电源管理：不只是供电，更是项目成败的关键玩嵌入式开发，尤其是物联网项目，最头疼的往往不是代码逻辑，而是“电”。一块板子，插着USB线跑得欢，一拔掉电池，没俩小时就歇菜了…...

编程新知 2026/5/15 6:36:14

JAVA摄影约拍线上预约系统源码的预约流程

📸 JAVA摄影约拍线上预约系统 — 完整预约流程（源码级拆解）🗺️ 整体预约流程图（一张图看懂）用户端（小程序/H5） Java后端（Spring Boot） …...

编程新知 2026/5/15 5:50:35

AugGPT：基于上下文增强与智能检索的代码生成框架解析

1. 项目概述：当代码生成器遇上“增强现实”最近在GitHub上看到一个挺有意思的项目，叫“AugGPT”。光看名字，可能很多人会联想到OpenAI的GPT模型，觉得这又是一个基于大语言模型的代码生成工具。但如果你仔细琢磨一下这个仓库名“yh…...

编程新知 2026/5/15 5:35:54

CursorTouch融合交互：工业与医疗场景下人机协同新范式

1. 项目概述：从“CursorTouch/Operator-Use”看人机交互的范式革新最近在GitHub上看到一个名为“CursorTouch/Operator-Use”的项目，这个标题乍一看有点抽象，但作为一名长期关注人机交互（HMI）和工业自动化领域的老兵&a…...

编程新知 2026/5/15 4:51:17

深入解析 gRPC：高性能开源 RPC 框架的原理与实战

深入解析 gRPC：高性能开源 RPC 框架的原理与实战文章目录深入解析 gRPC：高性能开源 RPC 框架的原理与实战引言一、gRPC 概览二、核心技术解析1. HTTP/2：传输层的革命2. Protocol Buffers：高效的序列化与契约3. 四种服务方法&…...

编程新知 2026/5/15 4:47:14

Overture：一站式AI应用开发框架，快速构建大模型服务

1. 项目概述：一个开箱即用的开源AI应用框架最近在折腾AI应用开发的朋友，估计都绕不开一个核心问题：如何快速、稳定地把一个大语言模型的能力，封装成一个可以对外提供服务的API，甚至是带界面的Web应用。从模型加载、推理…...

编程新知 2026/5/15 4:00:23

目的

准备工作

插件集成

完毕

相关文章：