当前位置：首页 > news >正文

SpringBoot/Java中OCR实现,集成Tess4J实现图片文字识别

news 2026/2/9 7:01:34

场景

Tesseract

Tesseract是一个开源的光学字符识别（OCR）引擎，它可以将图像中的文字转换为计算机可读的文本。

支持多种语言和书面语言，并且可以在命令行中执行。它是一个流行的开源OCR工具，可以在许多不同的操作系统上运行。

GitHub - tesseract-ocr/tesseract: Tesseract Open Source OCR Engine (main repository)

Tess4J

Tess4J是一个基于Tesseract OCR引擎的Java接口，可以用来识别图像中的文本，说白了，就是封装了它的API，让Java可以直接调用。

中文文字训练集下载

Tesseract引擎默认是无法识别中文的，只能识别数字或者英文。如果我们想实现中文的识别就得去下载对应的训练集。

GitCode - 开发者的代码家园

下载之后找到中文简体训练集文件

将chi_sim.traineddata复制到某磁盘路径下，这里放在D盘tessdata目录下

注：

博客：
霸道流氓气质-CSDN博客

实现

1、搭建SpringBoot项目后，添加Tess4J依赖

        <dependency><groupId>net.sourceforge.tess4j</groupId><artifactId>tess4j</artifactId><version>4.5.4</version></dependency>

2、在配置文件application.yml中添加训练集文件夹的路径

# 训练数据文件夹的路径
tess4j:datapath: D:/tessdata

3、新增配置类，读取配置文件内容，并初始化Tesseract类，交给Spring管理

import net.sourceforge.tess4j.Tesseract;
import org.springframework.beans.factory.annotation.Value;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;@Configuration
public class TesseractOcrConfiguration {@Value("${tess4j.datapath}")private String dataPath;@Beanpublic Tesseract tesseract() {Tesseract tesseract = new Tesseract();// 设置训练数据文件夹路径tesseract.setDatapath(dataPath);// 设置为中文简体tesseract.setLanguage("chi_sim");return tesseract;}
}

4、编写Service接口层

import java.io.InputStream;public interface IOcrService {String recognizeText(InputStream sbs);
}

5、编写ServiceImpl

import com.ruoyi.system.service.IOcrService;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.stereotype.Service;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.io.InputStream;@Service
public class OcrServiceImpl implements IOcrService {@Autowiredprivate Tesseract tesseract;@Overridepublic String recognizeText(InputStream sbs) {// 转换try {BufferedImage bufferedImage = ImageIO.read(sbs);// 对图片进行文字识别return tesseract.doOCR(bufferedImage);} catch (IOException | TesseractException e) {e.printStackTrace();return null;}}
}

6、编写单元测试

import com.ruoyi.system.service.IOcrService;
import org.junit.Test;
import org.junit.runner.RunWith;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.boot.test.context.SpringBootTest;
import org.springframework.test.context.junit4.SpringRunner;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.InputStream;@RunWith(SpringRunner.class)
@SpringBootTest(classes = RuoYiApplication.class,webEnvironment = SpringBootTest.WebEnvironment.RANDOM_PORT)
public class Tess4JOcrTest {@Autowiredprivate IOcrService iOcrService;@Testpublic void ocrLocalPng() {try {InputStream inputStream=new FileInputStream("D://tess4j.png");String result = iOcrService.recognizeText(inputStream);System.out.println(result);} catch (FileNotFoundException e) {e.printStackTrace();}}
}

7、这里的png文件随便截图并放在磁盘路径下，运行单元测试

识别效果可能存在不准确的情况。

其它使用场景，比如前端上传照片，后台识别返回结果等可自己进行扩展。

SpringBoot/Java中OCR实现,集成Tess4J实现图片文字识别

场景 Tesseract Tesseract是一个开源的光学字符识别（OCR）引擎，它可以将图像中的文字转换为计算机可读的文本。支持多种语言和书面语言，并且可以在命令行中执行。它是一个流行的开源OCR工具，可以在许多不同的操作系…...

编程日记 2024/2/27 17:29:46

【深度学习目标检测】十九、基于深度学习的芒果计数分割系统-含数据集、GUI和源码（python，yolov8）

使用深度学习算法检测芒果具有显著的优势和应用价值。以下是几个主要原因： 特征学习的能力：深度学习，特别是卷积神经网络（CNN），能够从大量的芒果图像中自动学习和提取特征。这些特征可能是传统方法难以手动…...

编程日记 2024/2/27 17:20:36

骑砍战团MOD开发(48)-多人联机模式开发环境搭建

一.多人联机模式网络拓扑图 <1.局域网网络拓扑图 <2.互联网网络拓扑图二.多人联机模式配置 MOD目录下module.ini修改配置项 has_multiplayer 1 has_single_player 1 三.服务端创建引擎内置presentation页面: prsnt_game_multiplayer_admin_panel start_multi…...

编程日记 2024/2/27 17:19:34

Java+SpringBoot+Vue+MySQL：美食推荐系统的技术革新

✍✍计算机编程指导师 ⭐⭐个人介绍：自己非常喜欢研究技术问题！专业做Java、Python、微信小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。 ⛽⛽实战项目：有源码或者技术上的问题欢迎在评论区一起讨论交流！ ⚡⚡ Java实战 |…...

编程日记 2024/2/27 17:16:29

【服务发现--ingress】

1、ingress介绍 Ingress 提供从集群外部到集群内服务的 HTTP 和 HTTPS 路由。流量路由由 Ingress 资源所定义的规则来控制。 Ingress 是对集群中服务的外部访问进行管理的 API 对象，典型的访问方式是 HTTP。 Ingress 可以提供负载均衡、SSL 终结和基于名称的虚拟…...

编程日记 2024/2/27 17:15:28

Yolov8有效涨点：YOLOv8-AM，添加多种注意力模块提高检测精度，含代码，超详细

前言 2023 年，Ultralytics 推出了最新版本的 YOLO 模型。注意力机制是提高模型性能最热门的方法之一。本次介绍的是YOLOv8-AM，它将注意力机制融入到原始的YOLOv8架构中。具体来说，我们分别采用四个注意力模块：卷积块注意力模块…...

编程日记 2024/2/27 17:10:22

苹果分拣检测YOLOV8NANO

苹果分拣，可以检测成熟、切片、损坏、不成熟四种类型，YOLOV8NANO，训练得到PT模型，然后转换成ONNX，OPENCV的DNN调用，支持C,PYTHON 苹果分拣检测YOLOV8NANO，检测四种类型苹果...

编程日记 2024/2/27 17:09:21

使用 Verilog 做一个可编程数字延迟定时器 LS7211-7212

今天的项目是在 Verilog HDL 中实现可编程数字延迟定时器。完整呈现了延迟定时器的 Verilog 代码。所实现的数字延迟定时器是 CMOS IC LS7212，用于生成可编程延迟。延迟定时器的规格可以在这里轻松找到。基本上，延迟定时器有 4 种操作模式：…...

编程日记 2024/2/27 17:06:16

戏说c语言文章汇总

c语言的起源GNU C和标准C第一篇: hello c!第二篇: 为什么需要编译第三篇: 当你运行./a.out时，发生了什么？第四篇: 简单的加法器第五篇: 两个正数相加竟然变成了负数！第六篇: 西西弗斯推石头(循环)第七篇: 九九乘法表(双循环)第八篇: 如果上天…...

编程日记 2024/2/27 17:00:11

面试redis篇-12Redis集群方案-分片集群

原理主从和哨兵可以解决高可用、高并发读的问题。但是依然有两个问题没有解决： 海量数据存储问题高并发写的问题使用分片集群可以解决上述问题，分片集群特征： 集群中有多个master，每个master保存不同数据每个master都可以有…...

编程日记 2024/2/27 16:59:09

【Java EE初阶二十三】servlet的简单理解

1. 初识servlet Servlet 是一个比较古老的编写网站的方式，早起Java 编写网站,主要使用 Servlet 的方式，后来 Java 中产生了一个Spring(一套框架)，Spring 又是针对 Servlet 进行了进一步封装,从而让我们编写网站变的更简单了；Sprin…...

编程日记 2024/2/27 16:57:07

c++ http操作接口

很简单的使用libcurl来操作http与服务器来通讯，包含http与https，对外只开放 #include "request.h" #include "response.h" #include "url.h" 三个头文件，简单易用，使用的实例如下： vo…...

编程日记 2024/2/27 16:47:58

oracle官网下载早期jdk版本

Java Downloads | Oracle JDK Builds from Oracle 以上压缩版，以下安装版 Java Downloads | Oracle 该链接往下拉能看到jdk8和jdk11的安装版 -- end...

编程日记 2024/2/27 16:46:56

Python爬虫实战：图片爬取与保存

引言： 在本文中，我们将学习如何使用Python创建一个简单的图片爬虫。我们将利用requests库来发送HTTP请求，BeautifulSoup库来解析HTML页面，以及os和shutil库来下载和保存图片。通过这个教程，你将学会如何爬取网…...

编程日记 2024/2/27 16:44:53

CMS垃圾回收器

CMS垃圾回收 CMS GC的官方名称为“Mostly Concurrenct Mark and Sweep Garbage Collector”（最大-并发-标记-清除-垃圾收集器）。作用范围： 老年代算法： 并发标记清除算法。启用参数：-XX:UseConMarkSweepGC 默认回收…...

编程日记 2024/2/27 16:41:49

【力扣白嫖日记】184.部门工资最高的员工

前言练习sql语句，所有题目来自于力扣（https://leetcode.cn/problemset/database/）的免费数据库练习题。今日题目： 184.部门工资最高的员工表：Employee 列名类型idintnamevarcharsalaryvarchardepartmentIdint …...

编程日记 2024/2/27 16:36:42

JAVA讲解算法-排序算法-选择排序算法-02

一、定义选择排序法是一种不稳定的排序算法。它的工作原理是每一次从待排序的数据元素中选出最小（或最大）的一个元素，存放在序列的起始位置，然后，再从剩余未排序元素中继续寻找最小（大）元素&a…...

编程日记 2024/2/27 16:35:41

【初始RabbitMQ】高级发布确认的实现

在生产环境中由于一些不明原因，导致 rabbitmq 重启，在 RabbitMQ 重启期间生产者消息投递失败， 导致消息丢失，需要手动处理和恢复。于是，我们开始思考，如何才能进行 RabbitMQ 的消息可靠投递呢？ …...

编程日记 2024/2/27 16:29:35

用39块钱的全志V851se视觉开发板做了个小相机，还可以物品识别、自动追焦！

用39块钱的V851se视觉开发板做了个小相机。可以进行物品识别、自动追焦！ 这个超低成本的小相机是在V851se上移植使用全志在线开源版本的Tina Linux与OpenCV框架开启摄像头拍照捕获视频，并结合NPU实现Mobilenet v2目标分类识别以及运动追踪等功能…并最终…...

编程日记 2024/2/27 16:26:31

主从复制实现Redis集群

主从复制实现Redis集群实验 (一主二从): 实验环境: 使用Docker 搭建 Redis 版本 5.0.5 打开一个终端窗口，在其中运行如下命令创建一个名为redis-master的Redis容器。注意，它的端口是6379 (本地的端口:映射到容器的端口) docker run -itd--name redis-m…...

编程日记 2024/2/27 16:24:28

【OSG学习笔记】Day 16: 骨骼动画与蒙皮（osgAnimation）

骨骼动画基础骨骼动画是 3D 计算机图形中常用的技术，它通过以下两个主要组件实现角色动画。骨骼系统 (Skeleton)：由层级结构的骨头组成，类似于人体骨骼蒙皮 (Mesh Skinning)：将模型网格顶点绑定到骨骼上，使骨骼移动…...

编程新知 2026/2/1 5:42:50

pikachu靶场通关笔记22-1 SQL注入05-1-insert注入(报错法)

目录一、SQL注入二、insert注入三、报错型注入四、updatexml函数五、源码审计六、insert渗透实战 1、渗透准备 2、获取数据库名database 3、获取表名table 4、获取列名column 5、获取字段本系列为通过《pikachu靶场通关笔记》的SQL注入关卡(共10关&#xff0…...

编程新知 2026/2/5 2:28:27

精益数据分析（97/126）：邮件营销与用户参与度的关键指标优化指南

精益数据分析（97/126）：邮件营销与用户参与度的关键指标优化指南在数字化营销时代，邮件列表效度、用户参与度和网站性能等指标往往决定着创业公司的增长成败。今天，我们将深入解析邮件打开率、网站可用性、页面参与时…...

编程新知 2025/12/13 4:04:33

C#中的CLR属性、依赖属性与附加属性

CLR属性的主要特征封装性： 隐藏字段的实现细节提供对字段的受控访问访问控制： 可单独设置get/set访问器的可见性可创建只读或只写属性计算属性： 可以在getter中执行计算逻辑不需要直接对应一个字段验证逻辑： 可以…...

编程新知 2025/12/4 0:13:33

import java.util.*;public class DemoTest5 {public static void main(String[] args) {Scanner in new Scanner(System.in);// 注意 hasNext 和 hasNextLine 的区别while (in.hasNextLine()) { // 注意 while 处理多个 caseSystem.out.println(solve(in.nextLine()));}}priv…...

编程新知 2026/1/31 6:01:08

uniapp 字符包含的相关方法

在uniapp中，如果你想检查一个字符串是否包含另一个子字符串，你可以使用JavaScript中的includes()方法或者indexOf()方法。这两种方法都可以达到目的，但它们在处理方式和返回值上有所不同。使用includes()方法 includes()方法用于判断一个字…...

编程新知 2025/9/28 19:00:18

书籍“之“字形打印矩阵(8)0609

题目给定一个矩阵matrix，按照"之"字形的方式打印这个矩阵，例如： 1 2 3 4 5 6 7 8 9 10 11 12 ”之“字形打印的结果为：1，…...

编程新知 2025/12/6 11:14:42

JavaScript 标签加载

目录 JavaScript 标签加载script 标签的 async 和 defer 属性，分别代表什么，有什么区别1. 普通 script 标签2. async 属性3. defer 属性4. type"module"5. 各种加载方式的对比6. 使用建议 JavaScript 标签加载 script 标签的 async 和 defer …...

编程新知 2025/10/2 20:58:12

__VUE_PROD_HYDRATION_MISMATCH_DETAILS__ is not explicitly defined.

这个警告表明您在使用Vue的esm-bundler构建版本时，未明确定义编译时特性标志。以下是详细解释和解决方案： ‌问题原因‌： 该标志是Vue 3.4引入的编译时特性标志，用于控制生产环境下SSR水合不匹配错误的详细报告1使用esm-bundler…...

编程新知 2025/11/2 19:29:07

【技巧】dify前端源代码修改第一弹-增加tab页

回到目录【技巧】dify前端源代码修改第一弹-增加tab页尝试修改dify的前端源代码，在知识库增加一个tab页"HELLO WORLD"，完成后的效果如下 [gif01] 1. 前端代码进入调试模式参考【部署】win10的wsl环境下启动dify的web前端服务启动调试…...

编程新知 2026/2/8 9:41:45

SpringBoot/Java中OCR实现,集成Tess4J实现图片文字识别

场景

Tesseract

Tess4J

中文文字训练集下载

实现

相关文章：

SpringBoot/Java中OCR实现,集成Tess4J实现图片文字识别

【深度学习目标检测】十九、基于深度学习的芒果计数分割系统-含数据集、GUI和源码（python，yolov8）

骑砍战团MOD开发(48)-多人联机模式开发环境搭建

Java+SpringBoot+Vue+MySQL：美食推荐系统的技术革新

【服务发现--ingress】

Yolov8有效涨点：YOLOv8-AM，添加多种注意力模块提高检测精度，含代码，超详细

苹果分拣检测YOLOV8NANO

使用 Verilog 做一个可编程数字延迟定时器 LS7211-7212

戏说c语言文章汇总

面试redis篇-12Redis集群方案-分片集群

【Java EE初阶二十三】servlet的简单理解

c++ http操作接口

oracle官网下载早期jdk版本

Python爬虫实战：图片爬取与保存

CMS垃圾回收器

【力扣白嫖日记】184.部门工资最高的员工

JAVA讲解算法-排序算法-选择排序算法-02

【初始RabbitMQ】高级发布确认的实现

用39块钱的全志V851se视觉开发板做了个小相机，还可以物品识别、自动追焦！

主从复制实现Redis集群

【OSG学习笔记】Day 16: 骨骼动画与蒙皮（osgAnimation）

pikachu靶场通关笔记22-1 SQL注入05-1-insert注入(报错法)

精益数据分析（97/126）：邮件营销与用户参与度的关键指标优化指南

C#中的CLR属性、依赖属性与附加属性

华为OD机考-机房布局

uniapp 字符包含的相关方法

书籍“之“字形打印矩阵(8)0609

JavaScript 标签加载

__VUE_PROD_HYDRATION_MISMATCH_DETAILS__ is not explicitly defined.

【技巧】dify前端源代码修改第一弹-增加tab页