当前位置：首页 > news >正文

利用深度学习实现验证码识别-2-使用Python导出ONNX模型并在Java中调用实现验证码识别

news 2025/12/30 18:18:32

在这里插入图片描述

1. Python部分：导出ONNX模型

首先，我们需要在Python中定义并导出一个已经训练好的验证码识别模型。以下是完整的Python代码：

import string
import torch
import torch.nn as nn
import torch.nn.functional as FCHAR_SET = string.digits# 优化后的模型设计
class CaptchaModel(nn.Module):def __init__(self):super(CaptchaModel, self).__init__()self.conv1 = nn.Conv2d(1, 32, 3, padding=1)self.conv2 = nn.Conv2d(32, 64, 3, padding=1)self.conv3 = nn.Conv2d(64, 128, 3, padding=1)self.fc1 = nn.Linear(128 * 5 * 12, 256)  # 调整为实际展平维度self.fc2 = nn.Linear(256, 4 * len(CHAR_SET))self.dropout = nn.Dropout(0.5)def forward(self, x):x = F.relu(F.max_pool2d(self.conv1(x), 2))x = F.relu(F.max_pool2d(self.conv2(x), 2))x = F.relu(F.max_pool2d(self.conv3(x), 2))x = x.view(x.size(0), -1)x = F.relu(self.fc1(x))x = self.dropout(x)x = self.fc2(x)return x.view(-1, 4, len(CHAR_SET))# 使用CUDA，如果可用的话
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(f"Using device: {device}")
# 假设你的模型已经训练好并保存在 'best_model.pth'
model = CaptchaModel().to(device)
model.load_state_dict(torch.load('best_model.pth'))# 生成一个测试输入 (示例输入的形状应与模型输入形状一致)
dummy_input = torch.randn(1, 1, 40, 100).to(device)# 导出模型为 ONNX 格式
torch.onnx.export(model, dummy_input, "captcha_model.onnx", input_names=["input"], output_names=["output"], dynamic_axes={"input": {0: "batch_size"}, "output": {0: "batch_size"}})print("Model exported to captcha_model.onnx")

这段代码定义了一个验证码识别模型，并将其导出为ONNX格式，以便在Java中使用。

2. Java部分：调用ONNX模型进行验证码识别

接下来，我们使用Java调用导出的ONNX模型进行验证码识别。以下是完整的Java代码：

引用onnxruntime-1.19.0.jar

package com.tushuoit;import ai.onnxruntime.*;
import javax.imageio.ImageIO;
import java.awt.*;
import java.awt.image.BufferedImage;
import java.io.File;
import java.nio.FloatBuffer;
import java.util.ArrayList;
import java.util.Collections;
import java.util.Random;
import java.util.List;public class CaptchaInference {private static final String CHAR_SET = "0123456789";private static final int INPUT_WIDTH = 100;private static final int INPUT_HEIGHT = 40;private static final Random random = new Random();public static void main(String[] args) throws Exception {// 随机生成4个字符的验证码文本String captchaText = generateRandomText(4);System.out.println("Generated Captcha Text: " + captchaText);// 生成包含文本的Bitmap (BufferedImage)BufferedImage captchaImage = generateCaptcha(captchaText, 36, INPUT_WIDTH, INPUT_HEIGHT);// 将Bitmap保存为文件（仅用于查看生成的图像，实际使用中可以省略）ImageIO.write(captchaImage, "png", new File("generated_captcha.png"));// 将图像转换为浮点数数组，并进行归一化处理float[] inputData = imageToFloatArray(captchaImage);// 创建ONNX Runtime环境OrtEnvironment env = OrtEnvironment.getEnvironment();OrtSession.SessionOptions opts = new OrtSession.SessionOptions();// 加载ONNX模型OrtSession session = env.createSession("captcha_model.onnx", opts);// 创建输入张量FloatBuffer inputBuffer = FloatBuffer.wrap(inputData);OnnxTensor inputTensor = OnnxTensor.createTensor(env, inputBuffer,new long[] { 1, 1, INPUT_HEIGHT, INPUT_WIDTH });// 进行推理OrtSession.Result result = session.run(Collections.singletonMap("input", inputTensor));// Extract output tensor and decode itfloat[][][] outputData = (float[][][]) result.get(0).getValue();List<String> decodedTexts = decodeOutput(outputData);// Print the decoded captcha textfor (String text : decodedTexts) {System.out.println("Predicted Captcha Text: " + text);}System.out.println("Inference completed.");// 释放资源session.close();env.close();}// 随机生成指定长度的验证码文本private static String generateRandomText(int length) {StringBuilder text = new StringBuilder(length);for (int i = 0; i < length; i++) {text.append(CHAR_SET.charAt(random.nextInt(CHAR_SET.length())));}return text.toString();}// 生成包含文本的BufferedImageprivate static BufferedImage generateCaptcha(String text, int fontSize, int width, int height) {BufferedImage image = new BufferedImage(width, height, BufferedImage.TYPE_INT_RGB);Graphics2D g2d = image.createGraphics();// 设置背景颜色为白色g2d.setColor(Color.WHITE);g2d.fillRect(0, 0, width, height);// 设置字体和颜色g2d.setFont(new Font("DroidSansMono", Font.PLAIN, fontSize));g2d.setColor(Color.BLACK);// 绘制文本FontMetrics fm = g2d.getFontMetrics();int x = 5; // 文字开始的X坐标int y = fm.getAscent() + 5; // 文字开始的Y坐标g2d.drawString(text, x, y);g2d.dispose();return image;}// 将BufferedImage转换为float数组，并进行归一化处理private static float[] imageToFloatArray(BufferedImage image) {int width = image.getWidth();int height = image.getHeight();float[] floatArray = new float[width * height];for (int y = 0; y < height; y++) {for (int x = 0; x < width; x++) {int rgb = image.getRGB(x, y);int gray = (rgb >> 16) & 0xFF; // 因为是灰度图，只需获取一个通道的值floatArray[y * width + x] = (gray / 255.0f - 0.5f) * 2.0f; // 归一化到[-1, 1]}}return floatArray;}private static List<String> decodeOutput(float[][][] outputData) {List<String> decodedTexts = new ArrayList<>();for (float[][] singleOutput : outputData) {StringBuilder decodedText = new StringBuilder();for (float[] charProbabilities : singleOutput) {int maxIndex = getMaxIndex(charProbabilities);decodedText.append(CHAR_SET.charAt(maxIndex));}decodedTexts.add(decodedText.toString());}return decodedTexts;}private static int getMaxIndex(float[] probabilities) {int maxIndex = 0;float maxProb = probabilities[0];for (int i = 1; i < probabilities.length; i++) {if (probabilities[i] > maxProb) {maxProb = probabilities[i];maxIndex = i;}}return maxIndex;}
}

这段Java代码首先生成一个随机的验证码图像，然后将其转换为模型输入格式，并通过ONNX Runtime调用导出的模型进行推理，最后解码模型的输出以获取识别的验证码文本。
在这里插入图片描述

总结

通过上述步骤，我们成功地在Python中导出了一个验证码识别模型，并在Java中调用该模型进行验证码识别。这种方法充分利用了Python在深度学习模型训练和导出方面的优势，以及Java在实际应用部署和性能方面的优势，实现了高效的验证码识别系统。

利用深度学习实现验证码识别-2-使用Python导出ONNX模型并在Java中调用实现验证码识别

1. Python部分：导出ONNX模型首先，我们需要在Python中定义并导出一个已经训练好的验证码识别模型。以下是完整的Python代码： import string import torch import torch.nn as nn import torch.nn.functional as FCHAR_SET string.digits# …...

编程日记 2024/9/7 7:07:39

如何通过Spring Cloud Consul增强微服务安全性和可靠性

为了增强微服务的安全性和可靠性，Spring Cloud Consul 是一个非常强大的工具。它不仅提供了服务发现和配置管理功能，还能够有效地管理微服务的安全和健康状态。本文将深入探讨如何通过 Spring Cloud Consul 来增强微服务的安全性和可靠性，主要…...

编程日记 2024/9/7 7:03:31

无代码搭建小程序zion

无代码搭建小程序zion 一、无代码搭建小程序zion的降低技术门槛，提升开发效率 1. 无需编程经验：Zion无代码平台通过提供直观的可视化界面和拖拽式操作，让开发者无需具备复杂的编程技能也能进行小程序的开发。这种方式大大降低了技术门槛&a…...

编程日记 2024/9/7 7:02:21

【南方科技大学】CS315 Computer Security 【Lab1 Packet Sniffing and Wireshark】

目录 IntroductionBackgroundTCP/IP Network StackApplication LayerTransport LayerInternet LayerLink LayerPacket Sniffer Getting WiresharkStarting WiresharkCapturing PacketsTest Run Questions for the Lab Introduction 实验的第一部分介绍数据包嗅探器 Wireshark。…...

编程日记 2024/9/7 7:00:19

【人工智能/机器学习/机器人】数学基础-学习笔记

函数奇偶性： 偶函数： f ( − x ) f ( x ) f(-x)f(x) f(−x)f(x) y轴对称 f ( x ) x 2 f(x)x^2 f(x)x2 f ( − x ) ( − x ) 2 x 2 f ( x ) f(-x)(-x)^2x^2f(x) f(−x)(−x)2x2f(x) 奇函数： f ( − x ) − f ( x ) f(-…...

编程日记 2024/9/7 6:56:04

视频安防监控LntonAIServer安防管理平台抖动检测和过亮过暗检测

随着视频监控技术的发展，视频质量成为确保监控系统有效性的重要因素。LntonAIServer通过引入抖动检测与过亮过暗检测功能，进一步提升了视频监控系统的可靠性和用户体验。这些功能可以帮助及时发现并解决视频流中的质量问题，确保视频监控系统始…...

编程日记 2024/9/7 6:53:00

网络模型及协议介绍

一.OSI七层模型 OSI Open System Interconnect 开放系统互连模型以前不同厂家所生产的网络设备的标准是不同的，所以为了统一生产规范就制定了OSI这个生产模型。作用：降低网络进行数据通信复杂度这个模型的作用第一降低数据通信的复杂度&#xff…...

编程日记 2024/9/7 6:50:58

手撕HashMap源码

终于通过不屑努力，把源码中的重要部分全都看完了，每一行代码都看明白了，还写了注释 import java.lang.reflect.ParameterizedType; import java.lang.reflect.Type; import java.util.*; import java.util.function.Consumer; import java.ut…...

编程日记 2024/9/7 6:48:57

OceanBase block_file与log过大的问题

一、说明 block_file 是存放sstable的数据文件，由datafile_disk_percentage 参数与datafile_size参数决定，两个参数同时配置，以datafile_size为主。 datafile_disk_percentage 默认值是90 datafile_size 默认值是0M到正无穷因为block_file 的…...

编程日记 2024/9/7 6:43:48

【Focal Loss 本质】

Focal Loss 示例 Focal Loss公式： 在后面的例子中，我们假定 y 1 的样本中，有两个预测值分别为(0.8, 0.4)。显然，0.8 很容易分类，0.4 很难分类。可以看出，Focal Loss 降低了容易分类（prt 0…...

编程日记 2024/9/7 6:42:44

端口安全老化细节

我们都知道port-security aging-time命令用来配置端口安全动态MAC地址的老化时间，但是后面还可以加上类型： [SW1-GigabitEthernet0/0/1]port-security aging-time 5 type absolute Absolute time 绝对老化 inactivity Inactivity time相对老化 …...

编程日记 2024/9/7 6:41:42

【C++】—— string 模拟实现

【C】—— string模拟实现 0 前言1 string的底层结构2 默认成员函数的实现2.1 构造函数2.1.1 无参构造2.1.2 带参构造2.1.2 合并 2.2 析构函数2.3 拷贝构造函数2.3.1 传统写法2.3.2 现代写法 2.3 赋值重载2.3.1 传统写法2.3.2 现代写法2.3.3 传统写法与现代写法的优劣 3 size、…...

编程日记 2024/9/7 6:40:41

详解TensorRT的C++高性能部署以及C++部署Yolo实践

详解TensorRT的C高性能部署一. ONNX1. ONNX的定位2. ONNX模型格式3. ONNX代码使用实例二、TensorRT1 引言三、C部署Yolo模型实例一. ONNX 1. ONNX的定位 ONNX是一种中间文件格式，用于解决部署的硬件与不同的训练框架特定的模型格式的兼容性问题。 ONNX本身其…...

编程日记 2024/9/7 6:38:38

手机如何切换网络IP地址：‌方法详解与操作指南‌

在当今的数字化时代，‌网络IP地址作为设备在网络中的唯一标识，‌扮演着至关重要的角色。‌对于手机用户而言，‌了解如何切换网络IP地址不仅有助于提升网络体验，‌还能在一定程度上保护个人隐私。‌本文将详细介绍手机切换网络IP地…...

编程日记 2024/9/7 6:37:37

南通网站建设手机版网页

随着移动互联网的迅猛发展，越来越多的人通过手机浏览网页，进行在线购物、信息查询和社交互动。因此，建立一个适合移动端访问的网站已成为企业和个人不可忽视的重要任务。在南通，网站建设手机版网页的需求逐渐增加，如何…...

编程日记 2024/9/7 6:36:36

macos系统内置php文件列表系统自带php卸载方法

在macos系统中, 自带已经安装了php, 根据不同的macos版本php的版本号可能不同, 我们可以通过 which php 命令来查看mac自带的默认php安装路径, 不过注意这个只是php的执行文件路径. 系统自带php文件列表一下就是macos默认安装的php文件列表. macos 10.15内置PHP文件列表配置…...

编程日记 2024/9/7 6:35:35

微信小程序认证和备案

小程序备案的流程一般包括以下步骤‌： 准备备案所需材料‌：通常需要提供‌营业执照、法人的‌身份证、两个‌手机号和一个邮箱等资料。 ‌1 ‌登录‌微信公众平台‌：作为第一次开发微信小程序的服务商，需要通过微信公众平台申请…...

编程日记 2024/9/7 6:34:33

C++复习day05

类和对象 1. 面向对象和面向过程的区别是什么？（开放性问题） 1. **抽象级别**：- **面向对象**：以对象（数据和方法的集合）为中心，强调的是数据和行为的封装。- **面向过程**&#xf…...

编程日记 2024/9/7 6:33:32

python数值误差

最近在用fenics框架跑有限元代码，其中有一个部分是把在矩阵里定义的初始值，赋值到有限元空间里，这就涉及到了初始矩阵和有限元空间坐标的转化，部分代码如下 for i in range(len(dof_coordinates)):# x, y dof_coordinates[i…...

编程日记 2024/9/7 6:31:30

基于FPGA的OV5640摄像头图像采集

1.OV5640简介 OV5640是OV（OmniVision）公司推出的一款CMOS图像传感器，实际感光阵列为：2592 x 1944（即500w像素），该传感器内部集成了图像出炉的电路，包括自动曝光控制（AEC…...

编程日记 2024/9/7 6:30:29

【根据当天日期输出明天的日期(需对闰年做判定)。】2022-5-15

缘由根据当天日期输出明天的日期(需对闰年做判定)。日期类型结构体如下： struct data{ int year; int month; int day;};-编程语言-CSDN问答 struct mdata{ int year; int month; int day; }mdata; int 天数(int year, int month) {switch (month){case 1: case 3:…...

编程新知 2025/11/27 21:52:13

python打卡day49

知识点回顾： 通道注意力模块复习空间注意力模块CBAM的定义作业：尝试对今天的模型检查参数数目，并用tensorboard查看训练过程 import torch import torch.nn as nn# 定义通道注意力 class ChannelAttention(nn.Module):def __init__(self,…...

编程新知 2025/12/19 0:02:24

云计算——弹性云计算器（ECS）

弹性云服务器：ECS 概述云计算重构了ICT系统，云计算平台厂商推出使得厂家能够主要关注应用管理而非平台管理的云平台，包含如下主要概念。 ECS（Elastic Cloud Server）：即弹性云服务器，是云计算…...

编程新知 2025/8/16 21:50:27

多模态商品数据接口：融合图像、语音与文字的下一代商品详情体验

一、多模态商品数据接口的技术架构 （一）多模态数据融合引擎跨模态语义对齐通过Transformer架构实现图像、语音、文字的语义关联。例如，当用户上传一张“蓝色连衣裙”的图片时，接口可自动提取图像中的颜色（RGB值&…...

编程新知 2025/7/23 3:55:49

聊一聊接口测试的意义有哪些？

目录一、隔离性 & 早期测试二、保障系统集成质量三、验证业务逻辑的核心层四、提升测试效率与覆盖度五、系统稳定性的守护者六、驱动团队协作与契约管理七、性能与扩展性的前置评估八、持续交付的核心支撑接口测试的意义可以从四个维度展开，首…...

编程新知 2025/10/14 6:46:13

Pinocchio 库详解及其在足式机器人上的应用

Pinocchio 库详解及其在足式机器人上的应用 Pinocchio (Pinocchio is not only a nose) 是一个开源的 C 库，专门用于快速计算机器人模型的正向运动学、逆向运动学、雅可比矩阵、动力学和动力学导数。它主要关注效率和准确性，并提供了一个通用的框架&…...

编程新知 2025/11/28 5:32:31

基于SpringBoot在线拍卖系统的设计和实现

摘要随着社会的发展，社会的各行各业都在利用信息化时代的优势。计算机的优势和普及使得各种信息系统的开发成为必需。在线拍卖系统，主要的模块包括管理员；首页、个人中心、用户管理、商品类型管理、拍卖商品管理、历史竞拍管理、竞拍订单…...

编程新知 2025/12/30 13:30:13

力扣热题100 k个一组反转链表题解

题目: 代码: func reverseKGroup(head *ListNode, k int) *ListNode {cur : headfor i : 0; i < k; i {if cur nil {return head}cur cur.Next}newHead : reverse(head, cur)head.Next reverseKGroup(cur, k)return newHead }func reverse(start, end *ListNode) *ListN…...

编程新知 2025/12/21 15:26:43

Ubuntu系统多网卡多相机IP设置方法

目录 1、硬件情况 2、如何设置网卡和相机IP 2.1 万兆网卡连接交换机，交换机再连相机 2.1.1 网卡设置 2.1.2 相机设置 2.3 万兆网卡直连相机 1、硬件情况 2个网卡n个相机电脑系统信息，系统版本：Ubuntu22.04.5 LTS；内核版本…...

编程新知 2025/12/24 20:24:01

0x-3-Oracle 23 ai-sqlcl 25.1 集成安装-配置和优化

是不是受够了安装了oracle database之后sqlplus的简陋，无法删除无法上下翻页的苦恼。可以安装readline和rlwrap插件的话，配置.bahs_profile后也能解决上下翻页这些，但是很多生产环境无法安装rpm包。 oracle提供了sqlcl免费许可&#xff0c…...

编程新知 2025/11/27 2:47:09

1. Python部分：导出ONNX模型

2. Java部分：调用ONNX模型进行验证码识别

总结

相关文章：