登录接口带验证码自动化(tesseract-OCR)
登录接口是很多网站和应用程序中必不可少的一部分。为了增加安全性,很多登录接口还会加入验证码的验证步骤,以防止恶意登录行为。

通常,遇到这样情况时有以下解决办法
1、使用万能验证码:如果遇到前台输入的是万能验证码,那就不要做验证码校验直接通过;
2、特定用户跳过验证码:如果遇到指定用户登录,那么不管输入什么验证码,验证码校验都通过;
3、通过OCR识别解决验证码问题;
4、将token变为变量,后续时长更新;
本文主要介绍第三种方式:
安装Pillow和pytesseract模块
pip install pytesseract -i https://pypi.tuna.tsinghua.edu.cn/simplepip install pillow -i https://pypi.tuna.tsinghua.edu.cn/simple
安装tesseract-OCR
下载地址Index of /tesseract
https://digi.bib.uni-mannheim.de/tesseract/
网站较慢,可从网盘获取
通过网盘分享的文件:tesseract-ocr-w64-setup-v5.3.0.20221214.exe
链接: https://pan.baidu.com/s/1DdDZsANpdY3Yg2uDxXbZgw 提取码: 4742
下载最新版本即可,直接next安装完成,
配置环境变量
1、添加到环境变量的系统变量(PATH)去(根据实际填写)
2、增加一个TESSDATA_PREFIX变量名,变量值是 实际安装路径\tessdata

3、打开终端,输入:tesseract -v,可以看到版本信息

代码演示
def test_get_token(self):json_path = read_json_path()path = get_yaml_data(read_yaml_file())["Token"]["get_uuid"]["path"]# 发送 GET 请求,请求路径由 self.select_env() 方法返回的环境URL与 path 拼接而成re = requests.get(self.select_env() + path)# 将响应转换为 JSON 格式response_data = re.json()---------------此处开始是相关的代码# 获取Base64编码的图片数据img_data = response_data["img"].split(",")[1]# 将Base64字符串解码为字节数据img_bytes = base64.b64decode(img_data)# 创建一个图像对象img = Image.open(BytesIO(img_bytes))# 进行图像增强处理img = img.convert("L") # 转为灰度图像img = img.filter(ImageFilter.MedianFilter()) # 去噪声# 可以尝试不同的阈值来改进图像处理threshold = 180 # 调整阈值进行实验img = img.point(lambda p: p > threshold and 255)# 配置参数,增强验证码识别的准确性custom_config = r'--oem 3 --psm 6'# 使用pytesseract进行验证码识别captcha_text = pytesseract.image_to_string(img, config=custom_config)print(captcha_text)# 显示图像,查看图像质量img.show()---------------此处是相关的代码的结束headers = read_json_file_dict(f'{json_path}/json/token_data.json', 'header')logging.info(f" headers 是 {headers}")data = read_json_file_dict(f'{json_path}/json/token_data.json', 'body')public_key = read_file(f"{json_path}/cipher_public.pem")username = encryption(self._USERNAME, public_key)password = encryption(self._PASSWORD, public_key)# 去除前后的空格和换行符code = captcha_text.replace("\n", "")uuid = response_data["uuid"]logging.info(f" username 是 {username}")logging.info(f" password 是 {password}")logging.info(f" uuid 是 {uuid}")logging.info(f" code 是 {code}")data["uuid"] = uuiddata["username"] = usernamedata["usercode"] = usernamedata["password"] = passworddata["code"] = code# 将字典转换成 JSON 格式的字符串data = json.dumps(data)logging.info(f" data是 {data}")path = get_yaml_data(read_yaml_file())["Token"]["get_token"]["path"]logging.info(f" path 是 {path}")# 发送 POST 请求,请求路径由 self.select_env() 方法返回的环境URL与 path 拼接而成re = requests.post(self.select_env() + path, headers=headers, data=data)# 将响应转换为 JSON 格式response_data = re.json()token = response_data["data"]["access_token"]return token
注意,
运行前,需修改pytesseract.py文件中
tesseract_cmd 的实际路径

说明
我演示的环境中,验证码会通过base64进行编码,所以我们先做的就是将接口中的编码信息拿到,然后进行解码操作,再将解码信息创建为图片对象,然后进行ocr识别,最后将识别的信息填入登录请求体中;


最后
免费的ocr不好使,哈哈哈,尽量选择第一、二种方式;或者使用付费的ocr进行识别,增加准确度;
相关文章:
登录接口带验证码自动化(tesseract-OCR)
登录接口是很多网站和应用程序中必不可少的一部分。为了增加安全性,很多登录接口还会加入验证码的验证步骤,以防止恶意登录行为。 通常,遇到这样情况时有以下解决办法 1、使用万能验证码:如果遇到前台输入的是万能验证码…...
【Python】pillow库学习笔记2-ImageFilter类和ImageEnhance类
PIL库的ImageFilter类和ImageEnhance类提供了过滤图像和增强图像的方法。 3.ImageFilter类 ImageFilter类共提供10种预定义图像过滤方法: 方法表示描述ImageFilter.BLUR图像的模糊效果ImageFilter.CONTOUR图像的轮廓效果ImageFilter.DETAIL图像的细节效果ImageFi…...
3.Matplotlib:绘图参数文件和绘图的主要函数
一 绘图参数文件 1.绘图参数文件是什么 可以通过在程序中添加代码对参数进行配置,但是如果一个项日对于 Matplotlib 的特性参数总会设置相同的值,就没有必要在每次编写代码的时候都进行相同的配置。在代码之外使用一个永久的文件设定 Matplotlib 参数默认…...
飞书只有阅读权限的文档下载,飞书文档下载没有权限的文件
wx搜索公zhong号:"狮心王"回复"飞书文档保存"下载chrome扩展文件 拿到扩展文件之后给chrome添加扩展...
蓝桥杯C++基础算法-0-1背包(优化为一维)
这段代码实现了0-1 背包问题的动态规划解法,并且使用了滚动数组来优化空间复杂度。以下是代码的详细思路解析: 1. 问题背景 给定 n 个物品,每个物品有其体积 v[i] 和价值 w[i],以及一个容量为 m 的背包。目标是选择物品使得总价值…...
【开题报告+论文+源码】基于SpringBoot的智能安全与急救知识科普系统设计与实现
项目背景与意义 在全球范围内,安全与急救知识的普及已成为提升公众安全素养、减少意外伤害发生率、提高突发事件应对能力的重要举措。尤其是在当今社会,人们面临的生活、工作环境日益复杂,交通事故、火灾、溺水、突发疾病等各种意外事件的发生…...
Django之旅:第五节--Mysql数据库操作(一)
Django开发操作数据库更简单,内部提供了ORM框架 一、安装第三方模块 pip install mysqlclient注:最新的django框架需要使用mysqlclient模块,之前pymysql模块与django框架有编码兼容问题。 二、ORM 1、ORM可以帮助我们做两件事:…...
蓝桥杯 - 简单 - 布局切换
介绍 为了提高用户体验,网站有时需要多种浏览模式。现在特邀请你为蓝桥官网设计具有经典、浏览和工具三种布局模式。使用户可以根据具体情况选择合适的模式,以便更好地浏览网页内容。 本题需要在已提供的基础项目中使用 JS 完善代码实现布局的切换。 …...
测试用例生成平台通过大模型升级查询功能,生成智能测试用例
在测试工作中,查询功能是各类系统的核心模块,传统的测试用例编写往往耗时且重复。如何让老旧平台焕发新活力?本文将结合大模型技术,通过用户输入的字段信息,自动化生成高效、精准的测试用例。同时,我们还将…...
python每日十题(9)
外存储器的容量一般都比较大,而且大部分可以移动,便于在不同计算机之间进行信息交流。外存储器中数据被读入内存储器后,才能被CPU读取,CPU不能直接访问外存储器。本题答案为A选项。 进程是指一个具有一定独立功能的程序关于某个数…...
macOS 制作dmg磁盘映像安装包
制作dmg磁盘影像安装包需要准备一下材料: 1. 导出的APP 2. 背景图片 3. 应用程序替身 前两种材料很容易得到。 下面介绍一下 应用程序替身制作过程: Finder —> 选中 应用程序 --> 找到顶部菜单栏中 的 前往 ----> 选择上层文件夹选中应用程…...
LeetCode热题100JS(79/100)第十五天|347|295|121|55|45
347. 前 K 个高频元素 题目链接:347. 前 K 个高频元素 难度:中等 刷题状态:1刷 新知识: 解题过程 思考 示例 1: 输入: nums [1,1,1,2,2,3], k 2 输出: [1,2] 没思路,看答案 题解分析 参考题解链接:…...
Rust从入门到精通之精通篇:22.Unsafe Rust 详解
Unsafe Rust 详解 在 Rust 的设计哲学中,安全性是核心原则之一。Rust 的所有权系统、借用检查器和类型系统共同保证了内存安全和线程安全。然而,有些底层操作无法通过 Rust 的安全检查机制进行验证,这就是 unsafe Rust 存在的原因。在本章中…...
Three.js 快速入门教程【十八】射线拾取模型——鼠标点击屏幕选中模型或物体
系列文章目录 Three.js 快速入门教程【一】开启你的 3D Web 开发之旅 Three.js 快速入门教程【二】透视投影相机 Three.js 快速入门教程【三】渲染器 Three.js 快速入门教程【四】三维坐标系 Three.js 快速入门教程【五】动画渲染循环 Three.js 快速入门教程【六】相机控件 Or…...
如何下载 Postman?快速指南!
Postman 是一款非常受欢迎的 API 测试工具。它最初是作为一个 Chrome 插件发布,后来发展成为一款独立的跨平台软件,支持 Windows、Mac、Linux 等操作系统。 Postman 怎么下载教程(2025最新版)?...
Shiro学习(一):Shiro介绍和基本使用
一、Shiro介绍 1、百科对shiro的定义如下: Apache Shiro 一个强大且易于使用的 Java 安全框架,它提供了身份验证、授权、加密和会话管理等功能。Shiro 的设计目标是简化企业级应用程序的安全性开发过程,同时保持代码的简洁和易于维护。 2、…...
【git】基本操作
添加文件进本地仓库 git add 文件名删除文件 git rm 文件名版本回退 git reset [--sort| -- mixed | -- hard] sort选项: 只回退版本库,不回退暂存区和工作区 mixed(reset的默认选项): 回退版本库和暂存区,不回退工作区 hard :…...
7.1 分治-快排专题:LeetCode 75. 颜色分类
1. 题目链接 LeetCode 75. 颜色分类 2. 题目描述 给定一个包含红色(0)、白色(1)和蓝色(2)的数组 nums,要求原地对数组进行排序,使得相同颜色的元素相邻,且按红、白、蓝…...
深度解析:TOML、XML、YAML及其他配置/数据格式对比
深度解析:TOML、XML、YAML及其他配置/数据格式对比 在软件开发和系统配置中,选择合适的配置或数据格式至关重要。本文将对比 TOML、XML、YAML 等常见格式,梳理它们的核心特性、适用场景及区别,并扩展介绍其他类似格式,…...
开源软件许可证冲突的原因和解决方法
1、什么是开源许可证以及许可证冲突产生的问题 开源软件许可证是一种法律文件,它规定了软件用户、分发者和修改者使用、复制、修改和分发开源软件的权利和义务。开源许可证是由软件的版权所有者(通常是开发者或开发团队)发布的,它…...
详解java体系实用知识总结
0.java技术能力框架 基础模块应用模块综合模块技术岗位与面试流程常用工具集系统架构设计计算机基础常用框架微服务架构jvm原理缓存容器化多线程队列云计算(阿里云/aws)设计模式数据库数据结构与算法 1.常用设计模式与应用场景 工厂模式:s…...
node-ddk,electron,主进程通讯,窗口间通讯
node-ddk,electron,主进程通讯,窗口间通讯 https://blog.csdn.net/eli960/article/details/146207062 也可以下载demo直接演示 http://linuxmail.cn/go#node-ddk import 在主进程 import main, { NODEDDK } from "node-ddk/main"在渲染进程 import renderer, …...
kubectl 命令参数详解与示例
kubectl 命令参数详解与示例 kubectl 是 Kubernetes 的命令行工具,用于与 Kubernetes 集群交互。下面我将详细介绍 kubectl 的主要命令参数,并提供相应的使用示例。 一、基础命令 1. kubectl get - 获取资源信息 常用参数: -n, --namesp…...
在 Ubuntu 20.04 上重新启动网络
参考链接: 如何在 Ubuntu 22.04 上重新启动网络 执行以下两条命令,ok sudo nmcli networking off sudo nmcli networking on...
STM32 - 在机器人、自动化领域,LL库相比HAL优势明显
在机器人控制器、电机控制器等领域的开发,需要高实时性、精细化控制或者对代码执行效率、占用空间有较高要求。所以,大家常用的HAL库明显不符合要求。再加上,我们学习一门技术,一定要学会掌握底层的原理。MCU开发的底层就是寄存器…...
【区块链安全 | 第二篇】区块链概念详解
文章目录 概述1. 区块链类型2 区块链五层架构3 账本模型4. 节点(Node)5. 区块(Block)6. 区块链(Blockchain)7. 区块链工作流程 核心技术1. 共识机制2. 智能合约 主要组件1. 交易(Transaction&am…...
【开源宝藏】30天学会CSS - DAY6 第六课 流光文字动画
第 0 步:项目结构 lighting-text/├─ index.html└─ style.cssindex.html:包含列表 <ul>,其中每个 <li> 放一个字母或符号。style.css:设置背景、文字样式,以及关键帧动画(lighting…...
linux - centos7 部署 redis6.0.5
事先说明 本篇文章只解决在部署redis中出现的问题,并没有部署redis的全过程,详细部署过程可以参考Linux安装部署Redis(超级详细) - 长沙大鹏 - 博客园 执行 make 命令时报错 原因:是因为gcc版本太低 升级gcc版本时 出现没有可用软件包 devt…...
Java反射机制详解:原理、应用与最佳实践
Java反射机制详解:原理、应用与最佳实践 1. 什么是反射? Java反射(Reflection)是指在运行时动态获取类的信息(如类名、方法、字段、构造方法等)并操作对象的能力。它允许程序在运行时检查和修改类的行为&…...
Swift实现嵌套json字典重排序并输出string
在网络请求或接口签名中,通常要求将参数按照一定规则拼接成字符串。一个常见的做法是对字典的 key 进行排序,然后按照 “keyvalue” 的格式拼接,多个参数之间以特定符号(例如 &)连接。 如果参数中包含嵌套的字典或…...
