当前位置: 首页 > article >正文

Python + PyAutoGUI 实现一键清理:从 OpenCV 图像识别到“按键精灵“的自动化之路

前言上篇文章说到我装了 148 个 Skills 到 CC Switch 里想清理却发现根本没有批量删除功能。没办法只能自己动手写脚本。这篇文章记录了我的自动化方案演进过程——从一开始想用 OpenCV 搞图像识别到最后发现一个简单的 PyAutoGUI 脚本就能搞定。有时候最土的方案反而是最好的方案。需求很明确CC Switch 的删除操作分两步点击删除按钮弹出确认框后点击确认148 个 Skills每个都要重复这两个动作。手动点 296 下疯了吧。方案一OpenCV 图像识别想多了我的第一反应是用 OpenCV 做图像识别自动找到删除按钮和确认按钮。思路大概是这样的pythonimport cv2 import pyautogui import numpy as np # 截屏 screenshot pyautogui.screenshot() screen cv2.cvtColor(np.array(screenshot), cv2.COLOR_RGB2BGR) # 加载按钮模板 delete_template cv2.imread(delete_button.png) confirm_template cv2.imread(confirm_button.png) # 模板匹配 res cv2.matchTemplate(screen, delete_template, cv2.TM_CCOEFF_NORMED) min_val, max_val, min_loc, max_loc cv2.minMaxLoc(res) # 点击 if max_val 0.8: pyautogui.click(max_loc[0], max_loc[1])但很快我就发现这个方案太蠢了需要截图模板不同分辨率、不同主题下按钮长得不一样模板匹配可能失灵窗口位置会变CC Switch 窗口每次打开位置可能不同杀鸡用牛刀我就点两个固定位置的按钮至于上 CV 吗开发时间太长调模板匹配参数、处理各种边界情况比手动删还费时间果断放弃。方案二PyAutoGUI 全局热键最终方案冷静下来一想我要做的其实就是一个按键精灵先手动把鼠标移到删除按钮上记录坐标再手动把鼠标移到确认按钮上记录坐标让脚本循环点击这两个位置就这么简单根本不需要图像识别。技术选型库用途pyautogui模拟鼠标点击、获取鼠标位置keyboard全局热键监听json保存配置下次直接用安装bashpip install pyautogui keyboard完整代码python#!/usr/bin/env python3 # -*- coding: utf-8 -*- 简单点击机器人 快捷键获取鼠标位置自动循环点击 import pyautogui import time import json import os import sys try: import keyboard except ImportError: print(请先安装: pip install keyboard) sys.exit(1) SAVE_FILE click_points.json # 全局状态 delete_pos None confirm_pos None running False def log(msg): print(f[{time.strftime(%H:%M:%S)}] {msg}) def save_config(): data {delete: delete_pos, confirm: confirm_pos} with open(SAVE_FILE, w) as f: json.dump(data, f) log(f配置已保存) def load_config(): global delete_pos, confirm_pos if os.path.exists(SAVE_FILE): with open(SAVE_FILE, r) as f: data json.load(f) delete_pos data.get(delete) confirm_pos data.get(confirm) if delete_pos: log(f已加载: 删除按钮 {delete_pos}) if confirm_pos: log(f已加载: 确认按钮 {confirm_pos}) return True return False def get_mouse_pos(): 获取当前鼠标位置 x, y pyautogui.position() return (x, y) def set_delete_pos(): 设置删除按钮位置 global delete_pos delete_pos get_mouse_pos() log(f删除按钮位置: {delete_pos}) save_config() def set_confirm_pos(): 设置确认按钮位置 global confirm_pos confirm_pos get_mouse_pos() log(f确认按钮位置: {confirm_pos}) save_config() def do_click(): 执行一次点击流程 global running if not delete_pos: log(请先设置删除按钮位置 (F1)) return # 点击删除 pyautogui.click(delete_pos[0], delete_pos[1]) time.sleep(0.3) # 确认 if confirm_pos: pyautogui.click(confirm_pos[0], confirm_pos[1]) else: pyautogui.press(enter) time.sleep(0.3) def start_clicking(): 开始自动点击 global running if running: return if not delete_pos: log(请先设置删除按钮位置 (F1)) return running True log(开始自动点击...) count 0 while running: do_click() count 1 if count % 10 0: log(f已点击 {count} 次) time.sleep(0.5) log(f停止共点击 {count} 次) def stop_clicking(): 停止点击 global running running False def toggle_clicking(): 切换开始/停止 if running: stop_clicking() else: import threading t threading.Thread(targetstart_clicking) t.daemon True t.start() def main(): print( * 50) print( 简单点击机器人) print( * 50) print() print(快捷键:) print( F1 设置删除按钮位置 (鼠标移到位置后按F1)) print( F2 设置确认按钮位置 (鼠标移到位置后按F2)) print( F3 开始/停止 自动点击) print( F4 退出程序) print() print(使用步骤:) print( 1. 把鼠标移到删除按钮上按 F1) print( 2. 手动点一下删除等确认弹窗出来) print( 3. 把鼠标移到确认按钮上按 F2) print( 4. 按 F3 开始自动点击) print( 5. 再按 F3 停止) print() # 加载配置 load_config() # 注册热键 keyboard.add_hotkey(f1, set_delete_pos) keyboard.add_hotkey(f2, set_confirm_pos) keyboard.add_hotkey(f3, toggle_clicking) keyboard.add_hotkey(f4, lambda: os._exit(0)) log(热键已注册等待操作...) # 保持运行 try: while True: time.sleep(1) except KeyboardInterrupt: pass if __name__ __main__: main()使用方法快捷键功能F1记录删除按钮位置F2记录确认按钮位置F3开始/停止 自动点击F4退出程序操作步骤text步骤1: 把鼠标移到删除按钮上 → 按 F1 步骤2: 手动点一下删除等确认弹窗出来 步骤3: 把鼠标移到确认按钮上 → 按 F2 步骤4: 按 F3 开始自动点击 步骤5: 再按 F3 停止运行效果text 简单点击机器人 快捷键: F1 设置删除按钮位置 (鼠标移到位置后按F1) F2 设置确认按钮位置 (鼠标移到位置后按F2) F3 开始/停止 自动点击 F4 退出程序 [21:30:00] 热键已注册等待操作... [21:30:05] 删除按钮位置: (1856, 320) [21:30:10] 确认按钮位置: (960, 540) [21:30:15] 开始自动点击... [21:30:45] 已点击 10 次 [21:31:15] 已点击 20 次 [21:31:20] 停止共点击 22 次核心设计思路1. 为什么不用图像识别一句话坐标固定的场景下图像识别纯属多余。图像识别适合按钮位置会变化的场景比如网页上滚动加载的内容。但 CC Switch 的窗口位置是你自己打开的删除按钮和确认按钮的位置基本固定。这种情况下手动标一次坐标比调半天 CV 参数快得多。2. 多线程点击pythondef toggle_clicking(): if running: stop_clicking() else: import threading t threading.Thread(targetstart_clicking) t.daemon True t.start()点击循环在独立线程中运行不阻塞主线程这样才能随时按 F3 停止。3. 配置持久化位置信息自动保存到click_points.json下次打开脚本直接用不用重新标记。方案对比总结方案复杂度适用场景本次评价手动点无10个以内太累OpenCV 图像识别高按钮位置不确定杀鸡用牛刀PyAutoGUI 热键低按钮位置固定✅ 最合适扩展应用这个脚本不只是用来删 Skills还可以用于场景说明批量删除文件任何需要反复确认删除的场景游戏挂机设置技能按钮位置自动释放技能表单填写设置输入框位置自动粘贴内容数据采集设置翻页按钮位置自动翻页注意事项管理员权限Windows 下全局热键可能需要管理员权限运行安全停止除了 F3也可以把鼠标快速移到屏幕左上角强制停止PyAutoGUI 默认开启 FAILSAFE点击间隔代码里默认 0.5 秒一次可根据需要调整DPI 缩放如果点击位置偏移可能是高 DPI 屏幕缩放问题右键脚本 → 属性 → 兼容性 → 更改高 DPI 设置结语这次经历最大的感悟就是写自动化脚本最忌讳想太多。明明一个土办法 5 分钟就能搞定的事情非得上 OpenCV、机器学习、深度学习三件套结果调参调到怀疑人生。很多时候最简单的方案就是最好的方案。代码不到 150 行但解决了实际问题。Python 自动化真的很强如果这篇文章对你有帮助欢迎点赞收藏有问题欢迎评论区讨论。

相关文章:

Python + PyAutoGUI 实现一键清理:从 OpenCV 图像识别到“按键精灵“的自动化之路

前言上篇文章说到我装了 148 个 Skills 到 CC Switch 里,想清理却发现根本没有批量删除功能。没办法,只能自己动手写脚本。这篇文章记录了我的自动化方案演进过程——从一开始想用 OpenCV 搞图像识别,到最后发现一个简单的 PyAutoGUI 脚本就能…...

【毕设】基于Spring Boot的社区团购系统的设计与实现

💟博主:程序员俊星:CSDN作者、博客专家、全栈领域优质创作者 💟专注于计算机毕业设计,大数据、深度学习、Java、小程序、python、安卓等技术领域 📲文章末尾获取源码数据库 🌈还有大家在毕设选题…...

用一块74LS00芯片,手把手教你搭建5种基础逻辑门电路(附Multisim仿真文件)

用一块74LS00芯片手把手搭建5种基础逻辑门电路 在电子工程和计算机科学的入门阶段,理解逻辑门的工作原理是掌握数字电路设计的基础。74LS00作为最常见的四路2输入与非门芯片,不仅价格低廉、易于获取,更是学习逻辑门搭建的理想起点。本文将带你…...

别再只写Actor Core了!LabVIEW Actor Framework中这7个可重写VI,你用对几个?

别再只写Actor Core了!LabVIEW Actor Framework中这7个可重写VI,你用对几个? 在LabVIEW Actor Framework(AF)的开发实践中,许多工程师习惯性地将注意力集中在Actor Core.vi的编写上,却忽略了其他…...

基于MCP协议的ZPL标签打印引擎:连接AI与工业打印的桥梁

1. 项目概述:一个专为MCP设计的ZPL引擎最近在折腾一些与工业打印、物流标签相关的自动化项目时,我遇到了一个挺有意思的库:cicicalex/zpl-engine-mcp。乍一看这个标题,它融合了几个关键元素:zpl、engine和mcp。对于不熟…...

隐式能量模型与均衡匹配:新一代生成建模技术解析

1. 项目概述"均衡匹配:基于隐式能量模型的生成建模新方法"是一项前沿的机器学习研究,它提出了一种全新的生成模型训练范式。这种方法通过建立隐式能量模型与数据分布之间的均衡关系,实现了更稳定、更高效的生成建模。我在实际研究中…...

volatile与信号

文章目录volatile 关键字与信号场景下的可见性问题编译器优化问题开启高优化后,程序可能无法退出高优化条件下程序不退出的原因volatile关键字编译器优化与寄存器缓存详解volatile 关键字与信号场景下的可见性问题 在讨论完信号捕捉、可重入函数等概念之后&#xf…...

如何快速解密游戏音频:acbDecrypter完整实战指南

如何快速解密游戏音频:acbDecrypter完整实战指南 【免费下载链接】acbDecrypter 项目地址: https://gitcode.com/gh_mirrors/ac/acbDecrypter 想要提取游戏中的背景音乐或角色语音,却被加密的音频文件难住了吗?acbDecrypter正是你需要…...

银河麒麟V10 SP1修改MAC地址踩坑记:为什么你的脚本开机不执行?

银河麒麟V10 SP1修改MAC地址的深度实践:从失效脚本到系统级解决方案 在国产操作系统逐步替代传统Linux发行版的浪潮中,银河麒麟V10 SP1以其出色的安全性和稳定性赢得了众多政企用户的青睐。然而,当一位习惯了Ubuntu操作习惯的运维工程师首次尝…...

终极指南:如何用抖音下载器轻松获取无水印视频和音乐

终极指南:如何用抖音下载器轻松获取无水印视频和音乐 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback suppor…...

从冰激凌到芯片制造:用Fluent融化凝固模型模拟5个意想不到的工业场景

从冰激凌到芯片制造:用Fluent融化凝固模型模拟5个意想不到的工业场景 当工程师们谈论Fluent的融化凝固模型时,脑海中浮现的往往是金属铸造车间里通红的钢水或铝液。但如果你认为这套工具只能解决传统制造业的问题,那就像用超级计算机只做加减…...

从‘虚轴’到‘实轴’:用倍福NC过程映像,在包装产线上实现凸轮同步的完整配置流程

从‘虚轴’到‘实轴’:倍福NC过程映像在包装产线凸轮同步中的实战解析 在高速包装产线上,铝箔药片装盒机的推入、封口、印刷等工序需要在传送带连续运动中完成,这对运动控制的同步精度提出了严苛要求。传统机械凸轮已难以满足柔性化生产需求…...

通过curl命令快速调试Taotoken大模型API接口与排查常见错误

通过curl命令快速调试Taotoken大模型API接口与排查常见错误 1. 准备工作 在开始使用curl命令调试Taotoken大模型API之前,需要确保已经完成以下准备工作。首先登录Taotoken控制台,在「API密钥」页面创建一个新的API Key。建议为调试用途单独创建一个Key…...

6大上海海鲜批发采购痛点解析:2025年直营模式与安全风控实战方案

在深入调研上海海鲜批发市场后发现,众多餐饮企业与中小供应商在采购环节普遍面临货源不稳、品控缺失、配送效率低、采购成本高、售后响应慢、线上线下脱节等六大核心痛点。这些问题直接制约着企业的经营稳定性与出品质量。为解答行业困惑,本文以FAQ架构&…...

华为暑期实习技术面复盘:手撕代码翻车后,我是如何靠八股文和项目讲解“救场”的?

华为技术面试突围战:当代码卡壳时如何用专业力扭转局面 去年夏天,我经历了一场堪称"过山车式"的华为技术面试——在手撕代码环节遭遇滑铁卢后,靠着对计算机基础的扎实理解和项目经验的深度拆解,最终赢得了面试官的认可。…...

别再只用WebRTC了!用LiveKit + Go快速搭建一个低延迟的Web音视频聊天室(附完整前后端代码)

用LiveKit与Go构建下一代Web音视频应用:从信令简化到生产部署 在实时音视频通信领域,WebRTC技术虽然强大,但其复杂的信令服务器和SFU(Selective Forwarding Unit)搭建过程常常让开发者望而却步。LiveKit作为新一代开源…...

B站视频下载终极指南:3步解锁大会员4K高清资源

B站视频下载终极指南:3步解锁大会员4K高清资源 【免费下载链接】bilibili-downloader B站视频下载,支持下载大会员清晰度4K,持续更新中 项目地址: https://gitcode.com/gh_mirrors/bil/bilibili-downloader 你是否遇到过这样的困境&am…...

视觉提示技术在视频理解中的应用与优化

1. 视觉提示技术概述:从静态图像到动态视频的演进视觉提示(Visual Prompting)技术最初源于静态图像处理领域,其核心思想是通过对输入图像进行有目的的视觉修饰,引导模型关注特定区域或特征。这种技术在图像分类、目标检…...

c语言开发者如何通过curl快速调用taotoken聚合大模型api

C语言开发者如何通过curl快速调用Taotoken聚合大模型API 1. 准备工作 在开始调用Taotoken的API之前,您需要准备以下两项内容: 获取API Key:登录Taotoken控制台,在「API密钥」页面创建新的密钥并妥善保存。确定模型ID&#xff1…...

Taotoken 用量看板如何帮助项目精准控制 API 成本

Taotoken 用量看板如何帮助项目精准控制 API 成本 1. 用量看板的核心功能 Taotoken 控制台的用量看板为开发者提供了多维度的 API 调用数据可视化能力。通过聚合不同时间粒度(小时、天、周)的 token 消耗统计,项目负责人可以快速掌握整体支…...

告别迷茫!GNSS数据处理从入门到实战:这10款免费/开源软件我帮你试过了

告别迷茫!GNSS数据处理从入门到实战:这10款免费/开源软件我帮你试过了 第一次打开GNSS数据处理软件列表时,那种扑面而来的窒息感我至今记忆犹新——满屏陌生的缩写、复杂的参数配置界面、晦涩的文档说明,就像面对一堵密不透风的技…...

通过Hermes Agent框架接入Taotoken实现自定义工作流的详细步骤指南

通过Hermes Agent框架接入Taotoken实现自定义工作流的详细步骤指南 1. 准备工作 在开始配置之前,请确保已安装Hermes Agent框架并完成基础环境搭建。您需要从Taotoken控制台获取两项关键信息:有效的API Key和所需调用的模型ID。登录Taotoken控制台后&a…...

mysql开发环境权限如何与生产隔离_MySQL多环境权限配置策略

...

D2R Pixel Bot终极指南:暗黑破坏神2重制版自动化运行完整解决方案

D2R Pixel Bot终极指南:暗黑破坏神2重制版自动化运行完整解决方案 【免费下载链接】botty D2R Pixel Bot 项目地址: https://gitcode.com/gh_mirrors/bo/botty D2R Pixel Bot是一款基于Python开发的高级像素级自动化工具,专为《暗黑破坏神2重制版…...

终极窗口隐私保护神器:Boss-Key老板键一键隐藏你的秘密窗口

终极窗口隐私保护神器:Boss-Key老板键一键隐藏你的秘密窗口 【免费下载链接】Boss-Key 老板来了?快用Boss-Key老板键一键隐藏静音当前窗口!上班摸鱼必备神器 项目地址: https://gitcode.com/gh_mirrors/bo/Boss-Key 在当今多任务办公环…...

如何快速掌握雀魂牌谱屋:麻将数据分析的终极指南

如何快速掌握雀魂牌谱屋:麻将数据分析的终极指南 【免费下载链接】amae-koromo 雀魂牌谱屋 (See also: https://github.com/SAPikachu/amae-koromo-scripts ) 项目地址: https://gitcode.com/gh_mirrors/am/amae-koromo 想要在雀魂麻将中实现段位突破却找不到…...

别再手动装了!用Docker一键部署带中文字体的LibreOffice服务(CentOS/Ubuntu通用)

容器化部署LibreOffice:告别繁琐安装,拥抱高效文档处理 在传统Linux服务器上部署LibreOffice并确保中文支持,往往需要经历依赖安装、字体配置、环境调优等一系列繁琐步骤。这不仅耗时费力,还容易因系统环境差异导致各种兼容性问题…...

如何永久保存你的数字记忆?WeChatMsg完整免费解决方案

如何永久保存你的数字记忆?WeChatMsg完整免费解决方案 【免费下载链接】WeChatMsg 提取微信聊天记录,将其导出成HTML、Word、CSV文档永久保存,对聊天记录进行分析生成年度聊天报告 项目地址: https://gitcode.com/GitHub_Trending/we/WeCha…...

stable编译指令使用

一、set_directive_stable指令 stable编译指令是用于只是在dataflow数据流区域的如何和出口出生成同步的时候,可以忽略某个 变量。 void dataflow_region(int A[...], int B[…] ...){ #pragma HLS stable variableA #pragma HLS dataflow proc1(...); proc2(A, ...…...

黑马点评新手必看:2大实战坑避坑指南

以下是针对“黑马点评新手避坑|2个高频实战坑”内容的整理导入。我将以结构清晰的方式,逐步梳理两个常见问题,包括错误示例、问题分析、正确解决方案(附可直接复用的代码),以及避坑要点。内容基于真实编程实…...