当前位置：首页 > news >正文

UI自动化测试痛点解决方案

news 2025/8/24 19:54:20

前言

UI自动化测试可以快速、准确地执行大量的测试用例，减少人工测试所需的时间和劳动力。能够在短时间内完成多个测试用例的执行，提高测试的效率和速度。但是UI自动化有个最大的痛点。当前端界面发生变化时，往往页面元素定位也会改变，这时就需要投入大量的人力和时间进行修改，导致我们最初引入UI自动化的初衷(节省人力、时间成本，提高测试效率和速度)不能很好的实现。针对这个问题，本篇文章介绍了怎么使用图片定位的方法进行UI自动化测试，抛弃传统的元素定位方式，这样前端页面元素样子没有发生变化，我们就不需要修改维护脚本。如果元素样子发生了变化，我们只需要将以前的元素图片换一张就可以。

介绍

本篇内容主要使用Python、Selenium、PyAutoGUI、OpenCV实现了UI自动化测试，使用图片定位方式。我们将页面元素截取成一个个单独的图片，实际上可能在UI设计后，这些图片都已经由UI设计师切图完成，我们只需要拿到这些切图就可以了。我们将这些元素切图和整体页面进行对比，找出图片在整体界面上的坐标点，然后使用Selenium的ActionChains接口执行页面交互操作就可以了。

实现方式

由于Selenium大家都比较熟悉就不过多介绍了，不熟悉的同学可以参考我之前写的文章《Selenium4.0详细介绍》。

PyAutoGUI是一个Python 第三方库，需要pip install 安装。它允许我们通过编程方式模拟鼠标和键盘的操作，窗口操作，以及界面的截图匹配。由于它是照搬人的操作，底层没有套牢在Windows系统，所以它可以跨平台。

OOpenCV（开源计算机视觉库）是计算机视觉和机器学习领域广泛应用的一个强大工具，它提供了丰富的API，支持多种编程语言，包括C++、Python、Java等。

安装

pip install pyautogui
pip install opencv-python
# 本人在使用过程中，由于要用到截图，有个报错，需要更新Pillow版本和安装gnome-screenshot，如果没有遇到相关报错，可以忽略下面
pip install Pillow --upgrade
sudo apt install gnome-screenshot

定位图片位置

首先，我们将被测系统的元素图片截图准备好。需要进行的操作是向接口名称输入框中输入‘test’。

系统页面
在这里插入图片描述

元素截图
在这里插入图片描述

定位图片位置

import cv2
import pyautoguiinput_img = cv2.imread('input.jpg')
# confidence参数设置了匹配度阈值,范围0到1,值越高要求越精确。
input_img_location = pyautogui.locateOnScreen(input_img, confidence=0.8)
# 获取输入框图片在整体页面的坐标位置，获取的是输入框图片的中心点位置
input_img_x, input_img_y = pyautogui.center(input_img_location)
# input_img_x 370  input_img_y 250

通过上面的方法，我们获取到了输入框的坐标点，下面用Selenium元素定位看一下位置是否正确。

from selenium import webdriver
from selenium.webdriver.common.by import Byinput_el = driver.find_element(By.XPATH, '//*[@id="app"]/section/section/div/form/div[1]')
input_el_location = input_el.location
print(input_el_location['x'], input_el_location['y'])
# 220 80

我们发现，两个方法获取的坐标点不一样，由于Selenium获取的是元素的左上角的点，所以我们看一下元素的高和宽计算一下。
在这里插入图片描述

从上图可以看出，元素的宽是296，高是41，通过计算Selenium获取的元素中心点位置为：(368，100.5)，x轴坐标没有什么问题，y轴坐标差别有点大。造成这种问题的原因可能是PyAutoGUI获取的是整个电脑屏幕的尺寸，而Selenium获取的可能是浏览器页面的尺寸，我们获取一下他们的整体尺寸对比一下。

import pyautogui
from selenium import webdriveroptions = webdriver.ChromeOptions()
options.add_argument("--start-maximized")
driver = webdriver.Chrome(options=options)
driver.get('http://172.17.0.1/apitest/#/api?id=79')
pyautogui_size = pyautogui.size()
#获取系统页面尺寸
selenium_size = driver.find_element(By.ID, 'app').size
print(pyautogui_size, selenium_size)
# Size(width=1920, height=1080) {'width': 1920, 'height': 860}

通过上面的对比发现y轴确实不一样，经过查看发现，Selenium获取的是浏览器整个窗口的尺寸，PyAutoGUI获取的是整个电脑屏幕的尺寸，所以我们需要做一个转换

# 我们将获取的元素坐标值，减去Selenium和PyAutoGUI的坐标相差的值，就是实际Selenium操作需要的坐标值，我的y值加70是因为我的操作系统是ubuntu，下面有Dock，高是70.
x = img_x - (pyautogui_x - selenium_x)
y = img_y - (pyautogui_y - selenium_y) + 70

示例

现在我们写一个脚本，使用图片定位的方式，向接口名称输入框输入“test”。

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.action_chains import ActionChains
import pyautogui
import cv2options = webdriver.ChromeOptions()
options.add_argument("--start-maximized")
driver = webdriver.Chrome(options=options)
driver.get('http://172.17.0.1/apitest/#/api?id=79')
pyautogui_size = pyautogui.size()
selenium_size = driver.find_element(By.ID, 'app').size
input_img = cv2.imread('img/input.jpg')
input_img_location = pyautogui.locateOnScreen(input_img, confidence=0.8)
input_img_x, input_img_y = pyautogui.center(input_img_location)
x = input_img_x - (pyautogui_size.width - selenium_size['width'])
y = input_img_y - (pyautogui_size.height - selenium_size['height']) + 70
ActionChains(driver).move_by_offset(x, y).click().perform()
ActionChains(driver).send_keys('test').perform()
driver.quit()

最终运行结果

在这里插入图片描述

总结

这样我们就完成了使用图片定位页面元素进行操作。避免了因前端改动，需要重新定位页面元素的痛点。当然这只是个简单的demo，后续项目中使用可能还会遇到其他的问题。包括图形比较复杂的元素图片，这个时候我们可以使用confidence来调整匹配度，当匹配度为1时(最高)，图片的一个像素不一致都会导致无法识别出坐标点。所以可以根据自己的实际情况来调整匹配度。

UI自动化测试痛点解决方案

前言

介绍

实现方式

安装

定位图片位置

示例

总结

相关文章：

UI自动化测试痛点解决方案

如何将QAD系统EDI模块无缝迁移到知行之桥？

Linux学习-ELK(一)

Selenium事件监听

视频写作入门：9个步骤开始您的视频日志并与观众建立真实的联系

使用豆包MarsCode 编写 Node.js 全栈应用开发实践

Spring Cloud全解析：熔断之Hystrix执行流程

大模型算法岗，面试百问百答，7天3个offer拿到手！

代码随想录算法day32 | 动态规划算法part05 | 完全背包，518. 零钱兑换 II， 377. 组合总和 Ⅳ，70. 爬楼梯（进阶）

【Linux 从基础到进阶】自动化备份与恢复策略

前端打包装包——设置镜像

volatile 的作用？是否具有原子性，对编译器有什么影响？什么情况下一定要用 volatile，能否和 const 一起使用？

iPhone 16分辨率,屏幕尺寸,PPI 详细数据对比 iPhone 16 Plus、iPhone 16 Pro、iPhone 16 Pro Max

FunASR搭建语音识别服务和VAD检测

设计一个支持多线程写入的并发日志记录系统：C++实战指南

使用LSTM（长短期记忆网络）模型预测股票价格的实例分析

开源的 Windows 12 网页体验版！精美的 UI 设计、丰富流畅的动画

chapter14-集合——（List）——day18

Frida 脚本抓取 HttpURLConnection 请求和响应

Java实现建造者模式和源码中的应用

ubuntu搭建nfs服务centos挂载访问

UE5 学习系列（三）创建和移动物体

新能源汽车智慧充电桩管理方案：新能源充电桩散热问题及消防安全监管方案

精益数据分析（97/126）：邮件营销与用户参与度的关键指标优化指南

libfmt: 现代C++的格式化工具库介绍与酷炫功能

云原生周刊：k0s 成为 CNCF 沙箱项目

基于鸿蒙(HarmonyOS5)的打车小程序

在Zenodo下载文件用到googlecolab googledrive

算法250609 高精度

CCF 开源发展委员会 “开源高校行“ 暨红山开源 + OpenAtom openKylin 高校行活动在西安四所高校成功举办