当前位置: 首页 > article >正文

人工智能丨视觉识别在自动化测试中的应用

视觉识别:自动化测试的新纪元

在当今快速发展的科技时代,软件测试正面对着日益复杂的挑战。作为其中一个关键领域,自动化测试不断寻求创新的方法,以提高测试效率和准确性。在这一背景下,视觉识别技术的引入为自动化测试带来了新的可能性和机遇。那么,究竟视觉识别在自动化测试中的应用有哪些呢?它又是如何改变我们测试的方式的呢?

视觉识别技术概述

视觉识别技术,通常被称为计算机视觉,是指通过计算机对图像或视频信息进行处理和分析,从中提取有用信息的过程。这项技术涉及到多个领域的知识,包括人工智能、机器学习和图像处理等。通过训练模型,计算机可“看见”屏幕上的元素,并能快速、准确地识别出按钮、文本框、图片等各种 UI 组件。

在软件测试中,视觉识别技术可以有效地帮助我们识别用户界面(UI)变化、验证布局的一致性、并提升测试用例的创建与维护效率。让我们深入挖掘视觉识别技术在自动化测试中的应用和益处。

视觉识别技术的应用方法

在这一部分,我们将详细探讨视觉识别技术在自动化测试中的五种具体应用方式,包括实现步骤和示例代码,让我们一起看看它们是如何工作的。

1. UI 元素识别

步骤:

  • 首先,选择一个用于测试的应用程序(例如,网站或移动应用)。
  • 然后,使用框架如 Selenium 或 Appium 开发基础的自动化测试脚本。
  • 接下来,整合视觉识别工具(如 OpenCV 或 SikuliX)来检测 UI 元素。

示例代码:

import cv2
import numpy as np
from selenium import webdriver# 启动浏览器
driver = webdriver.Chrome()
driver.get('http://example.com')# 截图并读取图像
screenshot = driver.get_screenshot_as_file('screenshot.png')
img = cv2.imread('screenshot.png')# 使用模板匹配识别按钮
template = cv2.imread('button_template.png')
result = cv2.matchTemplate(img, template, cv2.TM_CCOEFF_NORMED)# 查找位置和显示结果
threshold = 0.8
loc = np.where(result >= threshold)
for pt in zip(*loc[::-1]):cv2.rectangle(img, pt, (pt[0] + template.shape[1], pt[1] + template.shape[0]), (0, 255, 0), 2)cv2.imshow('Detected', img)
cv2.waitKey(0)

2. 视觉回归测试

步骤:

  • 在基于视觉的自动化测试中,首先需要对应用程序的各个状态进行截图。
  • 随后,将这些截图与后续更改后的截图进行对比,以检查 UI 的一致性。

示例代码:

from PIL import Image
import numpy as np# 打开两张图片
img1 = Image.open('old_screenshot.png')
img2 = Image.open('new_screenshot.png')# 将图片转换成 NumPy 数组
arr1 = np.array(img1)
arr2 = np.array(img2)# 对比两张图像的像素差异
difference = np.abs(arr1 - arr2)
if np.any(difference > 0):print("UI变化检测到!")
else:print("无变化.")

3. 动态元素验证

步骤:

  • 对于动态变化的 UI 元素(如轮播图),我们可以使用视觉识别来确保每一帧内容都被正确显示。
  • 编写测试脚本循环处理每个状态,并通过视觉识别验证。

示例代码:

# 确保使用具有动态元素的页面
driver.get('http://example.com/slideshow')for i in range(1, 6):  # 假设有5个幻灯片driver.switch_to.frame("slideshow_frame")screenshot = driver.save_screenshot(f'slide_{i}.png')# 进行视觉识别验证img = cv2.imread(f'slide_{i}.png')template = cv2.imread(f'slide_template_{i}.png')result = cv2.matchTemplate(img, template, cv2.TM_CCOEFF_NORMED)if np.amax(result) < 0.8:print(f"幻灯片 {i} 显示有误!")driver.switch_to.default_content()  # 退回主页面

4. 屏幕元素对比

步骤:

  • 当网页或应用更新时,我们需要确认更新后的布局与设计师提供的设计稿一致。
  • 使用视觉识别,快速检查是否所有元素都有正确渲染。

示例代码:

# 获取新版本布局截图
driver.get('http://example.com/updated_version')
driver.save_screenshot('new_layout.png')# 进行视觉对比
reference = cv2.imread('reference_layout.png')
new_version = cv2.imread('new_layout.png')# 对比算法
similarity = cv2.matchTemplate(new_version, reference, cv2.TM_CCOEFF_NORMED)
if np.amax(similarity) < 0.8:print("布局不一致!")
else:print("布局一致!")

5. 视觉缺陷检测

步骤:

  • 当软件中存在图形或图像时,确保识别图像的缺损或错误。
  • 通过视觉识别确认图形内容的完整性。

示例代码:

# 假设检测图像内容的完整性
img = cv2.imread('graphic_content.png')
template = cv2.imread('expected_template.png')# 测试内容完整性
result = cv2.matchTemplate(img, template, cv2.TM_CCOEFF_NORMED)
if np.amax(result) < 0.75:print("图形内容存在缺陷!")
else:print("图形完整无缺!")

视觉识别的亮点与好处

视觉识别在自动化测试中为我们带来的好处不容小觑。这项技术不仅提高了测试效率,也让我们能够更准确、更高效地捕捉到可能被遗漏的界面错误。以下是我们能够收获的一些主要亮点:

  1. 提高准确性:传统的定位方式往往依赖于控件的属性,而视觉识别则模拟了人类眼睛的视角,对图像的变化敏感。
  2. 适应性强:现代应用程序的界面往往复杂多变,视觉识别能更好地处理诸如位置变化、分辨率变化等挑战。
  3. 降低维护成本:通过减少对元素定位的依赖,能够显著降低因 UI 变化导致的测试用例维护工作量。
  4. 提升用户体验:确保所有关键界面元素在不同设备和浏览器中的正确显示,为用户提供一致的使用体验。
  5. 增强覆盖率:视觉检测可以轻松覆盖多种设备和平台,极大地提升了测试覆盖率。

视觉识别对软件测试职业发展的好处与前景

近年来,随着自动化测试技术的飞速发展,视觉识别技能越来越受到企业和应聘者的青睐。从职业发展的角度来看,掌握视觉识别技术将为我们的职业生涯开辟新的可能性:

  1. 职业转型机会:由于各大公司都在寻求自动化测试优秀人才,运用视觉识别能力的人才能在这个领域中脱颖而出。
  2. 核心竞争力提升:掌握这一新技术使得我们在众多求职者中更具竞争力,不仅能应对当今行业需求,也能适应未来技术变革。
  3. 推动团队创新:视觉识别技术的引入,也使团队能够在测试中使用新的思路,从而推动整体测试效率和质量的提升。
  4. 行业前景广阔:未来自动化测试的需求将持续增长,特别是在 AI 驱动的技术未来中,视觉识别将扮演重要角色。

常见问题 FAQ

1. 什么是视觉识别技术?

视觉识别技术是计算机通过图像或视频处理,识别和分析其中信息的过程。它可以用于检测UI组件、进行视觉回归测试等。

2. 如何在自动化测试中引入视觉识别?

可以通过使用工具如 OpenCV、SikuliX 或其他图像处理库,对 UI 元素进行识别和验证。

3. 视觉识别技术的必要性是什么?

在面对动态变化的 UI 元素及复杂应用时,视觉识别技术可以确保准确性并提高测试的覆盖率。

4. 我该如何培养视觉识别技能?

建议通过学习计算机视觉基础,运用相关工具进行实践,持之以恒地进行项目练习。

送您一份软件测试学习资料大礼包

推荐阅读

软件测试学习笔记丨Pytest配置文件
测试开发实战 | Docker+Jmeter+InfluxDB+Grafana 搭建性能监控平台
技术分享 | app自动化测试(Android)–元素定位方式与隐式等待
软件测试学习笔记丨Mitmproxy使用
软件测试学习笔记丨Chrome开发者模式
软件测试学习笔记丨Docker 安装、管理、搭建服务
软件测试学习笔记丨Postman基础使用
人工智能 | 阿里通义千问大模型
软件测试学习笔记丨接口测试与接口协议
软件测试学习笔记丨Pytest的使用

推荐学习

【霍格沃兹测试开发】7天软件测试快速入门带你从零基础/转行/小白/就业/测试用例设计实战

【霍格沃兹测试开发】最新版!Web 自动化测试从入门到精通/ 电子商务产品实战/Selenium (上集)

【霍格沃兹测试开发】最新版!Web 自动化测试从入门到精通/ 电子商务产品实战/Selenium (下集)

【霍格沃兹测试开发】明星讲师精心打造最新Python 教程软件测试开发从业者必学(上集)

【霍格沃兹测试开发】明星讲师精心打造最新Python 教程软件测试开发从业者必学(下集)

【霍格沃兹测试开发】精品课合集/ 自动化测试/ 性能测试/ 精准测试/ 测试左移/ 测试右移/ 人工智能测试

【霍格沃兹测试开发】腾讯/ 百度/ 阿里/ 字节测试专家技术沙龙分享合集/ 精准化测试/ 流量回放/Diff

【霍格沃兹测试开发】Pytest 用例结构/ 编写规范 / 免费分享

【霍格沃兹测试开发】JMeter 实时性能监控平台/ 数据分析展示系统Grafana/Docker 安装

【霍格沃兹测试开发】接口自动化测试的场景有哪些?为什么要做接口自动化测试?如何一键生成测试报告?

【霍格沃兹测试开发】面试技巧指导/ 测试开发能力评级/1V1 模拟面试实战/ 冲刺年薪百万!

【霍格沃兹测试开发】腾讯软件测试能力评级标准/ 要评级表格的联系我

【霍格沃兹测试开发】Pytest 与Allure2 一键生成测试报告/ 测试用例断言/ 数据驱动/ 参数化

【霍格沃兹测试开发】App 功能测试实战快速入门/adb 常用命令/adb 压力测试

【霍格沃兹测试开发】阿里/ 百度/ 腾讯/ 滴滴/ 字节/ 一线大厂面试真题讲解,卷完拿高薪Offer !

【霍格沃兹测试开发】App自动化测试零基础快速入门/Appium/自动化用例录制/参数配置

【霍格沃兹测试开发】如何用Postman 做接口测试,从入门到实战/ 接口抓包(最新最全教程)

相关文章:

人工智能丨视觉识别在自动化测试中的应用

视觉识别&#xff1a;自动化测试的新纪元 在当今快速发展的科技时代&#xff0c;软件测试正面对着日益复杂的挑战。作为其中一个关键领域&#xff0c;自动化测试不断寻求创新的方法&#xff0c;以提高测试效率和准确性。在这一背景下&#xff0c;视觉识别技术的引入为自动化测…...

lambda 表达式:Python中的极简艺术

lambda 表达式&#xff1a;Python中的极简艺术 — 让你的代码更简洁、更高效&#xff01; 引言 在 Python 中&#xff0c;lambda 表达式是一种简洁的定义匿名函数的方式。它通常用于需要函数对象的场景&#xff0c;但又不需要显式定义一个完整函数的场合。本文将详细介绍 la…...

BLE透传方案,IoT短距无线通信的“中坚力量”

在物联网&#xff08;IoT&#xff09;短距无线通信生态系统中&#xff0c;低功耗蓝牙&#xff08;BLE&#xff09;数据透传是一种无需任何网络或基础设施即可完成双向通信的技术。其主要通过简单操作串口的方式进行无线数据传输&#xff0c;最高能满足2Mbps的数据传输速率&…...

无用知识研究:对std::common_type以及问号表达式类型的理解

先说结论&#xff1a;如果问号表达式能编译通过&#xff0c;那么std::common_type就能通过。因为common_type的底层依赖的就是?: common_type的实现里&#xff0c;利用了问号表达式&#xff1a;ternary conditional operator (?:) https://stackoverflow.com/questions/1432…...

苍穹外卖—订单模块

该模块分为地址表的增删改查、用户下单、订单支付三个部分。 第一部分地址表的增删改查无非就是对于单表的增删改查&#xff0c;较基础&#xff0c;因此直接导入代码。 地址表 一个用户可以有多个地址&#xff0c;同时有一个地址为默认地址。用户还可为地址添加例如&q…...

「 机器人 」扑翼飞行器的数据驱动建模核心方法

前言 数据驱动建模可充分利用扑翼飞行器的已有运行数据,改进动力学模型与控制策略,并对未建模动态做出更精确的预测。在复杂的非线性飞行环境中,该方法能有效弥补传统解析建模的不足,具有较高的研究与应用价值。以下针对主要研究方向和实现步骤进行整理与阐述。 1. 数据驱动…...

openeuler 22.03 lts sp4 使用 cri-o 和 静态 pod 的方式部署 k8s-v1.32.0 高可用集群

前情提要 整篇文章会非常的长…可以选择性阅读,另外,这篇文章是自己学习使用的,用于生产,还请三思和斟酌 静态 pod 的部署方式和二进制部署的方式是差不多的,区别在于 master 组件的管理方式是 kubectl 还是 systemctl有 kubeadm 工具,为什么还要用静态 pod 的方式部署?…...

Helm Chart 实战指南

Helm 是 Kubernetes 的包管理工具,而 Helm Chart 是 Helm 的核心概念,用于定义、安装和升级 Kubernetes 应用。本文将带你从零开始,通过实战演练,掌握 Helm Chart 的创建、配置和部署,帮助你高效管理 Kubernetes 应用。 1. 环境准备 在开始之前,确保你已经具备以下环境:…...

【数据结构】_顺序表经典算法OJ(力扣版)

目录 1. 移除元素 1.1 题目描述及链接 1.2 解题思路 1.3 程序 2. 合并两个有序数组 1.1 原题链接及题目描述 1.2 解题思路 1.3 程序 1. 移除元素 1.1 题目描述及链接 原题链接&#xff1a;27. 移除元素 - 力扣&#xff08;LeetCode&#xff09; 题目描述&#xff1a…...

目前市场主流的AI PC对于大模型本地部署的支持情况分析-Deepseek

以下是目前市场主流AI PC对**大模型本地部署支持情况**的综合分析&#xff0c;结合硬件能力、软件生态及厂商动态进行总结&#xff1a; --- ### **一、硬件配置与算力支持** 1. **核心处理器架构** - **异构计算方案&#xff08;CPUGPUNPU&#xff09;**&#xff1a;主流…...

Vue3 v-bind 和 v-model 对比

1. 基本概念 1.1 v-bind 单向数据绑定从父组件向子组件传递数据简写形式为 : 1.2 v-model 双向数据绑定父子组件数据同步本质是 v-bind 和 v-on 的语法糖 2. 基础用法对比 2.1 表单元素绑定 <!-- v-bind 示例 --> <template><input :value"text&quo…...

MySQL分表自动化创建的实现方案(存储过程、事件调度器)

《MySQL 新年度自动分表创建项目方案》 一、项目目的 在数据库应用场景中&#xff0c;随着数据量的不断增长&#xff0c;单表存储数据可能会面临性能瓶颈&#xff0c;例如查询、插入、更新等操作的效率会逐渐降低。分表是一种有效的优化策略&#xff0c;它将数据分散存储在多…...

接口技术-第6次作业

目录 作业内容 解答 1.假设在一个系统中&#xff0c;8255A的端口地址为184H-187H&#xff0c;A口工作于方式1输出&#xff0c;B口工作于方式1输入&#xff0c;禁止中断&#xff0c;C口剩余的两根线PC5&#xff0c;PC4位输入&#xff0c;如下图所示&#xff0c;试编写初始化…...

计算机网络之计算机网络体系结构

一、定义与概述 计算机网络体系结构是计算机网络及其部件所应该完成功能的精确定义&#xff0c;这些功能由何种硬件或软件完成是遵循这种体系结构的。体系结构是抽象的&#xff0c;实现是具体的&#xff0c;是运行在计算机软件和硬件之上的。 二、主流模型 目前&#xff0c;…...

(1)Linux高级命令简介

Linux高级命令简介 在安装好linux环境以后第一件事情就是去学习一些linux的基本指令&#xff0c;我在这里用的是CentOS7作演示。 首先在VirtualBox上装好Linux以后&#xff0c;启动我们的linux&#xff0c;输入账号密码以后学习第一个指令 简介 Linux高级命令简介ip addrtou…...

网络直播时代的营销新策略:基于受众分析与开源AI智能名片2+1链动模式S2B2C商城小程序源码的探索

摘要&#xff1a;随着互联网技术的飞速发展&#xff0c;网络直播作为一种新兴的、极具影响力的媒体形式&#xff0c;正逐渐改变着人们的娱乐方式、消费习惯乃至社交模式。据中国互联网络信息中心数据显示&#xff0c;网络直播用户规模已达到3.25亿&#xff0c;占网民总数的45.8…...

CSS(快速入门)

欢迎大家来到我的博客~欢迎大家对我的博客提出指导&#xff0c;有错误的地方会改进的哦~点击这里了解更多内容 目录 一、什么是CSS?二、基本语法规范三、CSS选择器3.1 标签选择器3.2 id选择器3.3 class选择器3.4 通配符选择器3.5 复合选择器 四、常用CSS样式4.1 color4.2 font…...

waitpid使用

waitpid 是 Unix/Linux 系统中用于等待子进程状态变化的系统调用。它允许父进程挂起执行&#xff0c;直到指定的子进程终止或者发生了其他指定的状态变化。 waitpid 的语法 pid_t waitpid(pid_t pid, int *status, int options); pid: 要等待的子进程的进程 ID&#xff0c;特殊…...

对顾客行为的数据分析:融入2+1链动模式、AI智能名片与S2B2C商城小程序的新视角

摘要&#xff1a;随着互联网技术的飞速发展&#xff0c;企业与顾客之间的交互方式变得日益多样化&#xff0c;移动设备、社交媒体、门店、电子商务网站等交互点应运而生。这些交互点不仅为顾客提供了便捷的服务体验&#xff0c;同时也为企业积累了大量的顾客行为数据。本文旨在…...

MySQL查询优化(三):深度解读 MySQL客户端和服务端协议

如果需要从 MySQL 服务端获得很高的性能&#xff0c;最佳的方式就是花时间研究 MySQL 优化和执行查询的机制。一旦理解了这些&#xff0c;大部分的查询优化是有据可循的&#xff0c;从而使得整个查询优化的过程更有逻辑性。下图展示了 MySQL 执行查询的过程&#xff1a; 客户端…...

pytorch线性回归模型预测房价例子

import torch import torch.nn as nn import torch.optim as optim import numpy as np# 1. 创建线性回归模型类 class LinearRegressionModel(nn.Module):def __init__(self):super(LinearRegressionModel, self).__init__()self.linear nn.Linear(1, 1) # 1个输入特征&…...

UE AController

定义和功能 AController是一种特定于游戏的控制器&#xff0c;在UE框架中用于定义玩家和AI的控制逻辑。AController负责处理玩家输入&#xff0c;并根据这些输入驱动游戏中的角色或其他实体的行为。设计理念 AController设计用于分离控制逻辑与游戏角色&#xff0c;增强游戏设计…...

选择的阶段性质疑

条条大路通罗马&#xff0c;每个人选择的道路&#xff0c;方向并不一样&#xff0c;但不妨碍都可以到达终点&#xff0c;而往往大家会更推崇自己走过的路径。 自己靠什么走向成功&#xff0c;自己用了什么方法&#xff0c;奉行什么原则或者理念&#xff0c;也会尽可能传播这种&…...

Git进阶之旅:Git 配置信息 Config

Git 配置级别&#xff1a; 仓库级别&#xff1a;local [ 优先级最高 ]用户级别&#xff1a;global [ 优先级次之 ]系统级别&#xff1a;system [ 优先级最低 ] 配置文件位置&#xff1a; git 仓库级别对应的配置文件是当前仓库下的 .git/configgit 用户级别对应的配置文件时用…...

51单片机开发:定时器中断

目标&#xff1a;利用定时器中断&#xff0c;每隔1s开启/熄灭LED1灯。 外部中断结构图如下图所示&#xff0c;要使用定时器中断T0&#xff0c;须开启TE0、ET0。&#xff1a; 系统中断号如下图所示&#xff1a;定时器0的中断号为1。 定时器0的工作方式1原理图如下图所示&#x…...

ultralytics 是什么?

ultralytics 是一个用于计算机视觉任务的 Python 库&#xff0c;专注于提供高效、易用的目标检测、实例分割和图像分类工具。它最著名的功能是实现 YOLO&#xff08;You Only Look Once&#xff09; 系列模型&#xff0c;特别是最新的 YOLOv8。 1. YOLO 是什么&#xff1f; YO…...

Qt调用FFmpeg库实时播放UDP组播视频流

基于以下参考链接&#xff0c;通过改进实现实时播放UDP组播视频流 https://blog.csdn.net/u012532263/article/details/102736700 源码在windows&#xff08;qt-opensource-windows-x86-5.12.9.exe&#xff09;、ubuntu20.04.6(x64)(qt-opensource-linux-x64-5.12.12.run)、以…...

Python学习之旅:进阶阶段(五)数据结构-双端队列(collections.deque)

在 Python 的进阶学习过程中,数据结构的掌握至关重要。今天要介绍的双端队列(deque,即 double-ended queue),是一种非常实用的数据结构,Python 的collections模块中的deque类为我们提供了强大的双端队列操作功能。接下来,就一起深入了解双端队列吧。 一、什么是双端队列…...

selenium自动化测试框架——面试题整理

目录 1. 什么是 Selenium&#xff1f;它的工作原理是什么&#xff1f; 2. Selenium 主要组件 3. 常见 WebDriver 驱动 4. Selenium 如何驱动浏览器&#xff1f; 5. WebDriver 协议是什么&#xff1f; 6. Page Object 模式与 Page Factory 7. 如何判断元素是否可见&#x…...

第19篇:python高级编程进阶:使用Flask进行Web开发

第19篇&#xff1a;python高级编程进阶&#xff1a;使用Flask进行Web开发 内容简介 在第18篇文章中&#xff0c;我们介绍了Web开发的基础知识&#xff0c;并使用Flask框架构建了一个简单的Web应用。本篇文章将深入探讨Flask的高级功能&#xff0c;涵盖模板引擎&#xff08;Ji…...