当前位置: 首页 > article >正文

开发靠 AI 提效,测试成最大瓶颈,现状过于真实

面试求职「面试试题小程序」 内容涵盖 测试基础、Linux操作系统、MySQL数据库、Web功能测试、接口测试、APPium移动端测试、Python知识、Selenium自动化测试相关、性能测试、性能测试、计算机网络知识、Jmeter、HR面试命中率杠杠的。大家刷起来…职场经验干货软件测试工程师简历上如何编写个人信息一周8个面试软件测试工程师简历上如何编写专业技能一周8个面试软件测试工程师简历上如何编写项目经验一周8个面试软件测试工程师简历上如何编写个人荣誉一周8个面试软件测试行情分享这些都不了解就别贸然冲了.软件测试面试重点搞清楚这些轻松拿到年薪30W软件测试面试刷题小程序免费使用永久使用最近两个月高强度的使用AI进行了一些跟测试相关工作的探索结果可能令人大跌眼镜。从之前大火的openclaw到hermes从claude code到opencode再到codex从各种国内模型到sunnet再到gpt5.5感觉上是一日不见如隔三秋两个月的时间变化相当迅速。昨天同国内的某团队进行了一次关于ai在研发过程中使用的交流发现大家所处的阶段以及遇到的问题都差不多特别是在测试方面大家的诉求痛点以及难点都是相似的事后想了想是时候做一些阶段性总结了。实践在ai与测试工作结合的方向上我们做了一系列的探索大体分为如下几个部分。日常使用ai进行需求的分析用例的增强以及知识盲区的学习当前阶段有些产品经理使用ai进行需求的补充和完善某些需求一眼看上去就显得洋洋洒洒面面俱到但真正脱水和压缩之后里面的信息量其实还是有限的。这时候我们一些测试人员就使用ai进行总结把里面的核心要素给提取出来看上去像是提升了测试效率。但是提取的重点有可能还是有遗漏的地方所以需求我们还是要人工进行通读写用例的时候也是要对照大而全的需求的所以真实的情况是通过ai对需求的要点进行了总结能够比较快速的进行需求的了解但是细节还是反复阅读和对比才能搞清楚毕竟ai生成的需求里哪些是冗余的完全没有价值的还是人工去判断才比较稳妥。产品人员用ai去生成需求其他角色用ai去阅读需求也算是用魔法应对魔法了。还有就是在日常进行用例编写的时候我们也会把需求和用例都丢给ai让ai进行一些场景的补充很多时候ai给出的建议都是很有价值的。最后在做一些技术优化类需求测试的时候大部分的测试人员是不了解技术原理和优化细节的这时候我们就会用ai进行快速学习这点让我想起了二十年前我入行的时候很多东西其实完全没接触过当时硬是靠着百度和谷歌一点点的去搜索去学习有异曲同工之妙。不过当时我们搜到的是各种材料我们需要在材料里去总结去提炼现在ai直接给答案了效率跟之前相比真是不可同日而语了。一键用例生成我们用ai开发了一个简单的用例一键生成工作思路是从tapd上导出项目的所有需求并进行向量化。测试人员在使用的时候直接把tapd的需求链接贴进去工具会自动搜索与这个需求最接近的一些需求然后对需求进行合并最终分析合并过的完整需求生成测试用例。用例可以导出为xmind或markdown格式。最后测试人员再精调一下导入的用例去掉不合理的部分加入一些用例中考虑不到的细节形成最终用例。这个工具目前来使用频率很高属于不需要推广大家就会主动使用工具在提升效率和测试质量上都有不错的帮助。各种自动生成用例的框架ai有其不确定性比如问ai一个问题ai有可能每次给出的回答都不太相同。但对于非模型类的业务测试来说我们需要的是确定性确定的输入一定能得到确定的结果这样我们才能把确定的实际结果跟预期结果进行比较得到测试的结论。因此用ai来直接进行测试活动还是有一定的风险的。另外ai目前擅长的是直接输出代码而不是直接执行用例。基于上面这两点我们目前对ai的使用其实是偏重于让ai直接编写测试用例这是让ai写代码规定好测试步骤和断言这样每次执行的结果是稳定的既发挥了ai写代码的优势又一定程度上规避了ai运行结果不稳定的缺点。我们做了如下的一些自动化的用例生成探索。用claude code playwright cli 全自动化生成web自动化用例。这个之前我有录过视频感兴趣的同学可以去看一下。用这种方案只需要用自然语言把用例描述清楚直接把用例扔给ai就可以在无人值守的情况下让ai自己写自动化用例了。因为一般的项目都会有核心用例只要这些用例不是xmind脑图形式的其实都可以拿来直接用。这里有3个细节可能是比较有价值的。1一定要让ai在写完用例之后自己跑几轮确保所有的用例都能通过这样用例的稳定性会大大提升2可以用定时任务的方式让claude每天晚上自动去写这样不占用上班时间3尽量给ai比较高的权限比如claude code的--permission-mode auto模式这样就不需要人工干预了用claude code appium/maestro mcp实现客户端的自动化测试用例。跟上面的思路一样只是测试对象换成了app。用codex/claude code实现接口编排的测试用例。这里的思路是先让codex/claude实现单接口的用例然后实现一些典型业务的接口编排用例最后用自然语言给出高价值的业务场景让ai自动去生成并运行用例。这里我之前是用纯pytest去实现的后来发现接口编排的场景用代码描述出来不太直观后面用pytest-bdd去实现了效果要好不少。这里的思路是先实现单接口类似于给出了接口的返回然后实现典型场景等于是给出例子教ai怎么去做接口编排最后给出具体场景让ai根据单接口和编排的例子自己去推断准确性还是很高的而且可以实现无人值守自己写用例。实践中我还发现对于一些简单的用例或者是在框架和存量用例都比较成熟的情况下用国产模型的话都可以取得不错的效果。各种稀奇古怪的测试工具通过截图去测试多语言的自动化工具。我们的产品有9种语言人工去比对翻译的正确线其实基本上是不现实的所以这里我写了一个自动化工具只要测试人员在对应的场景把英文和目标语言的截图保存下来就可以自动去比对翻译的准确性了这个工具对于提升测试效率有着不错的效果自动化造数工具。这里我写了几个版本大概的思路就是导入所有的接口文档把每个接口做成tool或者是function call然后用agent框架实现让ai自动去推断造数据需调用到哪些接口自动把接口调用串起来实现批量造数的功能。最后的效果是简单的造数行为还是可以跑通的但是稍微复杂一点就不行了。效果一般的原因大体是接口文档可能不全复杂的造数逻辑ai没办法一步一步进行推断所以后面造数的工作还是要有一定的人工干预和补充才能实现的更好疑难杂症的复现。有时候我们需要长期进行重复的行为去复现一些疑难杂症的问题这属于机会主义不仅费时而且可能浪费了时间之后还无法达到效果。这时候其实可以用codex/claude给其设定一个目标(goal)让其自己写脚本去长时间运行尝试复现在codex辛苦复现的时候我们可以做其他事情不耽误日常的测试工作tapd质量数据上报工具。我这边在tapd上有多个项目想把所有项目的质量数据都拉下来做横向的比较和数据的挖掘其实还是有点费事的所以我用ai写了个自动上报的工具每天定时把每个项目的质量数据上报到远程机器上的indexdb上面用grafana做呈现目前看来挺方便的推荐大家也可以尝试一下。另外远程机器上的indexdb和grafana都是codex自己搭建的dashboard也是ai自己去创建的非常省事一些感触因为水平有限现阶段大部分的探索其实都是针对存量的功能去做的在新功能的测试上特别是在app的测试上目前人工点击还是比ai写脚本ai调试脚本通过脚本操作app的速度要快的多。因为我们的产品是给人类去用的交互多动效多ai对新功能的直接测试行为帮助有限所以目前情况下根本不存在ai去取代测试人员的情况开发侧在使用ai进行代码的编写之后单位时间内提测的需求数增加了不少导致目前测试反而成了瓶颈测试团队的规模其实是在增长的个别产品存在用ai提交的代码缺陷数量较多的情况提测质量不高反而导致测试的工作量增加大部分的测试人员其实没有开发思维所以哪怕给了他们最新的工具和最好的模型他们在进行测试工具和用例的开发上依然困难重重目前上层和中层对ai的态度是拥抱的反而执行层面的人员学习ai的热情不是很高当项目中不同角色之间的沟通成本足够高的时候ai进行代码编写的效率提升其实对项目的交付速度和交付质量并没有带来本质的变化从开发的角度上看ai使得年轻人的体力优势变得不是那么明显了但对于功能测试来说当前阶段我们靠见啊来提升生产力不同模型之间差距还是比较大的有条件的话还是得上好一点的模型最后下方这份完整的软件测试视频教程已经整理上传完成需要的朋友们可以自行领取【保证100%免费】​​​

相关文章:

开发靠 AI 提效,测试成最大瓶颈,现状过于真实

📝 面试求职: 「面试试题小程序」 ,内容涵盖 测试基础、Linux操作系统、MySQL数据库、Web功能测试、接口测试、APPium移动端测试、Python知识、Selenium自动化测试相关、性能测试、性能测试、计算机网络知识、Jmeter、HR面试,命中…...

深入了解指针(3)

文章目录数组名的理解对arr[i]的理解一维数组传参的本质二级指针指针数组指针数组的用处总结这里是think的博客 希望可以一起交流知识&#xff0c;一起think 今天我们来学习指针(3)吧 一起来think吧 数组名的理解 //测试环境:X86 #include <stdio.h> int main() { int a…...

论文修改踩坑无数?paperxie 帮你一站式搞定查重与 AIGC 降重难题

paperxie-免费查重复率aigc检测/开题报告/毕业论文/智能排版/文献综述/AI PPThttps://www.paperxie.cn/weight?type1https://www.paperxie.cn/weight?type1 作为一名被论文查重和 AIGC 检测反复折磨过的过来人&#xff0c;我深知毕业季里&#xff0c;对着飘红的查重报告和居高…...

什么是占位符

占位符就是字符串里预留空位&#xff0c;后面填上真实数据&#xff0c;PyCharm里直接写代码就能运行调试1.%格式化占位符&#xff08;旧式格式化&#xff09;语法格式&#xff1a;"模板字符串"%(数据1&#xff0c;数据2...)基础类型占位符1.%s &#xff1a;适配字符串…...

什么是运算符

等一下...

【Lovable前端开发实战指南】:20年专家亲授5个让团队抢着用的可维护性设计模式

更多请点击&#xff1a; https://kaifayun.com 第一章&#xff1a;Lovable前端开发的核心理念与可维护性本质 Lovable前端开发并非追求炫酷动效或技术堆砌&#xff0c;而是以人本设计为原点&#xff0c;将开发者体验&#xff08;DX&#xff09;与用户界面体验&#xff08;UX&a…...

深度解析:基于RAG与任务执行的AI Agent全能力矩阵在话务系统的工程实践

在企业通讯架构演进中&#xff0c;话务系统正经历从流程驱动向智能驱动的范式转移。传统话务台高度依赖预设的IVR流程与人工查询&#xff0c;不仅交互生硬&#xff0c;且存在严重的数据孤岛问题。本文将聚焦AI Agent的全能力矩阵&#xff0c;从技术架构与业务逻辑层面&#xff…...

2026 年 5 月 AI 热点:大模型、硬件、人形机器人全面升级

一、大模型技术突破 | LLM Technology Breakthroughs 1.1 OpenAI GPT‑5.5 正式成为ChatGPT默认模型 | GPT‑5.5 Becomes ChatGPT Default Model 英文内容 | English On May 5, 2026, OpenAI officially rolled out GPT‑5.5 Instant as the new default model for ChatGPT, …...

[特殊字符]通用漏洞挖掘(黑盒篇)| 从一个登录框SQL注入,到拿下CNVD证书

&#x1f3af; 0x00 这篇文章能给你什么&#xff1f; 黑盒测试中 如何发现 SQL 注入&#xff08;手工 思路&#xff09; 万能密码 ≠ 全部&#xff0c;但有了它一定有问题 如何从“事件型漏洞”升级为“通用型漏洞” 利用 JS 指纹 在 FOFA 上批量找同款系统 CNVD 证书 的获…...

编译和链接(以Windows,VS环境下C语言为例)

编译和链接(以Windows,VS环境下C语言为例&#xff09;一.什么是翻译环境和运行环境&#xff1f;二.翻译环境2.1预处理(预编译)2.2编译2.2.1词法分析2.2.2语法分析2.2.3语义分析2.3汇编2.4链接三.运行环境提前说明一下&#xff0c;虽然说我们是以Windows操作系统为例&#xff0c…...

用 shell 命令做 AI Agent 的插件系统:为什么 Hook 不是函数调用

用 shell 命令做 AI Agent 的插件系统&#xff1a;为什么 Hook 不是函数调用 这是 《写完一个 AI 编程助手之后&#xff0c;我才确定 prompt 工程不是重点》 系列的第七篇&#xff08;最后一篇&#xff09;。前六篇讲了进程模型、权限、并发调度、上下文压缩、记忆系统。这一篇…...

Gemini3.1Pro和GPT5.5写代码到底谁更强五类任务实测数据说

做多模型编码能力横向对比测试时用了AI模型聚合平台&#xff0c;一站接入两个模型方便跑同一套编码任务。Gemini 3.1 Pro在SWE-Bench Verified拿到80.6%。GPT-5.5在Terminal-Bench拿到82.7%。分数接近但写代码的实际体验和分数不是一回事。这次用五类真实开发任务做了一轮系统对…...

诚邀您参加 2026 Google Cloud Startup Day

以下文章来源于谷歌云服务&#xff0c;作者 Google Cloud...

不是碳基,也不是硅基!你好,我是金蝶灵基,企业AI原生操作系统!

AI是危还是机&#xff1f;自年初小龙虾“爆炸”以来&#xff0c;很多企业服务巨头都或主动或被动地陷入了深深地思考&#xff1a;连一直仰望并追捧的偶像——Salesforce都开始快速变革&#xff0c;我们能无动于衷吗&#xff1f;这半年以来&#xff0c;中国软件网注意到&#xf…...

谷歌“反重力”工具更新强行替换软件,用户恢复工作困难重重!

谷歌“反重力”工具更新强行替换软件&#xff0c;用户恢复工作困难重重&#xff01;2026年5月21日&#xff0c;原本打算用“反重力”工具工作的用户&#xff0c;遭遇了谷歌的意外安排。前一天&#xff0c;谷歌在2026年I/O开发者大会上推出“反重力”工具新版本&#xff0c;将其…...

BBEdit 16 正式发布!新增百多项功能,部分用户可免费升级

产品 产品 BBEdit Yojimbo iPad 版 Yojimbo TextWrangler 支持 支持 BBEdit Yojimbo iPad 版 Yojimbo TextWrangler 产品下载 找回序列号 SDK 与开发者信息 公司书架 商店 商店 购物车 许可协议 Mac App Store 常见问题 销售政策 查找经销商 多用户许可证 联系我们 联系我们 找…...

uv虽快但包管理体验差:命令笨拙、更新不安全,改进之路在何方?

【uv项目承接与特点】自2023年以来&#xff0c;作者首次有空承接新的项目。Astral的uv在Python世界掀起热潮&#xff0c;它速度极快&#xff0c;能轻松处理Python版本&#xff0c;还能用一个二进制文件替代半打工具&#xff0c;作者之前也写过多篇关于它的文章。【uv使用体验问…...

毫米波混合波束成形技术在VR中的应用与优化

1. 毫米波VR中的混合波束成形技术解析在无线VR应用中&#xff0c;用户对低延迟和高带宽的需求日益增长。传统Wi-Fi标准在密集环境下难以满足这些QoS要求&#xff0c;而毫米波技术凭借其高传输速率和低延迟特性成为理想选择。本文将深入探讨毫米波频段下混合波束成形技术的实现原…...

8051项目代码流程图工具选择与应用指南

1. 流程图工具概述接手一个大型8051项目时&#xff0c;快速理解代码结构是每个嵌入式工程师都会面临的挑战。我在处理遗留代码时&#xff0c;第一件事就是寻找合适的流程图工具来可视化程序逻辑。市面上确实存在多种能够解析C51代码并生成流程图的软件&#xff0c;但选择时需要…...

量子机器学习噪声挑战与HPQS混合框架解析

1. 量子机器学习中的噪声挑战与HPQS解决方案量子机器学习(QML)作为量子计算与经典机器学习的交叉领域&#xff0c;正在重新定义我们处理复杂模式识别问题的方式。与传统机器学习不同&#xff0c;QML利用量子态的叠加和纠缠特性&#xff0c;理论上可以在某些特定任务上实现指数级…...

混合参数化量子态(HPQS)在量子机器学习中的应用与优化

1. 混合参数化量子态&#xff08;HPQS&#xff09;框架解析量子机器学习在NISQ&#xff08;Noisy Intermediate-Scale Quantum&#xff09;时代面临两大核心挑战&#xff1a;参数化量子电路&#xff08;PQC&#xff09;因有限测量次数导致的统计不确定性&#xff0c;以及神经量…...

8051仿真器OMF转SIG格式的实战指南

1. Signum 8051 仿真器符号转换器使用指南在嵌入式开发领域&#xff0c;Signum Systems 的 8051 仿真器是一个常用的调试工具。很多开发者在使用 Vision 开发环境时&#xff0c;经常遇到需要将链接器生成的绝对目标模块(OMF)转换为仿真器专用格式的需求。本文将详细介绍这个转换…...

量子纠错码与逻辑门优化实现技术解析

1. 量子纠错码与逻辑门实现基础量子纠错码是量子计算中确保计算可靠性的核心技术。与经典计算不同&#xff0c;量子态具有相干性和不可克隆性&#xff0c;这使得量子信息在存储和处理过程中极易受到环境噪声的影响。稳定子码&#xff08;Stabilizer Codes&#xff09;作为一类重…...

Keil µVision TAB显示异常问题分析与解决方案

1. 问题现象与背景分析在Keil Vision集成开发环境中&#xff0c;部分用户遇到了编辑器界面显示异常的问题。具体表现为&#xff1a;当代码中包含TAB字符&#xff08;制表符&#xff09;时&#xff0c;屏幕上会出现奇怪的显示错乱&#xff0c;原本应该显示为空白缩进的区域&…...

量子纠错码与硬件定制逻辑门的优化实现

1. 量子纠错码与硬件定制逻辑门概述量子纠错码&#xff08;QECC&#xff09;是容错量子计算的核心组件&#xff0c;其核心思想是通过编码将量子信息分布在多个物理量子比特上&#xff0c;利用稳定子&#xff08;stabilizer&#xff09;测量来检测和纠正错误。在众多QECC中&…...

Keil调试中局部变量修改限制的解决方案

1. 问题现象与背景解析在嵌入式开发过程中&#xff0c;调试环节往往占据整个开发周期的40%以上时间。作为Keil Vision的资深用户&#xff0c;我最近在调试一个基于C166架构的通信协议栈时&#xff0c;遇到了一个看似简单却令人困扰的问题&#xff1a;当我在receive_data函数内部…...

到底什么是 AI 测试?AI 测试与传统测试的区别?

过去两年&#xff0c;AI已经从"加分项"变成了"必选项"。 不只是大厂&#xff0c;二线公司、甚至传统行业的测试团队都在要求&#xff1a;"能熟练使用AI工具提效"。 更关键的是&#xff0c;面试的玩法也变了。现在的技术面试早就跳出了 “考 AI 零…...

A51汇编器Error 21解析与8051开发实践

1. 解析A51汇编器Error 21的根源与应对策略在8051单片机开发过程中&#xff0c;使用Keil C51工具链的A51汇编器时&#xff0c;开发者常会遇到一个令人困惑的报错&#xff1a;"ERROR #21: EXPRESSION WITH FORWARD REFERENCE NOT PERMITTED"。这个错误看似简单&#x…...

量子计算与人工智能融合:技术原理与应用前景

1. 量子计算与人工智能融合的技术全景量子计算与人工智能&#xff08;AI&#xff09;的交叉领域正在重塑计算技术的边界。作为一名长期跟踪量子计算发展的技术研究者&#xff0c;我见证了从早期理论构想到如今实验室原型机的演进历程。量子计算利用量子比特的叠加与纠缠特性&am…...

Cortex-M3/M4处理器模式判断与调试技巧

1. Cortex-M3/M4处理器模式判断原理在嵌入式开发中&#xff0c;理解Cortex-M3和Cortex-M4处理器的运行模式对调试和异常处理至关重要。这两种处理器架构都采用了两级特权等级和两种执行模式的组合设计&#xff1a;特权等级&#xff08;Privilege Level&#xff09;&#xff1a;…...