当前位置: 首页 > article >正文

我用 AI 生成测试用例,效率提升 3 倍但发现了这 5 个问题

专栏《AI 测试实战手册》第 5 篇作者一线测试工程师适合人群手工测试转型、自动化测试提效、测试人搞副业开篇真实项目案例这是我上个月在一个电商项目中的真实经历。项目背景新上线一个会员积分系统需求文档 30 页要求 3 天内完成测试用例编写预估工作量500 条用例传统方式需要 5-6 天但这次我用了 AI 辅助实际用时 1.5 天。效率确实提升了但也踩了不少坑。今天把经验和问题都分享给你。一、我的 AI 用例生成流程1.1 第一步整理需求把需求文档拆成小块每块一个功能点1. 积分获取 - 签到得积分 - 购物得积分 - 评价得积分 2. 积分使用 - 积分抵扣 - 积分兑换 - 积分赠送 3. 积分管理 - 积分查询 - 积分明细 - 积分过期1.2 第二步设计 Prompt我的标准 Prompt 模板你是一个资深测试工程师有 10 年电商系统测试经验。 请为以下功能生成测试用例 【功能名称】积分获取 - 签到得积分 【功能描述】 - 用户每天可以签到一次 - 连续签到有额外奖励 - 第 7 天奖励翻倍 【业务规则】 1. 签到时间每天 00:00-23:59 2. 基础积分10 积分/次 3. 连续 3 天额外 20 积分 4. 连续 7 天额外 50 积分 5. 中断后重新计算 【测试要求】 1. 正常场景10 条 2. 边界条件10 条 3. 异常场景10 条 4. 性能场景5 条 【输出格式】 用例编号 | 用例标题 | 前置条件 | 测试步骤 | 预期结果 | 优先级1.3 第三步审核优化AI 生成的用例不能直接用需要删除重复的补充遗漏的修正错误的调整优先级的二、效率提升数据2.1 时间对比阶段传统方式AI 辅助提升需求分析4 小时2 小时50%用例编写16 小时5 小时69%用例评审4 小时3 小时25%总计24 小时10 小时58%2.2 用例数量对比类型传统方式AI 辅助变化正常场景150 条180 条20%边界条件120 条160 条33%异常场景100 条140 条40%性能场景30 条50 条67%总计400 条530 条32%2.3 用例质量对比指标传统方式AI 辅助变化需求覆盖率92%96%4%边界条件覆盖75%88%13%用例重复率5%12%-7%评审通过率90%85%-5%三、发现的 5 个问题问题 1边界条件覆盖不足现象AI 生成的边界条件看似很多但仔细一看都是表面边界。比如积分系统AI 会测0 积分、最大积分但不会测积分精度问题小数点后几位也不会测并发签到时的积分计算原因AI 没有实际业务经验不知道哪些边界容易出 bug。解决人工补充关键边界建立边界条件检查清单把历史 bug 场景喂给 AI问题 2业务逻辑理解偏差现象AI 会生成一些逻辑上正确业务上错误的用例。比如用例用户使用积分后申请退款 AI 预期积分原路返回 实际业务积分不退回这是业务规则原因需求文档里没写清楚AI 按常识推断。解决需求文档要写清楚隐性规则Prompt 里明确说明特殊规则人工审核时重点检查业务逻辑问题 3需要大量上下文输入现象想让 AI 生成高质量用例需要喂给它很多信息需求文档接口定义历史 bug业务规则问题整理这些信息本身就要时间大模型有输入长度限制信息太多 AI 会抓不住重点解决建立需求模板结构化输入分功能点逐个生成不要一次性全给用摘要 详情的方式组织信息问题 4误报率高仍需人工审核现象AI 生成的用例大约 15-20% 是有问题的步骤不可执行预期结果错误前置条件缺失数据不合理原因AI 无法真正理解系统只是模仿用例格式。解决必须人工审核不能直接用建立用例审核 checklist把常见错误反馈给 AI让它改进问题 5需求变更后维护困难现象需求变了用 AI 更新用例时AI 不知道哪些用例受影响可能生成和旧用例冲突的新用例版本管理混乱案例V1.0签到得 10 积分 V1.1签到得 15 积分 AI 生成的新用例里有的写 10 积分有的写 15 积分解决用例编号要规范需求变更时标注影响范围定期清理过时用例四、AI 生成用例的正确姿势4.1 什么场景适合用 AI✅推荐需求明确的常规功能边界条件多的场景重复性高的用例编写新人学习写用例❌不推荐业务逻辑复杂的核心功能需求模糊的新功能涉及安全、资金的场景需要创造性思维的探索性测试4.2 正确的使用方式AI 是助手不是替代者错误方式需求 → AI → 直接用 正确方式需求 → AI → 人工审核 → 修改 → 使用建议比例AI 生成70%人工补充20%人工修改10%五、我的 Prompt 模板库5.1 通用用例生成你是一个资深测试工程师请为以下功能生成测试用例 【功能名称】{功能名} 【功能描述】{描述} 【业务规则】{规则列表} 【测试要求】{正常/边界/异常数量} 【输出格式】{表格格式}5.2 边界条件专项请专门针对边界条件生成测试用例 【功能】{功能名} 【输入字段】{字段列表及约束} 【边界类型】 - 最小值/最大值 - 空值/ null - 特殊字符 - 超长输入 - 精度边界 请每个字段至少生成 5 条边界用例。5.3 异常场景专项请针对异常场景生成测试用例 【功能】{功能名} 【异常类型】 - 网络异常 - 数据异常 - 超时 - 并发 - 权限不足 - 资源不足 请每个类型至少生成 3 条用例。六、效率提升小技巧6.1 建立用例模板库把常用的用例格式存起来让 AI 按模板生成标准用例模板 1. 用例编号模块_功能_序号 2. 用例标题动词 对象 预期 3. 前置条件不超过 3 条 4. 测试步骤编号列表每步一个动作 5. 预期结果可验证的结果 6. 优先级P0/P1/P2/P36.2 批量生成不要一个功能一个功能地问可以请为以下 5 个功能分别生成测试用例 1. 用户登录 2. 用户注册 3. 密码找回 4. 账号注销 5. 信息修改 每个功能生成 15 条用例按相同格式输出。6.3 迭代优化第一轮生成后可以刚才生成的用例中边界条件不够充分。 请补充以下场景的测试用例 1. 网络超时 2. 并发操作 3. 数据一致性 每个场景补充 5 条用例。写在最后AI 生成测试用例效率提升是真实的但问题也是真实的。我的建议用起来—— 先体验效率提升别全信—— 必须人工审核持续优化—— 积累自己的 Prompt 库AI 是工具你才是专家。下一篇预告《AI 写自动化测试脚本PytestAI 实战记录》从 0 到 1 写脚本AI 生成的代码能直接用吗调试和优化的技巧如果本文对你有帮助欢迎点赞、收藏、关注专栏第一时间获取更新

相关文章:

我用 AI 生成测试用例,效率提升 3 倍但发现了这 5 个问题

专栏:《AI 测试实战手册》第 5 篇 作者:一线测试工程师 适合人群:手工测试转型、自动化测试提效、测试人搞副业开篇:真实项目案例 这是我上个月在一个电商项目中的真实经历。 项目背景: 新上线一个会员积分系统需求文档…...

手把手教你用Playwright+TestNG搭建H5巡检系统:从数据库驱动到钉钉告警

构建企业级H5自动化巡检系统:Playwright与TestNG深度整合实战 在移动优先的互联网时代,H5页面已成为企业与用户交互的核心门户。一次意外的白屏或功能异常,可能导致数百万的营收流失和品牌信任危机。本文将带你从零构建一套完整的H5自动化巡检…...

高价加了根24g的内存条,试试qwen 3.5 35b-3b的模型本地部署速度如何。关闭思考模式

1,下载lmstuduio https://lmstudio.ai/ 2, 执行: #先添加执行权限 chmod x LM-Studio-0.4.6-1-x64.AppImage#执行 ./LM-Studio-0.4.6-1-x64.AppImage --no-sandbox 在这个模型库里面搜索qwen3.5-35ba3b,下载那个unsloth的。 关闭思考模式:在…...

2026 九大 AI 毕业论文格式排版工具实测:Paperxie 领衔,精准适配 4000 + 高校模板

paperxie-免费查重复率aigc检测/开题报告/毕业论文/智能排版/文献综述/aippthttps://www.paperxie.cn/format/typesettinghttps://www.paperxie.cn/format/typesetting 毕业季的收尾阶段,格式排版始终是本科生、研究生跨越毕业门槛的 “关键一关”。从字体行距的精准…...

效率翻倍!统信UOS批量重命名文件的4种玩法,太实用了

原文链接:效率翻倍!统信UOS批量重命名文件的4种玩法,太实用了 在日常办公中,很多人都会遇到这样一个问题: 几十个文件需要统一改名 图片、文档命名混乱 一个一个改名太浪费时间 如果你正在使用统信UOS桌面操作系统…...

小米新模型让社区对 DeepSeek V4 耿耿于怀:但真正的变量,可能根本不在 benchmark 上

小米新模型让社区对 DeepSeek V4 耿耿于怀:但真正的变量,可能根本不在 benchmark 上 最近,Reddit 的 LocalLLaMA 社区里出现了一条很有代表性的讨论帖:“What the hell is Deepseek doing for so long?” 帖子的情绪并不复杂&…...

Qwen3.5-9B可审计部署:模型权重可验证,推理过程可追溯

Qwen3.5-9B可审计部署:模型权重可验证,推理过程可追溯 1. 项目概述 Qwen3.5-9B是通义千问团队推出的新一代多模态大语言模型,基于创新的混合架构设计,在保持高效推理的同时,提供了前所未有的可审计能力。该模型特别适…...

Java开发必看:NullPointerException的5种常见场景及实战避坑指南

Java开发必看:NullPointerException的5种常见场景及实战避坑指南 在Java开发中,NullPointerException(NPE)堪称最令人头疼的运行时异常之一。无论是初入职场的新手,还是经验丰富的老手,都难免会在某个深夜被…...

AI驱动的智能视频处理:FunClip精准剪辑工具完全指南

AI驱动的智能视频处理:FunClip精准剪辑工具完全指南 【免费下载链接】FunClip Open-source, accurate and easy-to-use video clipping tool, LLM based AI clipping intergrated || 开源、精准、方便的视频切片工具,集成了大语言模型AI智能剪辑功能 项…...

Fiber分布式追踪采样率:基于请求路径的动态调整

Fiber分布式追踪采样率:基于请求路径的动态调整 【免费下载链接】fiber ⚡️ Express inspired web framework written in Go 项目地址: https://gitcode.com/GitHub_Trending/fi/fiber 在现代微服务架构中,分布式追踪是排查系统问题、优化性能的…...

毕设程序java加盟平台推荐可视化系统 基于Java的连锁品牌加盟决策支持系统 SpringBoot框架下的创业加盟智能匹配与数据可视化平台

毕设程序java加盟平台推荐可视化系统ktdx2ldg (配套有源码 程序 mysql数据库 论文) 本套源码可以在文本联xi,先看具体系统功能演示视频领取,可分享源码参考。在当今的商业环境中,加盟连锁模式因其较低的创业风险和成熟的运营模式而…...

喜报|腾讯云TDSQL TCCP(MySQL)理论高分通关!解锁数据库高薪赛道,云贝教育助你一战成“证”

热烈祝贺云贝教育CHEN学员在腾讯云TDSQL TCCP(MySQL版)高级认证理论考试中斩获高分佳绩!顺利突破认证核心关卡,用实力诠释专业素养,用成绩彰显学习成效!成绩展示或许有小伙伴会问TDSQL TCCP(MySQL版)认证到底有多大价值?为什么越来…...

从代码反推UML类图:用Rational Rose 2007快速为现有Java/Python项目生成设计文档

逆向工程实战:用Rational Rose 2007从Java/Python代码生成UML类图 接手遗留项目时,面对数万行未经注释的代码就像闯入一座没有地图的迷宫。我曾花费两周时间逐行阅读某个电商平台的订单模块,直到发现Rational Rose 2007的逆向工程功能可以将代…...

Apktool ResFloatValue:Android APK 浮点数资源值的终极解析指南

Apktool ResFloatValue:Android APK 浮点数资源值的终极解析指南 【免费下载链接】Apktool A tool for reverse engineering Android apk files 项目地址: https://gitcode.com/GitHub_Trending/ap/Apktool Apktool 作为一款强大的 Android APK 逆向工程工具…...

毕设程序java仿淘宝购物网站的设计与实现 基于SpringBoot的在线电商交易平台的设计与实现 Java网络商城系统的设计与实现

毕设程序java仿淘宝购物网站的设计与实现x92b5h61 (配套有源码 程序 mysql数据库 论文) 本套源码可以在文本联xi,先看具体系统功能演示视频领取,可分享源码参考。随着互联网技术的飞速发展,电子商务已经深度融入人们的日常生活&am…...

CLLC对称双向全桥谐振变换器仿真模型 - 变频控制下的输出电压闭环运行与自动正反向切换

CLLC对称双向全桥谐振变换器仿真模型。 电路采用变频控制,实现输出电压闭环运行。 正、反向两个方向的输出波形效果良好。 模型可实现自动正反向运行。 如展示图二所示,0.2s时由正向切换为反向。 运行环境有matlab/simulink等 ~ 搞电力电子的兄弟应该都懂…...

OSX-KVM网络隔离方案:构建安全的macOS测试环境终极指南

OSX-KVM网络隔离方案:构建安全的macOS测试环境终极指南 【免费下载链接】OSX-KVM Run macOS on QEMU/KVM. With OpenCore Big Sur Monterey Ventura support now! Only commercial (paid) support is available now to avoid spammy issues. No Mac system is re…...

轴承(二维圆柱、二维球模型及三维深沟球)有限元模型与ANSYS仿真计算指南

轴承(二维圆柱和二维球模型)和三维深沟球有限元模型画好网格,可直接拿去ansys仿真计算,适合小白学习上手较快。 以上都是博主学习过程中的一部分成果,保证真实有效。 可以看到轴承的动态受力图。 另外,资料…...

STM32F411+CUBEMX驱动WS2812B全流程:从PWM配置到DMA调优实战

STM32F411CUBEMX驱动WS2812B全流程:从PWM配置到DMA调优实战 在嵌入式LED控制领域,WS2812B因其独特的单线通信协议和丰富的色彩表现力,成为创客和工程师们的热门选择。然而,这种智能LED的精确时序控制对微控制器提出了严苛要求——…...

GitHub Linguist依赖管理终极指南:Ruby gems与外部库整合技巧

GitHub Linguist依赖管理终极指南:Ruby gems与外部库整合技巧 【免费下载链接】linguist Language Savant. If your repositorys language is being reported incorrectly, send us a pull request! 项目地址: https://gitcode.com/GitHub_Trending/li/linguist …...

LeetCode图算法实战:从省份数量到猫和老鼠的5种必会解法

LeetCode图算法精要:5种核心解法与实战技巧 1. 图算法基础与高频问题分类 图算法是算法面试中的核心考察点,掌握常见解题模式能显著提升解题效率。我们将LeetCode高频图问题分为以下几类: 连通性问题:省份数量、封闭岛屿统计路径问…...

小程序启动优化:冷热启动机制与强制更新策略解析

1. 小程序启动机制:冷启动与热启动的底层逻辑 第一次打开小程序时,页面加载总感觉有点慢?而第二次打开却快如闪电?这背后就是冷启动和热启动的差异在起作用。作为开发者,理解这两种启动方式的运行机制,是优…...

Exchange Server 2019用户必看:如何零成本升级到订阅版(附详细步骤)

Exchange Server 2019零成本升级订阅版全流程指南 对于仍在运行Exchange Server 2019的企业IT团队来说,2025年将迎来一个关键转折点。微软最新推出的订阅版解决方案,不仅延续了企业级邮件系统的核心功能,更通过灵活的许可模式降低了长期使用成…...

虚拟控制器驱动技术革新:ViGEmBus从基础配置到深度开发的实战指南

虚拟控制器驱动技术革新:ViGEmBus从基础配置到深度开发的实战指南 【免费下载链接】ViGEmBus 项目地址: https://gitcode.com/gh_mirrors/vig/ViGEmBus 在游戏开发与外设兼容领域,虚拟控制器技术正成为连接多样化输入设备与标准化系统接口的关键…...

ThinkPHP8.0与PHP8.1兼容性实测:这些新特性让你的开发效率翻倍

ThinkPHP8.0与PHP8.1深度兼容指南:解锁性能飞跃的实战密码 当PHP8.1的JIT编译器遇上ThinkPHP8.0的现代化架构,会产生怎样的化学反应?作为长期深耕企业级PHP开发的实践者,我完整经历了从PHP7.4到8.1的升级历程,特别是在…...

一站式毕业助手:选题、写作、答辩全搞定

作为一个去年从“选题迷茫”到“答辩优秀”一路摸爬滚打过来的老学长,今天我把亲测好用的5款论文神器一次性分享出来。不整虚的,只说怎么用、解决什么问题。希望能帮你少熬几个大夜,顺利上岸。一、写不出?这两款帮你“搭框架”痛点…...

解决OSX-KVM打印服务问题:从驱动安装到网络共享完整指南

解决OSX-KVM打印服务问题:从驱动安装到网络共享完整指南 【免费下载链接】OSX-KVM Run macOS on QEMU/KVM. With OpenCore Big Sur Monterey Ventura support now! Only commercial (paid) support is available now to avoid spammy issues. No Mac system is r…...

教育SRC漏洞平台实战:从注册到漏洞提交的全流程解析

教育SRC漏洞平台实战指南:从入门到精通的全方位解析 在数字化教育快速发展的今天,教育行业网络安全问题日益凸显。作为安全研究人员,参与教育SRC(安全应急响应中心)漏洞平台不仅能提升个人技术能力,还能为教…...

光伏系统并网最头疼的就是太阳说变脸就变脸。咱们今天要聊的Simulink模型,就是让储能系统当个靠谱队友——光照突变时它能马上顶上,把并网功率稳得像条直线

Simulink光伏储能并网控制模型 微网,光储系统并网运行 光照强度发生改变时,储能可以有效配合光伏进行恒定功率并网,平抑波动,实现削峰填谷。 光伏最大功率点采用电导增量法 通俗易懂先看光伏这边的核心算法,电导增量法…...

vulmap漏洞扫描工具实战:从安装到批量检测Web中间件的完整指南

Vulmap漏洞扫描实战:高效检测Web中间件安全的全流程指南 在网络安全领域,Web中间件的漏洞往往是攻击者最常利用的入口点。面对层出不穷的安全威胁,安全从业者需要掌握高效精准的漏洞检测工具。本文将带您深入掌握Vulmap这一轻量级但功能强大的…...