当前位置: 首页 > article >正文

高质量测试 Skill 编写手册 -- 渐进式披露

什么是渐进式披露渐进式披露是高质量 Skill 中最基础也最重要的技巧之一。 用一句话表达就是不要把所有的规则和知识都一股脑的写在提示词中交给大模型而是只在必要的时候加载对应的知识。为什么需要渐进式披露在大模型领域有一句话叫上下文腐坏我通常喜欢叫它上下文污染但意思都是一样的。当交给大模型的上下文过长的时候这些内容就会让大模型产生误判或者说让大模型的注意力转移把真正重要的内容忽略掉没办法transform 模型本质上还是用注意力模式构建的。 这一点在复杂任务下会尤其明显。在我们的自动化测试工程中通常都会由 AI 来完成代码生成的工作但很多同学总会反馈 AI 生成的代码一次通过率很低大模型总会在一些细枝末节的地方出纰漏或者没有理解准确我的意思。 这很可能是长上下文带来的影响。这其实很好理解整个自动化测试的项目太大了 我们历史上可能已经构建了数千条测试用例。这些测试用例之间可能由于场景特性相近的功能但用了略有差异的执行和验证方式。这些就会给大模型带来困扰。我们应该让大模型只去理解那些必要的知识而非把所有东西一股脑扔给他。要如何做到渐进式披露概念好理解但概念太虚了我要怎么实操呢 这里我们先给出一个例子。 在我的编写接口自动化测试的 SKILL.md 中 最开头就有这样一段# 自动化测试用例编写 - 公共知识库 ## 工作流必须严格按顺序执行 每次编写测试用例时**必须按以下工作流依次执行** ### Step 1阅读规则 1. 阅读本文件获取公共模块知识 2. 根据用例所属功能域读取 references/ 目录下对应的参考文件见下方分层索引 3. 读取用例目标目录下的 .rules 文件获取该目录的特定规则 ### Step 2参考已有用例 1. 在用例目标目录下找到 1-2 个功能最相近的已有测试用例文件 2. 阅读这些用例的完整代码学习其基类、导入、写法、命名、步骤风格 3. 新用例的风格必须与同目录已有用例保持一致 #### 分层参考文件索引 根据要编写的用例所属功能域**必须读取**对应的参考文件 | 功能域 | 参考文件 | 对应用例路径 | |--------|---------|------------| | 权限测试 | [references/auth.md](references/auth.md) | cases/platform_management/auth/ | | 计费测试 | [references/billing.md](references/billing.md) | cases/platform_management/price/ | | 提示词模板 | [references/prompt-tpl.md](references/prompt-tpl.md) | cases/prompt_templates/ | | 模型广场 | [references/model-market.md](references/model-market.md) | cases/model_marketplace/ | | 插件广场 | [references/plugin-market.md](references/plugin-market.md) | cases/plugin_marketplace/ | | 多Agent模型 | [references/multi-agent.md](references/multi-agent.md) | cases/app_dev/multi_agent_model/ | **重要**编写特定领域用例时必须先读取对应的 references/*.md 文件获取该领域的基类、Service、测试模式等专用知识。在 references 目录下的文件在这段 skill 的工作流中首先说明需要大模型根据测试场景 和测试存放的目录进行分层读取首先如果是一个权限相关的测试用例。 大模型根据 skill 指引读取 references 下的 auth.md 文件这里面记录的是什么呢我们可以看一下## 三、权限测试标准流程 ### 3.1 创建工作空间并添加子账号 self.start_step(使用主账号创建工作空间) self.create_workspace_with_sub_account(权限测试工作空间名称) # self.workspace_id 和 self.sub_uin 自动设置 ### 3.2 三种授权方式 权限系统支持三种授权对象使用不同的 API | 授权对象 | API 方法 | 说明 | |---------|---------|------| | 用户 | AuthAPI.SetUserResourcePermissions | 给用户直接赋予数据权限 | | 组织 | AuthAPI.SetSubjectResourcePermissions | 给组织赋予数据权限组织内成员继承 | | 角色 | AuthAPI.SetRoleResourcePermissions | 给角色赋予数据权限角色下用户继承 | #### 用户直接授权 from lib.lke_api.platform_management.auth.auth_api import AuthAPI from cases.platform_management.auth.permissions import AppPermissions res AuthAPI.SetUserResourcePermissions( SpaceIdself.workspace_id, AccountUinself.sub_uin, PermissionsAppPermissions.adpAPP_no_permission, # 权限配置 account_nameMaster_Default, ResourceIds[*], # * 表示所有资源 ResourceTypeapp # 资源类型 ) ifErrorin res[Response]: raise Exception(f设置子账号权限失败. {res}) #### 组织授权 # SubjectType1 表示组织 res AuthAPI.SetSubjectResourcePermissions( SpaceIdself.workspace_id, SubjectIdself.dept_id, # 组织ID SubjectType1, # 1组织 PermissionsAppPermissions.adpAPP_view, ResourceIds[*], ResourceTypeapp, account_nameMaster_Default ) ifErrorin res.get(Response, {}): raise Exception(f为组织设置权限失败. {res}) time.sleep(40) # 等待权限生效 #### 角色授权 res AuthAPI.SetRoleResourcePermissions( SpaceIdself.workspace_id, RoleIdself.role_id, # 角色ID PermissionsAppPermissions.advance_custom_all, ResourceIds[*], ResourceTypeapp, account_nameMaster_Default ) ifErrorin res.get(Response, {}): raise Exception(f为角色设置权限失败. {res}) time.sleep(40) # 等待权限生效上面那些是权限模块的公共方法 但根据不同的场景 它还有特定的知识 比如根据角色设置权限的测试点和操作方法与根据组织设置权限就会略有不同。所以 SKILL.md 中的工作流还会要求大模型去读取对应目录 这些目录下的规则文件和相似的测试用例。 这些都是让大模型进行参考的重要知识。 所以在 SKILL.md 中才会在 step2 里规定### Step 2参考已有用例 1. 在用例目标目录下找到 1-2 个功能最相近的已有测试用例文件 2. 阅读这些用例的完整代码学习其基类、导入、写法、命名、步骤风格 3. 新用例的风格必须与同目录已有用例保持一致在整个知识体系中我们其实是分了三层的第一层SKILL.md 定义工作流和公共知识.第二层references该目录存放了多个文件记录着每个模块特有的代码知识。第三层特定场景测试 case 存放的目录该目录下也有 rule 文件记录特定场景知识也会让大模型读取这里的测试文件进行一定的参考。以上 就是我在接口自动化测试项目中的一个实践。进一步的扩展事实上在整个 Agent 和 SKILL 的优化实践中让 Agent 只理解必要的知识减少无关的内容是贯穿了整个设计的原则。 渐进式纰漏只是其中的一种。 在后面要讲的多 Agent 隔离 执行结果持久化 也是这种思想的体现。

相关文章:

高质量测试 Skill 编写手册 -- 渐进式披露

什么是渐进式披露渐进式披露是高质量 Skill 中最基础也最重要的技巧之一。 用一句话表达就是:不要把所有的规则和知识都一股脑的写在提示词中交给大模型,而是只在必要的时候,加载对应的知识。为什么需要渐进式披露在大模型领域有一句话叫上下…...

博德之门3 2026最新官方正版免费下载 一键转存 永久更新 (看到速转存 资源随时走丢)

拥抱高自由度探索:深挖《博德之门3》的幕后群像与核心构架 在当今节奏日益加快的电子游戏市场中,慢节奏的回合制硬核角色扮演游戏(RPG)能够突围并成为现象级作品并不多见。然而,有一款作品凭借极其庞大的网状叙事与深…...

为什么 AI 框架几乎全选 Python,而不选 C#?| 技术深度分析

关键词:Python AI、C# AI开发、PyTorch、Semantic Kernel、Microsoft Agent Framework、ML.NET这不是 C# 的失败,而是一场"不公平竞争"的历史必然。先看数据:Python 在 AI 领域有多统治?不是我吹,数据摆在这…...

TunaMH算法:基于谱间隙优化的小批量MCMC精确采样

1. 项目概述:当MCMC遇见大数据,我们如何“精打细算”地采样?搞贝叶斯推断或者统计计算的朋友,对马尔可夫链蒙特卡洛(MCMC)肯定不陌生。这玩意儿就像个不知疲倦的探险家,在复杂的概率分布地形里四…...

30+平台文档一键免费下载:浏览器文档下载工具的终极解决方案

30平台文档一键免费下载:浏览器文档下载工具的终极解决方案 【免费下载链接】kill-doc 看到经常有小伙伴们需要下载一些免费文档,但是相关网站浏览体验不好各种广告,各种登录验证,需要很多步骤才能下载文档,该脚本就是…...

如何用Python脚本实现大麦网90%成功率的自动抢票:终极指南

如何用Python脚本实现大麦网90%成功率的自动抢票:终极指南 【免费下载链接】Automatic_ticket_purchase 大麦网抢票脚本 项目地址: https://gitcode.com/GitHub_Trending/au/Automatic_ticket_purchase 你是否曾经为了抢到心仪演唱会门票而守在电脑前疯狂刷新…...

Qt应用AES/RSA加密监控:Frida+对象生命周期追踪框架

1. 这不是“又一个 Frida 教程”,而是一套可复用的逆向监控工程框架你有没有遇到过这样的场景:在分析一款 Qt 桌面客户端时,发现它用 AES 加密了用户登录凭证,用 RSA 加密了设备指纹,但所有加解密逻辑都藏在QByteArray…...

手机号查QQ号合法替代方案与技术合规指南

我不能提供任何涉及非法获取他人隐私信息的技术方案或操作指南。手机号与QQ号均属于受法律保护的个人敏感信息,其关联关系由腾讯公司严格管控,仅限用户本人通过官方渠道(如QQ安全中心、腾讯客服)在符合实名认证和身份核验的前提下…...

HexStrike AI v6.0:面向红队实战的多智能体渗透框架

1. 这不是又一个“AI安全”的概念玩具,而是一套能真正进红队作战包的智能体渗透框架我第一次在内部红队演练中把 HexStrike AI v6.0 推进真实靶场时,没敢直接叫它“AI渗透工具”——怕被老队员当场笑出声。毕竟过去三年里,我亲手试过七套标榜…...

漏洞研究工作流:从CVE追踪到Docker复现的闭环实践

1. 这不是资源列表,而是一套可落地的漏洞研究工作流“在线资源全攻略:漏洞复现、CVE 追踪、实战提升一条龙”——这个标题里藏着一个被很多人忽略的事实:漏洞研究从来不是靠堆砌工具和网站就能做好的事,它本质上是一套闭环的工作流…...

机器学习预测器评估随机数生成器最小熵:原理、实现与对比分析

1. 项目概述:当机器学习遇上随机性评估在信息安全领域,随机数生成器的质量是基石。无论是生成加密密钥、初始化向量,还是为各类协议提供随机性,其输出的不可预测性直接决定了整个系统的安全强度。我们如何量化这种“不可预测性”&…...

2026年AI写作辅助软件实测排行,哪款真正适合写论文?

2026 年学术 AI 论文工具已形成全流程、理工 / 社科、英文 / 中文、免费 / 付费的清晰分化。综合实测排行与场景适配,千笔AI 是中文全能首选,DeepSeek 学术版是理工开源首选,毕业之家是国内毕业专属首选。 一、2026 年实测排行 TOP5&#xff…...

构建高效的 Agent 任务队列

构建高效Agent任务队列:从第一性原理到生产级落地全指南 关键词 Agent任务队列、多智能体调度、优先级抢占、延迟敏感任务、分布式一致性、负载均衡、容错机制 摘要 随着大模型驱动的多Agent系统在企业服务、具身智能、自动驾驶等领域的规模化落地,传统消息队列与批处理调…...

2026年AI论文工具实测排行,哪款真正适合顺利通关?

2026 年学术 AI 论文工具已形成全流程、理工 / 社科、英文 / 中文、免费 / 付费的清晰分化。综合实测排行与场景适配,千笔AI 是中文全能首选,DeepSeek 学术版是理工开源首选,毕业之家是国内毕业专属首选。 一、2026 年实测排行 TOP5&#xff…...

评测全网10款主流降AI率工具:帮你锁定真正好用靠谱的一款

随着AI写作工具的普及,论文撰写和内容创作变得越来越高效,许多学生和职场人士都从中受益。然而,随着高校和学术机构对AIGC(人工智能生成内容)检测技术的不断升级,问题也逐渐显现。越来越多的学生发现&#…...

好用还专业!2026 降AIGC平台测评:最新工具推荐与对比分析

2026年真正好用的AI论文降重与改写工具,核心看降重效果、去AI味、格式保留、学术适配四大指标。综合实测,千笔AI、ThouPen、豆包、DeepSeek、Grammarly 是当前最值得推荐的梯队,覆盖从免费到付费、从中文到英文、从文科到理工的全场景需求。 …...

Web渗透信息收集实战:从被动侦察到精准测绘

1. 这不是“黑客速成班”,而是Web渗透工程师的日常切片很多人点开“精通 Kali Linux Web 渗透测试”这个标题,第一反应是:又要教怎么黑进某个网站了?其实恰恰相反——我带过的二十多个渗透测试新人里,前两周最常犯的错…...

雷电模拟器安卓7+抓包失败原因与Burp证书配置方案

1. 为什么在雷电模拟器上装Burp证书会反复失败?你是不是也遇到过这种情况:在雷电模拟器里打开App,Burp Suite明明开着代理、手机网络也设好了,可就是抓不到任何HTTPS流量?App要么直接报错“网络异常”,要么…...

Python基础篇:闭包、装饰器wrapper

一、闭包 元组字典解包 def func(*args, **kwargs):print(type(args)) # <class tuple>print...

设计模式实战解读(二):工厂模式——对象创建的解耦艺术

本文是「设计模式实战解读」系列第二篇。系列文章统一按照 定义 → 痛点场景 → 模式结构 → 核心实现 → 真实应用 → 常见变种 → 优缺点 → 避坑指南 → FAQ 的结构展开&#xff0c;每篇聚焦一个模式讲透。 一句话定义 工厂模式&#xff08;Factory&#xff09;&#xff1a…...

Windows上安装APK文件的终极指南:告别臃肿模拟器,轻松实现跨平台应用安装

Windows上安装APK文件的终极指南&#xff1a;告别臃肿模拟器&#xff0c;轻松实现跨平台应用安装 【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 你知道吗&#xff1f;…...

Qwen模型 LeetCode 2608. 图中的最短环 Java实现

哎呀&#xff0c;2608. 图中的最短环&#xff01;这题可有意思了&#xff5e;我第一次做时也卡了好一会儿&#xff0c;后来发现用 **BFS 枚举每条边 临时删除** 的思路特别清爽&#xff01;### &#x1f31f; 核心思想&#xff1a; - 对于每一条边 (u, v)&#xff0c;我们**暂…...

Qwen模型 LeetCode 2603. 收集树中金币 Python3实现

当然可以&#xff01;这次我给你一个**更精炼、更 Pythonic、逻辑清晰又高效**的 Python3 实现&#xff0c;还附带了详细的思路说明和小技巧&#xff5e;✨这道题的本质是&#xff1a;**在树上剪枝两次后&#xff0c;剩下的边数 2 就是答案**。为什么&#xff1f;因为&#xf…...

Qwen模型 LeetCode 2603. 收集树中金币 Java实现

哎呀&#xff0c;这道题我可太熟啦&#xff01;2603. 收集树中金币&#xff0c;看着挺复杂的&#xff0c;其实想通了就特别有意思&#xff5e;让我跟你聊聊我的思路&#xff5e;这题本质上是个树形DP问题&#xff0c;我们需要在无向树上进行两次遍历。先说说我的理解哈&#xf…...

矩阵补全因果推断:破解贸易政策评估中的内生性与异质性难题

1. 项目概述&#xff1a;当因果推断遇上贸易政策评估的“硬骨头”做贸易政策评估的同行都知道&#xff0c;这事儿有多棘手。你想啊&#xff0c;一个国家签了个自由贸易协定&#xff08;FTA&#xff09;&#xff0c;几年后出口额涨了&#xff0c;你怎么知道这增长里有多少是协定…...

Web安全 - 国密 SSL / TLCP 接入手把手系列

文章目录这个系列覆盖什么系列目录本系列和已有文档的关系权威资料入口这是一套面向“从来没接过国密 SSL”的开发者写的系列博客。它以本工程 gm-ssl-client 为主线&#xff0c;先补齐 SSL/TLS、国密算法、TLCP、证书、Java Provider 等基础知识&#xff0c;再一步一步讲清楚如…...

为什么92%的AI生成BP被秒拒?ChatGPT商业计划书写作的5大合规红线,今天不看明天就踩坑

更多请点击&#xff1a; https://kaifayun.com 第一章&#xff1a;AI商业计划书被秒拒的底层逻辑真相 投资人不是拒绝AI&#xff0c;而是拒绝“伪AI叙事”。当一份计划书开篇即堆砌“大模型”“AIGC”“多模态融合”等术语&#xff0c;却未定义清晰的用户痛点、可验证的最小闭…...

井下巷道无感精准定位 作业人员在岗离岗智能甄别

井下巷道无感精准定位 作业人员在岗离岗智能甄别技术白皮书编制单位&#xff1a;镜像视界浙江科技有限公司技术资质&#xff1a;国家十四五重点课题研究、镜像视界浙江普陀时空大数据应用技术联合研究、河南省电检院权威认证版本&#xff1a;V1.0一、项目概述井下巷道空间迂回交…...

【ChatGPT小红书爆款文案公式】:20年AI内容专家亲授3步生成高互动率文案(附17个真实转化数据)

更多请点击&#xff1a; https://kaifayun.com 第一章&#xff1a;ChatGPT小红书爆款文案的核心认知 小红书平台的内容生态高度依赖「真实感」「强共鸣」与「高信息密度」三重底层逻辑。ChatGPT生成的文案若直接照搬通用模板&#xff0c;极易因缺乏人设锚点、场景细节和情绪节…...

DeepSeek LeetCode 2617. 网格图中最少访问的格子数 TypeScript实现

以下是 LeetCode 2617「网格图中最少访问的格子数」的 TypeScript 实现&#xff0c;采用 BFS 并查集&#xff08;路径压缩&#xff09; 优化&#xff0c;保证每个格子只被访问一次&#xff0c;时间复杂度 O(mnα(mn))&#xff0c;空间复杂度 O(mn)。typescript function minim…...