当前位置：首页 > article >正文

【卷卷观察】Agent Skills 为什么突然火了？我花了一晚上研究，结论有点反直觉

article 2026/5/6 4:27:22

结论先甩Agent Skills 不是什么新东西但它解决了一个很实在的问题——怎么让 AI 不要找借口真正把活干完。我在用 AI 写代码的时候最烦的不是 AI 写得慢是 AI 写完之后跟你说测试我稍后加上。然后就没有然后了。这个问题我遇到太多次了。AI 写的代码逻辑看起来没问题但测试覆盖率 0%、边界情况没考虑、错误处理是空的。你让 AI 补AI 说好的我补然后生成一堆看起来像测试的代码实际上根本没跑通。直到我看到 Addy Osmani 写的 Agent Skills 文章我才意识到问题不在 AI 本身在于我们给 AI 的技能描述太水了。什么是 Agent Skills简单说Agent Skills 就是给 AI Agent 用的标准作业指导书。传统方式你给 AI 一段文字描述告诉它帮我写一个用户登录功能需要包含注册、登录、登出密码要加密异常情况要处理。AI 读完大概知道你想干嘛然后开始写。写出来的代码能跑但细节可能一塌糊涂。Agent Skills 的做法是把作业指导书变成流程图而不是说明书。一个 Skill 长这样## 测试技能 ### Step 1: 写测试 Checkpoint: - [ ] 测试覆盖率 80% - [ ] 所有测试通过 - [ ] 无硬编码凭证未通过停止执行。 ### Step 2: 验证测试确实运行 - 运行 npm test - 截图测试输出 - 检查覆盖率报告未通过停止执行。关键差异AI 不能说我写了测试必须通过 Checkpoint 才能继续。为什么在 HN 上火了Addy Osmani 这篇 Agent Skills 文章冲了 303 分151 条评论。看完 HN 评论总结几个要点实用派居多。评论区没有太多人在争论这是不是颠覆性创新而是在讨论这个设计能不能解决我的具体问题。说明确实打到了痛点。对抗 AI 借口文化。HN 评论区提到最多的一个词是anti-rationalization——反合理化。AI 很擅长给自己找借口这只是原型先这样吧测试稍后加上重构太复杂先不搞了Agent Skills 的做法是把这些借口直接写进技能文档里并附上反驳。我会稍后添加测试→ 稍后永不现在写。能跑就行→ 能跑不等于可维护。这个设计太骚了。AI 看到借口就会想起反驳。相当于给 AI 植入了一个内部监督机制。渐进式披露节省算力。传统方式下AI 每次任务开始都要读取大量背景信息。Agent Skills 采用渐进式披露——AI 只在真正需要时才加载对应技能的知识对长任务链特别有意义。跟 MCP 的关系这是 HN 评论里很多人问的问题。简单说MCP 解决接得上的问题Skills 解决干得对的问题。MCPModel Context Protocol是工具调用协议——让 AI 能调用外部工具。MCP 负责的是AI 能不能做到。Agent Skills 是流程规范——让 AI 按正确顺序、正确标准完成任务。Skills 负责的是AI 做的时候会不会偷懒。两者是互补关系不是替代关系。MCP 是基础设施Skills 是上层规范。我的踩坑经验用 AI 写代码这么久有几个跟 Skills 理念非常吻合的经验验收标准必须可量化。测试要写得好是废话测试覆盖率 80%才是标准。把做好翻译成具体的数字指标AI 执行起来才不会走偏。每个节点都要有明确的退出条件。AI 任务经常虎头蛇尾——开头认真后面糊弄。给每个步骤设置 Checkpoint未通过就停止逼着 AI 在每个节点都交出合格产出。让 AI 提供执行证据不要主观判断。AI 说测试都通过了——这是主观判断不可信。AI 说运行 npm test输出显示 15 passed0 failed覆盖率 82%——这是执行证据可验证。Skills 的 Checkpoint 机制就是强制 AI 提供证据而不是判断。什么时候该用 Agent Skills适合的场景重复性高的任务流程代码审查、测试生成、数据清洗多步骤、长链路的任务需要按顺序完成不能跳步团队需要固化最佳实践把资深工程师的经验转成 Skills对输出质量有明确标准的任务不适合的场景探索性任务你都不知道答案是什么让 AI 自由发挥一次性小任务写个 hello world 还要配 Skill 杀鸡用牛刀创意类任务写文案、做设计Skills 规范太死板判断与行动建议Agent Skills 是 2026 年最值得投入的 AI 工程化实践之一。它的价值不在于技术多先进而在于解决了一个很实在的问题怎么让 AI 在实际干活的时候不摸鱼、不糊弄、不找借口。如果你在带团队做 AI 应用落地建议把 Skills 设计纳入开发规范先从高频任务开始找到团队里重复执行最多的 3-5 个任务为它们编写 Skills。把 Checkpoint 当成 CI不过不了就不能继续——每个 Skill 的 Checkpoint 就是一道质量门。积累团队数字资产Skills 是可以被版本管理、复用的团队知识这是 AI 时代最重要的资产之一。

【卷卷观察】Agent Skills 为什么突然火了？我花了一晚上研究，结论有点反直觉

相关文章：

【卷卷观察】Agent Skills 为什么突然火了？我花了一晚上研究，结论有点反直觉

动态推理框架TERMINATOR：大模型推理加速与资源优化

Go轻量级Web框架zcf：高性能API开发与微服务实践指南

语言模型角色稳定性控制：激活截断技术解析

Proma指标库：轻量级监控系统设计与Go应用集成实践

别再手动调参了！R语言自动超参优化病害预测框架（比传统方法快6.8倍，AUC稳定≥0.913）

ToDesk免费版真能连100台设备？我实测了文件传输和远程打印，附保姆级配置避坑指南

Banana Pi BPI-W3开发板：RK3588芯片与双千兆网口深度解析

强化学习在视频理解中的应用与优化实践

化工园区智能巡检机器人路径规划【附代码】

Python配置管理利器：configurations库实现多环境配置自动化

基于PLC的防冻液精准喷洒控制模糊PID【附代码】

告别霍尔传感器：用STM32F4驱动BLDC无刷电机的无感控制保姆级教程

5分钟掌握YimMenu：GTA5终极开源防护菜单深度解析

MineCursor：开发者专属光标主题，提升编码体验与效率

PFL-Non-IID系统性能优化：GPU内存管理与多GPU并行训练

如何实现零运行时内存分配：ggml高性能推理的终极优化指南

微软HydraLab：云原生移动端自动化测试平台部署与实战指南

如何在Lobe-Chat中实现完整的操作记录追踪与审计分析

ICoT与傅里叶结构优化语言模型推理与效率

告别重复劳动：用harmes agent与快马平台自动化代码审查，效率翻倍

双曲空间视觉语言模型中的不确定性对齐技术

量子优化算法DO-QAOA：NISQ时代的突破与挑战

告别重复劳动：用快马AI自动生成Matlab风格的数据分析与可视化模板

利用Taotoken的稳定性与路由能力保障线上服务高可用

特种海洋作业平台锂电池完整设计方案要求【浩博电池】

5分钟快速上手YetAnotherKeyDisplayer：让键盘操作一目了然的终极指南

TypeScript-Babel-Starter 深度解析：为什么选择 Babel 而不是 tsc 编译器

剂泰科技开启招股：获1.5亿美元基石投资 5月13日上市红杉高瓴加持

告别‘断线’烦恼：用PyTorch实现动态蛇卷积，精准分割血管与道路（附完整代码）