当前位置: 首页 > article >正文

从 Rule、Spec 到 Harness:AI Coding 的渐进式建设路径

文章目录前言第一阶段Rule —— 给 AI 立规矩就像教小孩认字第二阶段Spec —— 先写文档再写代码就像盖房子先画图纸第三阶段Harness —— 自动验证与反馈就像给 AI 配了个质检员这三个阶段是啥关系不是替代是叠加2026 年的最佳实践渐进式建设路径第一步从 Rule 开始Week 1-2第二步引入 Spec 工作流Week 3-4第三步搭建 HarnessWeek 5写在最后AI Coding 的本质是工程化前言朋友们今天咱们来聊一个特别有意思的话题——AI Coding 这玩意儿到底怎么才能真正从玩具变成生产工具我知道你们肯定都玩过对着 Cursor 或者 Claude Code 喊一嗓子给我写个电商后台然后看着它哐哐哐一顿输出心里那个爽啊感觉程序员要失业了明天就能去马尔代夫晒太阳了。结果呢运行三天Bug 一堆性能稀烂最后还得自己熬夜重写。这感觉就像是你让实习生帮你写代码他写得飞快但你 review 的时候发现每一行都得改还不如自己写呢其实啊这不是 AI 不行而是咱们用错了姿势。2025 年到 2026 年这两年整个 AI Coding 领域发生了特别大的变化从最早的随意 vibe coding进化到了现在的工程化体系。今天我就给大家掰扯掰扯这个演进路径看看业界大神们是怎么解决AI 写得快但不可控这个问题的。第一阶段Rule —— 给 AI 立规矩就像教小孩认字咱们先说说最基础的阶段——Rule规则驱动。早期的 AI 编程助手比如 2023 年的 GitHub Copilot基本上就是个自动补全Plus。你写个注释它猜你想写啥然后给你补全。这时候的问题很明显每个人的代码风格不一样团队的技术栈也不一样AI 经常给你生成一些看起来很对但实际上完全不符合项目规范的代码。到了 2024 年Cursor 推出了 .cursorrules 文件这时候大家才反应过来哦原来可以给 AI 立规矩啊就像你教小孩子认字不能让他随便乱说得告诉他咱们家不说脏话、“见到长辈要叫叔叔阿姨”。这个 .cursorrules 文件放在项目根目录里面写清楚咱们项目用啥技术栈ReactVue还是纯原生代码风格要啥样的缩进两个空格还是四个用单引号还是双引号有哪些绝对不能碰的红线比如不能直接操作数据库必须用 ORM但是啊2024 年的规则系统还比较简单就是一个大文件所有规则都塞在里面。到了 2025 年Cursor 1.7 版本发布这个规则系统彻底进化了变成了多级架构 Global Settings全局规则你自己的编程偏好比如你喜欢函数式编程讨厌 class这些放在 Cursor 的设置里所有项目都生效。Project-Level Rules项目级规则放在 .cursor/index.mdc 文件里这是整个团队的宪法。比如你们团队规定必须用 TypeScript不能用 any必须写单元测试这些写在这里。Dynamic Rules动态规则放在 .cursor/rules/*.mdc 目录下这些是专项规定。比如有个文件专门管数据库操作告诉 AI必须用事务、“批量操作不能超过 1000 条”还有个文件专门管 UI 组件告诉它必须用 Tailwind、“颜色必须从设计系统里取”。你看这就好比一个公司先有员工手册全局规则再有部门规章项目级规则最后还有各个岗位的操作规范动态规则。AI 就像新入职的员工你把这些规矩给它讲清楚它写出来的代码至少不会跑偏太离谱。不过啊Rule 阶段有个明显的局限规则是静态的。就像你教小孩见到人要打招呼但他可能不知道什么时候该握手什么时候该鞠躬什么时候只需要点头微笑。规则越写越多文件越来越长AI 反而可能记混了或者抓不住重点。这时候业界就开始琢磨下一个阶段了。第二阶段Spec —— 先写文档再写代码就像盖房子先画图纸2025 年下半年到 2026 年初一个叫Spec-Driven Development规范驱动开发简称 SDD的概念开始火起来了 。啥意思呢就是说以前咱们写代码是边想边写想到哪写到哪。现在呢得先写一份详细的 Spec规范文档把要实现的功能、接口定义、数据流向、异常处理全都写清楚然后再让 AI 根据这份 Spec 去生成代码。这就好比盖房子。以前 vibe coding 就像是找个施工队跟工头说给我盖个三室两厅然后工头就开始干了干到哪算哪最后发现厨房没窗户卫生间门对着客厅傻眼了。而 Spec-Driven 就像是先找个建筑师画好图纸标注清楚哪里承重、哪里走水电、门朝哪开然后再让施工队按图施工。GitHub 在 2026 年推出的 Spec Kit 就是专门干这个的。它提供了一套 CLI 工具帮你创建规范的 Spec 文件结构uvx --from githttps://github.com/github/spec-kit.git specify init my-project运行完这个命令你的项目里就会出现几个目录specs/放功能规格说明书用 Markdown 写包含用户故事、验收标准、技术方案plans/放实现计划把大功能拆成具体任务tasks/放具体的技术任务每个任务对应一次代码提交这时候的工作流程变成了Research Phase调研阶段让 AI 当调研员去读现有的代码、查资料输出一份调研报告Spec Phase规范阶段根据调研结果写详细的 Spec包括要实现啥、怎么实现、怎么测试Plan Phase计划阶段把 Spec 拆成可执行的任务列表标记依赖关系Implementation Phase实现阶段让 AI 按照任务列表一步步执行每完成一个任务就提交一次代码Claude Code 在这个领域做得特别出色。它有个Plan Mode计划模式在这个模式下AI 只能读代码和问你问题不能写代码 。直到你们俩把方案对清楚了你批准了它才开始动手。这就避免了一上来就瞎写写完发现不对又得删的尴尬。Amazon 在 2026 年初推出的 Kiro IDE 更是把 SDD 直接集成到了编辑器里。它有个专门的Spec Mode你在左边写 Spec右边实时看到 AI 生成的代码两边是联动的。Spec 一改代码自动跟着改。但是啊Spec 阶段虽然比 Rule 阶段更 structured结构化了但还是有个大问题怎么保证 AI 生成的代码真的符合 Spec 呢毕竟 AI 可能会偷工减料或者理解偏差。这时候就需要第三个阶段——Harness。第三阶段Harness —— 自动验证与反馈就像给 AI 配了个质检员Harness 这个词原本在软件测试领域叫测试夹具就是一套自动化的测试环境。在 AI Coding 的语境下Harness 指的是把 AI 模型包裹起来的基础设施层负责管理上下文、验证输出、处理错误、编排多步任务 。听起来很抽象是吧我给你打个比方。想象 AI 是个厨师Rule 阶段就像是给他一本菜谱规定用什么食材、什么火候Spec 阶段就像是给他一张详细的订单客户要吃宫保鸡丁不要放花生多放葱。但是这个厨师可能会手滑把盐当糖放或者炒糊了。这时候就需要 Harness——一个自动化的质检系统。这个质检系统干啥呢每一步都检查厨师切完菜系统检查切得大小是否均匀炒完一个步骤系统尝尝咸淡最后出锅前系统拍张照片看看卖相。错了就反馈如果发现咸了系统不是简单说错了而是告诉厨师盐放多了建议加点糖中和一下或者加点水稀释。自动重试如果一次没做好让厨师重新做直到合格为止。记录全程把整个过程录下来万一客户投诉你能回溯看看到底是哪个环节出了问题。这就是 Stripe、Shopify、Airbnb 这些大厂在 2025-2026 年重点建设的 AI Coding Agent Harness 。具体来说一个完整的 Harness 包含这几个核心组件 Orchestration Loop编排循环这是 Harness 的心脏。AI 不是一口气把活干完的而是思考-行动-观察的循环。Harness 负责管理这个循环 assemble prompt组装提示词→ call LLM调用模型→ parse output解析输出→ execute tool calls执行工具调用→ feed results back反馈结果→ repeat until done重复直到完成。Tools工具集AI 能调用哪些工具都是 Harness 规定的。比如 Claude Code 提供了 19 个受权限控制的工具 包括读文件、写文件、执行 Shell 命令、Git 操作、Web 搜索等。Harness 不是让 AI 直接接触文件系统而是通过工具这个中间层。就像你给实习生配了个工具箱他要用啥工具得跟你申请你同意了才给。Validation验证层这是 Harness 最关键的部分。AI 每生成一段代码Harness 自动做以下检查语法检查能不能编译通过有没有语法错误类型检查TypeScript 类型对不对测试运行相关单元测试能不能通过规范检查是否符合项目的 lint 规则安全扫描有没有引入漏洞如果检查不通过Harness 不会把代码提交而是把错误信息结构化后反馈给 AI让它修复。这叫做Validation Loops验证循环[3]。Datadog 在 2026 年初分享他们的经验时把这个叫做Harness-First EngineeringHarness 优先工程[19]。他们的 BitsEvolve 项目用 LLM 优化代码性能但每次优化后都用生产流量做验证。结果实现了 10 倍的性能提升而且这些提升都是经过真实流量验证的不是看起来很快但实际有 Bug的优化。Multi-Agent Orchestration多智能体编排复杂任务一个 AI 搞不定Harness 支持多个专门的 AI 协作。比如一个 AI 负责读代码理解逻辑一个 AI 负责写新代码一个 AI 负责 review。Claude Code 的 Subagent 功能 就是干这个的你可以让主 AI 像项目经理一样 spawn派生出多个子 AI 并行工作最后汇总结果。Memory记忆系统AI 的上下文窗口是有限的Harness 负责管理长期记忆。短期记忆是当前对话的历史长期记忆是跨会话的项目知识。Claude Code 用三层记忆架构 轻量级索引总是加载、详细主题文件按需加载、原始转录通过搜索访问。你看到了 Harness 这个阶段AI Coding 才真正从一个聊天玩具变成了生产工具。因为这时候系统不再依赖人去检查 AI 的每一行代码而是有自动化的机制保证质量。这三个阶段是啥关系不是替代是叠加可能你会想既然 Harness 这么牛那是不是前面的 Rule 和 Spec 都不需要了不是的这三个阶段是渐进式叠加的关系就像你学武功先学扎马步Rule再学招式Spec最后学内功Harness。Rule 是基础就算到了 2026 年Cursor Rules 依然是每个项目的标配。没有规则AI 连基本的代码风格都把握不住。而且现在的 Rule 已经进化到了可以包含 Spec 的片段比如你可以写一个 Rule 说所有 API 接口必须先写 OpenAPI Spec再写实现代码。Spec 是桥梁Rule 太零散Harness 太技术化Spec 是连接人和 AI 的桥梁。产品经理能看懂 SpecAI 能根据 Spec 写代码Harness 能根据 Spec 验证代码。GitHub Spec Kit、Amazon Kiro、Tessl 这些工具 都是让 Spec 成为单一事实来源Single Source of Truth。Harness 是保障没有 Harness 的 Spec 就是一纸空文AI 可能阳奉阴违没有 Spec 的 Harness 就是无的放矢不知道要验证什么。只有三者结合才能既保证 AI 有发挥空间又保证不出大乱子。2026 年的最佳实践渐进式建设路径说了这么多如果你现在就想开始用该怎么一步步建设呢第一步从 Rule 开始Week 1-2给你的项目创建 .cursor/index.mdc 文件写上技术栈、代码风格、必用工具再加上一条“所有复杂功能必须先写 Spec再写代码”这时候你就能感受到 AI 输出质量的明显提升第二步引入 Spec 工作流Week 3-4装个 GitHub Spec Kit 或者直接用 Claude Code 的 Plan Mode每次做新功能先花 20 分钟写个 Spec描述清楚输入是什么、输出是什么、边界情况有哪些让 AI 根据 Spec 生成代码你会发现返工率大幅降低第三步搭建 HarnessWeek 5在 CI/CD 里加入自动化验证比如 PR 提交后自动跑测试、类型检查、lint如果是用 Claude Code可以用它的 Agent SDK 自定义权限规则比如不允许 AI 直接修改生产环境配置引入多 Agent 协作比如一个 Agent 写代码一个 Agent 专门做 Code ReviewDatadog 的工程师们总结得特别好 “Harness 不是让 AI 更聪明而是让 AI 可用。”The harness doesn’t make the AI smarter. It makes the AI usable.写在最后AI Coding 的本质是工程化回顾这三年2023-2026的发展AI Coding 从一个黑科技玩具变成了工程化实践。这和我们当年从手工作坊式编程进化到敏捷开发、DevOps 是一样的道理——工具再牛也需要工程化体系来约束和放大它的价值。Rule 解决的是风格一致性问题Spec 解决的是需求理解问题Harness 解决的是质量保证问题。这三个层次缺一不可。2026 年的今天如果你还在用 2023 年的方式对着 AI 聊天写代码那真的就 out 了。赶紧把这仨组合拳用起来你会发现 AI 从一个需要 babysit 的实习生变成了能独立承担任务的工程师。当然啦这套体系也不是一蹴而就的。就像我开头说的别指望明天就能去马尔代夫但你至少可以从今天开始先写个 .cursorrules 文件试试说不定写完你会发现AI 写的代码终于能看了呢咱们下篇文章再见到时候我再给大家详细讲讲怎么写一份好的 Spec让 AI 真正理解你的需求。记得点赞分享哦PS目前国内还是很缺AI人才的希望更多人能真正加入到AI行业共同促进行业进步增强我国的AI竞争力。想要系统学习AI知识的朋友可以看看我精心打磨的教程 http://blog.csdn.net/jiangjunshow教程通俗易懂高中生都能看懂还有各种段子风趣幽默从深度学习基础原理到各领域实战应用都有讲解我22年的AI积累全在里面了。注意教程仅限真正想入门AI的朋友否则看看零散的博文就够了。

相关文章:

从 Rule、Spec 到 Harness:AI Coding 的渐进式建设路径

文章目录前言第一阶段:Rule —— 给 AI 立规矩,就像教小孩认字第二阶段:Spec —— 先写文档再写代码,就像盖房子先画图纸第三阶段:Harness —— 自动验证与反馈,就像给 AI 配了个质检员这三个阶段是啥关系&…...

分析Python条件变量如何暂停和唤醒线程

在开始前,先了解一下基本使用 Condition Condition 本质上是一个带有等待队列的锁,它封装了: 一个底层锁(Lock 或 RLock)一个等待者队列(_waiters) 核心方法方法作用wait(timeout)释放锁并阻塞等…...

通俗易懂讲透贝叶斯优化

通俗易懂讲透贝叶斯优化(本科生/研究生都能看懂) 本文用大白话生活比喻公式拆解可运行代码对比总结,把贝叶斯优化从原理、流程、优缺点到适用场景讲得明明白白,适合机器学习、AutoML、超参数调优、面试复习。一、先搞懂&#xff1…...

一文搞懂 Spring Cloud:从入门到实战的微服务全景指南(建议收藏)蜗

一、中间件是啥?咱用“餐厅”打个比方 想象一下,你的FastAPI应用是个高级餐厅。 ?? 顾客(客户端请求)来到门口。- 迎宾(CORS中间件):先看你是不是从允许的街区(域名)来…...

2026届最火的六大AI辅助写作工具实际效果

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 在当下的学术环境当中,AI论文网站给研究者供给高效的辅助工具,这类平…...

Burpsuite之暴力破解+验证码识别 | 添柴不加火敢

springboot自动配置 自动配置了大量组件,配置信息可以在application.properties文件中修改。 当添加了特定的Starter POM后,springboot会根据类路径上的jar包来自动配置bean(比如:springboot发现类路径上的MyBatis相关类&#xff…...

你的终端神器之Oh My Zsh吭

1.安装环境准备 1.1.查看物理内存 [rootaiserver ~]# free -m 1.2.操作系统版本 [rootaiserver ~]# cat /etc/redhat-release 1.3.操作系统内存 [rootaiserver ~]# df -h /dev/shm/ 1.4.磁盘空间 [rootaiserver ~]# df -TH [rootaiserver ~]# df -h /tmp/ [rootaiserver ~]# d…...

2026届最火的五大降AI率助手实测分析

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 于内容创作范畴之中,将AI生成的痕迹予以降低,此即降AI率&#xff0c…...

精益目视设计全指南 | 2026工厂目视化从0到1全流程(第一弹)

2026 年,精益生产早已成为制造企业降本增效、规范管理的核心抓手,而精益目视设计(精益目视化设计),正是精益生产、5S/6S 管理、TPM 设备管理落地的核心载体,被称为现场管理的 “无声管理者”。但绝大多数工…...

【快速EI检索 | SPIE出版】2026通信系统与通信网络国际学术会议(CSACN 2026)

2026通信系统与通信网络国际学术会议(CSACN 2026) 2026 International Conference on Communication Systems and Networks 2026年5月15-17日 | 中国-西双版纳 大会官网:https://www.iccsacn.org/ 截稿时间:见官网&#xff0…...

突破学术资源获取壁垒:Unpaywall开源工具全解析

突破学术资源获取壁垒:Unpaywall开源工具全解析 【免费下载链接】unpaywall-extension Firefox/Chrome extension that gives you a link to a free PDF when you view scholarly articles 项目地址: https://gitcode.com/gh_mirrors/un/unpaywall-extension …...

3步实现QQ空间历史记录本地存储:面向普通用户的数据备份工具使用指南

3步实现QQ空间历史记录本地存储:面向普通用户的数据备份工具使用指南 【免费下载链接】GetQzonehistory 获取QQ空间发布的历史说说 项目地址: https://gitcode.com/GitHub_Trending/ge/GetQzonehistory 问题场景:那些正在消失的数字记忆 2023年某…...

【系统架构师-案例题-分布式数据缓存架构】22年下(3)分布式仓储货物管理系统

一、完整题目 【说明】 某大型电商平台建立了一个在线B2B商店系统,并在全国多地建设了货物仓储中心,通过提前备货的方式来提高货物的运送效率。但是在运营过程中,发现会出现很多跨仓储中心调货从而延误货物运送的情况。为此,该企业…...

开源能源管理实战指南:从零开始掌握OpenEMS系统应用

开源能源管理实战指南:从零开始掌握OpenEMS系统应用 【免费下载链接】openems OpenEMS - Open Source Energy Management System 项目地址: https://gitcode.com/gh_mirrors/op/openems OpenEMS(开源能源管理系统)作为一款模块化的能源…...

使用Microsoft Agent Framework构建C# AI代理握

简介 langchain中提供的chain链组件,能够帮助我门快速的实现各个组件的流水线式的调用,和模型的问答 Chain链的组成 根据查阅的资料,langchain的chain链结构如下: $$Input \rightarrow Prompt \rightarrow Model \rightarrow Outp…...

L型热收缩包装机选型:产业集群优势下的自动化包装方案解析

一、行业包装自动化的关键挑战在现代化生产体系中,包装环节正面临多维度的效率压力。传统纸箱包装不仅材料成本居高不下,仓储空间占用问题也日益突出。更为关键的是,手工包装速度难以匹配高速生产线的产出节奏,这种产能不匹配现象…...

AI开发-python-langchain框架(--串行流程 )悼

一、前言:什么是 OFA VQA 模型? OFA(One For All)是字节跳动提出的多模态预训练模型,支持视觉问答、图像描述、图像编辑等多种任务,其中视觉问答(VQA)是最常用的功能之一——输入一张…...

实测Z-Image-Turbo_UI界面:生成效果展示与使用技巧分享

实测Z-Image-Turbo_UI界面:生成效果展示与使用技巧分享 1. 快速上手:UI界面初体验 Z-Image-Turbo_UI界面提供了一种极其简单的图像生成方式,无需复杂配置即可快速体验AI绘画的魅力。启动服务后,只需在浏览器中输入http://localh…...

【LangChain 0.3 - 1 - 常用组件】 + 可运行 Agent 实战

一、常用核心组件 1. 聊天模型 ChatModels from langchain_openai import ChatOpenAI# 初始化大模型(大脑) llm ChatOpenAI(model"gpt-3.5-turbo",api_key"sk-xxxxxxxxxxxxxxxx", # 替换为自己的API Keytemperature0.1, # 数值…...

每日安全情报报告 · 2026-04-09

每日安全情报报告 2026-04-09 发布时间:2026-04-09 11:33 报告周期:近 24–48 小时 风险标注:🔴 严重(CVSS ≥ 9.0)|🟠 高危(CVSS 7.0–8.9)|&am…...

周末收听:中国之声DRM短波信号实收记录

本周末(4月4日)在成都用接收了CNR中国之声的DRM短波广播,记录了13825 kHz和13810 kHz两个频率的信号数据。一个从北京发射,一个从昆明发射,传播路径和信号特征差异明显。接收条件接收地点:成都。接收时间&a…...

5分钟搞定Linux打印机驱动:foo2zjs终极配置指南

5分钟搞定Linux打印机驱动:foo2zjs终极配置指南 【免费下载链接】foo2zjs A linux printer driver for QPDL protocol - copy of http://foo2zjs.rkkda.com/ 项目地址: https://gitcode.com/gh_mirrors/fo/foo2zjs 你是否曾经在Linux系统上为打印机驱动而烦恼…...

购物团截图自动马赛克地址,手机号码

订单截图隐私信息自动脱敏工具一、工具概述 本工具是基于 Python OCR 技术开发的电商订单截图隐私自动脱敏工具,针对淘宝、京东、拼多多等主流电商平台订单截图,自动识别并对收货地址、手机号码等敏感信息进行马赛克打码,实现隐私保护。 工具…...

OpenClaw备份恢复方案:千问3.5-35B-A3B-FP8任务配置的迁移技巧

OpenClaw备份恢复方案:千问3.5-35B-A3B-FP8任务配置的迁移技巧 1. 为什么需要备份OpenClaw配置 上周我的主力开发机突然硬盘故障,导致所有数据丢失。最让我痛心的不是代码,而是精心调校了三个月的OpenClaw自动化工作流——包括对接千问3.5模…...

2026开发者App质量监控工具盘点与选型

2026开发者App质量监控工具盘点与选型 质量导航君 头像: 粉丝数:9.6万|获赞数:42.7万 专注开发者工具选型科普,长期输出真实测评与场景解法,帮你在繁杂方案中快速锁定匹配工具。本期聚焦App质量监控领域&a…...

三个角度分析AI自动写文+自动发布自媒体矩阵提效实测

搞自媒体干久了,有谁没动过心思琢磨能不能让机器来帮忙写、帮忙发?尤其是你手头上攥着五六个账号,天天瞅着不同平台的规则、排版、发布时间的安排,脑袋都快给弄炸。最近我试了这么一个流程:用人工智能自动去写文章然后…...

Pyplot在图表显示中文--配置文件法

希望所有 Matplotlib 图表都默认使用黑体、红色线条、圆形标记步骤1:找到/创建配置文件 运行以下代码找到配置文件路径: import matplotlib print(matplotlib.matplotlib_fname())假设输出:C:\Users\你的用户名\.matplotlib\matplotlibrc 如果…...

**标题:MLOps实战进阶:用Python+Docker+Kubernetes打造自动化模型部署流水

标题:MLOps实战进阶:用PythonDockerKubernetes打造自动化模型部署流水线 在现代机器学习工程中,模型从实验到上线的全流程自动化已成为企业级落地的关键瓶颈。传统手动部署模式不仅效率低下,还容易因环境差异导致“在我电脑上能跑…...

【Swoole微服务适配黄金法则】:基于127个真实项目数据验证的8项兼容性阈值指标(含QPS衰减预警公式)

第一章:Swoole微服务适配黄金法则的提出背景与核心价值随着 PHP 生态在高并发、低延迟场景中的持续演进,传统 FPM 架构在微服务化进程中暴露出连接开销大、进程模型僵化、协程支持缺失等系统性瓶颈。Swoole 作为 PHP 原生高性能网络引擎,凭借…...

SDMatte多GPU并行推理配置:提升企业级批量处理吞吐量

SDMatte多GPU并行推理配置:提升企业级批量处理吞吐量 1. 为什么需要多GPU并行推理 当企业需要处理大批量图片时,单张GPU往往难以满足需求。想象一下,你有一家电商公司,每天需要处理上万张商品图片的背景替换。如果只用一张GPU&a…...