当前位置: 首页 > article >正文

Harness Engineering 是什么?三层演化,搞懂 AI Agent 的真正驱动力

提示词工程、上下文工程、Harness Engineering——一文说透附四张原创图解很多人搭 AI Agent卡在同一个地方照着教程写了提示词Agent 还是跑偏、忘事、乱执行。问题不在提示词写得不够好——是你对整个概念体系的理解停留在了第一层。这篇文章带你把三个容易混淆的概念——提示词工程、上下文工程、Harness Engineering——从起源到关系彻底理清。01 提示词工程起点但不是全部提示词工程Prompt Engineering是大多数人接触 AI 的第一课。核心动作就三件事写任务描述、加 few-shot 示例、规定输出格式。工作流极其简单[手工指令 示例 格式] → 大模型 → 文本输出↑ 图1提示词工程流程图在简单的单轮对话场景下好用但它有四个硬局限单次对话、无记忆、无工具、无反馈循环。一旦任务变成「帮我完成这个多步骤的项目」就彻底力不从心了。02 上下文工程才是真正的艺术与科学2025 年Andrej Karpathy 和 Shopify CEO Tobi Lutke 先后为一个新概念背书上下文工程Context EngineeringKarpathy 原话“在每一个工业级 LLM 应用里上下文工程是将恰当信息填满上下文窗口的微妙艺术与科学。”核心转变不是「写一段提示词」而是管理整个上下文窗口里装什么。上下文窗口能装的东西远不止提示词RAG 检索结果、工具定义、Few-shot 示例、对话历史、状态信息、规则文件……加上执行层的结果反馈写回形成完整的 ReAct 循环。↑ 图2上下文工程流程图 — 六格上下文窗口 ReAct 反馈闭环关键结论提示词工程 ⊂ 上下文工程。提示词只是上下文的一个子集。03 Harness EngineeringAI Agent 的最终形态2026 年随着 Coding Agent 大规模落地一个新术语出现了。Harness Engineering由开发者 Viv 提出随后经 OpenAI 推广文章标题是Harness engineering: leveraging Codex in an agent-first world核心公式只有一句话Agent 大模型 HarnessHarness 大模型之外的一切。↑ 图3Harness Engineering 架构图 — Agent 大模型 Harness展开六个组件具体包含六类组件System Prompt全局角色与行为约束Tools / MCP工具调用能力AGENTS.md 规则文件针对特定代码库的规范Sub-agents子 Agent 协作处理复杂任务验证 Sensors观察执行结果并触发反馈反压 Back-pressure防止 Agent 跑偏的控制机制Martin FowlerThoughtWorks专文分析将 Harness 的作用总结为两类控制Feedforward前馈执行前告诉 Agent 怎么做提高首次成功率Feedback反馈观察执行结果让 Agent 自我纠正重要限定Harness Engineering 的核心场景是 Coding Agents编程 Agent不是泛指所有 AI Agent。04 一个必须纠正的误解很多文章包括一些传播很广的图把三者描述成进化链提示词工程 → 上下文工程 → Harness Engineering越来越高级。这个关系方向是错的。↑ 图4概念关系澄清图 — CE 大框包裹 PE 和 HE底部红色纠错条正确的关系是包含关系Context Engineering 才是上位概念HumanLayer 博客“Harness engineering is a subset of context engineering”Martin Fowler“Engineering a user harness for a coding agent is a specific form of context engineering”一句话总结PE ⊂ CEHE ⊂ CEHE 不是 CE 的升级版而是 CE 在 Coding Agent 场景的落地实践。写在最后把三个概念提炼成三句话提示词工程告诉模型该做什么单次、静态上下文工程管理模型在每一步能看到什么动态、系统化Harness Engineering给 Coding Agent 搭建能自我纠错的运行环境可靠性工程如果你正在用 Claude Code、Cursor 或任何 Coding Agent——你每天在做的那些配置工作其实就是 Harness Engineering写 AGENTS.md、接 MCP、设置 hooks、拆分 sub-agent 任务。只是以前没有一个好名字现在有了。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

相关文章:

Harness Engineering 是什么?三层演化,搞懂 AI Agent 的真正驱动力

提示词工程、上下文工程、Harness Engineering——一文说透,附四张原创图解 很多人搭 AI Agent,卡在同一个地方: 照着教程写了提示词,Agent 还是跑偏、忘事、乱执行。 问题不在提示词写得不够好——是你对整个概念体系的理解&am…...

从VHDL到C指针:手把手拆解ZYNQ里PS用BRAM访问PL寄存器的完整数据通路

从VHDL到C指针:ZYNQ异构系统中PS与PL数据交互的深度解析 在嵌入式系统开发领域,Xilinx ZYNQ系列SoC因其独特的ARM处理器(PS)与FPGA(PL)异构架构而备受青睐。这种架构为开发者提供了前所未有的灵活性,但同时也带来了复杂的数据交互挑战。本文将…...

深入浅出Oracle RAC:gc buffer busy acquire等待事件的原理与优化策略

深入浅出Oracle RAC:gc buffer busy acquire等待事件的原理与优化策略 在Oracle RAC环境中,gc buffer busy acquire等待事件是影响性能的关键因素之一。这种等待事件通常发生在多个会话同时请求访问同一数据块时,特别是在跨实例访问的场景下。…...

uview-plus Picker组件实战:动态加载省市区数据的联动技巧

1. 为什么需要动态加载省市区数据 省市区三级联动是移动端开发中非常常见的功能需求,比如用户注册、地址填写、物流信息等场景都会用到。传统的做法是直接将完整的省市区数据打包到前端,但这种方式存在几个明显的问题: 首先,完整的…...

图文理解准确率提升23.6%的关键操作,深度复现SITS2026官方未公开的微调Checklist

第一章:SITS2026深度解析:图文理解模型优化 2026奇点智能技术大会(https://ml-summit.org) SITS2026(Semantic-Interleaved Text-Image System 2026)是面向多模态大模型推理效率与细粒度对齐能力双重瓶颈所提出的新一代图文理解架…...

如何快速搭建App Privacy Policy Generator:从项目结构到技术选型全解析

如何快速搭建App Privacy Policy Generator:从项目结构到技术选型全解析 【免费下载链接】app-privacy-policy-generator Generate a customized Privacy Policy and Terms of Use document for your mobile apps 项目地址: https://gitcode.com/gh_mirrors/ap/ap…...

【CANN训练营】自定义算子开发实战指南

1. 为什么需要自定义算子开发 在深度学习领域,算子(Operator)是构成神经网络的基本计算单元。就像搭积木一样,每个算子负责完成特定的计算任务,多个算子组合起来就能实现复杂的AI模型功能。昇腾AI处理器提供的CANN&…...

Qwen3-32B大模型并发性能优化实战:从理论估算到压力测试

1. Qwen3-32B并发性能优化的核心挑战 第一次在8张A10显卡上部署Qwen3-32B模型时,我遇到了典型的"显存充足但吞吐量上不去"的困境。这个拥有320亿参数的大家伙,就像个挑食的巨人——给它喂FP16精度的数据时,单是加载模型就要吃掉64G…...

ExtractorSharp:5步掌握专业游戏资源编辑工具的高效使用

ExtractorSharp:5步掌握专业游戏资源编辑工具的高效使用 【免费下载链接】ExtractorSharp Game Resources Editor 项目地址: https://gitcode.com/gh_mirrors/ex/ExtractorSharp ExtractorSharp是一款功能强大的游戏资源编辑软件,专为游戏开发者和…...

如何从源码编译安装ejabberd:构建高性能XMPP服务器的完整指南

如何从源码编译安装ejabberd:构建高性能XMPP服务器的完整指南 ejabberd是一款功能强大的开源即时通讯服务器,支持XMPP、MQTT和SIP协议,以其稳定性和可扩展性被广泛应用。本指南将带你完成从源码编译安装ejabberd的全过程,即使是新…...

遗传算法优化技巧:如何用PMX交叉提升Python求解效率

遗传算法优化实战:PMX交叉在Python中的高效实现与调优 当你在解决旅行商问题(TSP)或排班优化时,是否遇到过传统交叉算子导致无效解激增的情况?部分匹配交叉(PMX)正是为解决这类排列编码问题而生的利器。作为遗传算法中最高效的交叉算子之一&a…...

Leaflet使用Glify加载海量点、线、面数据,可加载几百万数据

源代码地址:Leaflet: https://gitee.com/SunBear/Leaflet 效果如图: vue中安装引入leaflet组件及相关插件: npm i leaflet npm i leaflet.glify // vue中引入 import * as L from "leaflet"; import "leaflet/dist/leaflet.c…...

从拼写检查到词典应用:二叉搜索树(BST)的K/V模型实战,用C++实现一个简易单词本

从拼写检查到词典应用:二叉搜索树(BST)的K/V模型实战,用C实现一个简易单词本 在编程学习过程中,数据结构常常让人感到抽象难懂。我们可能已经掌握了二叉搜索树(BST)的基本操作,却不知…...

免费开源Altium电路图转换器:无需专业软件查看SchDoc文件的终极指南

免费开源Altium电路图转换器:无需专业软件查看SchDoc文件的终极指南 【免费下载链接】python-altium Altium schematic format documentation, SVG converter and TK viewer 项目地址: https://gitcode.com/gh_mirrors/py/python-altium 你是否经常遇到这样的…...

Twisted Trial测试框架终极指南:异步代码单元测试的7个最佳实践

Twisted Trial测试框架终极指南:异步代码单元测试的7个最佳实践 Twisted Trial是Python中最强大的异步单元测试框架,专为测试基于Twisted的事件驱动网络应用程序而设计。作为Twisted框架的官方测试组件,Trial扩展了Python标准库的unittest模…...

Visual C++ Redistributable AIO 架构解析:企业级运行时环境统一管理方案

Visual C Redistributable AIO 架构解析:企业级运行时环境统一管理方案 【免费下载链接】vcredist AIO Repack for latest Microsoft Visual C Redistributable Runtimes 项目地址: https://gitcode.com/gh_mirrors/vc/vcredist 在Windows生态系统中&#xf…...

终极SOCD解决方案:如何用Hitboxer解决游戏键盘输入冲突,提升操作精度80%

终极SOCD解决方案:如何用Hitboxer解决游戏键盘输入冲突,提升操作精度80% 【免费下载链接】socd Key remapper for epic gamers 项目地址: https://gitcode.com/gh_mirrors/so/socd 你是否曾在激烈的游戏对抗中,因为同时按下相反方向键…...

Cursor Pro破解工具完整指南:免费解锁AI编程助手高级功能

Cursor Pro破解工具完整指南:免费解锁AI编程助手高级功能 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve reached your …...

如何5分钟搞定抖音批量下载:douyin-downloader开源工具终极指南

如何5分钟搞定抖音批量下载:douyin-downloader开源工具终极指南 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallb…...

R3nzSkin:英雄联盟安全换肤工具的技术实现与最佳实践

R3nzSkin:英雄联盟安全换肤工具的技术实现与最佳实践 【免费下载链接】R3nzSkin Skin changer for League of Legends (LOL) 项目地址: https://gitcode.com/gh_mirrors/r3n/R3nzSkin R3nzSkin是一款针对《英雄联盟》游戏开发的开源内存换肤工具,…...

终极Mantle开发问题解决指南:从GitHub Issues到Stack Overflow的实战技巧

终极Mantle开发问题解决指南:从GitHub Issues到Stack Overflow的实战技巧 【免费下载链接】Mantle Model framework for Cocoa and Cocoa Touch 项目地址: https://gitcode.com/gh_mirrors/ma/Mantle Mantle作为Cocoa和Cocoa Touch的Model框架,在…...

Qwen3.5-2B效果展示:对模糊车牌图的字符识别+车辆类型+颜色判断

Qwen3.5-2B效果展示:对模糊车牌图的字符识别车辆类型颜色判断 1. 模型简介 Qwen3.5-2B是一款轻量化多模态基础模型,属于Qwen3.5系列的小参数版本(20亿参数)。该模型主打低功耗、低门槛部署,特别适配端侧和边缘设备&a…...

基于微信小程序实现互助学习管理系统【附项目源码+论文说明】

基于java和微信小程序实现互助学习系统演示【内附项目源码LW说明】摘要 随着信息技术在管理上越来越深入而广泛的应用,管理信息系统的实施在技术上已逐步成熟。本文介绍了微信互助学习平台的开发全过程。通过分析微信互助学习平台管理的不足,创建了一个…...

【实战解析】三维Copula建模:从数据导入到联合分布计算全流程

1. 数据准备与伪观测值转换 做三维Copula建模的第一步,就是把原始数据处理好。我习惯用CSV格式存储数据,因为兼容性好,不需要额外安装包。这里用R语言演示,先加载必要的工具包: library(copula) # 核心Copula函数 lib…...

保姆级教程:在Ubuntu 20.04上从源码编译Autoware.universe (ROS2 Galactic) 的完整避坑指南

从零构建Autoware.universe开发环境:Ubuntu 20.04与ROS2 Galactic深度避坑指南 自动驾驶开发环境的搭建往往充满挑战,特别是当涉及到复杂的开源框架如Autoware.universe时。本文将带您一步步完成从系统准备到最终编译的完整流程,特别针对Ubun…...

Marinara数据存储与历史统计:使用Chrome Storage API的完整方案

Marinara数据存储与历史统计:使用Chrome Storage API的完整方案 【免费下载链接】marinara Pomodoro time management assistant for Chrome 项目地址: https://gitcode.com/gh_mirrors/ma/marinara Marinara是一款专为Chrome浏览器设计的番茄工作法时间管理…...

从零到一:EVE-NG网络仿真平台部署与多厂商设备集成实战

1. EVE-NG网络仿真平台初探 第一次接触EVE-NG是在三年前的一个企业级网络项目上,当时客户要求同时测试华为、思科和Juniper三家厂商设备的互联方案。传统模拟器要么功能受限,要么只能支持单一厂商设备,直到同事推荐了这款"网络工程师的瑞…...

Hermes与OpenClaw大比拼:谁才是AI Agent的王者?

AI热潮下的Hermes自从上周开始折腾Hermes,从研究到部署再到使用,原本以为它是个小众的AI产品,没想到直接在全球引爆了新的AI热潮。然而,很多人对Hermes的理解存在问题甚至是错误的。为此,准备了10个问题,有…...

网络安全自查清单:如何用Nmap快速检测你公司的‘三高一弱‘风险点?

企业网络安全实战:用Nmap精准定位"三高一弱"风险 当企业网络规模不断扩大,安全风险也随之增加。作为安全负责人,你是否曾担心过那些隐藏在系统中的高危漏洞、开放的高风险端口、异常的外连流量以及脆弱的登录凭证?这些…...

GridDB集群管理实战:构建高可用分布式数据库架构

GridDB集群管理实战:构建高可用分布式数据库架构 【免费下载链接】griddb GridDB is a next-generation open source database that makes time series IoT and big data fast,and easy. 项目地址: https://gitcode.com/gh_mirrors/gr/griddb GridDB是下一代…...