当前位置: 首页 > article >正文

AI Harness 到底是个啥?6 张图给你讲明白

最近AI 圈有个很火的词叫 Harness原意是马的“挽具”或“缰绳”。我之前曾写文章简单介绍过这个概念。OpenClaw 火了你准备好和它一起工作了吗但今天看到 Sebastian Raschka 博士的一篇文章它对 Harness 的解释堪称全面且透彻。我之所以想和大家分享这篇文章的核心观点是因为作者没有纸上谈兵。他亲手编写了一个极简版的 Harness 框架 Coding Agent并在实践中提炼出了 Harness 的 6 大核心组件。文章图文并茂地解释了 Harness 究竟是什么以及它为何如此重要。原文链接https://magazine.sebastianraschka.com/p/components-of-a-coding-agentLLM、Agent、Harness 啥关系在深入探究之前我们得先理清几个容易混淆的概念。千万别把大语言模型LLM和智能体Agent画等号。我们可以用“造汽车”来打个通俗的比方大模型LLM它是汽车的“发动机”。早期的 GPT-3、GPT-4核心能力是“文字接龙”。推理模型Reasoning Model它是一款“带涡轮增压的超级发动机”。在开口说话前它会在脑子里先打草稿、自我验证即 Thinking 过程。Agent智能体它是这辆车的“自动驾驶系统”。Agent 是一个循环Loop。当你下达“帮我修个 Bug”的指令时Agent 会自己做决策第一步看哪段代码第二步用什么工具报错了怎么纠正什么时候完成任务并交差。Harness框架这是围绕着发动机和司机打造的“汽车底盘、方向盘和仪表盘”。没有它Agent 就无法与真实世界交互。它负责帮模型读取本地文件、运行终端命令、管理各种工具。LLM / Agent / Harness 关系图大模型再聪明如果被关在网页聊天框里它也看不见你本地电脑里的项目结构。LLM Agent Harness 这套系统的出现彻底改变了游戏规则。模型提供“引擎”算力Agent 循环驱动问题被迭代解决而 Harness 提供的运行时支持则像“水电管道”一样构成了底层基础设施。Coding Harness 编程 Harness解剖 Harness 的六大核心组件当我们谈论 Harness框架时通常是指包裹在模型外围的那层软件系统。这套系统就像个“大管家”负责组装提示词、提供可用工具、追踪文件状态、应用代码修改、运行终端命令、管理权限、缓存提示词前缀、存储记忆等一系列脏活累活。在如今的大模型时代相比于在网页端干聊正是这层框架决定了我们绝大部分的 AI 体验。接下来我们就以 Raschka 博士的“迷你编程智能体”为例盘点 Coding Harness 的 6 大核心组件。Mini Coding Agent: https://github.com/rasbt/mini-coding-agent1. 实时上下文如果你直接在聊天框里对 AI 喊一句“帮我修一下测试代码的报错”。这就好比拉来一个对业务一无所知的程序员帮你看代码。结果肯定是满头大汗这是什么项目用的什么框架在哪报的错大模型也是如此。如果不知道你的代码仓库长什么样它就只能“瞎蒙”。但在 Harness 系统里情况完全不同。当你下达指令的瞬间Harness 会在后台迅速扫描代码库收集“情报”项目类型、文件目录排布、最新的代码提交记录等。随后它会自动生成一份简明的工作区摘要连同你的指令一起打包递给大模型。这样一来AI 每次接到新指令时就拥有了全局视野不再是大脑一片空白。2. 提示词缓存赋予 AI 全局视野后随之而来的是一个致命的体验问题如果每次对话AI 都要把项目从头到尾重新读一遍结果必然是又慢、又卡、还极其烧钱。为了解决这个问题Harness 引入了提示词的结构化设计与缓存复用。它会对信息进行“干湿分离”稳定前缀Stable Prefix包含不常变动的信息如 Agent 的人设、系统指令、可用工具列表、项目基础概况等。这部分会被系统缓存起来。动态状态Session State包含最新的聊天记录、AI 的短期记忆以及你刚刚下达的指令。每次对话大模型真正需要重新计算和处理的只有那一点点“动态状态”从而大幅提升了响应速度并降低了 API 成本。3. 工具用大模型写过代码的人都经历过这种痛点AI 甩出一段代码和几行终端命令你得自己复制粘贴、自己运行一旦报错还得把鲜红的报错信息再复制回网页问它。当跨入 Harness 领域时最大的质变发生了AI 长出了“手和脚”能亲自在你电脑里搜文件、改代码、跑测试。Harness 会提前给 AI 准备一个预设好的“工具箱”例如查看文件、读取文件、执行终端命令、修改代码。你可能会担心“让 AI 直接在我的电脑上运行命令万一它操作失控把数据库删了怎么办”别慌Harness 不仅给了 AI 手脚还给它戴上了“紧箍咒”。当 AI 提交行动申请后指令并不会立刻执行Harness 会在后台进行严密的拦截检查“这是已知的合法工具吗” “提供的参数格式正确吗” “这个高危操作需要用户点击授权吗” “它要访问的文件路径是否超出了当前工作区 (Workspace) 的限制”这种看似限制 AI 自由的机制反而换来了极高的系统安全性和可用性。4. 上下文管理在多轮编程对话中Agent 会不断读取长文件、接收冗长的工具输出和报错日志。AI 的“临时记事本”很容易被塞满这在专业上称为 Context Bloat上下文膨胀。如果不加节制不管多大的窗口分分钟都会被撑爆。Harness 主要是通过两套动作给 AI 的记忆“做瘦身”动作一暴力裁剪 (Truncation)Harness 会像无情的剪刀手将过长的日志或文档强制截断。它绝不允许单篇长篇大论霸占 AI 宝贵的脑容量。动作二去重与摘要 (Deduplication Summarization)如果在解决一个 Bug 的过程中AI 反复查看了同一个核心代码文件好几次Harness 会合并这些多余的读取记录。它还会将完整的历史记录浓缩成更适合放入提示词的摘要。真正的高手设计往往就藏在这些控制上下文长度的枯燥细节里。5. 会话记忆 (Session Memory)既然历史记录被精简了万一以后要查“旧账”怎么办这就引出了 Harness 核心的底层机制存储维度的双轨记忆结构。成熟的 Harness 系统会极其聪明地将记忆拆分成两本截然不同的“账本”完整对话记录 (Full Log)你输入的指令、系统吐出的每一行长日志、AI 的每一句回复都会被一字不落地记录在本地硬盘。这本账本是为了“留底”也是为了重建提示词 提供近期历史的准确快照。工作记忆 (Working Memory)这本账本极其精简没有啰嗦的运行日志只记录当前任务的关键情报。它会随着工程的推进不断擦除和更新侧重于保持任务的连贯性 防止 AI 在漫长的 debug 中“迷失自我”。6. 子智能体 (Subagents)顶级 Harness 还祭出了最后一件大杀器子智能体Subagents。简单来说就是让主模型学会“当老板”。当主 Agent 推进主线任务时突然遇到一个棘手的边缘问题比如某个冷门的测试跑不通。过去它只能停下核心工作去翻遍几十个文件找答案。但在 Harness 框架下主 Agent 会动态召唤出一个“子智能体”“你去把那个测试跑不通的原因查清楚只向我汇报结果。” 主 Agent 继续思考核心逻辑小弟在后台吭哧吭哧翻日志。关键在于Harness 必须对子智能体实施严格的权限控制Bounded。如果小弟没有被限制权力它可能会为了修一个边缘 Bug一顿乱改毁了你的核心代码或者它自己又去召唤一堆“孙子 Agent”导致系统无限套娃。因此Harness 在召唤小弟时会给它戴上极其严格的“镣铐”。小弟继承了老大的一部分上下文但权限被死死锁住通常处于“只读”模式或受限沙箱中。老大负责运筹帷幄把控主线小弟负责跑腿死磕支线细节。总结到这里我们一口气拆解了 Harness 的 6 大核心部件。当然在真正的系统源码中这六个组件是互相穿插、紧密咬合的。为什么我们要费这么大劲去搞懂这些底层逻辑因为一旦你在脑海中建立起这套高维度的“心智模型”。你会深刻地明白真正能让大模型从“聊天玩具”蜕变成“生产力工具”的正是外面这层看不见、摸不着的 Harness 系统。它补足了大模型的短板赋予了 AI 视野、记忆、手脚以及团队协作的能力。最近文章列表[1] Claude Code 竟然暗藏了 187 种“思考”状态[2] 手搓了一个 Skill让 AI 画出我心目中的流程图[3] 智能体 Skill 入门教程附下载地址[4] 两年踩坑换来这条 AI 学习路径[5] 难怪 Skill 不好用来看看 Google 总结的 5 种 Skill 设计模式[6] AI 是怎么学会唠嗑的系统提示词又是什么[7] Claude 控诉中国 AI 组团“偷家”到底什么是“大模型蒸馏”[8] 价值 3000 元的 AI 内部培训课今天我把它“开源”了[9] 拆解 AI 的大脑看懂谷歌“弱智”提示词[10] 日均30万亿拆解 AI 时代的“计量单位” Token[11] 2 分钟讲透为什么 AI 会胡说八道附避坑指南[12] AI 的回复怎么完美转 Word只要看懂这个格式 Markdown效率翻倍[13] 学习 AI 的最大障碍不懂大模型背后的灵魂[14] Vibe Coding 提示词指南内附编程提示词速查表[15] 为什么你的 AI 用得没别人好AI 真正的核心不是提示词而是逆向工程

相关文章:

AI Harness 到底是个啥?6 张图给你讲明白

最近,AI 圈有个很火的词叫 Harness(原意是马的“挽具”或“缰绳”)。我之前曾写文章简单介绍过这个概念。OpenClaw 火了,你准备好和它一起工作了吗?但今天看到 Sebastian Raschka 博士的一篇文章,它对 Harn…...

暗黑破坏神2存档编辑器:5分钟打造你的完美角色

暗黑破坏神2存档编辑器:5分钟打造你的完美角色 【免费下载链接】d2s-editor 项目地址: https://gitcode.com/gh_mirrors/d2/d2s-editor 还在为刷不到心仪的装备而烦恼吗?还在为角色build不够完美而反复重练吗?d2s-editor为你提供了一…...

Ollama镜像免配置优势解析:ChatGLM3-6B-128K无需conda/pip手动依赖

Ollama镜像免配置优势解析:ChatGLM3-6B-128K无需conda/pip手动依赖 1. 开篇:告别繁琐配置的AI部署新时代 如果你曾经尝试过在本地部署AI大模型,一定经历过这样的痛苦:安装Python环境、配置CUDA驱动、解决依赖冲突、处理版本兼容…...

语音信号处理中的频谱特征:幅度谱、相位谱、能量谱的区别与应用场景

语音信号处理中的频谱特征:幅度谱、相位谱、能量谱的区别与应用场景 在语音信号处理领域,频谱分析是理解声音本质的核心工具。当我们面对一段录音时,时域波形只能告诉我们声音的振幅随时间变化的情况,而频域分析则揭示了声音的&qu…...

Windows 10/11经典游戏兼容性终极解决方案:DDrawCompat完整使用指南

Windows 10/11经典游戏兼容性终极解决方案:DDrawCompat完整使用指南 【免费下载链接】DDrawCompat DirectDraw and Direct3D 1-7 compatibility, performance and visual enhancements for Windows Vista, 7, 8, 10 and 11 项目地址: https://gitcode.com/gh_mirr…...

静态代码分析:抽象语法树遍历与模式匹配

静态代码分析:抽象语法树遍历与模式匹配 在软件开发中,代码质量直接影响系统的稳定性和可维护性。静态代码分析作为一种无需运行程序即可检测潜在问题的方法,已成为现代开发流程中的重要工具。其中,抽象语法树(AST&am…...

多网卡编程:互联网与局域网选择

第一部分 多网卡上网冲突解决全流程分析:从HTTP到内核源码一、问题本质树形分析多网卡上网冲突根本原因 │ ├── 核心矛盾 │ ├── Linux默认路由表只有一张(main表) │ ├── 只能存在一条默认网关(default gateway) │ └── 多个网卡配置多个网关 →…...

Python实战:三步复现文献中的专业colorbar配色方案

1. 为什么需要复现文献中的colorbar? 在科研论文的可视化中,colorbar(色标)是数据可视化的重要组成部分。它不仅仅是颜色的展示,更是数据范围和分布的直观体现。很多顶级期刊的论文都会使用特定的配色方案&#xff0c…...

告别传统CNN/RNN:用Transformer玩转EEG信号分类(以CBraMod为例的实战指南)

告别传统CNN/RNN:用Transformer玩转EEG信号分类(以CBraMod为例的实战指南) 当你在深夜盯着脑电图(EEG)信号发愁时,是否也曾被那些蜿蜒曲折的波形搞得头晕目眩?作为一名长期与脑机接口&#xff0…...

SUPER COLORIZER实战:Java后端集成AI上色服务开发指南

SUPER COLORIZER实战:Java后端集成AI上色服务开发指南 你是不是也遇到过这样的场景?内容平台上有大量用户上传的黑白线稿,电商后台堆积着需要上色的商品设计草图,手动一张张处理不仅效率低下,而且对设计师来说也是重复…...

PIVlab软件入门:从GUI操作到2D2C粒子测速实战

1. PIVlab是什么?为什么选择它做粒子测速? 第一次接触PIVlab时,我也被这个基于MATLAB的开源工具惊艳到了。它把复杂的粒子图像测速(Particle Image Velocimetry, PIV)流程封装成了一个直观的图形界面,让没有…...

基于LSTM神经网络实现锂电池SOH估计的案例学习:使用牛津电池老化数据集与特征工程

[电池SOH估算案例3]: 使用长短时记忆神经网络LSTM来实现锂电池SOH估计的算法学习案例(基于matlab编写) 1.使用牛津锂离子电池老化数据集来完成,并提供该数据集的处理代码,该代码可将原始数据集重新制表,处理完的数据非…...

Qt QTabWidget标签页文字方向修复:手把手教你重写QProxyStyle实现左侧标签水平显示

Qt QTabWidget标签页文字方向定制:从原理到实践的深度解决方案 在桌面应用开发中,Qt框架因其跨平台特性和丰富的UI组件库而广受欢迎。然而,当开发者尝试将QTabWidget的标签页位置设置为左侧时,一个令人困扰的问题出现了——标签文…...

忍者像素绘卷:天界画坊LSTM时间序列分析应用:预测用户绘画风格偏好

忍者像素绘卷:天界画坊LSTM时间序列分析应用 1. 场景痛点:AI绘画平台的用户偏好捕捉难题 在AI绘画平台"天界画坊"的运营过程中,我们发现一个普遍存在的痛点:用户风格偏好的动态变化难以捕捉。传统推荐系统主要基于静态…...

抖音去水印批量下载:3大核心痛点与颠覆性解决方案

抖音去水印批量下载:3大核心痛点与颠覆性解决方案 【免费下载链接】TikTokDownload 抖音去水印批量下载用户主页作品、喜欢、收藏、图文、音频 项目地址: https://gitcode.com/gh_mirrors/ti/TikTokDownload 还在为抖音视频下载而烦恼吗?TikTokDo…...

Figo 关于OntoGuard-CRE 技术白皮书——已在gitee上开源发布

OntoGuard-CRE 技术白皮书 版本:v1.0.0(已在gitee上开源发布:https://gitee.com/figo-cheung/OntoGuard-CRE) 发布人:Figo Cheung 发布日期:2026年4月 标签:KnowledgeGraph (知识图谱), LLM (大模型), InformationExtraction (信息抽取) 1…...

nli-distilroberta-base行业基准测试报告:在金融、法律、医疗文本上的专项评估

nli-distilroberta-base行业基准测试报告:在金融、法律、医疗文本上的专项评估 1. 测试背景与目标 自然语言推理(NLI)作为理解文本语义关系的核心技术,在专业领域的应用价值日益凸显。本次测试聚焦nli-distilroberta-base模型在金融、法律、医疗三大专…...

LCD屏幕闪烁(Flicker)的幕后元凶:用示波器实测VCOM电压,手把手教你调校

LCD屏幕闪烁(Flicker)的实战调校指南:从示波器测量到VCOM优化 当一块LCD屏幕在你面前不停闪烁时,那种视觉上的不适感会立刻转化为工程师的职业焦虑。Flicker现象不仅影响用户体验,更可能是产品设计缺陷的警示信号。作为…...

从离线微调到在线热更:构建可审计、可回滚、可灰度的模型生命周期闭环(金融级SLA保障方案)

第一章:大模型工程化中的模型热更新机制 2026奇点智能技术大会(https://ml-summit.org) 模型热更新是支撑大模型服务持续可用与敏捷演进的核心能力,它允许在不中断推理请求的前提下动态加载新版本权重、替换推理图结构或切换Tokenizer配置。该机制显著降…...

gitru:一个由 Rust 打造的零依赖 Git 提交信息校验工具乖

一、项目背景与核心价值 1. 解决的核心痛点 Navicat的数据库连接密码并非明文存储,而是通过AES算法加密后写入.ncx格式的XML配置文件中。一旦用户忘记密码,常规方式只能重新配置连接,效率极低。本项目只作为学习研究使用,不做其他…...

抖音内容获取革命:智能下载引擎如何打破平台壁垒

抖音内容获取革命:智能下载引擎如何打破平台壁垒 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback support. 抖…...

深度学习图像分割终极指南:U-Net与ResNet-50的完美融合

深度学习图像分割终极指南:U-Net与ResNet-50的完美融合 【免费下载链接】pytorch-unet-resnet-50-encoder 项目地址: https://gitcode.com/gh_mirrors/py/pytorch-unet-resnet-50-encoder 还在为复杂的图像分割任务发愁吗?今天我要为你介绍一个基…...

python polars

# 关于Polars,一个Python数据处理库的深度观察 最近在数据处理的项目中频繁接触到Polars,这个库在社区里的讨论热度逐渐升高。作为在数据领域工作多年的开发者,觉得有必要梳理一下对这个工具的理解,特别是它和传统工具的区别以及实…...

如何用OpCore-Simplify在30分钟内完成黑苹果EFI自动化配置?

如何用OpCore-Simplify在30分钟内完成黑苹果EFI自动化配置? 【免费下载链接】OpCore-Simplify A tool designed to simplify the creation of OpenCore EFI 项目地址: https://gitcode.com/GitHub_Trending/op/OpCore-Simplify 黑苹果(Hackintosh…...

7步解锁小米摄像机完整功能:yi-hack-v3固件终极指南

7步解锁小米摄像机完整功能:yi-hack-v3固件终极指南 【免费下载链接】yi-hack-v3 Alternative Firmware for Xiaomi Cameras based on Hi3518e Chipset 项目地址: https://gitcode.com/gh_mirrors/yi/yi-hack-v3 小米摄像机yi-hack-v3固件是一款专为海思Hi35…...

ZYNQ实战:AXI4-Stream FIFO跨时钟域传输的5个关键配置(附ADDA实验代码)

ZYNQ实战:AXI4-Stream FIFO跨时钟域传输的5个关键配置(附ADDA实验代码) 在FPGA开发中,跨时钟域数据传输一直是工程师面临的棘手问题之一。特别是当系统需要处理高速数据流时,如何确保数据在不同时钟域间安全、高效地传…...

Qwen3-0.6B-FP8在微信小程序开发中的应用:打造智能客服助手

Qwen3-0.6B-FP8在微信小程序开发中的应用:打造智能客服助手 你有没有遇到过这种情况?在小程序里买东西或者咨询问题,客服要么半天不回,要么就是机械的自动回复,问东答西,体验特别差。对于小程序开发者来说…...

如何高效优化Windows 11:5个实用技巧全面提升系统性能

如何高效优化Windows 11:5个实用技巧全面提升系统性能 【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other changes to declutter and cu…...

FaceFusion镜像部署:一键运行,免配置快速体验AI换脸

FaceFusion镜像部署:一键运行,免配置快速体验AI换脸 1. 什么是FaceFusion FaceFusion是当前最先进的AI换脸工具之一,它通过深度学习技术实现了高质量的人脸替换功能。与传统的换脸工具相比,FaceFusion具有以下显著优势&#xff…...

IDM激活终极指南:开源脚本完整解决方案与快速配置方法

IDM激活终极指南:开源脚本完整解决方案与快速配置方法 【免费下载链接】IDM-Activation-Script IDM Activation & Trail Reset Script 项目地址: https://gitcode.com/gh_mirrors/id/IDM-Activation-Script IDM(Internet Download Manager&am…...