当前位置: 首页 > article >正文

从Prompt到Harness:AI工程四层逻辑,助你玩转大模型!

本文从生活化的小时工类比出发深入剖析了AI工程中的四层逻辑提示词、提示词工程、上下文工程和Harness工程。文章逐层解析了每个概念的核心内涵及其演进关系强调了Harness工程对于提升AI模型实际应用能力的重要性。通过理解这四层逻辑读者能够更清晰地诊断AI应用中的问题并掌握如何让AI在真实环境中持续、安全、可靠地完成复杂任务的关键。文章最后指出这四层逻辑是AI时代最重要的认知框架之一对于深入理解和应用AI技术具有重要意义。最近AI 圈里又开始流行一个新词Harness Engineering。说实话每次出来新概念我都会想起那句时代经典语录只要你学的够慢明天你就不用学。最开始是 Prompt Engineering前段时间是 Context Engineering现在又蹦出来个 Harness Engineering。AI圈造新词的速度真的比模型迭代还快。搞得人很难不 FOMO那这仨到底是什么关系是一层套一层还是又在炒概念换名字今天这篇文章就是想把这四层逻辑给大家彻底捋清楚。让你真的理解它们为什么会按这个顺序出现以及你在实际使用 AI 的时候问题到底出在哪一层。这个认知一旦建立起来你用AI、看 AI 产品的眼光会完全不一样。00 一个例子把底层逻辑打通为了方便大家理解我用一个生活中的例子来解释这件事。AI这里指大模型 LLM 就像一个通用能力很强的小时工。他啥都会做做饭、打扫卫生、修理东西等等。但他有个怪毛病每次进门都失忆不记得你是谁、你有什么习惯、上次干过啥。所以你每次让他干活都得重新交代一遍。而我们的目的是搞明白怎么和一个失忆但聪明的家伙好好合作理解了这个前提下面的四层逻辑就特别清晰容易理解了。01 第一层提示词Prompt你请了一个小时工回来想让他帮你做点事。于是你跟小时工说“去做个西红柿炒鸡蛋。”这句话就叫提示词。很多人误以为提示词就等于问题或者命令其实不是。你发给模型的那段输入不管是一个问题、一条指令、还是一段待续写的文本全都算作提示词。 它就是一段文本是你交代给小时工的那句话。模型接收到输入之后干嘛呢它就按照预测下一个 token的机制生成回复。就这么简单。02 第二层提示词工程Prompt Engineering你发现光说一句做个西红柿炒鸡蛋不行他做出来的不合口味。于是你琢磨我得把话说清楚点才行。你想了想改成“做个西红柿炒鸡蛋少放盐西红柿先炒出汁鸡蛋要嫩一点少放糖。”这个研究怎么把话说得更明白、让AI更不容易出错的过程就叫提示词工程。说白了就是话该怎么讲的学问。这玩意儿在 2022—2023 年特别火。那时候大家发现同一个模型、同一项任务仅仅是改写了提示词的措辞和结构效果就能产生巨大差异。于是一大堆技巧被总结出来Few-shot少量样本在提示词里先给几个示例让模型照着样子来Chain-of-Thought思维链加一句Let’s think step by step让模型先推理再回答复杂任务准确率直接拉上去Role Prompting角色提示告诉模型你是一位资深律师约束它的语气和专业方向ReAct让模型在想和做之间交替进行是 Agent 的早期雏形这些技巧的共同点都是在研究给大模型的那段输入文本应该怎么写。但这里有一个关键点必须说清楚提示词工程本质上是经验科学。没有严格的理论闭环效果高度依赖迭代测试。工程这两个字的分量在于它要求你把提示词的设计当作一个可测量、可优化、可复用的工作流来对待而不是凭直觉随手一写。03 第三层上下文工程Context Engineering好继续回到我们的小时工。你发现光把话讲清楚还不够。比如今天你想让他帮你做一桌年夜饭光靠你嘴上说根本说不完。于是你提前给他准备好菜谱、冰箱里有啥的清单、全家人的忌口表、客人名单、灶台和烤箱的说明书等等全摆在厨房台面上。他一进门看一眼台面就知道今天该干啥、用啥、注意啥。琢磨该把哪些东西摆到他眼前、什么时候换上别的资料这件事就叫上下文工程。为什么这个概念会在 2025 年火起来因为模型越来越聪明了。上下文窗口从最早的2K、4K tokens扩展到了几十万甚至上百万。同时 RAG、Agent、长对话这些应用形态全面铺开。大家突然意识到一件事单纯打磨那一句话已经不够了。真正决定模型能不能干好活的是你给它准备的那一套资料和工具全不全、对不对。提示词工程关心一段文本怎么写更有效上下文工程关心整个上下文窗口应该被填充成什么样。前者可以看作后者的一个子集提示词处理的是上下文中由人类直接撰写的那部分指令文本而上下文工程处理的是整个上下文的组装流水线。用一句大白话说提示词工程是在研究给小时工的话怎么讲上下文工程是在研究要给小时工准备哪些工具和资料。04 第四层Harness 工程Harness Engineering好重头戏来了。继续回到我们的小时工。你发现光准备好桌上那堆资料还是不够。这小时工干活时还会出别的问题他可能干一半工具坏了不知道咋办、可能把不该动的东西动了、可能干完一件事忘了下一件该干啥、可能要和另一个小时工配合但俩人对不上话。所以你还得给他整一套干活的规矩和装备给他规定干活的流程干完一步先停下来验收验收完毕再进行下一步给他一套工具箱告诉他每个工具啥时候能用、啥时候不准碰给他划好活动范围厨房随便进但卧室抽屉别动教他出岔子怎么办切到手要先包扎别接着切如果今天来俩小时工一起干活还得安排好谁管买菜、谁管下锅、俩人怎么对接这一整套规矩 工具 范围 应急预案 配合方式就叫 Harness 工程。“Harness这个词原意是挽具”——套在马身上、把马和马车连起来、让人能驾驭马的那套装备。在 AI 语境下模型本身只是一个会预测下一个 token 的大脑而 harness 就是让这个大脑能真正干活的整副身体和装备。这个概念在 2025—2026 年随着编码 AgentClaude Code、Cursor、Codex CLI 等的普及而爆发。Anthropic 公开说过一个非常有意思的判断当代编码 Agent 的能力提升中模型本身的进步只占一半另一半来自 harness 的演进。也就是说同一个模型放进不同的 harness 里能力表现可以天差地别。这就是为什么不同的编码 Agent 产品底层用的是同一个模型体验差距却巨大的根本原因。一个成熟的 Agent Harness 通常包括六层还是用小时工来对应上下文管理每次干活前在桌上摆好他需要的资料。上下文工程其实就是 harness 的一个子模块。工具系统给他准备一套工具箱告诉他每个工具怎么用、什么时候该用哪个。执行编排给他规定干活流程干完一步先汇报你说继续再继续而不是让他自己闷头干到底。这是整个循环的调度中枢。记忆与状态管理给他一个笔记本让他记住上次干了啥、干到哪了别每次进门都从头来。评估与观测装个监控知道他干得好不好、哪一步出了问题事后能追溯。约束与恢复划好规矩厨房随便进卧室别动切到手了先包扎别硬撑着继续切。同一个 Agent 项目在同样的模型、同样的提示词的情况下把任务拆分、状态管理、校验恢复等这些模型外围的工程做好之后能让项目的成功率大幅提升。这就是 Harness 的力量。不是模型变聪明了是给它配的装备变好了。05 四层关系一张图看懂说到这里我们把四层关系整理一下提示词 ⊂ 提示词工程 ⊂ 上下文工程 ⊂ Harness 工程四个概念是逐层包含、层层向外扩展的关系提示词那段输入文本本身你交代的那句话提示词工程这段文本应该怎么写研究话怎么讲上下文工程整个上下文窗口该填什么研究该把哪些资料递到他手上Harness 工程模型外部的整套运行系统研究整套让他能持续、安全、靠谱干活的规矩和装备。这条演进路径也完美对应了行业重心的迁移最后那讲了这么多对我们日常使用AI有什么用呢我认为理解这四层逻辑最大的价值是提升你的诊断能力。当你用 AI 干活效果不好的时候你能判断问题出在哪一层模型输出风格不对、格式不对大概率是提示词的问题改一改措辞和结构。模型缺少关键信息、答非所问大概率是上下文工程的问题该补检索源、调整上下文的组装策略。模型单次回答没问题但多步任务经常跑偏、出错没法自救这就是 Harness 层面的问题了需要调整循环控制、错误恢复、工具权限等这些东西。就像你家小时工做菜不好吃你一直在纠结我是不是没把话说清楚但实际问题可能是你根本没把菜谱和忌口表准备好上下文层或者他根本不知道菜刀在哪、煤气灶怎么开、切到手了该咋办Harness 层。从提示词到 Harness本质上是同一条线如何让 AI 在真实环境中持续、安全、可靠地完成复杂任务。每一层的出现都不是为了淘汰上一层而是在上一层的基础上向外扩展了一圈。提示词工程没有过时它依然是基本功。但如果你只停留在这一层你能做的事情就会有上限。这条演进路线还在继续。今天的 Harness 可能还只是个开始未来可能还有更外层的工程实践出现。但不管怎么变理解这个层层嵌套、逐层扩展的结构本身就是 AI 时代最重要的认知框架之一。说真的这两年看着身边一个个搞Java、C、前端、数据、架构的开始卷大模型挺唏嘘的。大家最开始都是写接口、搞Spring Boot、连数据库、配Redis稳稳当当过日子。结果GPT、DeepSeek火了之后整条线上的人都开始有点慌了大家都在想“我是不是要学大模型不然这饭碗还能保多久”我先给出最直接的答案一定要把现有的技术和大模型结合起来而不是抛弃你们现有技术掌握AI能力的Java工程师比纯Java岗要吃香的多。即使现在裁员、降薪、团队解散的比比皆是……但后续的趋势一定是AI应用落地大模型方向才是实现职业升级、提升薪资待遇的绝佳机遇这绝非空谈。数据说话2025年的最后一个月脉脉高聘发布了《2025年度人才迁徙报告》披露了2025年前10个月的招聘市场现状。AI领域的人才需求呈现出极为迫切的“井喷”态势2025年前10个月新发AI岗位量同比增长543%9月单月同比增幅超11倍。同时在薪资方面AI领域也显著领先。其中月薪排名前20的高薪岗位平均月薪均超过6万元而这些席位大部分被AI研发岗占据。与此相对应市场为AI人才支付了显著的溢价算法工程师中专攻AIGC方向的岗位平均薪资较普通算法工程师高出近18%产品经理岗位中AI方向的产品经理薪资也领先约20%。当你意识到“技术AI”是个人突围的最佳路径时整个就业市场的数据也印证了同一个事实AI大模型正成为高薪机会的最大源头。最后我在一线科技企业深耕十二载见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事早已在效率与薪资上形成代际优势我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我整理出这套 AI 大模型突围资料包【允许白嫖】✅从入门到精通的全套视频教程✅AI大模型学习路线图0基础到项目实战仅需90天✅大模型书籍与技术文档PDF✅各大厂大模型面试题目详解✅640套AI大模型报告合集✅大模型入门实战训练这份完整版的大模型 AI 学习和面试资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】①从入门到精通的全套视频教程包含提示词工程、RAG、Agent等技术点② AI大模型学习路线图0基础到项目实战仅需90天全过程AI大模型学习路线③学习电子书籍和技术文档市面上的大模型书籍确实太多了这些是我精选出来的④各大厂大模型面试题目详解⑤640套AI大模型报告合集⑥大模型入门实战训练获取方式有需要的小伙伴可以保存图片到wx扫描二v码免费领取【保证100%免费】

相关文章:

从Prompt到Harness:AI工程四层逻辑,助你玩转大模型!

本文从生活化的小时工类比出发,深入剖析了AI工程中的四层逻辑:提示词、提示词工程、上下文工程和Harness工程。文章逐层解析了每个概念的核心内涵及其演进关系,强调了Harness工程对于提升AI模型实际应用能力的重要性。通过理解这四层逻辑&…...

transformer到底是个啥?用它的大白话+类比,彻底搞懂GPT、ChatGPT、DeepSeek的底层架构

transformer是一种全新的神经网络架构,几乎所有的主流大模型都基于它。它通过自注意力机制,让模型能够关注到句子中每个词的相关性,从而理解上下文。文章用通俗的语言和类比,解释了transformer的核心组件,如编码器、解…...

Kuramoto模型与CNN融合:构建可解释的脑电信号特征提取与分类框架

1. 项目概述:从脑电信号到智能解码的桥梁脑电信号,这个记录大脑神经元集群电活动的微弱生物电信号,一直是神经科学、临床医学和脑机接口领域研究的核心。它蕴含着海量的信息,从简单的警觉状态到复杂的认知意图,但如何从…...

AI蠕虫Worm-GPT:原理、风险与防御前瞻

1. 项目概述与核心定位最近在安全研究社区里,一个名为“Worm-GPT”的项目引起了不小的讨论。这个项目托管在GitHub上,由用户JuraSecurity维护。从名字就能看出,它试图将“蠕虫”的自我复制、传播特性与当下火热的“GPT”大语言模型能力相结合…...

集成学习与可解释AI在医疗影像诊断中的应用:以脑肿瘤检测为例

1. 项目概述:当AI诊断脑肿瘤时,我们如何看清它的“思考”过程?在医疗影像诊断领域,尤其是脑肿瘤的早期筛查与识别,人工智能(AI)模型,特别是深度卷积神经网络(CNN&#xf…...

SQL调优三维战法:执行计划×索引策略×监控体系

SQL调优三维战法:执行计划索引策略监控体系 在数据量爆炸式增长的时代,每秒延迟都可能意味着数百万损失。某头部电商平台曾因一个未被发现的索引缺失导致大促期间数据库崩溃,直接损失超2亿营收——这绝非孤例。本文将揭示从金融级交易系统到亿级用户社交平台验证过的SQL优化…...

ARM架构特权级别与安全监控机制解析

1. ARM架构特权级别与安全监控机制解析在ARMv8/v9架构中,异常级别(EL)构成了系统安全的基础隔离机制。EL3作为最高特权级别,承担着安全监控器(Secure Monitor)的关键角色。不同于EL0/1/2主要处理应用、操作系统和虚拟化需求,EL3专门负责安全世…...

开源TTS工具在低资源语言中的实战评估与优化

1. 开源TTS工具在低资源语言中的实战评估:罗马尼亚语案例研究语音合成技术(TTS)正在重塑人机交互方式,但当我们把目光投向英语之外的语言世界时,技术鸿沟立刻显现。罗马尼亚作为欧盟中使用人口排名第七的语言&#xff…...

ARM汇编器FPU配置与性能优化指南

1. ARM汇编器与FPU架构深度解析在嵌入式系统开发领域,ARM汇编器(armasm)作为连接高级语言与底层硬件的桥梁,其命令行参数的精确配置直接影响最终生成的机器码质量和性能表现。其中,--fpu选项作为控制浮点运算单元&…...

构建可信AI食品系统:技术、伦理与治理的跨学科实践

1. 项目概述:当AI遇见食物,一场关乎信任的深度变革如果你和我一样,既对前沿技术着迷,又关心每天吃进嘴里的东西是否安全、健康、可持续,那么“可信AI食品系统”这个话题,绝对值得你花时间深究。这不仅仅是把…...

TropicClaw:基于Bash的命令行工具框架开发实践

1. 项目概述:一个命令行工具的诞生与价值在开发者的日常工作中,我们常常会面对一些重复、繁琐但又至关重要的任务。比如,你需要定期检查一批远程服务器的日志,看看有没有特定的错误关键词出现;或者,你需要从…...

ARM Cortex-A9 MPCore架构优化与多核缓存一致性解析

1. ARM Cortex-A9 MPCore架构演进概述作为嵌入式领域最具影响力的多核处理器架构之一,ARM Cortex-A9 MPCore的技术手册修订历程堪称嵌入式处理器设计的"进化图谱"。从2008年首次发布到2012年的多次迭代更新,每个版本变更都直指多核系统的核心挑…...

USB 2.0高速连接方案在移动设备中的应用与优化

1. 移动设备USB 2.0高速连接方案概述在2005年的移动设备开发领域,实现高速数据传输一直是个技术难点。当时主流的PXA27x处理器虽然性能强劲,但其内置的USB接口仅支持全速(Full-Speed)12Mbps传输速率。本文介绍的NET2272控制器方案…...

如何在OpenClaw中配置Taotoken作为其AI能力供应商

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 如何在OpenClaw中配置Taotoken作为其AI能力供应商 基础教程类,面向使用OpenClaw框架构建Agent的开发者,文章…...

基于大语言模型的科学实验报告自动评估系统设计与实践

1. 项目概述:当AI成为科学实验的“第二双眼睛”在科学教育的日常教学中,批改学生实验报告是一项既基础又繁重的工作。一位教师面对几十份报告,需要逐字阅读、理解学生有时稚嫩甚至混乱的逻辑,判断实验设计是否合理、变量控制是否得…...

基于Pix2Pix GAN的火山灰云卫星图像智能分割方法研究

1. 项目概述:当卫星“看”到火山灰云几年前,我在处理一次火山喷发后的应急遥感数据时,遇到了一个头疼的问题:海量的卫星图像里,如何快速、准确地把那团巨大的、形态各异的火山灰云给“抠”出来?传统方法依赖…...

AI应用落地实战:从算法选型到工程部署的可持续架构

1. 项目概述:不只是概念,更是落地的工具箱“人工智能”这个词,现在几乎无处不在,从手机里的语音助手,到新闻里讨论的自动驾驶,再到电商平台给你推荐的商品。但很多时候,我们听到的要么是过于宏大…...

CANN/pypto条件操作API

pypto.cond 【免费下载链接】pypto PyPTO(发音: pai p-t-o):Parallel Tensor/Tile Operation编程范式。 项目地址: https://gitcode.com/cann/pypto 产品支持情况 产品是否支持Atlas A3 训练系列产品/Atlas A3 推理系列产品√Atlas A…...

备战蓝桥杯国赛【Day 7】

例题 1&#xff1a;装船问题&#xff08;蓝桥杯 P532&#xff09;项目内容链接https://www.lanqiao.cn/problems/532/learning/类型反向扫描 贪心核心最轻配最重&#xff0c;能装一起装题目描述 船载重 w&#xff0c;n 个货物&#xff0c;每次最多装两件&#xff08;和 < w…...

WarcraftHelper:3分钟让经典魔兽争霸3完美适配现代电脑

WarcraftHelper&#xff1a;3分钟让经典魔兽争霸3完美适配现代电脑 【免费下载链接】WarcraftHelper Warcraft III Helper , support 1.20e, 1.24e, 1.26a, 1.27a, 1.27b 项目地址: https://gitcode.com/gh_mirrors/wa/WarcraftHelper 还在为魔兽争霸3在Windows 10/11上…...

【每日一题】双指针

双指针是算法竞赛中最常用的优化技巧之一&#xff0c;核心思想是利用两个下标同时遍历&#xff0c;将 O(n) 暴力优化到 O(n)。本文系统讲解反向扫描和同向扫描两大类型&#xff0c;配合经典例题和完整代码。一、核心原理 1.1 什么是双指针 双指针&#xff1a;在区间操作时&…...

ARM缓存维护指令DC IGVAC与DC ISW详解

1. ARM缓存维护指令概述在ARMv8/9架构中&#xff0c;缓存维护指令&#xff08;Cache Maintenance Instructions&#xff09;是处理器与内存子系统交互的关键接口。这些指令允许软件直接控制缓存行为&#xff0c;确保数据一致性并优化系统性能。根据操作粒度的不同&#xff0c;A…...

基于RAG的本地知识库构建:Klug工具实践与优化指南

1. 项目概述&#xff1a;一个轻量级、可扩展的本地知识库构建工具最近在折腾个人知识管理和AI应用落地的过程中&#xff0c;我一直在寻找一个能让我把散落在各处的文档、笔记、网页内容快速“喂”给本地大语言模型&#xff08;LLM&#xff09;的工具。市面上的方案要么太重&…...

基于SpringBoot+Vue的实验室管理系统管理系统设计与实现【Java+MySQL+MyBatis完整源码】

&#x1f4a1;实话实说&#xff1a; CSDN上做毕设辅导的都是专业技术服务&#xff0c;大家都要生活&#xff0c;这个很正常。我和其他人不同的是&#xff0c;我有自己的项目库存&#xff0c;不需要找别人拿货再加价。我就是个在校研究生&#xff0c;兼职赚点饭钱贴补生活费&…...

Webpack日志转发插件:将浏览器Console输出实时同步至终端

1. 项目概述&#xff1a;一个将浏览器控制台日志“搬”到终端的神器如果你和我一样&#xff0c;长期在Webpack生态里摸爬滚打&#xff0c;肯定对开发调试时频繁切换浏览器和终端窗口的体验深恶痛绝。想象一下这个场景&#xff1a;你在终端里跑着webpack-dev-server&#xff0c;…...

SPI可编程死区+故障状态回读:STGAP1BSTR的智能化驱动配置方案

STGAP1BSTR&#xff1a;带SPI诊断和保护的车规级隔离单通道栅极驱动器在高功率开关应用中&#xff0c;如电动汽车牵引逆变器、大功率工业变频器和光伏逆变器&#xff0c;功率器件&#xff08;IGBT/SiC MOSFET&#xff09;的驱动和保护是决定系统效率与长期可靠性的关键。传统的…...

如何用scrapy-pinduoduo构建电商数据智能分析管道

如何用scrapy-pinduoduo构建电商数据智能分析管道 【免费下载链接】scrapy-pinduoduo 拼多多爬虫&#xff0c;抓取拼多多热销商品信息和评论 项目地址: https://gitcode.com/gh_mirrors/sc/scrapy-pinduoduo 在电商竞争日益激烈的今天&#xff0c;数据驱动的决策变得至关…...

AI增强型本地优先路线图规划器:可视化思维与智能协作

1. 项目概述&#xff1a;一个为创意工作者打造的AI驱动路线图规划器如果你和我一样&#xff0c;是个喜欢同时推进好几个项目&#xff0c;但脑子又经常被各种想法、任务和依赖关系塞满的人&#xff0c;那你一定懂那种“剪不断&#xff0c;理还乱”的痛苦。无论是开发一个新功能、…...

Tracciatto:基于rdbg的Ruby调试环境增强套件详解

1. 项目概述&#xff1a;一个为现代Ruby开发者打造的深度调试伴侣如果你是一名Ruby开发者&#xff0c;并且正在使用Cursor或Visual Studio Code作为主力编辑器&#xff0c;那么你很可能已经体验过调试Ruby代码时的那种“隔靴搔痒”的感觉。传统的调试器要么功能简陋&#xff0c…...

别再盲目刷算法了!先把这5个编程基础核心打牢

文章目录前言一、数据结构&#xff1a;不是背红黑树&#xff0c;而是搞懂天天用的那几个1.1 数组与链表&#xff1a;储物柜vs糖葫芦1.2 字典与集合&#xff1a;通讯录vs去重神器1.3 那个扎心的问题&#xff1a;Python 3.7之后dict有序了&#xff0c;OrderedDict还有必要吗&…...