当前位置: 首页 > article >正文

从“听懂”到“干活”:带你了解驾驭工程、提示词工程与上下文工程的核心逻辑

引言在AI技术飞速普及的今天越来越多的人开始尝试用大模型解决实际问题——可能是让AI写一段代码、整理一份文档也可能是搭建一个能自主完成复杂任务的智能体。但很多人都会遇到同一个困惑明明我给AI发了指令它却总答非所问聊了几轮之后它就忘了我最初的要求好不容易让它听懂了、记住了却又不知道怎么让它真正“动手干活”其实这三个问题的答案恰恰对应了三个极易混淆却又至关重要的AI工程概念提示词工程Prompt Engineering、上下文工程Context Engineering以及驾驭工程Harness Engineering。有很多人在接触这些概念时总会陷入“分不清、记不住、用不上”的困境——误以为提示词工程就是“写好一句话”上下文工程只是“记好之前的话”而驾驭工程更是听起来高深莫测不知道和前两者有什么关系。但实际上这三者不是孤立存在的而是一套从“让AI听懂”到“让AI记住”再到“让AI自主干活”的完整体系。一、提示词工程让AI不乱说话大语言模型的本质是预测下一个词的概率如果指令太宽泛输出就会发散。提示词工程通过有意识地设计指令加入角色设定、背景、格式限制等约束就会让模型的输出更符合预期因此提示词工程解决的核心问题是怎么让AI听懂我说的话不跑偏1.他到底在干什么我们给 AI 的每一句话本质上都是一个 “提示词”。提示词工程就是教你把这句话变成一份逻辑清晰、要求明确、格式固定的 “任务说明书”。说明书越清楚AI 的输出就越接近你的预期。2.如何写提示词要结合角色设定、背景、历史对话等来和AI进行对话这里举个例子模块作用例子角色设定给 AI 一个身份让它用对应的专业能力和语气回答你是资深Python工程师背景 / 目标说清楚你要解决什么问题、达到什么效果我现在需要优化一段数据处理代码历史对话补充之前聊过的关键信息避免重复说明我前面提到过代码要兼容Python3.8参考文档 / 规则给 AI 划定 “知识边界”避免它瞎编参照Python3官方文档不要用第三方库限制条件明确 “什么不能做”防止 AI 过度发挥不改原有代码逻辑只新增排序功能输出格式规定结果的形式方便你直接使用直接返回完整可运行的函数代码不要多余文字解释如果你说帮我优化一下代码结果AI会写一堆废话或者把原有的改的面目全非二、上下文工程让AI知道的更多模型回答的不准往往是因为“知道的不够多”所以我们会将很多资料打包给AI其中包含提示词这些资料就叫上下文。但是大模型再厉害一次能处理的资料也是有限的这个限制就叫上下文窗口在对话中如果对话次数变多很容易将上下文窗口变满于是大模型就会丢弃或压缩部分信息因此不可避免会丢失一些关键信息从而破坏我们要的结果的正确性这就是上下文腐化因此问题变成了如何在合适的时候、将合适的内容塞到上下文窗口中这就引出了上下文工程提示词工程是上下文工程的一部分上下文工程通过召回、压缩、组装三个步骤将最相关、最精简的信息喂给模型从而提升回答的准确性1.召回就是获得什么信息这些信息可以来自外部信息、历史对话、当前代码环境以及程序运行报错等从这些信息里面获取一些关键信息2.压缩由于上下文窗口的限制因此就会有压缩比如将信息分开发给大模型做总结3.组装因为在压缩时信息放置的位置和顺序会直接影响大模型的输出比如越靠后越容易被大模型关注不同AI工具的上下文工程策略不同三、驾驭工程让AI自主干活提示词工程和上下文工程都是为了让 AI“听得懂、记得住”这样AI只能聊天没办法帮我们干活如果让 AI“能动手、能干活、能自己调整”就需要驾驭工程了。1.核心组成能够像人一下利用外部工具来干活读写代码文件、执行命令做测试这些共同构成了执行层2.ReAct将上下文工程、大模型、执行层串成一个流程上下文发给大模型大模型负责思考外部程序负责执行将得到的报错等信息加到上下文里然后继续传给大模型......就是一个循环过程这就是所谓的AI Agent本质就是一个for循环但是当循环越来越长上下文得到的信息也会越来越多就会导致产生上下文腐化因此只要我们保证上下文里面一直有一些可复用的核心信息那么大模型就能在大框架约束下减少理解偏移因此整体上变成了这样的框架共同组成了一个包裹着大模型的工程外壳这就是驾驭工程Agent大模型Harness

相关文章:

从“听懂”到“干活”:带你了解驾驭工程、提示词工程与上下文工程的核心逻辑

引言在AI技术飞速普及的今天,越来越多的人开始尝试用大模型解决实际问题——可能是让AI写一段代码、整理一份文档,也可能是搭建一个能自主完成复杂任务的智能体。但很多人都会遇到同一个困惑:明明我给AI发了指令,它却总答非所问&a…...

Rust的#[non_exhaustive]:防止模式匹配穷尽的可扩展枚举

Rust的#[non_exhaustive]:防止模式匹配穷尽的可扩展枚举 Rust作为一门注重安全性与性能的系统级语言,其枚举(enum)类型在模式匹配中扮演着重要角色。当枚举需要跨库扩展时,如何保证下游代码的兼容性成为挑战。为此&am…...

世界及中国地震相关数据(2012-2024年)

01、数据介绍全球范围内,地震活动持续活跃,多起重大地震事件引发了广泛关注。全球共发生了数千次地震,其中有震级较高、破坏力较强的地震。这些地震不仅分布在板块交界地带,也出现在一些地质构造复杂的地区,显示出地震…...

ARM嵌入式C/C++库架构与优化实践

1. ARM C/C库架构解析ARM架构下的C/C标准库实现与通用PC环境存在显著差异,其设计充分考虑了嵌入式系统的特殊需求。库函数分为两个主要部分:与硬件无关的纯算法实现(如字符串处理、数学运算),以及与硬件/操作系统相关的…...

基于 SpringBoot+Vue 的 Web 网上摄影工作室开发与实现(PF 管理系统)——MyBatis + MySQL 全栈实战

随着短视频、电商内容与个性化影像消费不断增长,传统线下摄影工作室面临“获客成本高、排期混乱、订单跟踪低效、作品交付体验差”等问题。将摄影业务迁移到 Web 平台,构建统一的预约、订单、作品、客户与财务管理体系,已成为中小型摄影机构数…...

从解决问题的角度从零实现二插树

引言:二叉树是自我学习c以来学习的第一个数据结构,其复杂程度与顺序表,链表等数据结构不是一个量级,学习顺序表时,我感觉如鱼得水,甚至产生"编程也没什么大不了的"的想法,即使我忘记,…...

第二十一篇技术笔记:郭大侠学DoIP——4S店郎中的“秘密武器”

写在开篇:丢失的武侠梦,在这里起航和延续,用科技向老爷子的经典致敬。话说郭靖在江湖上混了几年,立了不少功,家底也越来越厚实。黄蓉早就不想坐那台快十年的老马车了——颠得慌不说,还没有空调。更气人的是…...

Python数据分析实战:Pandas处理缺失值的5个高级技巧(附完整代码)

Python数据分析实战:Pandas处理缺失值的5个高级技巧真实业务数据从来不会干净。今天把我在项目中踩过的坑,一次性整理给你。做数据分析的都知道,数据清洗占整个分析工作量的60-80%。而缺失值处理,又是数据清洗中最常见的问题。很多…...

4.20-4.26周报

牛客周赛 Round 140:A B C D E...

MCP 2026量子适配实录:从经典HPC集群到QPU协同架构的90天平滑过渡路径

更多请点击: https://intelliparadigm.com 第一章:MCP 2026量子适配实录:从经典HPC集群到QPU协同架构的90天平滑过渡路径 在国家超算中心某前沿实验室,MCP 2026量子适配项目以“零停机、双栈并行、渐进式卸载”为原则&#xff0c…...

【VS Code MCP性能调优黄金21条】:基于137个真实企业插件压测报告,第9条90%开发者至今未启用

更多请点击: https://intelliparadigm.com 第一章:VS Code MCP插件生态搭建手册 性能调优指南 MCP(Model Control Protocol)插件正成为 VS Code 中连接本地开发环境与大模型服务的关键桥梁。高效搭建其生态并保障响应性能&#x…...

想给照片换背景底色?2026 年这几款工具加一个微信小程序的搭配建议

如果你是日常需要处理证件照、产品白底图或社交分享图的人,想搞清楚换背景底色到底怎么操作才不翻车,这篇文章给你三种路径建议:零门槛手机搞定的、追求画质用桌面软件的、以及介于两者之间不需要安装的工具。下面会先拆解一款叫抠图喵的微信…...

模型加载慢、吞吐暴跌、OOM频发,MCP AI推理配置错误诊断与秒级修复方案

更多请点击: https://intelliparadigm.com 第一章:MCP AI推理配置的典型故障全景图 在大规模模型协同平台(MCP)中,AI推理配置的稳定性直接决定服务可用性与响应质量。常见故障并非孤立发生,而是呈现链式耦…...

抖音下载终极解决方案:douyin-downloader完全指南,新手也能轻松上手

抖音下载终极解决方案:douyin-downloader完全指南,新手也能轻松上手 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, an…...

关于Navicat Premium 17破解方法

文件内容非原创,纯分享链接:https://pan.xunlei.com/s/VOr8GQmMy1b57H9mhJ6VYL7kA1# 提取码:r39z 复制这段内容后打开「手机迅雷 App」即可获取。无需下载在线查看,视频原画享倍速播放解压后将winmm.dll文件拖至软件根目录下重启即…...

从零开始学习 Linux SPI 驱动开发(基于 IMX6ULL + TLC5615 DAC)

从零开始学习 Linux SPI 驱动开发(基于 IMX6ULL TLC5615 DAC) 文章目录从零开始学习 Linux SPI 驱动开发(基于 IMX6ULL TLC5615 DAC)[TOC]1. 什么是 SPI?硬件信号与连接![在这里插入图片描述](https://i-blog.csdnim…...

EmbeddingGemma-300m惊艳效果展示:音乐流派评论语义聚类与用户画像关联分析

EmbeddingGemma-300m惊艳效果展示:音乐流派评论语义聚类与用户画像关联分析 1. 核心能力概览 EmbeddingGemma-300m是谷歌推出的开源嵌入模型,拥有3亿参数,基于先进的Gemma 3架构构建。这个模型专门用来将文本转换成向量表示,就像…...

使用 GES DISC 的 IMAP-DOAS 预处理器 (IDP) V11.2 (OCO2_L2_IMAPDOAS) 筛选 OCO-2 二级空间排序地理定位反演结果

OCO-2 Level 2 spatially ordered geolocated retrievals screened using the IMAP-DOAS Preprocessor (IDP) V11.2 (OCO2_L2_IMAPDOAS) at GES DISC 简介 当前数据集版本为 11.2。旧版本将不再可用,并被 11.2 版本取代。轨道碳观测站 (OCO-2) 是 NASA 首个旨在收…...

nli-MiniLM2-L6-H768快速部署:Kubernetes Helm Chart一键部署到生产集群

nli-MiniLM2-L6-H768快速部署:Kubernetes Helm Chart一键部署到生产集群 1. 模型概述 nli-MiniLM2-L6-H768是一个轻量级自然语言推理(NLI)模型,专注于文本关系判断而非内容生成。该模型的核心能力是分析两段文本之间的语义关系,主要判断以下…...

别再用namespace硬隔离了!MCP 2026正式启用硬件辅助隔离(Intel AMX+AMD SVM-V),性能损耗<0.7%?

更多请点击: https://intelliparadigm.com 第一章:MCP 2026沙箱资源隔离的演进逻辑与战略意义 随着云原生基础设施向多租户、高密调度和强合规方向加速演进,MCP(Multi-Container Platform)2026 引入了基于 eBPF cgro…...

cv_unet_image-matting WebUI二次开发指南:从改颜色到加功能的完整教程

cv_unet_image-matting WebUI二次开发指南:从改颜色到加功能的完整教程 1. 环境准备与快速部署 1.1 系统要求 在开始二次开发前,确保你的开发环境满足以下要求: 操作系统:支持Windows 10/11、macOS或Linux(推荐Ubu…...

MCP低代码集成调试成功率从41%→98.6%:基于137个真实产线案例提炼的7阶渐进式验证模型

更多请点击: https://intelliparadigm.com 第一章:MCP低代码集成调试的行业痛点与演进逻辑 在企业级低代码平台(如MCP——Model-Code-Platform)快速落地过程中,集成调试正成为交付瓶颈的核心症结。开发者常需在可视化…...

Phi-mini-MoE-instructGPU利用率提升:通过batch size与kv cache优化

Phi-mini-MoE-instruct GPU利用率提升:通过batch size与kv cache优化 1. 项目概述 Phi-mini-MoE-instruct是一款轻量级混合专家(MoE)指令型小语言模型,在多个基准测试中表现出色: 代码能力:在RepoQA、Hu…...

油藏模拟中线性求解器的优化与Arm架构实践

1. 油藏模拟与线性求解器的关键作用在石油天然气勘探开发领域,油藏模拟技术堪称工程师们的"数字实验室"。这项技术通过构建复杂的数学模型,能够模拟地下数千米深处油、气、水在多孔介质中的流动行为。想象一下,这就像是在计算机里重…...

SMU4.20-4.26补题

牛客周赛140 A-F牛客北华大学 A,D,F,H,I,L;团体天梯赛5,8题;Spring天梯赛一5,8题...

【花雕学编程】Arduino BLDC 之多旋翼无人机局部避障

基于 Arduino 平台结合无刷直流电机(BLDC)的多旋翼无人机局部避障系统,是嵌入式飞控领域的高阶应用。它要求无人机在高速动态飞行中,利用机载传感器实时感知环境,并通过 BLDC 电机的毫秒级响应调整姿态与轨迹&#xff…...

用Python模拟宏观超导电路的量子化现象

摘要 超导电路是当代量子信息科学和低温凝聚态物理中最重要的宏观量子系统之一。与原子、电子、光子等微观对象不同,超导电路通常由金属薄膜、电容、电感、约瑟夫森结和外部控制线路组成,其几何尺寸可以达到微米甚至毫米量级,包含数量巨大的电子。然而,当金属进入超导态后…...

AOS演进的非对称性真相

AOS架构演进策略分析:软件先行与硬件迭代的非对称性博弈 针对AOS(全光磁反转)计算架构中“软件先转型、硬件后迭代”与“硬件先突破、软件滞后”两种路径的对比分析,该论证逻辑高度可靠,深刻揭示了物理计算范式与传统…...

【xiaozhi-客户端】xiaozhi-web-client 连接客户端 6位有效码

小智Web客户端介绍与使用指南 一、项目概述 xiaozhi-web-client 是一个开源的小智Web客户端实现,提供了语音对话功能。该项目通过WebSocket实现实时通信,支持Opus音频编码,让用户可以在浏览器中直接与小智进行语音交互。 项目说明链接xiao…...

别再只懂JWT三部分了:手把手教你用Node.js + Express实战JWT登录与权限控制

别再只懂JWT三部分了:手把手教你用Node.js Express实战JWT登录与权限控制 每次看到技术文章里"JWT由Header、Payload、Signature三部分组成"的科普,我都想问问作者:您自己实现过完整的JWT流程吗?三年前我第一次在项目中…...