当前位置: 首页 > article >正文

AI Agent 时代工程范式革命全解(非常详细),Harness Engineering 从入门到精通,收藏这一篇就够了!

如果你最近在关注 AI 编程领域一定刷到过这个词Harness Engineering。这个新概念正在以惊人的速度取代 Prompt Engineering 和 Context Engineering成为 AI Agent 工程优化的正解。今天这篇文章我用自己的理解帮你理清楚。三个时代从“说什么”到“知道什么”再到“在什么环境里做事”要理解 Harness Engineering得先回头看前两个阶段。2023-2024 年Prompt Engineering 时代这是“怎么问”的阶段。Few-shot、Chain-of-Thought、角色扮演……所有技巧都在围绕一条指令做文章。那时候的 AI 还是单轮问答的工具写好提示词就能拿到不错的结果。像给实习生写一张纸条“去楼下咖啡店买一杯美式少糖”。2025 年Context Engineering 时代这个阶段的焦点从“写好一条指令”扩展到了“设计一个动态系统来组装上下文”——RAG、对话历史、工具输出、系统指令的编排都成了工程师需要操心的事。除了纸条还给他一张地图、一张咖啡店的菜单、你的工牌和零钱告诉他“这家店周二有折扣”。2026 年 2 月至今Harness Engineering 时代OpenAI在2026年2月的一篇官方博文中提出harness-engineering指人类工程师从亲手写代码转变为为AI智能体设计工具、规则和反馈环境从而在几乎不写代码的情况下实现大规模、高效率的软件开发。你发现这个实习生总买错于是你给他配了一个工牌、一个固定工位、一套标准操作流程甚至在他走错路的时候自动提醒。下次再来新人这套东西可以复用。为什么 Context Engineering 不够用了2025 年下半年一线实践者开始发现一个悖论光有好的上下文Agent 依然会失控。随着 Agent 进入更长链路、更高复杂度的真实任务Context Engineering 的局限性开始集中暴露它受到上下文注意力预算的约束会因为工具接入和协议开销持续挤压有效认知空间还难以自动补齐企业场景中真正关键的业务定义、数据口径和组织隐性知识。2025年底到2026年初Agent开始从“玩具”变成“工具”。OpenClaw这类框架让AI能真正操控电脑、调用API、执行多步任务。但也暴露了一个问题Agent跑得越长越容易失控。● 你让它“每天整理邮件并生成简报”它第三天可能开始重复发送同一封邮件● 你让它“帮我测试这个项目”它可能自己写代码、自己跑测试、自己部署但中间漏了一个步骤导致线上挂了● 你让它“帮我自动回消息”它可能因为某个对话卡住陷入无限循环这些问题光靠“更好的提示词”或“更全的上下文”解决不了。你需要的是一套能兜底的工程结构——这就是Harness Engineering要做的事。Harness Engineering 的三个维度1. 约束Constraints告诉Agent“什么不能做”。比如不能直接操作生产环境不能在没有确认的情况下发送邮件不能访问敏感文件夹OpenClaw 2026.3.28版本里加的requireApproval钩子就是典型例子执行危险操作前必须问用户一声。2. 脚手架Scaffolding给Agent搭好“骨架”让它知道步骤怎么走。比如收到任务后先拆解成子任务每完成一步记录状态如果某步失败尝试重试或回滚LangChain最近发布的Deep Agents核心就是内置了一套规划器让Agent不再“走一步看一步”而是先有全盘计划再执行。3. 回收机制Garbage CollectionAgent跑久了会产生各种“垃圾”——废弃的会话、重复的文件、跑偏的中间状态。需要有机制定期清理否则系统会越来越臃肿越来越容易出错。OpenAI那篇关于Harness Engineering的文章里提到他们有一个专门的Agent负责扫描代码库里的“腐烂残渣”比如那些被复制多次、已经不合理的模式。让Agent自己清理自己才是真正的闭环。一个具体例子假设你要做一个“自动回复客服邮件”的Agent。Prompt Engineering阶段你写一段提示词让它“根据邮件内容生成礼貌的回复”。Context Engineering阶段你给它加上历史邮件记录、客户信息、产品手册让它能更准确地回答。Harness Engineering阶段你规定它只能回复特定类型的邮件约束你设计一个流程先分类 → 再检索知识库 → 再生成回复 → 再人工确认脚手架你设置一个每周跑一次的清理任务删除已处理的旧邮件记录避免数据库膨胀回收工程师的新角色工程师的角色正在从“执行者”变为“驾驭者”。你需要的是强大的架构能力能够定义系统的边界设计模块之间的约束构建那个让 AI 不跑偏的“围栏”。同时你还需要精准的表达能力学会用最清晰的语言无论是自然语言还是结构化文档向 AI 描述你的意图。Harness Engineering 的真正启示不在于技术细节而在于组织哲学当 AI 执行时人类必须学会更好地掌舵。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

相关文章:

AI Agent 时代工程范式革命全解(非常详细),Harness Engineering 从入门到精通,收藏这一篇就够了!

如果你最近在关注 AI 编程领域,一定刷到过这个词:Harness Engineering。 这个新概念正在以惊人的速度取代 Prompt Engineering 和 Context Engineering,成为 AI Agent 工程优化的正解。 今天这篇文章,我用自己的理解帮你理清楚。…...

Claude Code 里,Subagents 和 Agent Teams 到底怎么选?有什么区别?

之前我写过几篇关于Multi-Agent的文章,介绍了Multi-Agent的一些模式。但是前不久Claude Code推出了Agent Team模式,当时我觉得,这不就是Multi-Agent的模式的一种新实现而已。后面详细拆解后,看到了 todo.md,task-list.…...

多LLM查询扩展框架实战指南(非常详细),RAG优化新范式从入门到精通,收藏这一篇就够了!

🎯 一句话总结:本文提出一套完全自动化的领域自适应查询扩展框架,无需人工编写Prompt或选择示例,通过BM25-MonoT5 pipeline构建领域内示例池,再用LLM精化多LLM扩展结果,显著提升检索性能。 📖 为…...

新手福音:在快马平台通过生成式提示零基础学懂lstm情感分析

今天想和大家分享一个特别适合深度学习新手的实践项目——用LSTM做文本情感分析。作为一个刚入门NLP的小白,我最初看到"长短期记忆网络"这个词就头大,直到在InsCode(快马)平台上通过生成式提示直接获得了可运行的代码项目,才真正理…...

兼容FX3U源码的增强版:支持以太网与串口下载,集成MODBUS-TCP协议,实现相对定位与绝...

18650锂电池高温热失控一、模块概述 FX3U系列PLC CAN网络通信模块是基于STM32F10x系列微控制器开发的专用通信组件,旨在实现多节点PLC设备间的可靠数据交互。该模块采用STM32F10x CAN外设硬件资源,结合自定义应用层协议,支持主从式网络架构&a…...

2025最权威的五大降重复率工具推荐榜单

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 基于自然语言处理以及机器学习算法的AI论文查重系统,会去分析文本语义&#xff0…...

2025届必备的降AI率神器推荐榜单

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 此刻知网已然集成了AI检测功能,是针对学术文本里的人工智能生成痕迹去做识别的。…...

2025届学术党必备的五大降AI率工具横评

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 要是想降低AIGC检测率,那就得从内容生成与后期修饰这两个关键的方面开始着手。在…...

看门狗悖论:对波普尔可证伪主义划界标准的归谬反驳

看门狗悖论:对波普尔可证伪主义划界标准的归谬反驳摘要卡尔・波普尔提出的可证伪性标准,被学界长期奉为科学与非科学的核心划界原则。该原则主张:一个命题若具备被经验事实反驳的逻辑可能,即可归入科学命题范畴。然而,…...

终极指南:3天快速上手ALOHA开源双臂机器人系统,从零到实战操作

终极指南:3天快速上手ALOHA开源双臂机器人系统,从零到实战操作 【免费下载链接】aloha 项目地址: https://gitcode.com/gh_mirrors/al/aloha ALOHA(A Low-cost Open-source Hardware System for Bimanual Teleoperation)是…...

Linux命令-ncftp(增强的的FTP工具)

ncftp 是 Linux 中一个功能强大的 FTP 客户端,提供了比传统 ftp 命令更丰富的功能和更友好的界面。它支持自动登录、断点续传、递归传输、书签管理等功能,是 FTP 操作的强大工具。 📖 基本语法 ncftp [选项] [主机名] ncftpget [选项] 主机名…...

3个技巧让N_m3u8DL-RE流媒体下载更高效

3个技巧让N_m3u8DL-RE流媒体下载更高效 【免费下载链接】N_m3u8DL-RE Cross-Platform, modern and powerful stream downloader for MPD/M3U8/ISM. English/简体中文/繁體中文. 项目地址: https://gitcode.com/GitHub_Trending/nm3/N_m3u8DL-RE 还在为喜欢的在线视频无…...

FastAPI + PostgreSQL 实战:从入门到不踩坑,一次讲透

🧐 第一部分:为什么是PostgreSQL?你可以把PostgreSQL想象成一个“极度守规矩的档案管理员”——数据完整性、ACID、复杂查询支持得滴水不漏。相比MySQL,它对JSON、全文检索、地理空间数据的支持更原生,而且这几年性能优…...

如何通过arknights-ui实现明日方舟界面定制?解锁个性化游戏体验新方式

如何通过arknights-ui实现明日方舟界面定制?解锁个性化游戏体验新方式 【免费下载链接】arknights-ui H5 复刻版明日方舟游戏主界面 项目地址: https://gitcode.com/gh_mirrors/ar/arknights-ui arknights-ui是一个基于H5CSS技术的开源项目,它提供…...

3分钟搞定B站缓存视频永久保存:m4s转MP4终极指南

3分钟搞定B站缓存视频永久保存:m4s转MP4终极指南 【免费下载链接】m4s-converter 一个跨平台小工具,将bilibili缓存的m4s格式音视频文件合并成mp4 项目地址: https://gitcode.com/gh_mirrors/m4/m4s-converter 你是否曾因B站视频下架而懊恼&#…...

当英文游戏遇上中文玩家:Degrees of Lewdity本地化之旅

当英文游戏遇上中文玩家:Degrees of Lewdity本地化之旅 【免费下载链接】Degrees-of-Lewdity-Chinese-Localization Degrees of Lewdity 游戏的授权中文社区本地化版本 项目地址: https://gitcode.com/gh_mirrors/de/Degrees-of-Lewdity-Chinese-Localization …...

Switch手柄电脑连接全攻略:BetterJoy开源工具使用指南

Switch手柄电脑连接全攻略:BetterJoy开源工具使用指南 【免费下载链接】BetterJoy Allows the Nintendo Switch Pro Controller, Joycons and SNES controller to be used with CEMU, Citra, Dolphin, Yuzu and as generic XInput 项目地址: https://gitcode.com/…...

新手必看:知乎话题数据采集从入门到精通(含代理IP配置与数据清洗技巧)

知乎数据采集实战指南:从零搭建合规爬虫系统 在信息爆炸的时代,知乎作为高质量内容社区,汇聚了大量行业见解和用户真实反馈。对于市场研究人员、产品经理或数据分析师而言,获取这些数据能为决策提供宝贵参考。本文将系统性地介绍如…...

SpringBoot+MinIO上传大文件报错?三步搞定Tomcat文件大小限制

SpringBootMinIO大文件上传报错深度解决方案 1. 问题现象与初步诊断 最近在开发一个基于SpringBoot和MinIO的文件存储系统时,遇到了一个令人困扰的问题:当尝试上传超过1MB的文件时,系统会抛出FileSizeLimitExceededException异常。错误日志明…...

Atlas 800I A2实战:5小时搞定DeepSeek V3 W4A8量化全流程(含显存优化技巧)

Atlas 800I A2实战:5小时搞定DeepSeek V3 W4A8量化全流程(含显存优化技巧) 在AI模型部署领域,量化技术正成为突破硬件限制的关键手段。当我们面对Atlas 800I A2这样的高性能服务器时,如何充分发挥其64GB显存优势&#…...

中文分词避坑指南:Jieba与统计分词法的性能对比与优化技巧

中文分词避坑指南:Jieba与统计分词法的深度对比与实战优化 在自然语言处理领域,中文分词一直是基础却充满挑战的环节。不同于英文等以空格分隔单词的语言,中文文本的连续字符流特性使得准确划分词语边界成为NLP预处理的关键难题。本文将深入剖…...

OpenMMLab 环境配置实战:从 YOLO 项目报错到模块化开发的避坑指南

1. 从YOLO项目报错说起:OpenMMLab环境配置的典型痛点 最近在复现一个基于YOLOv5改进的OpenMMLab项目时,遇到了让人头疼的ModuleNotFoundError: No module named mmdet报错。这个场景太典型了——明明项目目录里清清楚楚躺着mmdet文件夹,Pytho…...

Flutter Web:混合开发的最佳实践

Flutter Web:混合开发的最佳实践一次编写,多端运行。Flutter Web 让前端开发更加高效。一、Flutter Web 的优势 作为一名追求像素级还原的 UI 匠人,我对跨平台解决方案有着严格的要求。Flutter Web 不仅让我们能够使用相同的代码库构建 Andro…...

CSS 变量进阶:动态主题与复杂动画

CSS 变量进阶:动态主题与复杂动画从基础到高级,掌握 CSS 变量的全部潜能。一、CSS 变量的强大之处 作为一名把 CSS 视为流动韵律的 UI 匠人,我深知 CSS 变量的革命性意义。它们不仅让样式代码更易维护,还开启了动态主题、复杂动画…...

2025届毕业生推荐的降重复率方案实际效果

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 学术写作以及论文发表进程里,查重之后的降重处置是关键一环,当下市面…...

对接亚马逊 SP-API(Amazon Selling Partner API) 第一章:AWS IAM 配置详解

1. AWS IAM 基础概念扫盲 第一次接触亚马逊SP-API的开发者,往往会在IAM配置环节卡壳。我见过不少团队在这个阶段浪费两三周时间反复调试,其实只要理解几个核心概念就能事半功倍。IAM(Identity and Access Management)就像亚马逊AW…...

Scratch二次开发实战:如何按需“阉割”菜单栏功能?从关闭语言切换、主题到隐藏教程按钮

Scratch教学环境定制指南:精准控制菜单栏功能的艺术 1. 为什么需要定制Scratch界面? 在少儿编程教育领域,Scratch作为全球最受欢迎的图形化编程工具之一,其默认界面设计面向的是广泛年龄段的国际用户。然而在实际教学场景中&#…...

别再乱接光纤了!手把手教你用华为SNS2224交换机配置SAN Zone(附实战命令)

华为SNS2224光纤交换机SAN Zone配置实战指南 第一次接触企业级存储网络的新手,往往会被那些闪烁的光纤端口和复杂的命令行界面吓到。记得我刚入行时,就因为接错了一根光纤线,导致整个存储集群的性能下降了70%,那次事故让我深刻理解…...

【FastAPI】 + SQLAlchemy 异步 ORM 实现完整 CRUD 操作

🚀从零实战:FastAPI SQLAlchemy 异步 ORM 实现完整 CRUD 操作(附完整代码) 一、为什么要学「FastAPI SQLAlchemy 异步 ORM」? 在现代 Web 服务中,数据库是核心组件。然而,传统同步操作&#x…...

最小二乘问题详解15:束平差原理与基础实现

初始两帧的 E 矩阵分解可能存在错误解或尺度模糊;三角化结果受位姿误差和图像噪声影响;PnP 的位姿估计会继承并放大前期误差。 随着图像数量增加,这些局部误差会不断累积,导致最终重建结果出现尺度漂移、结构扭曲甚至拓扑错误。要…...