当前位置: 首页 > article >正文

Harness Engineering 又是什么新 AI 玩具?

今天我们聊了业内最新提出的 Harness Engineering。可以看到在 AI 智能体优先的世界里软件工程的鲁棒性开始转移到了支撑智能体上。最近 AI 编程可以说是卷上天了不得不说时代的大车轱辘已经碾过来了。GLM 一个月内狂发新模型。我们今天来聊聊 OpenAI 最近公布的一个极其硬核的内部实践——他们花五个月时间完全用内部的 Codex 从零写了一个百万行代码的产品。在这个过程中人类工程师一行代码都没写。为了支撑这种开发模式他们提出了一个非常核心的新概念Harness Engineering (驾驭工程)。我们今天这篇文章来聊聊这是什么新玩具Harness Engineering 是什么简单来说以前我们写代码是 “微观管理”敲击键盘写下每一个函数和业务逻辑。而在 Harness 模式下工程师的主要工作变成了“设计环境”。你不需要亲自下场干活而是去打造一套极其严密的护栏上下文系统和反馈回路用这套 “缰绳”去驾驭 AI 这个生产力怪兽。为了更直观地理解直接看概念图有了这套体系本质上就是人类掌舵智能体执行。AI 就像拉车的马只要缰绳在你手里跑得再快也不会偏离赛道。为什么不用传统的 Prompt 模式很多人的日常体验就是给一段 Prompt复制粘贴报错了再贴回去问。这个方式其实挺常见。我们一直把 AI 当成一个高级的自动智能工具。但是很无奈的是当你的目标是交付一个具备高可用性的大型软件时这种模式根本行不通。根据 OpenAI 团队的真实案例分享他们在项目初期进展非常缓慢。这倒不是因为模型能力不行而是因为 AI 缺乏上下文和工作环境。这引出了 Harness Engineering 的动因我们需要重新定义工程师的角色。你得把 AI 驾驭好而不是跟着它的报错在后面擦屁股。Harness Engineering 核心玩法我们来看下OpenAI 这帮大佬具体是怎么搭建这套驾驭环境的。这里有几个点需要注意。把代码仓库变成记录系统以前我们为了让 AI 懂业务恨不得写个几千行的超大 Prompt。OpenAI 团队也尝试过搞一个巨无霸的AGENTS.md文件。结果显而易见一旦指令过多AI 就会开始漏看关键约束甚至产生幻觉。这就很尴尬当所有东西都“重要”时就等于什么都不重要。现在的解法是给 AI 一张地图而不是一本厚重的说明书。新旧写法对比举个例子我们来看下旧写法和新写法的对比直观感受。旧写法 (灾难现场)试图在一个 Prompt 或大文件中塞入所有架构规范数据库表结构和业务历史。AI 瞬间上下文爆炸开始瞎编乱造。新写法 (Harness 模式)只给一个 100 行左右的短小AGENTS.md作为目录索引配合严格的文档目录结构代码仓库/ ├── AGENTS.md (仅作导航地图告诉 AI 去哪找什么) ├── docs/ │ ├── design-docs/ (核心理念与设计状态) │ ├── exec-plans/ (正在执行的计划与技术债) │ └── generated/ (由 AI 自动生成的 Schema 等) └── src/通过这种渐进式的信息披露机制AI 从一个稳定的小入口开始工作按照指南去查找深层资料。并且他们还会专门跑一个定期任务让另一拨 AI 自己去巡检文档是否过期实现自动化更新。面向智能体的可观测性这是一个非常超前的概念。以往我们写代码讲究“对人友好”现在得讲究“对 AI 友好”。AI 就像是一个永远在线但无法参加你在 Slack 和会议室里讨论的新员工。如果知识只存在于飞书文档或者你的脑子里对 AI 来说就是不存在的。代码仓库里存放的版本化工件就是它能看到的全部世界。为了让 AI 拥有“视觉”和“触觉”OpenAI 团队为 AI 接入了 Chrome DevTools 协议。当前端出现问题时AI 可以直接启动应用实例通过 DOM 快照和页面截图去复现 Bug 并验证修复。他们甚至为本地开发赋予了完整的可观测性堆栈。当任务跑起来后AI 可以直接使用 LogQL 查询日志或者用 PromQL 查询监控指标。这就意味着你可以直接给 AI 下达这样的指令“确保这个接口的冷启动耗时在 800ms 以内。” 剩下的排查工作AI 会自己在半夜跑上六个多小时去死磕。用机制规范架构与代码品味AI 写代码很容易放飞自我如果不加干预百万行代码很快就会变成一座难以维护的屎山。怎么解决呢本质上就是上硬核的架构约束。在 Harness Engineering 中我们不会去微观管理 AI 的每一行代码实现而是通过 Linter 和结构化测试在边界处架起机枪。比如他们设计了一套有着明确界限的分层领域架构。代码的依赖方向必须严格遵守规范Types - Config - Repo - Service - Runtime - UI。对抗熵增AI 代码的垃圾回收频繁使用 AI 会带来新的问题。AI 会模仿代码库里现有的写法甚至包括那些不太优雅的历史包袱导致技术债加速积累。起初工程师们每周五还要苦哈哈地手动清理这些“AI 残渣”。后来发现这根本不符合 Harness Engineering 的精神。最终的终极方案是用魔法打败魔法。他们将“黄金原则”直接编码到代码仓库中然后在后台起一组 AI 智能体定期全盘扫描代码库寻找偏差。这就好比我们熟知的 Go 语言里的垃圾回收机制 (GC)这些 AI 会自动发起重构的 Pull Request把不符合规范的逻辑给替换掉。这种高频微小的还债方式彻底解决了大项目积重难返的问题。社区声音与延伸思考面对这样疯狂的开发范式社区里大家也是谁都不服谁。一方面许多坚守传统的极客认为彻底把底座交给黑盒的 AI 模型风险极高万一出个安全漏洞连排查都无从下手。另一方面前沿的拥抱者觉得只要测试覆盖率和 Linter 护栏足够严密AI 带来的效率提升是碾压级的。五个月搞定平时几十个人的工作量这在商业上的诱惑力太大了。我个人的感觉是核心工程师的职能真的在发生转移。未来的高级开发会越来越像 “环境架构师”或者 “系统平台维护者”。当吞吐量大到一定程度时你连 Code Review 都懒得看了直接让另一个 AI 去做 CR 审查。这听起来有点科幻但已经在不少公司里落地了。总结今天我们聊了业内最新提出的 Harness Engineering。可以看到在 AI 智能体优先的世界里软件工程的鲁棒性开始转移到了支撑智能体上。通过把代码仓库打造成纯粹的记录系统面向智能体优化可读性并利用强约束 Linter 和自动化 GC 机制我们完全可以驾驭 AI 替我们干掉海量的工作。如果大家可以提前掌握这种高维度的 “驾驭” 能力绝对是未来几年的核心竞争力。

相关文章:

Harness Engineering 又是什么新 AI 玩具?

今天我们聊了业内最新提出的 Harness Engineering。可以看到,在 AI 智能体优先的世界里,软件工程的鲁棒性开始转移到了支撑智能体上。最近 AI 编程可以说是卷上天了,不得不说时代的大车轱辘已经碾过来了。GLM 一个月内狂发新模型。我们今天来…...

MissionPlanner地面站调试Pixhawk:除了基础校准,你的F450还能设置这些高级功能

MissionPlanner地面站进阶指南:解锁Pixhawk飞控的隐藏潜力 当你已经能够熟练完成F450无人机的基础校准,让四轴稳稳升空只是起点而非终点。MissionPlanner作为Pixhawk飞控的瑞士军刀,藏着许多被普通教程忽略的进阶功能——这些功能往往决定着你…...

MiniCPM-o-4.5-nvidia-FlagOS处理Markdown文档效果:使用Typora风格进行优雅排版

MiniCPM-o-4.5-nvidia-FlagOS处理Markdown文档效果:使用Typora风格进行优雅排版 不知道你有没有过这样的经历:辛辛苦苦写了一大堆技术笔记,代码片段、命令、思路混杂在一起,过几天自己再看,都感觉像在看天书。或者&…...

ISL29125 RGB环境光传感器驱动与嵌入式应用实战

1. ISL29125 RGB环境光传感器技术解析与嵌入式驱动开发实践ISL29125 是 Intersil(现属 Renesas)推出的一款高精度、低功耗、IC 接口的 RGB 环境光传感器(Ambient Light Sensor, ALS),专为智能手机、平板电脑、可穿戴设…...

解决MicroBlaze程序启动难题:Vivado中bit与elf文件合并的完整流程

解决MicroBlaze程序启动难题:Vivado中bit与elf文件合并的完整流程 在FPGA开发中,MicroBlaze软核处理器的应用越来越广泛,但许多开发者都会遇到一个共同的痛点:每次下载程序都需要分别加载bit文件和elf文件,这不仅增加了…...

如何用React打造经典Windows XP桌面体验:完整实现指南

如何用React打造经典Windows XP桌面体验:完整实现指南 【免费下载链接】winXP 🏁 Web based Windows XP desktop recreation. 项目地址: https://gitcode.com/gh_mirrors/wi/winXP Windows XP作为微软最经典的操作系统之一,至今仍被许…...

告别繁琐安装!3分钟用PPTist打造专业级在线演示文稿

告别繁琐安装!3分钟用PPTist打造专业级在线演示文稿 【免费下载链接】PPTist 基于 Vue3.x TypeScript 的在线演示文稿(幻灯片)应用,还原了大部分 Office PowerPoint 常用功能,实现在线PPT的编辑、演示。支持导出PPT文…...

从零到一:基于LLaMA-Factory与Ollama的本地大模型定制化实战

1. 为什么需要本地定制化大模型? 最近两年,大语言模型的发展速度简直让人瞠目结舌。从最初的GPT-3到现在的Llama 3,模型能力越来越强,但随之而来的问题是:这些通用大模型真的能满足我们每个人的特定需求吗?…...

3步实现URL效率革命:Redirector极简方案让浏览器跳转更智能

3步实现URL效率革命:Redirector极简方案让浏览器跳转更智能 【免费下载链接】Redirector Browser extension (Firefox, Chrome, Opera, Edge) to redirect urls based on regex patterns, like a client side mod_rewrite. 项目地址: https://gitcode.com/gh_mirr…...

保姆级教程:在绿联NAS上用Docker Compose一键部署PaddleOCR,打造本地私有化OCR服务

绿联NASDocker Compose极简部署PaddleOCR:零命令行打造私有文字识别服务 家里堆积如山的合同发票需要电子化?团队内部敏感文档不敢用云端OCR?绿联NAS用户现在可以抛开复杂命令,用Docker Compose三分钟搭建企业级文字识别服务。本文…...

51单片机项目避坑实录:我的声光控灯为什么白天也亮?从硬件到代码的故障排查指南

51单片机声光控灯项目实战:从硬件选型到代码调试的深度避坑指南 深夜的实验室里,我盯着眼前这个不听话的声光控灯——明明窗外阳光明媚,它却固执地亮着。作为一名嵌入式开发新手,这个看似简单的51单片机项目让我踩遍了所有可能的坑…...

全平台广告拦截神器:AdGuard扩展零门槛部署与优化指南

全平台广告拦截神器:AdGuard扩展零门槛部署与优化指南 【免费下载链接】AdguardBrowserExtension AdGuard browser extension 项目地址: https://gitcode.com/gh_mirrors/ad/AdguardBrowserExtension 广告拦截技术已成为现代浏览器的必备能力,AdG…...

Realistic Vision V5.1镜像免配置部署教程:Docker+本地模型路径自动校验

Realistic Vision V5.1镜像免配置部署教程:Docker本地模型路径自动校验 1. 项目概述 Realistic Vision V5.1虚拟摄影棚是基于Stable Diffusion 1.5生态顶级写实模型开发的本地化工具,专为追求摄影级人像效果的用户设计。这个解决方案通过Docker容器化技…...

硬件(6)——定时器

硬件中如何确定引脚电平的高低?硬件内部有一个比较器,类似门电路,有两个输入一个输出,其中一个输入接稳定的参考值(DCDC 3.3V),另一个输入接引脚。当引脚高于3.3V就输出高电平,引脚低于3.3V就输…...

Nuka Carousel与TypeScript完美集成:类型安全和开发体验提升

Nuka Carousel与TypeScript完美集成:类型安全和开发体验提升 【免费下载链接】nuka-carousel Small, fast, and accessibility-first React carousel library with an easily customizable UI and behavior to fit your brand and site. 项目地址: https://gitcod…...

终极指南:如何用Ice打造清爽Mac菜单栏?2025年最强大的macOS菜单栏管理工具

终极指南:如何用Ice打造清爽Mac菜单栏?2025年最强大的macOS菜单栏管理工具 【免费下载链接】Ice Powerful menu bar manager for macOS 项目地址: https://gitcode.com/GitHub_Trending/ice/Ice Ice是一款强大的macOS菜单栏管理工具,它…...

音频工程师必看:奈奎斯特采样定理在实际录音中的5个常见误区

音频工程师必看:奈奎斯特采样定理在实际录音中的5个常见误区 在专业音频制作领域,采样率设置是决定录音质量的基础性环节。许多工程师虽然熟悉44.1kHz或48kHz这些标准数字,却对背后的奈奎斯特采样定理存在认知偏差。这些误解轻则导致后期处理…...

WPS加载项开发实战:从零到一构建你的第一个wpsjs插件

1. 为什么你需要WPS加载项开发 第一次听说WPS加载项时,我也是一头雾水。直到接手了一个客户需求——他们需要在WPS里快速生成固定格式的周报模板,我才真正体会到这个功能的价值。想象一下,你每天要处理几十份格式雷同的文档,如果能…...

ES10(ES2019)新特性完整指南

ES10(ES2019)新特性发布时间:2019年6月 ES10 新增了数组扁平化、对象转换、字符串修剪等实用方法。1. Array.prototype.flat() 将嵌套数组"拉平",返回一个新数组: 基本用法 [1, 2, [3, 4]].flat(); //…...

终极指南:Hilt依赖注入在Droid-ify开源应用中的实战应用 [特殊字符]

终极指南:Hilt依赖注入在Droid-ify开源应用中的实战应用 🚀 【免费下载链接】client F-Droid client with Material UI. 项目地址: https://gitcode.com/gh_mirrors/clie/client 在Android应用开发领域,Droid-ify作为一个优秀的F-Dro…...

华为 eNSP 实战:SSH 密钥认证配置与安全加固指南

1. 为什么选择SSH密钥认证而非密码? 在华为eNSP模拟的企业网络环境中,传统的SSH密码认证虽然比Telnet安全,但依然存在被暴力破解的风险。我曾在实际项目中发现,使用弱密码的设备在暴露公网后,平均每天会遭受上千次登录…...

2023B卷,IPv4地址转换成整数

👨‍⚕️ 主页: gis分享者 👨‍⚕️ 感谢各位大佬 点赞👍 收藏⭐ 留言📝 加关注✅! 👨‍⚕️ 收录于专栏:华为OD面试 文章目录 一、🍀前言 1.1 ☘️题目详情 1.2 ☘️参考解题答案 一、🍀前言 2023B卷,IPv4地址转换成整数。 1.1 ☘️题目详情 题目: 存…...

Syncfusion Dashboard部署指南:从开发到生产环境的完整流程

Syncfusion Dashboard部署指南:从开发到生产环境的完整流程 【免费下载链接】project_syncfusion_dashboard This is a code repository for the corresponding YouTube video. In this tutorial we are going to build and deploy a an admin dashboard app using …...

MySQL开发者必看:金仓数据库兼容性迁移避坑指南(含外键处理技巧)

MySQL开发者必看:金仓数据库兼容性迁移避坑指南(含外键处理技巧) 当企业级应用需要从MySQL迁移到金仓数据库时,开发者往往会面临一系列兼容性挑战。作为国产数据库的代表,金仓数据库虽然提供了MySQL兼容模式&#xff0…...

老旧设备系统升级技术解析:4步实战指南让旧Mac焕发新生

老旧设备系统升级技术解析:4步实战指南让旧Mac焕发新生 【免费下载链接】OpenCore-Legacy-Patcher 体验与之前一样的macOS 项目地址: https://gitcode.com/GitHub_Trending/op/OpenCore-Legacy-Patcher 老旧Mac设备升级macOS系统是许多用户面临的技术难题&am…...

5个WebGL流体模拟创新体验让你轻松打造动态视觉艺术

5个WebGL流体模拟创新体验让你轻松打造动态视觉艺术 【免费下载链接】WebGL-Fluid-Simulation Play with fluids in your browser (works even on mobile) 项目地址: https://gitcode.com/gh_mirrors/web/WebGL-Fluid-Simulation 当静态网页设计已无法满足用户对交互体验…...

三步突破语音克隆音质瓶颈:VoxCPM ZipEnhancer全解析

三步突破语音克隆音质瓶颈:VoxCPM ZipEnhancer全解析 【免费下载链接】VoxCPM VoxCPM: Tokenizer-Free TTS for Context-Aware Speech Generation and True-to-Life Voice Cloning 项目地址: https://gitcode.com/GitHub_Trending/vo/VoxCPM 在语音合成领域&…...

Wan2.2-I2V-A14B绿色AI实践:显存优化降低35%功耗的碳足迹测算

Wan2.2-I2V-A14B绿色AI实践:显存优化降低35%功耗的碳足迹测算 1. 引言:绿色AI的迫切需求 在AI技术快速发展的今天,大模型训练和推理带来的能源消耗问题日益突出。Wan2.2-I2V-A14B作为一款先进的文生视频模型,通过显存优化技术实…...

Django CORS Headers终极配置指南:Vue、React、Angular前端框架完美集成方案

Django CORS Headers终极配置指南:Vue、React、Angular前端框架完美集成方案 【免费下载链接】django-cors-headers Django app for handling the server headers required for Cross-Origin Resource Sharing (CORS) 项目地址: https://gitcode.com/gh_mirrors/d…...

open-parse快速入门:5分钟掌握智能文档解析的终极方法

open-parse快速入门:5分钟掌握智能文档解析的终极方法 【免费下载链接】open-parse Improved file parsing for LLM’s 项目地址: https://gitcode.com/gh_mirrors/op/open-parse open-parse是一款专为LLM(大语言模型)优化的智能文档解…...