当前位置：首页 > article >正文

AI Agent不是你以为的那样

article 2026/4/2 8:18:01

系列《AI Agent 从原理到实战 —— 解密 Claude Code 背后的工程智慧》第1篇引言你大概有过这样的体验打开 ChatGPT说一句帮我写封邮件拒绝周五的会议邀请语气委婉一点几秒钟后一封措辞得体的邮件就出来了。复制粘贴发送完事。但如果你说的是帮我把这个项目的测试覆盖率从 40% 提到 80%呢这不是写一段文字就能解决的事。它需要读代码、理解业务逻辑、找出没覆盖的分支、写测试用例、跑测试、看失败原因、改测试、再跑——可能要循环几十次。前者是一个工具在帮你后者才接近一个Agent在帮你。这两件事的区别远比大多数人以为的要大。而市面上很多自称AI Agent的产品本质上还停留在第一种——只是把它包装得像第二种。回到起点最早的 AI Agent 长什么样要理解什么是真正的 Agent值得回头看几个里程碑。2013年DeepMind 的 DQN 打 Atari 游戏。一个神经网络输入是游戏画面的像素输出是手柄操作。没有人写规则告诉它看到敌人要开枪它自己从零开始通过反复试错学会了玩几十款游戏——有些甚至超过了人类玩家的水平。2019年OpenAI Five 打 Dota 2。五个 AI 组队击败了 Dota 2 世界冠军 OG。Dota 2 是一个信息极其复杂的游戏地图有战争迷雾英雄有上百个技能需要团队配合、资源分配、时机判断。OpenAI Five 没有任何硬编码的策略全靠自我对弈训练出来。同年DeepMind 的 AlphaStar 打星际争霸。星际争霸被认为是 AI 最难攻克的游戏之一——实时操作、不完全信息、长期规划缺一不可。AlphaStar 达到了欧服大师段位超过 99.8% 的人类玩家。还是2019年腾讯的绝悟打王者荣耀。在与 KPL王者荣耀职业联赛职业选手的对抗中取得了胜利。又一个纯粹靠训练、没有人工策略的 AI。这些 Agent 的共同点把这四个案例放在一起看有一个关键共性Agent 就是模型本身。DQN 是一个神经网络。OpenAI Five 是五个神经网络。AlphaStar 是一个神经网络。绝悟也是。它们的智能不是外面套的代码给的是训练出来的。没有人写了一个if enemy_nearby then attack()的规则——如果靠这种规则它们不可能超越人类因为写规则的人本身就是人类天花板就在那里。这就引出了一个核心观点。Agent 训练出来的模型不是规则拼出来的工作流现在市面上有大量AI Agent 平台它们的工作方式通常是这样的用户定义一个流程比如先搜索再总结再发邮件每一步调用一次 LLM步骤之间用硬编码的逻辑串起来这不是 Agent。这是一条流水线LLM 只是流水线上的一个零件。决策权不在模型手里在写流程的人手里。这种做法有一个学术名字叫GOFAIGood Old-Fashioned AI也就是经典符号人工智能。上世纪六七十年代的主流思路把世界建模成规则和符号用逻辑推理解决问题。专家系统就是这条路的产物。它能解决一些结构化的、边界清晰的问题但碰到真实世界的复杂性就崩了——因为你不可能穷举所有规则。给 LLM 套一个 if-else 外壳本质上就是穿了新衣服的 GOFAI。它看起来时髦但走的是同一条死胡同。真正的 Agent 应该是模型自己决定下一步做什么。它看到当前状态判断需要什么信息或操作选择合适的工具执行观察结果再决定下一步。整个决策链条是模型的推理能力驱动的不是预设的流程图驱动的。那程序员的角色是什么如果 Agent 的智能来自模型模型又不是我们训练的那是 Anthropic、OpenAI 这些公司的事那我们干什么这里有一个类比值得记住模型是司机代码是车。你造的不是司机你造的是车。一个优秀的司机模型坐进一辆没有方向盘的车里哪儿也去不了。而你的工作就是造一辆好车——有方向盘、有仪表盘、有油门刹车、有导航系统——让司机能充分发挥能力。这辆车在 AI Agent 领域有一个专门的名字Harness。Harness 这个词在中文里不太好直译。它的本意是线具或挽具——套在马身上的那套装备让马的力量能被有效利用。在 AI Agent 语境下你可以把它理解成驾驶舱它不提供动力智能但它决定了动力能不能被正确释放。Claude Code 就是这样一个 Harness。它本身不是 Agent——Claude 模型才是 Agent。Claude Code 是给 Claude 造的那辆车让它能在你的电脑上读文件、写代码、跑命令、搜索信息。小结回顾一下这篇文章的核心观点AI Agent 的智能来自训练出来的模型不是外面包的规则和流程给 LLM 套 if-else 外壳的做法本质是老式符号 AI 的翻版有明确的天花板我们程序员、产品经理、各行各业的从业者的角色不是造司机而是造车这辆车叫 Harness那这辆车到底长什么样它最核心的结构是什么下一篇我们来看 AI Agent 最简单也最重要的一个机制——Agent Loop。

AI Agent不是你以为的那样

相关文章：

AI Agent不是你以为的那样

智慧树自动刷课插件：三步实现网课自动化学习的完整指南

百度网盘提取码智能方案：从繁琐搜索到效率革命的技术跃迁

PasteMD在技术文档整理中的应用：快速将接口说明转为标准Markdown

告别混乱！用Power BI工作区高效管理跨部门报表：数据集/仪表板/报告编排技巧

社区居家养老实训室设备配置与空间布局

金融保险会议室怎么打造？数据安全+高效协作会议系统标杆

uniApp实现跨平台跳转支付宝小程序的完整方案

SenseVoice Small模型可解释性：注意力权重可视化与关键语音片段定位

AssetRipper终极指南：轻松提取Unity游戏资源的完整教程

艾体宝洞察|语义搜索与关键词搜索？业务的抉择

2026软考高项论文题目预测！十大管理+绩效域双押题（附答题思路）

DeepCAD实战指南：AI驱动CAD模型生成的终极解决方案

从图像处理到推荐系统：特征值不等式在工程中的5个妙用

告别手动逐个校验，用快马快速构建vmware密钥批量验证工具提升效率

实测联想小新Pro 16 GT：一台把性能、AI和续航拉满的AI PC

如何快速搭建抖音批量下载工具：面向初学者的完整指南

CAM++说话人识别系统优化指南：调整相似度阈值提升准确率

MelonLoader完全解决方案：Unity游戏Mod加载实战指南

广州邮科如何为你的系统选择合适的在线式充电机？

如何通过LeaguePrank实现游戏界面个性化：打造独特的英雄联盟视觉体验

Qwen3.5-4B-Claude-Opus镜像保姆级教程：双RTX4090D上开箱即用

SenseVoice WebUI镜像体验：上传音频秒获文字+表情标签，小白也能玩转

PyTorch 2.8镜像实操手册：基于40G数据盘的视频生成训练环境搭建

基于凌科芯安加密芯片智能门锁解决方案

Zotero GPT插件全攻略：打造智能化文献管理工作流

效率倍增：用快马生成openclaw在ubuntu的一键部署与docker化脚本

MCP 实现深度技术报告

TranslucentTB 架构深度解析：Windows 任务栏透明化技术实现与工程化实践

5秒破解百度网盘提取码：baidupankey智能工具如何重塑你的资源获取体验