当前位置: 首页 > article >正文

AI Agent不是你以为的那样

系列《AI Agent 从原理到实战 —— 解密 Claude Code 背后的工程智慧》 第1篇引言你大概有过这样的体验打开 ChatGPT说一句帮我写封邮件拒绝周五的会议邀请语气委婉一点几秒钟后一封措辞得体的邮件就出来了。复制粘贴发送完事。但如果你说的是帮我把这个项目的测试覆盖率从 40% 提到 80%呢这不是写一段文字就能解决的事。它需要读代码、理解业务逻辑、找出没覆盖的分支、写测试用例、跑测试、看失败原因、改测试、再跑——可能要循环几十次。前者是一个工具在帮你后者才接近一个Agent在帮你。这两件事的区别远比大多数人以为的要大。而市面上很多自称AI Agent的产品本质上还停留在第一种——只是把它包装得像第二种。回到起点最早的 AI Agent 长什么样要理解什么是真正的 Agent值得回头看几个里程碑。2013年DeepMind 的 DQN 打 Atari 游戏。一个神经网络输入是游戏画面的像素输出是手柄操作。没有人写规则告诉它看到敌人要开枪它自己从零开始通过反复试错学会了玩几十款游戏——有些甚至超过了人类玩家的水平。2019年OpenAI Five 打 Dota 2。五个 AI 组队击败了 Dota 2 世界冠军 OG。Dota 2 是一个信息极其复杂的游戏地图有战争迷雾英雄有上百个技能需要团队配合、资源分配、时机判断。OpenAI Five 没有任何硬编码的策略全靠自我对弈训练出来。同年DeepMind 的 AlphaStar 打星际争霸。星际争霸被认为是 AI 最难攻克的游戏之一——实时操作、不完全信息、长期规划缺一不可。AlphaStar 达到了欧服大师段位超过 99.8% 的人类玩家。还是2019年腾讯的绝悟打王者荣耀。在与 KPL王者荣耀职业联赛职业选手的对抗中取得了胜利。又一个纯粹靠训练、没有人工策略的 AI。这些 Agent 的共同点把这四个案例放在一起看有一个关键共性Agent 就是模型本身。DQN 是一个神经网络。OpenAI Five 是五个神经网络。AlphaStar 是一个神经网络。绝悟也是。它们的智能不是外面套的代码给的是训练出来的。没有人写了一个if enemy_nearby then attack()的规则——如果靠这种规则它们不可能超越人类因为写规则的人本身就是人类天花板就在那里。这就引出了一个核心观点。Agent 训练出来的模型不是规则拼出来的工作流现在市面上有大量AI Agent 平台它们的工作方式通常是这样的用户定义一个流程比如先搜索再总结再发邮件每一步调用一次 LLM步骤之间用硬编码的逻辑串起来这不是 Agent。这是一条流水线LLM 只是流水线上的一个零件。决策权不在模型手里在写流程的人手里。这种做法有一个学术名字叫GOFAIGood Old-Fashioned AI也就是经典符号人工智能。上世纪六七十年代的主流思路把世界建模成规则和符号用逻辑推理解决问题。专家系统就是这条路的产物。它能解决一些结构化的、边界清晰的问题但碰到真实世界的复杂性就崩了——因为你不可能穷举所有规则。给 LLM 套一个 if-else 外壳本质上就是穿了新衣服的 GOFAI。它看起来时髦但走的是同一条死胡同。真正的 Agent 应该是模型自己决定下一步做什么。它看到当前状态判断需要什么信息或操作选择合适的工具执行观察结果再决定下一步。整个决策链条是模型的推理能力驱动的不是预设的流程图驱动的。那程序员的角色是什么如果 Agent 的智能来自模型模型又不是我们训练的那是 Anthropic、OpenAI 这些公司的事那我们干什么这里有一个类比值得记住模型是司机代码是车。你造的不是司机你造的是车。一个优秀的司机模型坐进一辆没有方向盘的车里哪儿也去不了。而你的工作就是造一辆好车——有方向盘、有仪表盘、有油门刹车、有导航系统——让司机能充分发挥能力。这辆车在 AI Agent 领域有一个专门的名字Harness。Harness 这个词在中文里不太好直译。它的本意是线具或挽具——套在马身上的那套装备让马的力量能被有效利用。在 AI Agent 语境下你可以把它理解成驾驶舱它不提供动力智能但它决定了动力能不能被正确释放。Claude Code 就是这样一个 Harness。它本身不是 Agent——Claude 模型才是 Agent。Claude Code 是给 Claude 造的那辆车让它能在你的电脑上读文件、写代码、跑命令、搜索信息。小结回顾一下这篇文章的核心观点AI Agent 的智能来自训练出来的模型不是外面包的规则和流程给 LLM 套 if-else 外壳的做法本质是老式符号 AI 的翻版有明确的天花板我们程序员、产品经理、各行各业的从业者的角色不是造司机而是造车这辆车叫 Harness那这辆车到底长什么样它最核心的结构是什么下一篇我们来看 AI Agent 最简单也最重要的一个机制——Agent Loop。

相关文章:

AI Agent不是你以为的那样

系列:《AI Agent 从原理到实战 —— 解密 Claude Code 背后的工程智慧》 第1篇引言 你大概有过这样的体验:打开 ChatGPT,说一句"帮我写封邮件,拒绝周五的会议邀请,语气委婉一点",几秒钟后一封措辞…...

智慧树自动刷课插件:三步实现网课自动化学习的完整指南

智慧树自动刷课插件:三步实现网课自动化学习的完整指南 【免费下载链接】zhihuishu 智慧树刷课插件,自动播放下一集、1.5倍速度、无声 项目地址: https://gitcode.com/gh_mirrors/zh/zhihuishu 还在为智慧树平台冗长的网课视频而烦恼吗&#xff1…...

百度网盘提取码智能方案:从繁琐搜索到效率革命的技术跃迁

百度网盘提取码智能方案:从繁琐搜索到效率革命的技术跃迁 【免费下载链接】baidupankey 项目地址: https://gitcode.com/gh_mirrors/ba/baidupankey 问题诊断:资源获取的现代困境 时间成本的指数级浪费 传统提取码查找流程涉及多平台切换、关键…...

PasteMD在技术文档整理中的应用:快速将接口说明转为标准Markdown

PasteMD在技术文档整理中的应用:快速将接口说明转为标准Markdown 1. 技术文档整理的痛点与解决方案 在日常开发工作中,技术文档的编写和维护往往是最容易被忽视却又至关重要的环节。特别是接口文档,它们通常以多种形式存在:代码…...

告别混乱!用Power BI工作区高效管理跨部门报表:数据集/仪表板/报告编排技巧

告别混乱!用Power BI工作区高效管理跨部门报表:数据集/仪表板/报告编排技巧 在数据驱动的商业环境中,跨部门协作常陷入"数据孤岛"困境——财务部的销售分析需要市场部的活动数据,运营部的库存报表又依赖采购部的供应商信…...

社区居家养老实训室设备配置与空间布局

社区居家养老实训室是衔接养老服务理论与实操的核心载体,其设备配置需贴合居家养老实际场景,空间布局需兼顾实操便利性与场景真实性,以下结合实操需求,分模块给出具体可落地的配置与布局方案,适配各类院校及培训机构建…...

金融保险会议室怎么打造?数据安全+高效协作会议系统标杆

金融保险机构的会议室不仅是协作空间,更是数据安全与合规管控的核心场景。面对战略研讨、风控决策、客户洽谈等高密会议需求,传统会议系统已难以兼顾 “高清协作、智能提效、数据不外泄” 三大核心诉求。思科视频会议 思必驰音频 离线转写主机的组合方…...

uniApp实现跨平台跳转支付宝小程序的完整方案

1. 跨平台跳转支付宝小程序的背景与挑战 在移动应用开发中,实现应用间的无缝跳转是提升用户体验的关键环节。对于使用uniApp框架的开发者来说,如何在不同操作系统上正确唤起支付宝小程序,是一个既常见又棘手的问题。iOS和Android平台在协议处…...

SenseVoice Small模型可解释性:注意力权重可视化与关键语音片段定位

SenseVoice Small模型可解释性:注意力权重可视化与关键语音片段定位 1. 项目背景与意义 语音识别技术在日常生活中的应用越来越广泛,从智能助手到会议转录,从语音输入到多媒体内容处理,都离不开高效准确的语音转文字服务。Sense…...

AssetRipper终极指南:轻松提取Unity游戏资源的完整教程

AssetRipper终极指南:轻松提取Unity游戏资源的完整教程 【免费下载链接】AssetRipper GUI Application to work with engine assets, asset bundles, and serialized files 项目地址: https://gitcode.com/GitHub_Trending/as/AssetRipper 还在为无法获取Uni…...

艾体宝洞察|语义搜索与关键词搜索?业务的抉择

包括我在内,不少人第一次做搜索功能时,都会觉得这是一件没什么技术含量的事:用户输入几个词,系统返回结果,不就行了吗? 但只要你真正做过搜索系统,尤其是参与过 RAG(Retrieval-Augme…...

2026软考高项论文题目预测!十大管理+绩效域双押题(附答题思路)

备考软考高项的同学都知道,论文是决定成败的关键一科。随着2025年绩效域全面上位,论文考核方式已从“单一知识点”升级为“绩效域协同五大过程组联动可量化测量指标”的实战型命题。2026年考什么?如何准备?本文基于近3年命题规律&…...

DeepCAD实战指南:AI驱动CAD模型生成的终极解决方案

DeepCAD实战指南:AI驱动CAD模型生成的终极解决方案 【免费下载链接】DeepCAD code for our ICCV 2021 paper "DeepCAD: A Deep Generative Network for Computer-Aided Design Models" 项目地址: https://gitcode.com/gh_mirrors/de/DeepCAD DeepC…...

从图像处理到推荐系统:特征值不等式在工程中的5个妙用

从图像处理到推荐系统:特征值不等式在工程中的5个妙用 在工程实践中,数学工具往往能带来意想不到的优化效果。特征值不等式作为线性代数中的重要结论,其应用范围远超理论推导,能解决图像处理、推荐系统等多个领域的实际问题。本文…...

告别手动逐个校验,用快马快速构建vmware密钥批量验证工具提升效率

告别手动逐个校验,用快马快速构建vmware密钥批量验证工具提升效率 最近在帮朋友处理一批VMware16的密钥验证工作,发现手动逐个检查不仅耗时耗力,还容易出错。特别是当需要验证几十甚至上百个密钥时,这种重复劳动简直让人崩溃。于…...

实测联想小新Pro 16 GT:一台把性能、AI和续航拉满的AI PC

最近体验了联想小新Pro 16 GT AI元启版,它不像是传统轻薄本,更像一台兼顾便携、性能和智能体验的全能机型。抛开品牌滤镜,单看硬件和实际使用,确实有不少值得一说的亮点。外观轻薄耐看,屏幕和接口都很实在这台机器用了…...

如何快速搭建抖音批量下载工具:面向初学者的完整指南

如何快速搭建抖音批量下载工具:面向初学者的完整指南 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback suppor…...

CAM++说话人识别系统优化指南:调整相似度阈值提升准确率

CAM说话人识别系统优化指南:调整相似度阈值提升准确率 1. 相似度阈值的基础认知 1.1 什么是相似度阈值 在CAM说话人识别系统中,相似度阈值是一个关键参数,用于判断两段语音是否来自同一说话人。系统会计算两段语音特征的余弦相似度&#x…...

MelonLoader完全解决方案:Unity游戏Mod加载实战指南

MelonLoader完全解决方案:Unity游戏Mod加载实战指南 【免费下载链接】MelonLoader The Worlds First Universal Mod Loader for Unity Games compatible with both Il2Cpp and Mono 项目地址: https://gitcode.com/gh_mirrors/me/MelonLoader 当你兴致勃勃地…...

广州邮科如何为你的系统选择合适的在线式充电机?

设备运行最怕断电。在线式充电机,就是那个能让设备“永不断电”的充电神器。今天咱们用大白话,把它讲清楚。它到底是什么?简单说,就是能一边给设备供电,一边给电池充电的智能设备。设备不用停机,电池也能充…...

如何通过LeaguePrank实现游戏界面个性化:打造独特的英雄联盟视觉体验

如何通过LeaguePrank实现游戏界面个性化:打造独特的英雄联盟视觉体验 【免费下载链接】LeaguePrank 项目地址: https://gitcode.com/gh_mirrors/le/LeaguePrank LeaguePrank是一款专注于英雄联盟客户端界面自定义的开源工具,它通过安全的官方LCU…...

Qwen3.5-4B-Claude-Opus镜像保姆级教程:双RTX4090D上开箱即用

Qwen3.5-4B-Claude-Opus镜像保姆级教程:双RTX4090D上开箱即用 1. 镜像概述 Qwen3.5-4B-Claude-4.6-Opus-Reasoning-Distilled-GGUF 是一个基于 Qwen3.5-4B 的推理蒸馏模型,重点强化了结构化分析、分步骤回答、代码与逻辑类问题的处理能力。该版本以 GG…...

SenseVoice WebUI镜像体验:上传音频秒获文字+表情标签,小白也能玩转

SenseVoice WebUI镜像体验:上传音频秒获文字表情标签,小白也能玩转 1. 快速了解SenseVoice WebUI SenseVoice WebUI是一个开箱即用的语音识别工具,它能将你上传的音频文件快速转换成文字,并自动标注说话人的情感状态和音频中的特…...

PyTorch 2.8镜像实操手册:基于40G数据盘的视频生成训练环境搭建

PyTorch 2.8镜像实操手册:基于40G数据盘的视频生成训练环境搭建 1. 环境准备与快速部署 在开始视频生成训练之前,我们需要先准备好硬件环境和镜像部署。本镜像专为RTX 4090D显卡优化,配备了24GB显存和CUDA 12.4支持,能够高效处理…...

基于凌科芯安加密芯片智能门锁解决方案

随着物联网产业的快速发展,智能网络设备对信息安全的需求与依赖日益增强。在万物互联的背景下,电子锁作为典型的安全防范产品,在重点场所安防与居民居家安全保障中发挥着关键作用。其中,智能门锁凭借密码、指纹、人脸识别、手机远…...

Zotero GPT插件全攻略:打造智能化文献管理工作流

Zotero GPT插件全攻略:打造智能化文献管理工作流 【免费下载链接】zotero-gpt GPT Meet Zotero. 项目地址: https://gitcode.com/gh_mirrors/zo/zotero-gpt 学术研究中,文献管理往往耗费研究者大量时间与精力。Zotero GPT插件将人工智能技术与文献…...

效率倍增:用快马生成openclaw在ubuntu的一键部署与docker化脚本

最近在折腾一个开源项目openclaw的部署,发现每次在Ubuntu服务器上手动安装配置特别费时间。作为一个懒人程序员,我决定研究下怎么把整个流程自动化,结果发现用InsCode(快马)平台可以轻松搞定这件事,效率直接翻倍。 传统部署方式的…...

MCP 实现深度技术报告

1. MCP 协议概述与架构定位 1.1 协议背景 Model Context Protocol (MCP) 是 Anthropic 推出的开放标准协议,旨在标准化 AI 助手与外部数据源、工具之间的集成方式。在 Claude Code 中,MCP 不仅是外部集成接口,更是核心架构组件,…...

TranslucentTB 架构深度解析:Windows 任务栏透明化技术实现与工程化实践

TranslucentTB 架构深度解析:Windows 任务栏透明化技术实现与工程化实践 【免费下载链接】TranslucentTB A lightweight utility that makes the Windows taskbar translucent/transparent. 项目地址: https://gitcode.com/gh_mirrors/tr/TranslucentTB Tran…...

5秒破解百度网盘提取码:baidupankey智能工具如何重塑你的资源获取体验

5秒破解百度网盘提取码:baidupankey智能工具如何重塑你的资源获取体验 【免费下载链接】baidupankey 项目地址: https://gitcode.com/gh_mirrors/ba/baidupankey 你是否曾为百度网盘加密资源而烦恼?面对"请输入提取码"的提示却束手无策…...