当前位置：首页 > article >正文

【AI Agent 学习笔记 task1】Day2：初识智能体

article 2026/3/18 20:10:06

【AI Agent 学习笔记 task1】Day2初识智能体上一篇【AI Agent 学习笔记】Hello-Agents 环境配置与首个 Agent 实战一、Agent 的本质Agent智能体大模型大脑工具手脚控制循环决策与普通 LLM 调用的区别特性普通 LLMAgent执行方式单次问答多轮循环工具使用无可调用外部 API决策能力无自主规划执行步骤结果反馈直接生成基于观察调整策略二、ReAct 模式Thought-Action-Observation本章核心ReActReasoning Acting是 Agent 的主流实现范式。2.1 三要素结构Thought思考→ Action行动→ Observation观察→ ... → Finish完成以我的运行日志为例循环ThoughtActionObservation1用户要查天气推荐景点先获取天气get_weather(city北京)小雨阵雨10°C2模型输出为空——❌ 解析失败未找到 Action3已获取天气根据雨天推荐景点get_attraction(city北京, weatherLight rain shower)博物馆、海洋馆等室内景点4整合信息生成回答Finish[...]任务完成2.2 关键观察错误循环的价值第 2 轮模型输出为空导致解析失败但 Agent自动重试进入第 3 轮。这说明Agent 具备容错能力控制循环会强制要求模型遵循格式规范失败后会重新调用 LLM而非直接报错退出三、工具Tool的作用本章代码中 Agent 使用了两个工具# 工具定义示例get_weather(city:str)-str# 获取指定城市天气get_attraction(city:str,weather:str)-str# 根据天气推荐景点核心设计LLM 只负责决定调用什么工具、传什么参数实际执行由框架完成。这种分离让 Agent 既能利用大模型的推理能力又能获得精确的外部数据。四、Prompt 工程控制模型行为Agent 能遵循 Thought-Action 格式核心在于System Prompt 的设计你必须按以下格式回复 Thought: 你的思考过程 Action: 工具名(参数值) 或者任务完成时 Action: Finish[最终答案]Prompt 技巧少样本示例Few-shot给 1-2 个正确格式的例子严格格式约束明确分隔符、字段名错误处理提示告知模型输出错误会怎样五、关键代码逻辑max_loops5# 防止无限循环foriinrange(max_loops):# 1. 组装 Prompt历史记录工具描述用户输入promptbuild_prompt(history,tools,user_input)# 2. 调用 LLMresponsellm.chat(prompt)# 3. 解析 Thought 和 Actionthought,actionparse_response(response)# 4. 执行工具ifactionFinish:returnresult# 任务完成else:observationexecute_tool(action)history.append(fObservation:{observation})# 反馈给下一轮六、学习总结Agent 核心认知不是更复杂的 Prompt而是推理-行动的闭环LLM 当决策者工具当执行者观察结果反馈给 LLM实现动态调整与上一篇的衔接Day1环境配置跑通代码Day2理解 ReAct 原理分析运行日志下一步学习第二章——工具的定义与注册机制。运行截图参考资源课程文档第一章初识智能体论文ReAct: Synergizing Reasoning and Acting in Language Models 项目教程地址hello-agents - Datawhale AI Agent 入门教程 https://github.com/datawhalechina/hello-agents版权声明本笔记基于 Datawhale hello-agents 开源项目整理转载请注明出处。记录时间2026年3月17日本文由AI润色输出总结

【AI Agent 学习笔记 task1】Day2：初识智能体

相关文章：

【AI Agent 学习笔记 task1】Day2：初识智能体

一次生成、无限复用：易元 AI 双引擎重构生产逻辑，AI 混剪素材复用让内容越做越省

5-11字典合并

86745238

AI 模型推理系统的延迟优化方案

LeetCode 3070. 元素和小于等于 k 的子矩阵数目

Java的虚拟线程调度与平台线程池在IO密集型应用中的扩展性

都跟掉电保护有关,但不是一个东西

虚拟实验室：物理化学实验的计算机模拟

Python的__init_subclass__类方法在框架开发中的钩子机制与扩展点设计

去中心化应用(DApp)开发全流程

Rust Trait 对象动态分派原理

SSH隧道实战：内网穿透与端口转发

如何设计一个安全的 RESTful API？

计算机视觉算法优化

STM32：UART串口通信

# WebHID：用 JavaScript 实现浏览器与物理设备的“直连”交互在传统Web 开发中，浏览器对硬件设备的

Java synchronized 锁优化与偏向锁分析

Python的getattr业务对象

软件工程软件开发生命周期瀑布模型与敏捷模型的比较

wythoff构造（正十二面体）

C++ 析构函数的隐藏风险

JavaScript性能优化实战不赜

C++中的策略模式实战

开源软件的使用贡献与社区参与经验分享

MySQL 查询优化与索引覆盖机制

身份认证方案

湖南特产酱板鸭项目有哪些

Spring Boot 异步任务超时控制机制

消息队列选型指南2024