当前位置: 首页 > article >正文

【AI Agent 学习笔记 task1】Day2:初识智能体

【AI Agent 学习笔记 task1】Day2初识智能体上一篇【AI Agent 学习笔记】Hello-Agents 环境配置与首个 Agent 实战一、Agent 的本质Agent智能体大模型大脑 工具手脚 控制循环决策与普通 LLM 调用的区别特性普通 LLMAgent执行方式单次问答多轮循环工具使用无可调用外部 API决策能力无自主规划执行步骤结果反馈直接生成基于观察调整策略二、ReAct 模式Thought-Action-Observation本章核心ReActReasoning Acting是 Agent 的主流实现范式。2.1 三要素结构Thought思考→ Action行动→ Observation观察→ ... → Finish完成以我的运行日志为例循环ThoughtActionObservation1用户要查天气推荐景点先获取天气get_weather(city北京)小雨阵雨10°C2模型输出为空——❌ 解析失败未找到 Action3已获取天气根据雨天推荐景点get_attraction(city北京, weatherLight rain shower)博物馆、海洋馆等室内景点4整合信息生成回答Finish[...]任务完成2.2 关键观察错误循环的价值第 2 轮模型输出为空导致解析失败但 Agent自动重试进入第 3 轮。这说明Agent 具备容错能力控制循环会强制要求模型遵循格式规范失败后会重新调用 LLM而非直接报错退出三、工具Tool的作用本章代码中 Agent 使用了两个工具# 工具定义示例get_weather(city:str)-str# 获取指定城市天气get_attraction(city:str,weather:str)-str# 根据天气推荐景点核心设计LLM 只负责决定调用什么工具、传什么参数实际执行由框架完成。这种分离让 Agent 既能利用大模型的推理能力又能获得精确的外部数据。四、Prompt 工程控制模型行为Agent 能遵循 Thought-Action 格式核心在于System Prompt 的设计你必须按以下格式回复 Thought: 你的思考过程 Action: 工具名(参数值) 或者任务完成时 Action: Finish[最终答案]Prompt 技巧少样本示例Few-shot给 1-2 个正确格式的例子严格格式约束明确分隔符、字段名错误处理提示告知模型输出错误会怎样五、关键代码逻辑max_loops5# 防止无限循环foriinrange(max_loops):# 1. 组装 Prompt历史记录 工具描述 用户输入promptbuild_prompt(history,tools,user_input)# 2. 调用 LLMresponsellm.chat(prompt)# 3. 解析 Thought 和 Actionthought,actionparse_response(response)# 4. 执行工具ifactionFinish:returnresult# 任务完成else:observationexecute_tool(action)history.append(fObservation:{observation})# 反馈给下一轮六、学习总结Agent 核心认知不是更复杂的 Prompt而是推理-行动的闭环LLM 当决策者工具当执行者观察结果反馈给 LLM实现动态调整与上一篇的衔接Day1环境配置 跑通代码Day2理解 ReAct 原理 分析运行日志下一步学习第二章——工具的定义与注册机制。运行截图参考资源课程文档第一章 初识智能体论文ReAct: Synergizing Reasoning and Acting in Language Models 项目教程地址hello-agents - Datawhale AI Agent 入门教程 https://github.com/datawhalechina/hello-agents版权声明本笔记基于 Datawhale hello-agents 开源项目整理转载请注明出处。记录时间2026年3月17日本文由AI润色输出总结

相关文章:

【AI Agent 学习笔记 task1】Day2:初识智能体

【AI Agent 学习笔记 task1】Day2:初识智能体 上一篇:【AI Agent 学习笔记】Hello-Agents 环境配置与首个 Agent 实战 一、Agent 的本质 Agent(智能体) 大模型(大脑) 工具(手脚) 控…...

一次生成、无限复用:易元 AI 双引擎重构生产逻辑,AI 混剪素材复用让内容越做越省

内容生产的真正效率,从来不取决于单条视频做得有多快,而在于单次投入能产生多少次价值、一次制作能支撑多少次产出,这就是素材复用的核心价值。在传统模式下普通的混剪工具只是机械拼接、单次产出,无法实现素材沉淀与循环使用&…...

5-11字典合并

输入用字符串表示两个字典,输出合并后的字典。字典的键用一个字母或数字表示。注意:1和‘1’是不同的关键字!输入格式:在第一行中输入第一个字典字符串;在第二行中输入第二个字典字符串。输出格式:在一行中输出合并的字典&#xf…...

86745238

86745238...

AI 模型推理系统的延迟优化方案

AI模型推理系统的延迟优化方案 随着AI技术的广泛应用,模型推理延迟成为影响用户体验和系统性能的关键因素。无论是实时语音识别、自动驾驶,还是在线推荐系统,高延迟都会降低响应速度,甚至导致业务损失。如何优化AI推理系统的延迟…...

LeetCode 3070. 元素和小于等于 k 的子矩阵数目

LeetCode 3070. 元素和小于等于 k 的子矩阵数目 题目描述 给你一个大小为 m x n 的整数矩阵 grid 和一个整数 k。你需要找出 grid 中所有以左上角 (0,0) 为起始点的子矩阵,并统计这些子矩阵中元素和不超过 k 的个数。 注意:子矩阵必须包含 (0,0) 这个格子…...

Java的虚拟线程调度与平台线程池在IO密集型应用中的扩展性

Java虚拟线程与平台线程池在IO密集型应用中的扩展性探索 随着微服务与云原生架构的普及,IO密集型应用对高并发的需求日益增长。传统Java线程模型因平台线程(OS线程)的创建成本高、上下文切换开销大等问题,难以实现高效扩展。Java…...

都跟掉电保护有关,但不是一个东西

以前会误以为 BKP 就等于 RTC因为它们有三个很容易让人混淆的共同点:它们都和“掉电保持”有关它们都在备份域里访问它们时常常都要先打开相关权限于是很容易脑子里变成:既然都和掉电保持有关,那它们是不是一回事其实不是。这就像&#xff1a…...

虚拟实验室:物理化学实验的计算机模拟

虚拟实验室:物理化学实验的计算机模拟 在传统物理化学实验中,学生常受限于设备、安全风险或时间成本,而虚拟实验室通过计算机模拟技术,为学习者提供了全新的实验体验。虚拟实验室不仅能高度还原真实实验场景,还能突破…...

Python的__init_subclass__类方法在框架开发中的钩子机制与扩展点设计

Python作为一门灵活的动态语言,其元编程能力为框架设计提供了强大的扩展性。在众多魔法方法中,__init_subclass__作为Python 3.6引入的类方法,正逐渐成为框架开发中实现钩子机制与扩展点设计的秘密武器。这个特殊方法允许父类在子类创建时进行…...

去中心化应用(DApp)开发全流程

去中心化应用(DApp)开发全流程:从构思到落地 随着区块链技术的普及,去中心化应用(DApp)成为开发者关注的热点。与传统应用不同,DApp运行在区块链网络上,具备透明、不可篡改和去中心…...

Rust Trait 对象动态分派原理

Rust Trait对象动态分派原理探析 Rust作为一门注重安全与性能的系统级语言,其多态实现机制一直是开发者关注的焦点。Trait对象通过动态分派(Dynamic Dispatch)实现了运行时的多态行为,这种机制在需要灵活处理不同类型但共享相同行…...

SSH隧道实战:内网穿透与端口转发

SSH隧道实战:内网穿透与端口转发 在当今数字化时代,远程访问内网资源成为许多企业和开发者的刚需。由于防火墙或NAT的限制,直接访问内网服务往往困难重重。SSH隧道作为一种安全高效的解决方案,能够轻松实现内网穿透和端口转发&am…...

如何设计一个安全的 RESTful API?

如何设计一个安全的 RESTful API?在当今数字化时代,RESTful API 已成为不同系统间数据交互的核心桥梁。随着网络攻击手段的日益复杂,API 的安全性已成为开发者不可忽视的挑战。一个设计不当的 API 可能导致数据泄露、服务瘫痪甚至法律风险。那…...

计算机视觉算法优化

计算机视觉算法优化:让机器更懂世界 计算机视觉作为人工智能的核心领域之一,正深刻改变着我们的生活。从人脸识别到自动驾驶,从医疗影像分析到工业质检,计算机视觉算法的性能直接决定了应用的准确性和效率。随着数据量的爆炸式增…...

STM32:UART串口通信

将一个设备的数据传送到另一个设备时,需要根据情况的不同,制定通信的规则,即通信协议。通信双方按照协议规则进行数据收发。常用的通信协议有名称引脚双工时钟电平设备USARTTX\RX全双工异步单端点对点I2CSCL\SDA半双工同步单端多设备SPISCLK\…...

# WebHID:用 JavaScript 实现浏览器与物理设备的“直连”交互在传统Web 开发中,浏览器对硬件设备的

WebHID:用 JavaScript 实现浏览器与物理设备的“直连”交互 在传统 Web 开发中,浏览器对硬件设备的支持始终受限于安全策略。但随着 WebHID API 的出现,开发者终于可以绕过复杂的驱动层和中间件,直接通过标准 JavaScript 与 USB H…...

Java synchronized 锁优化与偏向锁分析

Java synchronized锁优化与偏向锁分析 在多线程编程中,synchronized关键字是Java实现线程同步的核心机制。早期的synchronized实现因性能问题饱受诟病,直到JVM引入了锁优化技术,尤其是偏向锁的引入,显著提升了并发性能。本文将深…...

Python的__getattr__业务对象

Python魔法方法揭秘:灵活操控属性的__getattr__在Python的面向对象编程中,__getattr__是一个强大而神秘的魔法方法,它像一位隐藏在幕后的属性调度员。当常规属性访问失败时,这个方法就会被自动触发,为开发者提供了处理…...

软件工程软件开发生命周期瀑布模型与敏捷模型的比较

软件工程中的开发模型选择直接影响项目成败,瀑布模型与敏捷模型作为两种经典方法论,分别代表了结构化与灵活性的两极。随着数字化转型加速,开发团队常面临模型选择的困惑。本文将从核心维度对比二者的差异,帮助读者理解不同场景下…...

wythoff构造(正十二面体)

...

C++ 析构函数的隐藏风险

C析构函数的隐藏风险:那些容易被忽视的陷阱 在C编程中,析构函数作为对象生命周期的终结者,负责释放资源、清理内存等重要任务。其看似简单的设计背后却暗藏诸多风险,稍有不慎便可能导致内存泄漏、未定义行为甚至程序崩溃。本文将…...

JavaScript性能优化实战不赜

JavaScript性能优化实战技术文章大纲 性能优化的核心原则 减少代码执行时间 降低内存占用 优化网络请求 提升用户体验 代码层面的优化 避免全局变量污染,使用模块化或闭包 减少DOM操作,批量更新或使用文档片段 使用事件委托减少事件监听器数量 优化循环结…...

C++中的策略模式实战

1、非修改序列算法这些算法不会改变它们所操作的容器中的元素。1.1 find 和 find_iffind(begin, end, value):查找第一个等于 value 的元素,返回迭代器(未找到返回 end)。find_if(begin, end, predicate):查找第一个满…...

开源软件的使用贡献与社区参与经验分享

开源世界的大门:我的贡献与成长之旅 在数字化浪潮中,开源软件已成为技术发展的核心驱动力。从个人开发者到大型企业,无数人通过使用、改进和共享代码推动创新。作为一名长期参与开源项目的技术爱好者,我深刻体会到开源不仅是工具…...

MySQL 查询优化与索引覆盖机制

MySQL查询优化与索引覆盖机制是提升数据库性能的核心技术。随着数据量激增,高效的查询处理成为系统流畅运行的关键。索引覆盖机制通过避免回表操作,显著减少I/O消耗,而查询优化则能从根本上改善执行效率。本文将深入解析其原理与实践方法&…...

身份认证方案

身份认证方案:构建数字世界的安全基石 在数字化时代,身份认证是保障信息安全的第一道防线。无论是登录银行账户、访问企业内网,还是使用社交媒体,身份认证方案都在确认“你是谁”的过程中扮演关键角色。随着网络攻击手段的日益复…...

湖南特产酱板鸭项目有哪些

大家好,今天咱们聊聊湖南特产中的明星产品——酱板鸭。说到酱板鸭,大家可能会想到各种品牌,但今天我要重点介绍的是“渔小站君山酱板鱼”这个品牌。为什么呢?因为它不仅传承了传统的制作工艺,还在经营模式上做了很多创…...

Spring Boot 异步任务超时控制机制

Spring Boot异步任务超时控制机制解析 在现代高并发系统中,异步任务处理是提升性能的关键手段,但若任务执行时间过长,可能导致资源阻塞或系统雪崩。Spring Boot通过灵活的异步任务超时控制机制,帮助开发者平衡效率与稳定性。本文…...

消息队列选型指南2024

消息队列选型指南2024:如何为你的业务挑选最佳方案 在数字化浪潮中,消息队列作为分布式系统的核心组件,承担着解耦、异步通信和流量削峰的关键作用。随着技术的快速演进,2024年的消息队列生态涌现出更多高性能、高可用的解决方案…...