当前位置: 首页 > article >正文

万字干货 | OpenClaw 进阶玩法大全:技能 / 多 Agent / 省钱 / 安全,+ 实战技巧一次学会

1.概述在人工智能快速发展的今天AI不再仅仅是回答问题的聊天机器人而是正在演变为能够主动完成复杂任务的智能代理。OpenAI的Codex CLI就是这一趋势的典型代表——一个跨平台的本地软件代理能够在用户的机器上安全高效地生成高质量的软件变更。2.内容如果你只把 Codex 当成“更会写代码的 ChatGPT”那你只理解了它 10% 的价值。真正让 Codex 不同的是它背后那套完整、可运行、可反复思考的 Agent Loop智能体循环系统。2.1 Codex 到底和普通大模型有什么区别我们先看一个最普通的大模型交互流程你帮我写一个 Python 脚本模型给你一段代码结束这是一次性生成模型不知道代码能不能运行不知道有没有报错更不知道“下一步该干什么”1. Codex 的真实工作方式完全不同Codex 的思路更像一个新手工程师坐在你电脑前复制代码1 看需求2 写点代码3 运行一下4 报错了看看错误5 改代码6 再运行7 直到成功复制代码这个「反复尝试」的过程就是 Codex Agent Loop。2.2 什么是 Agent LoopAgent Loop 让模型在一个循环里不断思考 → 行动 → 看结果 → 再思考。Codex CLI 的核心不是“一次推理”而是反复展开这个循环模型不是直接给答案而是每一轮只决定我下一步该干什么1. 先忘掉「大模型」把 Codex 当成一个“新人程序员”想象一个刚入职的初级工程师你给他一个任务“帮我把这个项目跑起来并写一个 README。”他会怎么做一定不是“我闭上眼睛一次性把所有事情做对。”而是更接近下面这个过程复制代码1 先看看项目目录结构2 猜一猜怎么运行3 真的运行一下4 发现报错5 根据报错改代码6 再运行7 直到跑通8 最后再总结写 README复制代码注意这个过程中每一步都依赖上一步的结果。这就是 Agent Loop 的直觉来源。2.普通 ChatBot VS Agent根本区别在哪普通 ChatBot 的工作方式复制代码输入问题↓模型“想一想”↓一次性输出答案↓结束复制代码它的特点是只能“想”不能“做”没有真实世界的反馈更像是在考试答题Codex Agent 的工作方式复制代码目标↓想一小步↓做一小步↓看结果↓再想一小步↓……↓完成复制代码它的特点是每一轮只解决一个非常小的问题每一步都基于真实执行结果更像是在真实工作Agent Loop本质上就是把“一次性回答问题”拆成了“多轮小决策”。3. 「Loop」这个词为什么这么重要我们先看一个不展开的情况模型在脑子里想 10 步↓一次性输出最终答案这种方式的问题是中间哪一步想错了你完全不知道没有机会修正对复杂任务非常不稳定而 Agent Loop 是把这 10 步“摊开”复制代码第 1 步我该不该看目录↓第 2 步我该不该运行测试↓第 3 步这个报错是什么意思↓第 4 步我该改哪个文件复制代码这就是 unrolling the loop 的含义把模型原本“在脑子里一次性完成的思考”拆成一轮一轮、可执行、可观察的步骤。4.为什么说「模型不是直接给答案」复杂问题没有人能在“看都没看现场”的情况下一次就给出完美答案。Agent Loop 的设计正是承认了这一点。所以 Codex 的策略是不追求“一次答对”而是追求每一步都有依据每一步都能被验证每一步错了都能修假设你的项目现在是这样“一个 Node 项目运行 npm start 会报错”Codex 的内心独白并不是一句话而是类似这样一轮一轮展开1 我不知道项目结构我需要先看看 → 调用工具ls2 看起来是 Node 项目我应该试着运行 → 调用工具npm start3 报错说缺依赖 → 调用工具npm install4 再运行一次 → npm start5 现在跑通了我可以总结了 → 输出最终回答2.3 把 Agent Loop 拆成 5 个步骤2.3.1 接收用户目标不是马上干活1 用户输入 ≠ 模型直接思考的内容当你在 Codex CLI或任何 Agent 系统里输入一句话比如“帮我给这个项目补一个 README。”很多人会误以为这句话直接被送进模型然后模型开始思考。但实际上在 Agent 系统里这句话的角色更接近于“任务目标Goal”也就是说它只是告诉系统最终你要把事情做到什么状态2 为什么要把“目标”和“过程”分开因为 Agent Loop 的设计理念是目标是稳定的过程是动态变化的举个生活化的例子你的目标是“把房间收拾干净”你并不会一开始就决定先扫地还是先整理桌子垃圾有多少要不要换垃圾袋你只是知道最后要干净Codex 也是一样。用户输入只负责定义“终点”不负责定义“路径”。2.3.2 构造当前上下文Prompt1.Prompt 是“模型看世界的全部信息”这是 Agent Loop 里最关键、也最容易被低估的一步。我们先说一句非常重要的话对模型来说它并不知道“刚刚发生了什么”除非你把这些信息放进 Prompt。所以每一轮 Agent Loop都会重新构造一个 Prompt。2.Prompt 里通常包含哪些东西一个完整的 Prompt通常包含你是谁系统设定你是一个 coding agent你可以修改文件、运行命令你能用什么工具shell文件读写测试运行用户目标比如补 README到目前为止发生了什么我刚才运行了什么命令输出结果是什么有没有报错对模型来说这些内容就是它的“记忆”。3.为什么每一轮都要“重新构造” Prompt举个例子第一轮你还没看过项目结构第二轮你已经知道有哪些文件第三轮你已经看到测试报错如果 Prompt 不更新模型就会永远以为自己什么都不知道所以 Agent Loop 的一个核心动作就是把“刚刚发生的现实结果”翻译成模型能理解的文字再塞回 Prompt。2.3.3 让模型做“下一步决策”1.模型在这一轮只回答一个问题这是 Agent Loop 的灵魂所在。模型不会在这一轮里把所有事情想完。它只做一个非常具体、非常有限的判断“在当前信息条件下我下一步该做什么”2.这个“下一步”通常只有两种可能情况一我还需要更多信息 / 行动模型会说类似“我需要看看目录结构”“我需要跑一下测试”“我需要打开某个文件看看内容”在系统层面这会被表达为Tool Call工具调用情况二信息已经够了可以结束模型会说类似“现在我可以写 README 了”“问题已经修复完成”这时它会直接输出最终回答Agent Loop 结束。3.为什么要限制成“只想一步”因为这是控制复杂度的关键。如果模型一次性想 10 步中间哪一步错了你不知道无法插入真实反馈很难纠正而“一步一想”的好处是每一步都可以被验证错了就马上修对复杂任务更稳2.3.4 如果要干活 → 调工具1.模型自己“不会干活”模型 ≠ 能执行命令的程序模型只能输出文字或结构化指令但它不能真的运行 ls不能真的执行 npm install不能真的写文件2.Tool 的作用把“建议”变成“现实动作”当模型说“我需要运行 ls 看看目录”Agent 系统会1 解析模型输出2 发现这是一个 tool call3 在真实环境里执行命令4 收集真实输出2.3.5 把结果塞回上下文继续循环1.这是 Agent Loop 最“反直觉”的一步很多人会以为工具执行完模型“就知道结果了”其实不然。模型并不知道工具执行结果除非你把结果写进 Prompt。2.现实 → 文本 → PromptAgent 会把刚才的执行结果转成类似这样的内容你刚刚运行了 ls输出是src/package.json然后把这段文字加入 Prompt再发起下一轮模型推理这一步完成后新的一轮 Loop 开始。我们现在可以把这 5 步用一句非常生活化的话说清楚1 把当前情况告诉模型2 让模型决定下一小步3 把真实结果反馈回去4 直到模型觉得“可以收工了”3.Agent Loop代码示例前面我们讲了很多概念Agent Loop、目标、Prompt、工具、反馈……现在我们用一段最小但完整的代码把这些概念全部落到实处。复制代码class SimpleAgent:def __init__(self, llm):self.llm llmself.history []def run(self, goal):while True:prompt self.build_prompt(goal)response self.llm(prompt)# 如果模型说“完成了”if response[type] final:print(response[text])break# 如果模型要用工具if response[type] tool_call:result self.execute_tool(response)self.history.append(result)def build_prompt(self, goal):return {goal: goal,history: self.history}def execute_tool(self, call):if call[name] shell:return os.popen(call[command]).read()复制代码这段代码不是生产级但它100%体现了 Agent Loop 的本质结构。下面我们从整体 → 局部 → 每一行的“为什么”来拆。1.先整体理解这段代码在干什么它在做一件事不断把“当前状态”交给模型让模型决定下一步然后根据结果更新状态直到模型说“可以结束了”。可以理解为“你先想一步 → 我帮你干 → 把结果告诉你 → 你再想一步”2.class SimpleAgentAgent 不是模型而是“调度者”Agent ≠ 模型LLMllm负责“思考 / 决策”Agent负责“循环 / 执行 / 状态管理”Agent 的角色更像是一个项目经理 执行助理。3.__init__Agent 的“长期记忆”在哪里self.llm 是什么它是一个函数或对象输入Prompt输出模型的“下一步决策”你可以把它理解成response 大模型(prompt)4.self.history 为什么这么重要这是整个 Agent Loop 的核心状态。history 里存的不是聊天记录而是你刚刚执行了什么命令命令输出了什么有没有报错它是“现实世界发生过的事情”的文本化记录如果没有 history模型每一轮都会“失忆”永远不知道自己刚才干过什么5.run 方法Agent Loop 的真正入口def run(self, goal):这里的 goal就是你输入的那句“帮我给这个项目加一个 README”它只做一件事定义终点不定义路径。6.while True为什么 Agent 必须是“死循环”这行代码非常关键。很多人一看到“死循环”会下意识觉得不优雅但在 Agent 里没有循环就没有 Agent为什么因为 Agent 的工作模式是不知道要循环多少轮不知道什么时候信息才“足够”只能一轮一轮试结束条件不是写死的而是由模型决定的。7.build_prompt模型“看到的世界”是怎么来的prompt self.build_prompt(goal)这是 Agent Loop 中最容易被忽略但最重要的一步。def build_prompt(self, goal):return {goal: goal,history: self.history}它做的事情非常简单但意义非常大把“目标 已发生的事实”打包交给模型。8.response self.llm(prompt)模型只做一件事response self.llm(prompt)这一行看似简单其实决定了整个 Agent 的风格。模型在这里不会写完整代码一次性解决所有问题它只回答一个问题“在当前 prompt 条件下我下一步该做什么”我们用一句完整的流程复述Agent 把目标 历史交给模型模型说“下一步干这个”Agent 去真实执行Agent 把结果记录下来回到第 1 步直到模型说“可以结束了。”4.总结Codex Agent 的真正价值并不在于它“写代码有多快”而在于它被设计成一个可以反复思考和行动的系统。通过 Agent Loop模型不再试图一次性给出完美答案而是像真实工程师一样先尝试、再观察、再修正逐步推进目标完成。这种“思考 → 执行 → 反馈 → 再思考”的循环机制让复杂问题被自然拆解成一连串可验证的小步骤也让错误变成系统的一部分而不是失败的终点。痉奶砍桓

相关文章:

万字干货 | OpenClaw 进阶玩法大全:技能 / 多 Agent / 省钱 / 安全,+ 实战技巧一次学会

1.概述在人工智能快速发展的今天,AI不再仅仅是回答问题的聊天机器人,而是正在演变为能够主动完成复杂任务的智能代理。OpenAI的Codex CLI就是这一趋势的典型代表——一个跨平台的本地软件代理,能够在用户的机器上安全高效地生成高质量的软件变…...

SpringCloud快速入门--GateWay路由网关与Config配置中心

背景 StreamJsonRpc 是微软官方维护的用于 .NET 和 TypeScript 的 JSON-RPC 通信库,以其强大的类型安全、自动代理生成和成熟的异常处理机制著称。在 HagiCode 项目中,为了通过 ACP (Agent Communication Protocol) 与外部 AI 工具(如 iflow …...

5 分钟搭建智能终端:自动补全 + 历史建议 + 语法高亮,效率拉满

文章目录 📖 介绍 📖 🏡 演示环境 🏡 📒 终端优化指南:补全、提示与高亮一步到位 📒 📝 实现效果与核心能力 📝 Windows 平台完整配置步骤 📝 Linux 平台完整配置步骤 📝 macOS(苹果)平台配置步骤 📝 各平台效果说明 ⚓️ 相关链接 ⚓️ 📖 介绍 �…...

基于智能软开关的配电网优化调度分析(含故障恢复能力与分布式电源影响)

基于智能软开关的配电网优化调度matlab 采用matlab编程,分析得到了含智能软开关下的配电网故障恢复能力,包括恢复负荷、失电节点以及节点电压等,程序选择标准ieee33节点系统作为分析对象,采用yalmip编程,运行稳定。 这…...

效率提升不可想象!传统程序员转型AI数字化办公专家,如何靠提效工具实现升职

不是加班感动老板,而是工具改变产出01. 一个真实的职场跃迁张恒,35岁,某传统IT部门的Java开发,月薪28K。他技术扎实,但部门不核心,干的都是“增删改查报表导出”。每年晋升答辩,评委都说“表现不…...

探索MATLAB/Simulink下风光储电解制氢与氢燃料电池系统仿真模型

MATLAB/Simulink风光储电解制氢与用氢燃料电池系统仿真模型(风光伏耦合电解槽制氢和PEM燃料发电 附参考文献 电解槽和燃料电池都有水热管理模型 光储电解制氢模型,电解槽恒功率制氢,光伏风机耦合PEM制氢,电解槽与燃料电池&#xf…...

OpenClaw语音交互方案:千问3.5-27B对接Whisper实现听写

OpenClaw语音交互方案:千问3.5-27B对接Whisper实现听写 1. 为什么需要语音交互自动化 上个月帮朋友整理一场3小时的行业访谈录音时,我对着逐字稿反复暂停播放、标记重点、提炼观点,整整花了6小时才完成笔记。这种机械劳动让我开始思考&…...

白嫖DeepSeek、GLM、MiniMax、Kimi等大模型,每天 1亿 Token 免费领!

每天免费领 1亿 Token,白嫖DeepSeek、GLM、MiniMax、Kimi等大模型! 最近折腾 AI 编程的朋友估计挺多的。这玩意儿现在进化得确实有点吓人。就拿名气最大的 Claude Code 来说,它这个命令行工具直接把写代码变成了“在线聊天”。你只要嘴上说清…...

OpenClaw配置优化:千问3.5-9B长任务稳定性提升50%

OpenClaw配置优化:千问3.5-9B长任务稳定性提升50% 1. 问题背景与挑战 去年11月接手一个自动化内容处理项目时,我第一次遭遇OpenClaw长任务执行的"断链"问题。当时需要连续完成"爬取网页→提取关键数据→生成报告→邮件发送"四个步…...

TPA2016D2音频放大器Arduino驱动与AGC工程实践

1. 项目概述Adafruit TPA2016 Library 是一款专为 Texas Instruments TPA2016D2 音频功率放大器设计的 Arduino 兼容驱动库。该库封装了 IC 协议通信、寄存器配置、自动增益控制(AGC)参数调节及硬件复位管理等底层操作,使嵌入式开发者无需直接…...

嵌入式开发全流程:从芯片设计到系统部署

1. 嵌入式开发全景解析:从芯片设计到系统部署作为一名在嵌入式领域摸爬滚打十年的老兵,我见过太多初学者被这个行业的复杂性吓退。但我想说的是——嵌入式开发确实门槛高,但绝非不可攻克。关键在于理解它的技术栈构成,就像搭积木一…...

【2026 CVPR】Asking like Socrates: Socrates helps VLMs understand remote sensing images

RS-EoT (Remote Sensing Evidence-of-Thought) 研究旨在解决视觉语言模型(VLM)在处理遥感图像时的“虚假推理”问题 。 文章目录 核心问题 核心思想 核心方法 A. 数据合成:SocraticAgent Data Statistics B. 训练策略:两阶段渐进式强化学习 (RL) C. 训练策略 实验验证 主要…...

智能体学习9——CrewAI-Agent与Task核心方法详解

文章目录 CrewAI Agent 与 Task 核心方法详解 一、Agent() — 定义智能体 1.1 完整参数表 1.2 核心三要素 1.3 双模型策略 1.4 常见配置模板 1.5 直接调用(不经过 Crew) 二、Task() — 定义任务 2.1 完整参数表 2.2 参数详解 2.3 context 参数(关键) 2.4 完整使用示例 三、…...

SEO优化师如何制定优化策略和计划_SEO优化师如何分析网站流量和排名数据

SEO优化师如何制定优化策略和计划_SEO优化师如何分析网站流量和排名数据 前言 SEO(搜索引擎优化)在现代数字营销中扮演着至关重要的角色。对于一个SEO优化师来说,制定有效的优化策略和计划是关键,分析网站流量和排名数据能帮助他…...

第十六天~在Arxml中创建一个IPDU Group

1. 为什么你的ECU需要IPDU Group? 想象这样一个场景:你的汽车ECU在正常运行时,只需要周期性发送几个核心CAN报文,比如车速、转速、水温。但当诊断仪连接上来,或者某个特殊条件触发(比如车辆进入工厂测试模式),你需要瞬间“激活”另外15个用于调试和标定的私有报文。更…...

OpenClaw家庭作业助手:Qwen3-14B解析数学题并分步讲解

OpenClaw家庭作业助手:Qwen3-14B解析数学题并分步讲解 1. 为什么需要家庭作业助手? 作为一个经常辅导孩子功课的家长,我深刻体会到传统辅导方式的痛点。每天晚上检查作业时,孩子遇到不会的题目需要等待家长解答,而家…...

实测对比:ChatGPT、Gemini、Grok、Claude 在四个开发任务中的表现差异

2026年,AI编程助手已经成为开发者的标配。但不同模型在不同任务上的表现差异很大,选对模型往往能事半功倍。本文基于同一测试环境(聚合平台solo.kulaai.cn),对四款主流模型进行了横向对比,记录下实测数据&a…...

C语言指针核心解析与六大实战应用

1. 指针在C语言中的核心地位指针是C语言的灵魂所在,它直接操作内存地址的特性赋予了程序员极大的灵活性。在嵌入式开发领域,指针的使用频率尤其高,因为我们需要直接与硬件寄存器打交道,进行内存管理等底层操作。注意:指…...

快照模式 vs 命令模式:一篇分清什么时候用谁

在做带撤销、回滚、历史记录的功能时,我们最常纠结两个设计模式:快照模式(备忘录模式)和命令模式。很多同学容易混淆,其实核心区别一句话就能记住: 快照存数据,命令存动作。 下面用最清晰、最好…...

从修车铺到世界冠军,从废塑料到再生资源:一场关于坚持与价值的时代对话

最近,张雪的故事刷屏了。这个14岁辍学、睡在修车铺阁楼、月薪300元的湖南山村少年,用了整整二十年,将自己亲手打造的摩托车送上了世界超级摩托车锦标赛(WSBK)的冠军领奖台。当五星红旗在葡萄牙阿尔加维国际赛道升起时&…...

AI 编程上下文管理新范式(非常详细),Spec 机制从入门到精通,收藏这一篇就够了!

最近围绕 Spec 的讨论明显变多。比较有代表性的声音大致有两类:一类更关注 Spec 和代码之间的边界,另一类更关注 Spec 在真实项目协作中的工程价值。这两类观察并不冲突,放在一起看,刚好能把问题看得更完整。 本质上都在回答同一…...

LLMKG+ 知识图谱改进实战指南(非常详细),大模型提升质量与覆盖从入门到精通,收藏这一篇就够了!

LLMKG+: Systematically improving knowledge quality and coverage in KGs using LLMs – A case study in medical domain 摘要 本文提出了LLMKG框架,首次系统性地解决了知识图谱中三元组级别的语义冗余问题。该框架结合检索增强生成与分层扩展过滤机…...

为什么80%AI率降完后还有残留?根本原因在这

你用了降AI工具,处理前90%,处理后17%。 17%达标了,但还是有AI率残留。或者更糟,处理后22%,还是没过。 为什么工具处理后AI率不能降到0%?残留从哪来?怎么进一步处理? 残留AI率的三…...

省考面试必看!初心教育不玩虚的,真实口碑+实战演练,上岸更稳

公考面试有多卷?千人争一岗,拼的不只是实力,更是选择!选对培训机构,能少走半年弯路;选不对,再努力也可能白费功夫 今天给所有进面考生避坑,推荐一家深耕公考面试多年、口碑拉满的宝藏…...

代码写不动了?传统程序员不转型AI工程化提示词专家,将被AI助手彻底平替

2026年开年,全球科技圈的裁员潮撕开了行业变革的残酷真相:甲骨文一天内裁掉3万名员工,其中绝大多数是从事基础编码、数据库维护的传统程序员。取代他们的,正是曾经被视为“辅助工具”的AI助手。值得关注的是,在这场行业…...

补题记录2

牛客周赛137 C D Epta 天梯赛6 8,9,10,11...

STM32 定时器与 PWM 输出:电机调速、LED 呼吸灯实战

在嵌入式开发的世界里,有一个问题困扰着无数初学者:微控制器只能输出0V和3.3V(或5V)的数字信号,但现实世界中的设备——从电机的转速控制到LED的亮度调节——需要的却是连续的模拟信号。如何用数字引脚“模拟”出模拟电…...

西交提出 OdysseyArena:让智能体真正“学会探索”的长程归纳推理基准

📌 一句话总结: 本工作提出 OdysseyArena,一个面向长时程(long-horizon)、主动探索(active)、归纳学习(inductive)三大核心能力的交互式评测平台,系统性检验…...

OpenClaw技能组合拳:Qwen3.5-9B实现多步骤跨境电商运营

OpenClaw技能组合拳:Qwen3.5-9B实现多步骤跨境电商运营 1. 为什么选择OpenClaw做跨境电商自动化? 去年夏天,我接手了一个跨境电商副业项目。每天需要手动处理商品信息抓取、多语言翻译、定价调整和库存同步,很快发现人工操作不仅…...

EF Core 原生 SQL 实战:FromSql、SqlQuery 与对象映射边界

先唠两句:参数就像餐厅点单 把API想象成一家餐厅的“后厨系统”。 ? 路径参数/dishes/{dish_id} -> 好比你要点“宫保鸡丁”这道具体的菜,它是菜单(资源路径)的一部分。查询参数/dishes?spicytrue&typeSichuan -> 好比…...