当前位置: 首页 > article >正文

Openclaw一周烧掉我14亿Token后,我总结了这10条血泪教训

一开始我以为装个OpenClaw丢给它几个任务然后让它自己跑就完事了。演示视频里就是这么讲的。但前两周根本不是这么回事。前两周简直就是带娃——盯着它烧token看着它在同一个答案上循环八次看着Codex任务在那儿空转。我布置个任务走开一会儿回来发现它要么只做了一件事就罢工了要么陷入和自己关于用tab还是space的无限对话里。经过大量试错现在它终于能稳定运行真的在干正事了。从这玩意儿就是个玩具到我睡觉的时候它把功能都上线了这个差距是真实存在的。关键就在于你得停止把它当聊天机器人开始把它当基础设施来看待。openclaw 交流下面是真正起作用的东西。10个我想告诉每个今天刚开始的人的事。1. 模型路由决定一切别用Opus去跑心跳这是最关键的决策也是我14亿token主要烧在哪儿的原因。我把所有东西都往Opus或Codex上怼——心跳、定时检查、状态ping、普通聊天全都在用最贵的模型。这周开始Sonnet 4.6是日常使用的最佳选择。刚发布基本上有Opus级别的智商但只需要五分之一的成本。输入/输出每百万token只要$3/$15美元而Opus是15/75美元。它在OSWorld上得分72.5%几乎追平Opus 4.6的72.7%。性格也很好。这是我用过最适合做agent工作的模型质量够硬还不会让你大出血。如果Sonnet的价格对你的配置来说还是太贵那就降级到Kimi K2.5通过OpenRouter调用。大约$0.60/$2美元每百万token工具调用也很稳定。把Opus预算留到真正需要深度推理或长上下文作的时候。设置一个分层配置。好模型做主引擎处理日常任务强力模型做后备处理复杂工作。{ agents: { defaults: { model: { primary: anthropic/claude-sonnet-4-6, fallbacks: [ anthropic/claude-opus-4-6, openrouter/moonshotai/kimi-k2.5 ] } } } }你可以在聊天中用/model随时切换模型。需要Opus处理复杂任务切换。回到常规工作切回Sonnet。上面的配置会自动处理后备方案如果主模型碰到速率限制的话。2. 不写Skill文件你的agent就是个智障刚开箱的时候你的OpenClaw agent会做一些让人叹为观止的蠢事。在同一个失败的方法上循环六次。编辑它根本没资格碰的配置文件。跳过文档自己瞎编解决方案结果把整个项目搞崩。模型是聪明的agent行为不是。这是两回事。解决办法是Skill文件。这些文件放在你的workspace/skills/文件夹里告诉agent具体该怎么表现。把它们想象成防止你的agent越野脱缰的护栏。这是大多数人跳过的部分你得自己写这些规则。没人知道你的技术栈、你的偏好或者你的agent具体会以什么方式搞砸。你是在为一个能力很强但非常死板的员工写操作手册。没有它你就只能祈祷。让我错误率直接砍半的一条规则做任何改动之前先读文档。Agent喜欢即兴发挥它们会硬刚那些文档里早就有的优雅解决方案。我做了个叫DocClaw的Skill强制先读再做的工作流在任何代码改动前必须有个侦察阶段。已经在ClawHub上了。没有这些文件你的agent干完一件事就卡住了。没有后续没有迭代。只有一个昂贵的光标在凌晨3点等你告诉它该干嘛。3. Soul.md是你的大脑不是你的待办清单构建 → 测试 → 记录 → 决策 → 循环## 操作系统 ### 核心方法 - 把每个有意义的任务当作执行循环而不是一次性尝试。 - 优先验证结果而不是快速猜测。 - 保持决策透明确保进度可审计。 ### 规划纪律 - 任何非琐碎请求都从规划模式开始。 - 在实施前定义范围、约束条件和明确的完成标准。 - 如果事实改变或某一步失败暂停执行并重新规划。 ### 执行循环 - 重复构建 → 测试 → 记录 → 决策。 - 构建最小的有意义的改动。 - 立即针对预期行为进行测试。 - 把变更、通过/失败情况、下一步该做什么记录在progress-log.md里。 - 根据证据决定迭代、升级或关闭。 ### 任务管理 - 保持todo.md作为实时真相来源。 - 将工作分解为子任务持续更新状态。 - 发现后续任务时立即添加而不是留下隐性债务。 ### 学习循环 - 每次纠正后追加到tasks/lessons.md。 - 每条记录失败情况、根本原因、预防规则。 - 每次会话开始前回顾教训。 ### 质量关卡 - 没有证据绝不标记完成。 - 要求测试通过、日志干净且可理解、可观察的正确性。 - 最终检查一个资深工程师会批准这个作为生产就绪代码吗 ### 升级规则 - 缺少凭证、外部故障或需求模糊时立即升级。 - 同一问题上失败三次后停止并重新规划再继续。4. Todo.md 自动扩展的任务清单自扩展任务列表。睡前给agent一个大任务。它会分解成子任务工作时更新状态发现后续工作时生成新任务。午夜的一个任务到早上可能变成三四个。5. ProgressLog.md 你的晨间简报每轮构建-测试循环都要记录。它试了什么通过还是失败学到了什么。边喝咖啡边打开这个不用看会话记录就知道昨晚发生了什么。6. Cron job 长会话你不能布置个任务就合上笔记本。会话只有在开着的时候才有状态。窗口一关agent就全忘了。真正的后台工作需要定时任务按计划唤醒agent。我跑了三个定时任务凌晨2点、4点、6点。每个都会唤醒agent让它检查Todo.md里的剩余任务。有活就接着干干完了就写个总结然后继续睡觉。openclaw cron add --name overnight-2am --cron 0 2 * * * --message Check Todo.md. Pick up incomplete tasks. Log progress. openclaw cron add --name overnight-4am --cron 0 4 * * * --message Continue working through Todo.md. Update progress-log. openclaw cron add --name overnight-6am --cron 0 6 * * * --message Final check. Summarize all overnight work. openclaw cron list在这些定时任务之前agent会在任务中途卡住然后闲置几小时直到我注意到。定时任务就像闹钟。最坏情况下它闲置两小时就会被戳醒继续干活。7. 文件就是记忆长会话会被压缩。这意味着你的agent会悄悄丢失上下文。它之前做的决策、跟踪的状态、已经搞清楚的东西全没了。然后它从头开始重新推导一遍烧token做已经做过的工作有时候第二次还会得出不同结论。解决办法是把所有重要的东西都写到workspace的markdown文件里。想象一下就像给一个每天早上失忆的员工写入职文档。你写得越多它需要从头搞清楚的就越少。~/.openclaw/workspace/ ├── USER.md # 你是谁偏好上下文 ├── AGENTS.md # Agent身份和路由 ├── HEARTBEAT.md # 每次心跳要检查什么 ├── MEMORY.md # 长期事实 ├── Soul.md # 决策循环和行为 ├── Todo.md # 当前任务 └── progress-log.md # 运行日志8. 模型质量 ≠ Agent质量大部分挫败感不是来自OpenClaw而是来自那些不会调工具的模型。聊天质量和agent质量是完全不同的两件事。一个模型能写诗但在需要调用函数、解析结果、决定下一步做什么的时候可能直接卡死。我的日常配置Sonnet 4.6作为OpenClaw的日常主力。刚发布基本上是Opus级别的办公任务能力但只需要五分之一的价格。OSWorld上72.5%几乎追平Opus 4.6的72.7%。目前做agent工作性价比最高的模型。Opus 4.6留给需要严肃推理或长上下文的工作。100万token上下文窗口。最强大脑只是你不想让心跳任务跑在上面。GPT-5.3-Codex专门用来写代码。比5.2快25%在SWE-Bench Pro和Terminal-Bench 2.0上都是最顶尖的。我在Codex app/CLI里用它做开发工作和OpenClaw运维分开。Agent苦力活的预算模型Kimi K2.5通过OpenRouter或NVIDIA调用依然便宜得离谱。MiniMax M2.5是预算之王SWE-Bench上80.2%开源MIT协议输入每百万token只要0.30美元。GLM-5做重推理任务很稳。这三个工具调用都很可靠这才是agent工作最重要的。9. 一次只加一个新集成别试图一次性把邮件日历Telegram网页爬虫定时任务全配上。每个集成都是一个独立的故障点。每个渠道都是一个新的出错表面。我从一个简单的晨间简报定时任务开始。稳定跑了一周后才加下一个。然后再下一个。每个都搞稳了再往前走。出问题了就跑openclaw doctor --fix。专业提示一旦某个工作流稳定了让你的agent学习它。让它读Skill文件、定时任务配置、成功运行的日志。当它理解你这套配置的正常状态是什么样子后它会更擅长保持系统运行在问题级联之前发现它们。10. 分开你的Dev和Ops AgentCodex / Claude Code 做开发 写代码、调试、上线功能。有时候Codex会卡住。换Claude。有时候反过来。不同工作用不同模型。都指向一个有干净git结构的私有GitHub仓库。Agent在组织良好的代码里很擅长识别模式。OpenClaw 做运维 监控、调度、通信、自动化。定时任务、心跳、消息路由、任务管理。把开发和运维分开这样它们不会互相污染上下文。关于记忆系统的补充最好的agent是不会每次会话都从零开始的。OpenClaw有内置的向量记忆openclaw memory status和openclaw memory search。还有Claw Vault和Supermemory可以做更高级的设置。我自己在搭一个记忆系统Gigabrain目前已经索引了911条记忆。每次对话、每个决策、每个偏好都被存储并可搜索。Agent记得上次什么有效、什么坏了、我喜欢什么。这个上下文让一切都更快更可靠。关键洞察透明度和可审计性比单纯的回忆更重要。你得能看到agent知道关于你和项目的什么。否则你就是在信任一个有shell访问权限的黑盒子。关于安全的补充OpenClaw出过真实的安全事故。多个CVE包括一个CVSS 8.8的远程代码执行漏洞Bitsight和Censys的扫描团队发现了超过3万个暴露实例ClawHub还有大规模的供应链投毒活动。你的agent有shell访问权限、浏览器控制权还能以你的名义发消息。在循环里运行。不需要问你就执行。# 健康检查 自动修复 openclaw doctor --deep --fix --yes # 安全审计 openclaw security audit # 自动修复安全问题 openclaw security audit --fix # 深度扫描JSON输出 openclaw security audit --deep --json # 完整状态 openclaw status --all --deep安全审计会标记暴露的网关认证、浏览器控制暴露、提升的允许列表、文件系统权限。光是ClawHavoc活动就在ClawHub上种植了1,184个恶意Skill当时占了整个注册表的约12%。这些可不是什么 subtle 的东西加密货币窃取器、反向shell、伪装成交易机器人和生产力工具的凭证外泄。CrowdStrike、Cisco和Kaspersky都发布了警告。最后你不是不擅长这个。这事儿现在就是很难。那些发我的agent一晚上做了个完整应用的人已经调了几周了。他们烧了token写了几十页规则调试了你正在经历的同样卡顿。对我有帮助的是接受这个事实——配置本身就是工作。写**就是产品工作。调整模型路由是基础设施工作。定时任务是运维工作。你不是在用一个工具你是在搭建一个系统。14亿token之后agent在我睡觉的时候真的在产出成果。配置就是护城河。大部分人在到达这里之前就放弃了。存好这篇。发给你的bot。等它在晚上自动产出成果的时候再回来看看。

相关文章:

Openclaw一周烧掉我14亿Token后,我总结了这10条血泪教训

一开始我以为,装个OpenClaw,丢给它几个任务,然后让它自己跑就完事了。演示视频里就是这么讲的。但前两周根本不是这么回事。 前两周简直就是"带娃"——盯着它烧token,看着它在同一个答案上循环八次,看着Code…...

讯维音视频分布式控制系统:打造智慧会议室的沉浸式体验

现代高端会议室不仅需要清晰的音画质,更需要智能化、便捷化的管控体验。成都讯维推出的音视频分布式控制系统,以AI赋能为核心,将分布式节点、软件KVM、智能中控融为一体,为企业用户打造高效、智能、安全的会议新生态。一、智能会议…...

一个 GitHub Issue 标题如何让 4000 台电脑沦陷?

此系列并非原文的死板翻译,而是我经过理解和提炼后的输出。仅聚焦其中最有意思和有价值的部分。想了解所有细节的小伙伴,可以去原文查看完整内容。 试想一下:你只是像往常一样打开电脑写代码,但你的 npm publish token 却已经被黑…...

经理结算记录分页

接口说明接口路径方法说明/manager/community-manager/settle-record/pageGET获取社区经理结算记录分页请求参数 支持以下筛选条件(来自 CommunityManagerSettleRecordPageReqVO):参数类型说明settlementTypeInteger结算类型:1-日…...

集成产品知识库,AI自动应答+人工无缝衔接的全渠道微信智能客服系统源码

温馨提示:文末有资源获取方式在数字化服务时代,企业客户服务面临724小时响应、多渠道整合与智能化升级的多重挑战。本文将介绍一款基于PHP原创开发的全渠道微信智能客服系统源码,它深度融合AI自动应答与人工客服,内置完善的产品知…...

金智维Ki-Agent平台如何打造“会思考”的数字员工?

当数字员工从“机械执行指令”的工具,升级为“能自主决策、可主动协作”的“硅基伙伴”,企业自动化便迈入了全新阶段。区别于市面上“伪智能”数字员工,金智维立足十余年企业级自动化技术沉淀,以受监督智能体(Supervis…...

COMSOL专业模型在激光熔覆与选区熔融仿真中的应用

COMSOL专业模型|激光熔覆/选区熔融仿真|生死单元活化技术/单道多层 专业级COMSOL模型: - 激光熔覆(Laser Cladding) - 激光选区熔融(SLM) - 集成生死单元(Element Birth and Death&a…...

深度剖析SWAP模型,从SWAP模型源代码编译到AI大语言模型辅助建模

SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了W…...

sdut-python-实验二-程序流程控制(1-10)

7-1 sdut-sel-10 直角坐标系象限判断 分数 10 作者 周雪芹 单位 山东理工大学 X是一个喜欢数学的小孩,现在刚刚学了坐标系。象限划分示意图如下: 他想知道点(X,Y)在第几象限内。输入数据保证点不在坐标轴及原点上。 输入格式: 多组输入。 每组输入…...

# 金丝雀发布实战:用 Go 实现渐进式流量灰度部署在微服务架构日益普及的今天,**如何安全、可控地发布新版

金丝雀发布实战:用 Go 实现渐进式流量灰度部署 在微服务架构日益普及的今天,如何安全、可控地发布新版本代码成为每个 DevOps 团队的核心挑战。传统的“全量发布”模式风险高、回滚慢,而金丝雀发布(Canary Release)则提…...

贵州棒球特长生认证路径·棒球1号位联盟

🔍 解锁贵州棒球特长生认证路径 | Ultimate Guide to Baseball Certification in Guizhou⛰️ 当中国棒球1号位联盟WBC碰撞贵州山地!由棒球1号位MAC矩阵KOL专业解析1️⃣ ⚾ 国际标准 本土落地:Why认证体系至关重要?世界棒球经典…...

知识付费SaaS选型攻略:为何创客匠人成为行业首选

在知识付费行业快速发展、从业者变现需求日益精细化的当下,市面上知识付费SaaS平台品类繁多,功能参差不齐、服务深浅不一、定价套路各异,让个人IP、中小培训机构乃至大型教育企业陷入选型难题。而创客匠人凭借多年行业深耕、全链路闭环服务和…...

“35岁红线”终于松了!多所高校官宣:45岁博士仍可进编

原文来源:GZ号【欧亚科睿学术】长期以来,博士毕业求职常被一条无形的“年龄线”所束缚,尤其是“35岁门槛”让许多人倍感压力。然而,随着人才观念的更新与政策环境的优化,一场关于“年龄”的破冰行动正在悄然推进。近期…...

华为OLT智能管理工具:图形化配置替代命令行,零代码完成开局部署

温馨提示:文末有联系方式华为OLT智能管理工具:告别命令行,实现图形化高效配置 华为OLT智能管理工具是一款面向网络工程师与运维人员的轻量化辅助平台,彻底摆脱传统CLI命令依赖,通过直观的Web界面完成全部核心配置任务&…...

顶流集结,分享出海实战真经!出海大会终极剧透!

出海,早已不是一道选择题,而是一道必答题。现在关键是:出去之后,怎么把本地业务做深、做透?不是表面功夫,而是合规到位、业务扎根,最后能产生实实在在的收益。2026亚马逊云科技出海大会&#xf…...

OpenClaw 调用 Claude Code和Codex

ACP (Agent Client Protocol) 配置完整指南📖 什么是 ACP?ACP (Agent Client Protocol) 是一个开放协议,用来规范 AI Agent 与代码编辑器/IDE 之间的通信方式。它类似于 Language Server Protocol (LSP),但专注于 AI 代理的集成,帮助开发者在不同编辑器中使用各种 …...

Nature Microbiology | 效应蛋白-宿主相互作用组图谱将健康肠道微生物组中的III型分泌系统与免疫调节联系起来

点击蓝字 关注我们Nature Microbiology | Pascal Falter-Braun 组-效应蛋白-宿主相互作用组图谱将健康肠道微生物组中的III型分泌系统与免疫调节联系起来研究论文DOI:IF: 18.7 Q1 B1https://doi.org/10.1038/s41564-025-02241-y原文链接:https://www.nat…...

网站流量从哪来?手把手教你安装百度统计 + Google Analytics(2026)

网站流量从哪来?手把手教你安装百度统计 Google Analytics(2026) 如果你做网站,却不知道访客从哪里来,那你的网站基本等于盲人摸象。 今天这期教程,我手把手教你 注册并使用百度统计和 Google Analytics。…...

hLife Collection | Viruses (Part Ⅱ)

1. ACE2-using coronaviruses: A global concern 通信作者:刘科芳、高福 引用: Xu Z, Lobato AC, Liu K, et al. ACE2-using coronaviruses: A global concern. hLife 2025; 3: 615–617. 2. Enabling the immune escaped etesevimab fully-armed agai…...

中国龙虾ai软件有哪些选择?2026自动化选型指南

2026年3月,随着 OpenClaw(俗称“龙虾AI”)开源框架的彻底引爆,企业自动化正式从“对话时代”跨入“执行时代”。 面对琳琅满目的“数字员工”方案,企业决策者亟需一套客观的选型逻辑,在提效红利与系统风险之…...

OpenClaw到底是啥?能做什么?怎样部署?一文讲懂!

OpenClaw到底是啥?能做什么?怎样部署?一文讲懂,从零讲透这只会干活的AI小龙虾!...

MySQL不使用子查询的原因

MySQL不使用子查询的原因及优化案例 目录 MySQL不使用子查询的原因及优化案例 目录不推荐使用子查询和JOIN的原因解决方案优化案例 案例1:查询所有有库存的商品信息案例2:使用EXISTS优化子查询案例3:使用JOIN代替子查询案例4:优化…...

荣事达3.18榜上产品 AI智能养生壶功能介绍

荣事达智能养生壶 AI 伙伴__自叙一款超暖心的养生神器------荣事达智能养生壶,里面藏着超贴心的中国AI女孩,就是我,你的专属养生AI伙伴!我来自荣电集团,专管一家人的茶饮香与养生暖,是住在家中茶台的“养生…...

@SpringBootApplication 与 SPI 机制的终极解密

敲代码离不开springboot,少了springboot谁还来替我当牛马——ai欢迎来到 Spring Boot 的“后台控制室”~刚开始、小白的你是否曾有过这样的错觉:“我就加了一个 SpringBootApplication 注解,连 application.properties 都没怎么写…...

1.2指令系统-存储系统-cache

一、指令系统 00:02 1. 计算机指令的组成 00:03 基本结构:由操作码和操作数两部分组成,以二进制编码形式存放在存储器中操作码:决定要完成的操作(如加法、减法),用二进制数码表示操…...

水厂、电站、化工厂用的闸阀一样吗?

闸阀是工业里最常用的全开全关型阀门,很多人以为闸阀都是通用的,不管哪个行业都是同一种。但实际上,水厂、电站、化工厂的工况天差地别,对应的闸阀在材质、压力、密封等标准上完全不一样,用错了轻则可能漏液&#xff0…...

S7-1200 PLC 高级语言SCL数控G代码功能块源文件

S7-1200PLC 高级语言SCL数控G代码功能块源文件 整个G代码解析的程序做成了一个FB功能块,利用1200PLC内置的字符串控制指令来实现拆分提取字符串信息;整个程序的大概思路就是1.解析指令 2.提取数据 3.判断书否输入有错误 把提取出来的数据对应上并且赋…...

新概念英语第一册037_Making a bookcase

Lesson 37: Making a bookcase. Watch the story and answer the question What is Susan’s favourite colour? Pink.Key words and expressions work 工作hard adv. 努力地make 做bookcase 书橱,书架hammer 锤子paint …...

【AI】创建 claude code cli 风格的欢迎界面

使用高级 ANSI 字体生成器(Text to ANSI) 不要局限于 Python 自带的 pyfiglet 字体。你可以去一些专业的 ANSI Art 网站生成文本,然后直接把生成的字符串复制到代码里。 去 TAAG (Text to ASCII Art Generator)。 尝试使用 Sub-Zero、ANSI …...

【网络安全入门】一文讲透:核心属性、主流攻击手法与防御体系

网络安全(Network Security)是指通过采取必要措施,防范对网络的攻击、侵入、干扰、破坏和非法使用以及意外事故,使网络处于稳定可靠运行的状态,以及保障网络数据的完整性、保密性、可用性的能力。通俗来说,…...