当前位置: 首页 > article >正文

Productivity 的核心不是任务管理:拆解 Claude 的 L1/L2 记忆缓存

我们假设这样一个场景项目群里有人扔过来一句ask todd to do the PSR for oracle。对一个刚入职的新同事这句话基本等于乱码——todd 是哪个 toddPSR 是什么报告oracle 指公司还是某笔交易得反问三轮才能动手。但对老员工三秒就翻译完了让财务的 Todd Martinez 把 Oracle Systems 那笔单子的 Pipeline Status Report 准备出来。Anthropic 在 Claude 的 Productivity 插件里干的一件事就是把这种老员工的解码能力装进 Claude 的脑子。手段不是把数据塞进 vector DB、上 RAG、做 embedding而是纯文本 Markdown 文件 一套严格的两层缓存架构。一个反直觉的类比CLAUDE.md 是 L1memory/ 是 L2学过计算机体系结构的人对这套结构应当一眼能识破CLAUDE.md L1 cache。容量小≤ 100 行、命中快、放最热门的 ~30 个人 ~30 个术语 当前活跃的 5–15 个项目目标覆盖 90% 日常解码需求。memory/ L2 / 主存。容量无限可以放公司全员、所有术语、所有项目档案、所有人际偏好。L1 没命中时再往里翻。熟悉 CPU 缓存的人立刻就能理解为什么这样设计让 Claude 每次解码请求都完整加载几百号人的画像等于让 CPU 每次取数都直接走主存——慢且费 token。让 90% 的请求只读 100 行 CLAUDE.md、剩下 10% 才下钻 memory/跟 L1 hit rate ~90% 是同一种工程取舍。但真正反直觉的一点在这里整个系统没有用 vector DB、没有 embedding、没有相似度匹配。业界做给 LLM 加记忆几乎全在卷向量数据库——chunk、embedding、cosine similarity、ANN 检索一整套。Productivity 偏偏走另一条路用 Markdown 表格做哈希表、用文件名做主键、用 LLM 自己的长上下文当全文检索引擎。memory/glossary.md就是一张大查表memory/people/todd-martinez.md这种命名就是 key→value 结构要用谁就加载谁全程 grep 友好、人类可读、版本可控。为什么这条路反而更稳三个原因LLM 已经擅长读全文——专门给它再加一层 embedding 检索反而是给读者戴墨镜读字。可解释、可审计——出错了直接打开glossary.md看哪条写错了向量库出问题只能重新 embed。可手工维护——同事换岗、术语更新改文件就行vector DB 要重新构建索引。拆开看4 个 skill 怎么形成闭环打开 Productivity 的插件页会看到它一共 4 个 skill。光看名字像各管一事合起来其实是一个完整的记忆生命周期/start—— bootstrap 冷启动第一次安装 Productivity 时跑这个 skill。它会扫日历、邮件、聊天记录把最常出现的人、项目、术语提取出来写一份 CLAUDE.md 和 memory/ 的初始版本。它解决的是上一秒 Claude 还是空白纸、下一秒就要懂公司黑话的冷启动问题——没有它第一周 Claude 会被反复打断who is todd?。memory-management—— auto-trigger 的解码主力注意它的 frontmatter 里写着user-invocable: false——这意味着它不是斜杠命令而是每次 Claude 接到请求都会被自动加载。每条用户输入进来都先走一遍 tiered lookup1. CLAUDE.md (hot cache) → 90% 命中 2. memory/glossary.md → 兜底全量 3. memory/people/, projects/ → execution 时拉详细资料 4. Ask user → 真不认识就主动问第 4 步是关键当所有缓存都 miss它不是猜是反问X 是什么我学一下——学到的内容沉淀回 glossary下次就不再问。这是一个会自我成长的解码器。/task-management—— 简到离谱的 TASKS.md整个 skill 就维护一个TASKS.md文件纯 Markdown 任务列表。功能极简显然是设计选择复杂任务管理已经被 Linear、Asana、Jira 吃透了重做没有意义。Productivity 只想成为 Claude 视角下的我手头还剩什么——一个轻量侧栏不抢主路径。/update—— 周期性同步跑/update时Claude 会重扫最近的对话、邮件、日历事件把新冒出来的人、项目、术语合并进记忆库。这个 skill 是 L1 hot cache 的晋升 / 降级动作触发器最近频繁出现的人 → 升进 CLAUDE.md上季度结束的项目 → 降回 memory/。如架构图所示4 个 skill 各管一段/start写 L1L2 初始值memory-management每次对话读两层并按需补 L2/update周期性维护两层之间的内容流动/task-management是独立侧栏不参与解码主路径。整个系统的聪明不在任何一个 skill 里而在它们之间的协作——这才是 Productivity 做成一个 plugin 而不是单一 skill 的原因。它不解决什么边界比能力更重要了解一个工具的边界比了解它的能力更值钱。Productivity 在以下场景不够用或根本不适合不替代向量检索 / RAG——如果记忆库不是几百号人 上百个术语而是十万份合同条款或百万个产品 SKU纯 Markdown 就跑不动了。Productivity 针对的是工位社交语境这种数千条以内的离散事实规模超出后向量库才是正解。不能跨设备 / 跨团队同步——CLAUDE.md在 working dir 本地memory/也是本地目录。换台电脑就丢了团队成员之间也不共享。要团队级共享得自己接 git 或 NAS。不会自动决定什么该 promote 到 L1——SKILL 里写“When something’s used frequently, promote it to CLAUDE.md”但谁判断frequently目前是人工或/update时半自动判断没有滑动窗口频次统计。如果懒得维护CLAUDE.md 会逐渐失去 hot cache 性质——变成上次塞进来就再没出去的死库。bootstrap 强依赖外部接入——/start要扫日历、邮件、聊天意味着没接 ConnectorGmail / Calendar / Slack的用户冷启动几乎是空。Productivity 真正发挥威力的前提是先把这些数据源接进 Claude。不懂中文工位场景——所有模板PSR、standup、ship review、escalate天然是英语 SaaS 公司的内部语境。中文团队用起来要把模板里的术语全替换一遍——但这反而说明扩展点很清楚换术语机制本身不变。记忆系统从来不是越多越准。Productivity 的设计哲学是把它做成 cache hierarchy——L1 永远精简、L2 永远完备、晋升降级永远清晰——让 Claude 在三个月、半年、一年后仍然记得对的人、忘掉早该忘掉的项目。这种工程美感比AI 能记住一切那类营销话术值钱得多。

相关文章:

Productivity 的核心不是任务管理:拆解 Claude 的 L1/L2 记忆缓存

我们假设这样一个场景:项目群里有人扔过来一句"ask todd to do the PSR for oracle"。对一个刚入职的新同事,这句话基本等于乱码——todd 是哪个 todd?PSR 是什么报告?oracle 指公司还是某笔交易?得反问三轮…...

手把手教你用Nginx给NPS管理后台加SSL证书(含免费证书申请与配置全流程)

从零到一:Nginx反向代理为NPS管理后台部署HTTPS全指南 每次登录NPS管理后台时,浏览器地址栏那个刺眼的"不安全"提示总让人心里发毛。作为一款内网穿透工具,NPS的管理界面往往需要暴露在公网,HTTP明文传输就像用明信片传…...

速看|营销智脑 V6 本周上线,四大维度焕新,解锁全域营销新玩法

在 AI 技术飞速迭代的当下,人人都在谈AI商业化,却很少有人真正看透其底层逻辑。从通用大模型横空出世,到各行各业落地AI应用,看似纷繁复杂的技术变革、商业转型,归根结底只在做一件事:把人类漫长积累的认知…...

物联网的本质回归:从技术堆栈到务实应用的设计哲学

1. 从喧嚣到本质:我们为何需要重新审视“物联网”每年在拉斯维加斯举办的消费电子展,都像一场盛大的科技狂欢节。巨大的横幅、激情澎湃的主题演讲者、以及无处不在的自我推销,都在齐声高喊同一个词:物联网。这个词听起来宏大、变革…...

嵌入式安全关键系统开发:形式化需求验证工具STIMULUS的核心价值与实践

1. 项目概述:为什么我们需要更好的软件需求工具?在嵌入式系统开发领域,尤其是涉及安全关键(Safety-Critical)应用的场景,如汽车电子、医疗设备或工业控制,项目成败往往在写下第一行代码之前就已…...

过度切分容易改变查询语义

“过度切分容易改变查询语义”——精准地戳中了中文搜索(乃至所有基于词袋模型的检索系统)的核心痛点。下面我用 语言学 搜索原理 真实案例 三层拆解,为什么“切分 语义解释”,而“过度切分 语义失真”。🧠 一、中…...

全程可视、零干扰:非侵入式 SRT 监控详解

什么是非侵入式监控 非侵入式监控是一种不会中断信源与接收器之间现有会话的监控方式。 换言之,监控探针不会与信源建立单独的会话,也不会像中继/代理解决方案那样创建中间会话。 优势 探针监控的会话正是待观测的目标会话。探针不创建第二个会话&am…...

最后30天,PMP救命冲刺法:我是如何在考前一个月提分40%的

大家好,我是一个去年刚考过PMP的过来人。前几天有人问我:“距离6月14日PMP考试只有一个月了,我才刚开始看PMBOK第七版,但越看越困,还有戏吗?”说实话,我看见这条消息的时候,恍惚间看…...

模具工装全生命周期智能化管理,工业Agent驱动的落地方法详解

站在2026年的时间节点回望,制造业的数字化转型已从简单的“系统上云”演进为“智能体进场”。 传统的模具管理往往深陷“纸质单据多、维护靠经验、数据孤岛深”的泥潭。 随着实在智能新一代企业级「龙虾」矩阵智能体数字员工的全面普及,模具工装全生命周…...

MAX2140 SDARS接收器架构与射频前端设计解析

1. MAX2140 SDARS接收器核心架构解析卫星数字音频广播服务(SDARS)接收器的设计需要同时应对卫星直射信号和地面中继信号的复杂接收环境。MAX2140作为高度集成的解决方案,其架构设计充分考虑了卫星广播的特殊性。接收链路从天线输入开始,信号首先经过外部…...

Git Worktree Manager:高效管理多分支并行开发的Git增强工具

1. 项目概述与核心价值如果你和我一样,长期维护着多个Git分支,并且经常需要在不同的功能开发、Bug修复和线上问题排查之间来回切换,那么你一定对git checkout和git stash这两个命令又爱又恨。爱的是它们确实能解决问题,恨的是频繁…...

开发者AI实战指南:从工具选型到应用落地的系统化路径

1. 项目概述:一份面向开发者的AI实战指南最近几年,AI工具的发展速度,用“日新月异”来形容都显得有些保守。作为一名在技术一线摸爬滚打了十多年的开发者,我深切感受到,从最初的惊叹于GPT-3的对话能力,到如…...

自研AI产品如何借助Taotoken快速实现多模型备援与降级

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 自研AI产品如何借助Taotoken快速实现多模型备援与降级 应用场景类,设想一个已上线的AI应用面临主要模型服务突发降级的…...

用Python和Matplotlib可视化理解:为什么梯度向量就是曲面的法线方向?

用Python和Matplotlib可视化理解:为什么梯度向量就是曲面的法线方向? 在机器学习和计算机图形学中,理解曲面的几何特性至关重要。当我们讨论梯度下降算法时,经常会遇到一个关键概念:梯度向量与曲面的法线方向一致。这个…...

在嵌入式项目中观测大模型API用量与成本的实际体验

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 在嵌入式项目中观测大模型API用量与成本的实际体验 在小型嵌入式开发项目中引入大模型API作为智能化辅助工具,一个核心…...

5G神经接收器技术:站点特定微调与性能优化

1. 5G NR神经接收器技术背景解析在5G及未来通信系统中,物理层信号处理面临三大核心挑战:复杂的信道环境、多样化的硬件损伤以及动态变化的移动场景。传统基于固定模型的接收算法(如MMSE)在设计时往往依赖简化的信道假设&#xff0…...

英特尔移动战略失败解析:技术路径依赖与生态博弈的教训

1. 从一则旧闻看科技巨头的战略转型之痛周一清晨的硅谷,空气里弥漫的不仅是咖啡因,还有无形的压力。2016年4月5日,对于时任英特尔无线业务负责人的艾莎埃文斯来说,这个周一格外艰难。一则来自彭博社的报道,将她离职的消…...

DeepSeek V4低调发布,普通人该看懂的三件事

2026年4月24日,DeepSeek在没有发布会、没有预热、没有媒体采访的情况下,悄然上线了V4模型。 对比过去半年来,外界对“V4跳票”的反复质疑和“DeepSeek是不是已经被超越了”的议论,这种沉默显得格外有力——他们一次都没有回应&am…...

Rust代码可视化:基于rustc语义分析生成精准调用关系图

1. 项目概述与核心价值最近在梳理一个中型Rust项目的代码依赖和架构时,我遇到了一个挺典型的痛点:虽然cargo的依赖管理很强大,但当你想要直观地理解模块间的调用关系、特别是那些跨越多个crate的复杂交互时,光看Cargo.toml和代码文…...

荷兰与英国高校:无需重训实现大模型安全模式动态切换能力

这项由拉德堡德大学、布里斯托大学与莱顿大学联合开展的研究,以预印本形式于2026年4月30日发布在arXiv平台,编号为arXiv:2604.27818v1,研究方向归属于计算机安全领域(cs.CR)。感兴趣的读者可通过该编号在arXiv上查阅完…...

AI技能地图:从数学基础到工程部署的完整学习路径解析

1. 项目概述与核心价值最近在GitHub上看到一个挺有意思的项目,叫“ai-skills”,作者是yoriiis。乍一看标题,你可能会觉得这又是一个关于AI技能学习的普通资源列表。但当我点进去,花了一个周末的时间仔细梳理和实践后,发…...

斯坦福大学造了一个“AI医生考场“,结果最强的AI也只考了46分

这项由斯坦福大学医学信息学团队完成的研究,以预印本形式于2026年5月发表,论文编号为arXiv:2605.02240。研究核心是一套名为PhysicianBench的测试系统,专门用来考察AI大模型能否像真正的医生一样在电子病历系统中完成真实的临床工作。有兴趣深…...

G-Helper技术解析:华硕笔记本硬件控制框架的逆向工程实现与性能优化

G-Helper技术解析:华硕笔记本硬件控制框架的逆向工程实现与性能优化 【免费下载链接】g-helper Lightweight Armoury Crate alternative for Asus laptops with nearly the same functionality. Works with ROG Zephyrus, Flow, TUF, Strix, Scar, ProArt, Vivobook…...

5分钟搞定华硕笔记本性能控制:G-Helper终极轻量化解决方案

5分钟搞定华硕笔记本性能控制:G-Helper终极轻量化解决方案 【免费下载链接】g-helper Lightweight Armoury Crate alternative for Asus laptops with nearly the same functionality. Works with ROG Zephyrus, Flow, TUF, Strix, Scar, ProArt, Vivobook, Zenbook…...

81页精品PPT | 企业数字化底座与数字化转型方案

很多企业在数字化转型过程中会遇到数据孤岛、业务流程繁琐和响应市场变化慢等问题。这些问题导致企业效率低下,难以快速适应市场变化。这个方案旨在帮助企业构建数字化底座,实现数据整合、流程优化和敏捷响应市场变化。通过统一的数据平台,打…...

告别数据丢失!ABAP ALV修改事件(Data Changed)的两种正确注册与刷新姿势

ABAP ALV数据修改事件全解析:两种高效注册与刷新策略实战 在SAP系统开发中,ALV(ABAP List Viewer)作为数据展示和交互的核心组件,其可编辑功能一直是企业级应用的关键需求。当用户修改ALV表格数据时,如何确…...

opencode会话同步skill

Session Sync OpenCode 会话同步工具 - 将会话导出保存到 GitHub/Gitee Gist,或从 Gist 拉取历史会话并导入本地。 仓库地址:skills: skill合集 功能特性 📤 上传会话:将当前或指定的 OpenCode 会话导出为 JSON,上…...

技术创业者如何用Bootstrapping模式实现零成本启动与快速验证

1. 从“灵光一现”到“现实骨感”:一个博士生创业者的第一课几年前,我还是个埋头在实验室里捣鼓能量收集技术的博士生,满脑子都是微瓦级的功率优化和晦涩的论文。有一天,盯着桌上那台崭新的iPad,一个念头突然蹦出来&am…...

奇点大会不是展会,是AI产业分水岭:基于2025全球17家头部机构内部评估报告的5维竞争力对标分析

更多请点击: https://intelliparadigm.com 第一章:奇点大会不是展会,是AI产业分水岭:基于2025全球17家头部机构内部评估报告的5维竞争力对标分析 奇点大会已超越传统技术展会范式,演变为全球AI战略能力的“压力测试场…...

零代码RAG构建与向量数据库操作:从文档到知识的自动化之路

如果你接触过大语言模型(LLM),大概率听过RAG(Retrieval-Augmented Generation,检索增强生成)这个词。简单来说,RAG就是让AI在回答问题之前,先去翻一翻你提供的资料库,找到…...