当前位置: 首页 > article >正文

Claude Code源码学习之上下文压缩(Compact)

Claude Code Compact 深度分析本文档面向 Java 开发者,深度解析 Claude Code 的上下文压缩(Compact)体系设计。源码路径:src/services/compact/分析版本:Claude Code 2.1.88一、先澄清边界:compact 包 ≠ 全部记忆管理很多人看到"上下文压缩"就以为这是 AI 记忆管理的全部,实际上 Claude Code 的"记忆"分为三个维度:维度负责模块说明对话轮次管理(多轮对话)QueryEngine.ts维护 messages 数组,每轮追加用户/AI消息Token 超限压缩services/compact/当消息总 Token 接近模型上限时,压缩历史持久化会话记忆services/SessionMemory/跨会话保存的结构化记忆,类似数据库工程化记忆文件memdir/(CLAUDE.md)项目级别的静态说明文件,每次会话注入本文档专注 compact 包,即解决"对话历史太长、Token 快溢出了"这一核心技术问题。二、为什么需要压缩?2.1 Token 限制背景大语言模型都有Context Window(上下文窗口)限制,例如 Claude 3.5 Sonnet 是 200K tokens。一次 API 调用 = System Prompt + 历史消息 + 当前输入 + AI 输出 ↑ ↑ ↑ 固定消耗 随对话增长 需要预留空间当历史消息越积越多,最终会超出 Context Window,API 调用失败。2.2 核心矛盾需要保留历史:AI 需要了解之前做了什么、用户的需求是什么必须压缩历史:Token 有上限,不可能无限增长压缩有代价:每次压缩都要调用 AI 写摘要,消耗时间和费用compact 包的核心任务就是在这三者之间找到最优平衡。三、压缩体系总览:5层架构Claude Code 设计了 5 层递进式压缩策略,从轻量到重量依次尝试:层级 名称 文件 代价 ───────────────────────────────────────────────────────────────────── 第1层 Time-based MicroCompact microCompact.ts 极低(无AI调用) 第2层 Cache-based MicroCompact microCompact.ts 极低(无AI调用) 第3层 SessionMemory Compact sessionMemoryCompact.ts 低(读文件) 第4层 Full Compact (Auto/手动) compact.ts 高(AI调用) 第5层 Partial Compact compact.ts 中(AI调用,局部)设计哲学:能不调用 AI 就不调,能少处理就少处理,最后迫不得已才全量压缩。四、第1层:Time-based MicroCompact(时间触发微压缩)4.1 触发条件// microCompact.ts// 当距离上次 AI 响应超过 N 分钟时触发constTIME_BASED_MC_THRESHOLD_MINUTES=...// 具体阈值场景:用户去吃饭了,回来继续对话。这期间 Anthropic 服务端的Prompt Cache(提示词缓存)已经失效(缓存有效期约5分钟),再发送这些历史工具调用结果完全是浪费。4.2 执行逻辑触发 → 找到所有旧的工具调用结果消息 → 把内容替换为 '[Old tool result content cleared]' → 不删除消息,只清空内容(保留结构完整性) → 不调用 AI,纯本地操作4.3 为什么不删消息?AI 模型要求消息满足以下不变量:每个tool_use(工具调用请求)必须有对应的tool_result(工具调用结果)它们必须成对出现,不能只有一个所以只能清空内容,不能删除消息,否则 API 会报错。Java 类比:类似于把MapString, Object中的 value 设为 null,但保留 key,否则外部代码遍历 key 时会出错。五、第2层:Cache-based MicroCompact(缓存感知微压缩)5.1 触发条件在正常响应时,如果检测到消息中有大量工具调用结果且 Token 数较高,会触发此层。5.2 核心逻辑// COMPACTABLE_TOOLS - 可被微压缩的工具集合constCOMPACTABLE_TOOLS=['FileRead',// 文件读取结果(可能很长)'Bash',// 命令行输出(可能很长)'Grep',// 搜索结果'Glob',// 文件列表'WebSearch'

相关文章:

Claude Code源码学习之上下文压缩(Compact)

Claude Code Compact 深度分析 本文档面向 Java 开发者,深度解析 Claude Code 的上下文压缩(Compact)体系设计。 源码路径:src/services/compact/ 分析版本:Claude Code 2.1.88 一、先澄清边界:compact 包 ≠ 全部记忆管理 很多人看到"上下文压缩"就以为这是 …...

向上管理核心三招(极简版)

不是拼命干活就行,而是要让领导 “看见你、认可你、愿意为你投入”。我帮你把核心逻辑和可直接用的话术整理成一份更精炼的职场向上管理手册,方便直接记、直接用:向上管理核心三招(极简版)一、适度麻烦领导・富兰克林效…...

SecGPT-14B效果展示:对同一段Apache日志,输出3种专业视角(运维/安全/合规)

SecGPT-14B效果展示:对同一段Apache日志,输出3种专业视角(运维/安全/合规) 你有没有想过,一段看似普通的服务器日志,在不同专家的眼里,会看到完全不同的世界? 运维工程师看到的是系…...

别再用top了!用Linux内核自带的perf工具,5分钟定位线上服务CPU毛刺

告别top:用perf工具5分钟精准定位Linux服务CPU毛刺问题 凌晨3点,服务器告警铃声划破寂静——某核心服务的CPU使用率突然从15%飙升至98%,响应延迟突破秒级。运维团队迅速登录机器,习惯性输入top命令,却只看到"java…...

Qwen3-0.6B-FP8惊艳效果:同一问题不同Temperature下的创造性梯度展示

Qwen3-0.6B-FP8惊艳效果:同一问题不同Temperature下的创造性梯度展示 你有没有想过,同一个问题问AI,为什么每次的回答都不一样?有时候它回答得严谨认真,有时候又天马行空充满创意? 这背后其实有个关键的“…...

Ubuntu 22.04 下 Intel D405 开箱即用:手把手教你安装 Realsense Viewer 和驱动

Ubuntu 22.04 下 Intel D405 深度相机从开箱到实战:完整配置指南 拆开快递包装的那一刻,Intel RealSense D405深度相机就躺在防静电袋里——这款紧凑型设备将成为你三维视觉项目的得力助手。不同于消费级摄像头,D405通过主动红外投影实现毫米…...

Git Submodule 深度避坑指南

如果你曾被 submodule 折磨过,这篇文章就是为你准备的。 一、理解 Submodule 的基本概念 什么是 Submodule? Submodule(子模块)是 Git 提供的一种嵌套仓库管理机制。你可以在一个 Git 仓库中嵌入另一个独立的 Git 仓库&#xff…...

数据库面试通关秘籍——从原理到实战的DBA技术剖析

1. 数据库复制机制深度解析 数据库复制是DBA面试必问的核心技术点,也是实际工作中保障数据高可用的基础。我经历过多次因为复制问题导致的线上故障,深刻理解不同数据库的复制特性差异。下面就以Oracle、MySQL、PostgreSQL三大主流数据库为例,…...

AKConv凭什么能‘变形’?深入源码图解动态偏移与任意采样点的生成机制

AKConv凭什么能‘变形’?深入源码图解动态偏移与任意采样点的生成机制 卷积神经网络(CNN)早已成为计算机视觉领域的基石,但传统卷积操作就像拿着固定尺寸的模具去套各种形状的物体——检测行人时用方形模板,识别车辆时…...

Rust194发布-6倍编译提速与RISC-V嵌入式实战

Rust 1.94 发布:6 倍编译提速与 29 项 RISC-V 特性稳定,嵌入式开发者的春天来了Rust 1.94 于2026年4月正式发布,代号"(无特殊代号)"。本次更新最大的亮点是编译速度提升高达 6 倍,以及 29 项 RIS…...

利用Docker在Mac上快速部署SQL Server开发环境

1. 为什么要在Mac上用Docker跑SQL Server? 作为常年和数据库打交道的开发者,我太理解在Mac上折腾SQL Server的痛苦了。微软官方根本不提供macOS原生版本,以前要么用虚拟机装Windows系统,要么就得买台Windows电脑当开发机。直到Doc…...

Zotero Citation插件完整指南:三步搞定Word文献引用自动化

Zotero Citation插件完整指南:三步搞定Word文献引用自动化 【免费下载链接】zotero-citation Make Zoteros citation in Word easier and clearer. 项目地址: https://gitcode.com/gh_mirrors/zo/zotero-citation Zotero Citation插件是学术写作领域的革命性…...

软件测试全解析:方法、技能与实战案例,软件测试到底做什么?

软件测试是贯穿软件开发生命周期(SDLC)的系统性质量保障活动,其核心远非简单的“找Bug”。它要求从业者像“显微镜”般洞察细节,又需具备“架构师”的全局思维,通过一系列科学的方法、技术和流程,验证软件产…...

SSH连接报错?手把手教你用ssh-keygen清理known_hosts文件(附常见场景解析)

SSH密钥验证失败?深度解析known_hosts文件管理与安全实践 当你兴冲冲地准备通过SSH连接远程服务器部署最新代码时,终端突然弹出一串红色警告:"WARNING: REMOTE HOST IDENTIFICATION HAS CHANGED!"。这种场景对于开发者和运维人员来…...

Java整合海康相机SDK:构建工位管理系统的拍照录像客户端

1. 工位管理系统中的海康相机集成需求 在现代化工厂的生产线上,每个工位配备智能相机已经成为提升生产效率和质量控制的重要手段。我们最近实施的一个项目就采用了海康威视MV-CU120-0UC USB相机,配合工位上的平板电脑或工控机,构建了一套完整…...

前端微前端架构:别再把所有代码都放在一个仓库里了

前端微前端架构:别再把所有代码都放在一个仓库里了 什么是前端微前端架构? 前端微前端架构是一种将前端应用分解为多个独立的、可独立部署的微应用的架构风格。别以为微前端只是后端微服务的前端版本,它有自己的特点和挑战。 为什么需要前…...

从概率视角解析Logistic回归中的交叉熵损失函数

1. 从概率论到交叉熵:理解Logistic回归的底层逻辑 我第一次接触交叉熵损失函数时,完全被这个看似复杂的公式吓到了。直到后来从概率论的角度重新审视它,才发现这个设计简直精妙绝伦。让我们从一个简单的例子开始:假设你正在玩一个…...

【ROS2】SLAM建图成功,但是导航失败,加载地图报错Timed out waiting for transform from base_link to map to become availabl

背景 SLAM建图成功,但是使用命令ros2 launch nav2_bringup bringup_launch.py map:my_house.yaml use_sim_time:false 加载地图后,有报错打印 [component_container_isolated-1] [INFO] [1776087546.872633844] [global_costmap.global_costmap]: Checki…...

YOLO12模型在Web应用中的实时目标检测实现

YOLO12模型在Web应用中的实时目标检测实现 1. 引言 想象一下,你正在开发一个智能安防系统,需要实时分析摄像头画面中的行人、车辆和异常行为。或者你正在构建一个电商平台,希望自动识别用户上传的商品图片中的物品。传统方案需要将视频流发…...

基于Gradle 7.6与Spring Boot 3.0构建现代化Java 17微服务架构

1. 为什么选择Gradle 7.6 Spring Boot 3.0 Java 17组合 最近两年Java生态发生了翻天覆地的变化。作为一个经历过多个微服务项目的老兵,我发现这套技术组合正在成为企业级开发的新标准。Gradle 7.6带来的构建速度提升,Spring Boot 3.0对云原生的深度支持…...

解锁QQ音乐加密音频:qmc-decoder全面解决方案指南

解锁QQ音乐加密音频:qmc-decoder全面解决方案指南 【免费下载链接】qmc-decoder Fastest & best convert qmc 2 mp3 | flac tools 项目地址: https://gitcode.com/gh_mirrors/qm/qmc-decoder 还在为QQ音乐下载的加密音频文件无法在其他播放器或设备上播放…...

TinyML实战:手把手教你用C++和TensorFlow Lite Micro构建一个正弦波预测器

TinyML实战:用C和TensorFlow Lite Micro构建正弦波预测器的完整指南 在嵌入式AI的世界里,TinyML正掀起一场革命。想象一下,在一个只有指甲盖大小的微控制器上运行机器学习模型,实时预测正弦波数值——这正是我们将要探索的奇妙旅…...

避开开关电源的坑:AP值计算中3个易错点实测复盘

避开开关电源的坑:AP值计算中3个易错点实测复盘 在开关电源设计中,AP值(Area Product)作为磁芯选择的核心参数,直接关系到变压器的功率处理能力和整体效率。然而,即使经验丰富的工程师,在实际项…...

Wan2.1 VAE开发实战:集成至微信小程序实现前端AI绘图

Wan2.1 VAE开发实战:集成至微信小程序实现前端AI绘图 最近在捣鼓AI绘图应用,发现很多开发者把模型部署在服务器上,然后做个网页端就完事了。但说实话,现在大家更习惯用手机,如果能直接在微信小程序里玩AI绘图&#xf…...

从零构建可验证知识表示层:2024最新AIAgent架构白皮书核心章节精译(含OWL2+SHACL+Prolog混合推理原型代码)

第一章:可验证知识表示层的架构定位与核心价值 2026奇点智能技术大会(https://ml-summit.org) 可验证知识表示层(Verifiable Knowledge Representation Layer, VKRL)是现代可信AI系统中承上启下的关键抽象层,位于数据采集层与推理…...

Mission Planner/QGC连不上Pixhawk?可能是固件签名在捣鬼(附ArduCopter稳定版固件下载)

Mission Planner/QGC连接Pixhawk失败的深度排查与解决方案 当你的无人机开发工作正进行到关键时刻,地面站却突然无法识别Pixhawk飞控,这种"幽灵串口"现象确实令人抓狂。作为一名经历过多次类似问题的开发者,我理解这种挫败感——明…...

双NPN三极管恒流源电路设计与性能优化

1. 双NPN三极管恒流源电路基础解析 第一次接触恒流源电路时,我也被这个"电流稳定器"的概念深深吸引。想象一下,就像给水管装上智能阀门,无论水压如何变化,出水流量始终保持恒定。双NPN三极管组成的恒流源电路&#xff0…...

低成本ROS小车传感器融合实战:用MPU6050和模拟里程计搞定robot_pose_ekf

低成本ROS小车传感器融合实战:用MPU6050和模拟里程计实现精准定位 在机器人开发领域,定位精度往往决定了整个系统的上限。传统方案依赖昂贵的编码器和高端IMU,但今天我要分享的是一种完全不同的思路——如何用不到200元的硬件预算&#xff0c…...

LaTeX投稿IEEE期刊,编辑让我改排版?别慌,这份单栏+双倍行距+行号配置指南帮你搞定

LaTeX投稿IEEE期刊排版急救指南:单栏、双倍行距与行号配置实战 收到期刊编辑的格式修改意见时,那种"明明内容没问题却卡在排版细节"的焦虑感,每个科研人都深有体会。上周我刚帮同事处理完一份被要求"单栏双倍行距行号"的…...

别再只用基础API了!手把手教你用OnlyOffice Connector实现文档自动批注与事件监听

解锁OnlyOffice Connector高阶玩法:从自动化批注到智能事件流处理 当大多数开发者还在用基础API处理文档时,OnlyOffice Connector早已为深度集成准备好了全套武器库。想象一下这样的场景:法务团队上传的合同能自动标记风险条款,销…...