藏在《Compact Memory 实现指南》里的Skill

技能描述

用 Anthropic API 或 Claude Agent SDK 为 Agent 实现 compact memory 的开发者指南——涵盖触发时机、fork compactor 模式、compact JSON schema 设计、跨会话记忆恢复的完整实现代码。

Skill.md

Compact Memory 实现指南

Agent 在长会话中面临一个根本性问题:对话历史随轮次无限增长,但模型的 context window 有固定上限。一旦超限,要么截断历史(丢失关键上下文),要么会话崩溃。这个 skill 给出了一套完整的工程实现方案:在 context 接近上限时,自动派生一个 compactor sub-agent 执行压缩,将压缩结果注入下轮的 system prompt,跨会话持久化

适用于使用 Anthropic API(Python/TypeScript SDK)或 Claude Agent SDK 开发 Agent 的工程师。

7 步实现框架

步骤内容
Step 1确认架构:SDK、agent 模式、session 模型
Step 2触发时机:token 阈值 / turn 计数 / 阶段边界三种策略
Step 3Fork compactor:独立 API 调用,用 Haiku 模型,主 agent 同步等待
Step 4compact 输出 schema:task、current_state、key_decisions、eliminated_approaches、next_steps
Step 5记忆恢复:system prompt 注入(推荐)或 first-message 注入
Step 6完整 agent 循环:含触发、压缩、持久化、恢复的完整代码
Step 7链式 compact:多次会话的 compact 合并更新,避免堆积

为什么 Fork 而不是自我压缩

主 agent 在长时间运行后焦点容易漂移——它沉浸在当前任务的细节里,很难站出来做全局总结。独立的 compactor 从零开始读全量历史,产出更准确的摘要。同时,compaction 是总结任务,用 Haiku 足够,节省下来的额度用于主 agent 的执行工作。

支持的使用场景

  • 构建需要跨会话保持状态的研究型 / 执行型 Agent
  • Agent 会话长度不可预测,需要自动管理 context,不能手动介入
  • 中间决策、放弃的方案、工具调用结果不能在压缩中丢失
  • 需要 compact 在多次会话后仍然准确(链式更新模式)

常见陷阱对照表

陷阱解决方法
compact 丢失后续步骤需要的工具结果把关键结果摘要写入 relevant_tool_results
新会话忽略 compact注入 system prompt,不要放在 messages 里
compactor 用了昂贵模型用 Haiku 做压缩,Opus 做主工作
compact 跨会话无限增大用链式 compact 合并更新,不要堆叠
compact JSON 解析失败崩溃加重试机制 + 降级 compact 兜底

局限说明

这个 skill 提供的是实现框架和代码模板,不是一个可以直接运行的库。compact 输出质量依赖 compactor 的提示词设计——如果 compactor system prompt 指令不清晰,生成的摘要可能遗漏关键上下文。建议在开发阶段手动验证前几次 compact 的输出质量,再投入生产。

安装使用

安装指令

npx skills add simbajigege/book2skills/skills/compact-memory-implementation
OR

直接下载

相关技能

Tool Permission System AI Skill

为 agent 工具设计可配置的分层权限/安全系统:用一条权限流水线统一决定 allow / ask / deny,支持企业 / 用户 / 项目多作用域规则覆盖,并通过 hook 系统扩展。

Compact with Memory AI Skill

正确执行 /compact——生成高质量的对话摘要,完整保留推理过程、决策背景和当前状态,同时在压缩前通过记忆预处理持久化机构知识。

Harness Step 1 — 创建 AGENTS.md 与知识库 AI Skill

扫描项目代码库,自动生成 AGENTS.md(agent 工作指南)和完整的 docs/ 知识库骨架,让 Claude Code 在任意新会话中 30 秒内定向,无需重复解释项目结构。

Session Dream AI Skill

会话结束时的手动记忆提炼——从当前对话中提取关键决策、失败路径、新发现和当前阻塞,写入 MEMORY.md topic 文件。Claude Code autoDream 后台服务的手动触发版本。

Claude Code 记忆架构实现指南 AI Skill

将混乱的 MEMORY.md 重构为 Claude Code autoDream 内部使用的 2 层记忆架构 —— 保持常驻索引精简、主题文件按需加载,让 autoDream 提取代理正确去重和维护记忆。

Harness Step 3 — 建立跨 Session 状态管理 AI Skill

创建 init.sh(环境健康检查)、tasks.json(结构化任务队列)和 progress.md(会话日志),解决 Claude Code 每次新对话失忆的问题,让任意 session 在 30 秒内完全恢复工作状态。

LangChain Tool Builder AI Skill

用 Claude Code 的 fail-closed 设计模式定义 LangChain(Python)工具——name、schema、权限、执行逻辑统一写在一个类里,自动走 validate → permission → call ...

Harness Step 2 — 填充 docs/ 知识库内容 AI Skill

深度阅读项目代码,将隐藏在代码里的架构知识、命名约定、技术决策显式写入 docs/ 各文件,让 agent 在任何 session 都能快速理解项目全貌,而不是靠猜测。

Query Loop Implementation AI Skill

为 AI 应用实现可上线的 LLM query loop:工具调用、结构化 tool_result 回传、ReAct 循环、最大轮次退出、权限检查、超时、预算控制和 fatal error 终止路径。

一本书读懂财报 AI Skill

用肖星的三表联动框架分析企业财务报表,判断一家公司是否真正赚钱。适用于:解读资产负债表、分析现金流健康度、ROIC vs WACC好公司测试、跨行业财务比较。

商业冒险分析框架 AI Skill

运用约翰·布鲁克斯《商业冒险》(原书名《Business Adventures》)分析企业失败、市场恐慌、产品时机、治理缺口、监管风险、欺诈暴露、机构脆弱性和创新盲区。