
关于
设计短期、长期和基于图的记忆架构。适用于构建需要跨会话持久化的代理、需要在对话间保持实体一致性,或实现基于累积知识推理的场景。
name: memory-systems description: "设计短期、长期和基于图的记忆架构。用于构建需要跨会话持久化的智能体、需要在对话间保持实体一致性或实现对累积知识的推理。" risk: safe source: "https://github.com/muratcankoylan/Agent-Skills-for-Context-Engineering/tree/main/skills/memory-systems" date_added: "2026-02-27"
使用场景
设计短期、长期和基于图的记忆架构
当处理短期、长期和基于图的记忆架构设计时使用此技能。
记忆系统设计
记忆提供持久化层,使智能体能够跨会话保持连续性并对累积知识进行推理。简单智能体完全依赖上下文作为记忆,会话结束时丢失所有状态。复杂智能体实现分层记忆架构,平衡即时上下文需求和长期知识保留。从向量存储到知识图谱再到时序知识图谱的演进,代表着对结构化记忆的投入增加,以改善检索和推理。
使用场景
激活此技能当:
- 构建需要跨会话持久化的智能体时
- 需要在对话间保持实体一致性时
- 实现对累积知识的推理时
- 设计从过去交互中学习的系统时
- 创建随时间增长的知识库时
- 构建跟踪状态变化的时间感知系统时
核心概念
记忆存在于从即时上下文到永久存储的光谱上。一端是上下文窗口中的工作记忆,提供零延迟访问但会话结束时消失。另一端是永久存储,无限期持久化但需要检索才能进入上下文。
简单向量存储缺乏关系和时间结构。知识图谱保留关系用于推理。时序知识图谱添加有效期用于时间感知查询。实现选择取决于查询复杂度、基础设施约束和准确性要求。
详细主题
记忆架构基础
上下文-记忆光谱 记忆存在于从即时上下文到永久存储的光谱上。一端是上下文窗口中的工作记忆,提供零延迟访问但会话结束时消失。另一端是永久存储,无限期持久化但需要检索才能进入上下文。有效的架构沿此光谱使用多个层次。
光谱包括工作记忆(上下文窗口,零延迟,易失)、短期记忆(会话持久,可搜索,易失)、长期记忆(跨会话持久,结构化,半永久)和永久记忆(归档,可查询,永久)。每层具有不同的延迟、容量和持久性特征。
为什么简单向量存储不够 向量 RAG 通过在共享嵌入空间中嵌入查询和文档来提供语义检索。相似性搜索检索语义最相似的文档。这对文档检索效果很好,但缺乏智能体记忆的结构。
向量存储丢失关系信息。如果智能体学到"客户 X 在日期 Z 购买了产品 Y",向量存储可以在直接询问时检索此事实。但它无法回答"购买了产品 Y 的客户还买了什么产品?"因为关系结构未被保留。
向量存储也难以处理时间有效性。事实随时间变化,但向量存储除了通过显式元数据和过滤外,没有机制区分"当前事实"和"过时事实"。
向基于图的记忆转变 知识图谱保留实体间的关系。图编码实体 A 与实体 B 具有关系 R,而非孤立的文档块。这使得查询能够遍历关系而非仅仅相似性。
时序知识图谱为事实添加有效期。每个事实有"有效起始"和可选的"有效截止"时间戳。这使得时间旅行查询能够重建特定时间点的知识。
基准性能比较 深度记忆检索(DMR)基准提供了跨记忆架构的具体性能数据:
| 记忆系统 | DMR 准确率 | 检索延迟 | 备注 | |----------|-----------|----------|------| | Zep(时序 KG) | 94.8% | 2.58s | 最佳准确率,快速检索 | | MemGPT | 93.4% | 可变 | 良好的通用性能 | | GraphRAG | ~75-85% | 可变 | 比基线 RAG 提升 20-35% | | 向量 RAG | ~60-70% | 快 | 丢失关系结构 | | 递归摘要 | 35.3% | 低 | 严重信息丢失 |
Zep 展示了与全上下文基线相比 90% 的检索延迟降低(2.58s vs 28.9s for GPT-5.2)。这种效率来自仅检索相关子图而非完整上下文。