Part 3: 上下文与记忆
Agent的"大脑":如何管理有限的上下文窗口和构建长期记忆
章节列表
| 章节 | 标题 | 核心问题 |
|---|---|---|
| 07 | 上下文窗口管理 | 如何在有限Token内保留最重要的信息? |
| 08 | 记忆架构 | 如何让Agent拥有短期和长期记忆? |
| 09 | 多轮对话设计 | 如何设计高质量的会话持久化? |
学习目标
完成本Part后,你将能够:
- 实现智能上下文截断策略
- 设计分层记忆架构 (短期/长期)
- 使用向量数据库进行语义检索
- 处理多轮对话的去重和压缩
Shannon代码导读
Shannon/
├── docs/memory-system-architecture.md # 记忆系统设计
├── python/llm-service/ # Qdrant集成
└── go/orchestrator/ # Session管理
关键概念
- 滑动窗口: Token-aware的上下文管理
- 语义去重: 95%相似度阈值
- 层级记忆: 近期消息 + 向量检索
前置知识
- Part 1-2 完成
- 向量数据库基础 (Embedding概念)