エージェントの「脳」:限られたコンテキストウィンドウとどう付き合い、長期メモリをどう構築するか
章一覧
| 章 | タイトル | コア質問 |
|---|---|---|
| 07 | コンテキストウィンドウの管理 | 限られたトークン数で、最も重要な情報をどう保ちつづけるか? |
| 08 | メモリアーキテクチャ | エージェントに短期メモリと長期メモリをどう持たせるか? |
| 09 | マルチターン対話の設計 | 高品質な会話の永続化をどう設計するか? |
学習目標
このPartを終えると、以下ができるようになる:
- インテリジェントなコンテキスト切り詰め戦略を実装する
- 階層的なメモリアーキテクチャを設計する(短期/長期)
- ベクトルデータベースを使った意味的検索を活用する
- マルチターン対話の重複排除と圧縮を扱う
Shannon コード読み解きガイド
Shannon/
├── docs/memory-system-architecture.md # メモリシステム設計
├── python/llm-service/ # Qdrant統合
└── go/orchestrator/ # セッション管理
主要概念
- スライディングウィンドウ: トークン認識型のコンテキスト管理
- 意味的重複排除: 95%相似度閾値
- 階層的メモリ: 最近のメッセージ + ベクトル検索
前提知識
- Part 1-2 完了済み
- ベクトルデータベース基礎(Embedding概念)