エージェントの「脳」:限られたコンテキストウィンドウとどう付き合い、長期メモリをどう構築するか

章一覧

タイトルコア質問
07コンテキストウィンドウの管理限られたトークン数で、最も重要な情報をどう保ちつづけるか?
08メモリアーキテクチャエージェントに短期メモリと長期メモリをどう持たせるか?
09マルチターン対話の設計高品質な会話の永続化をどう設計するか?

学習目標

このPartを終えると、以下ができるようになる:

  • インテリジェントなコンテキスト切り詰め戦略を実装する
  • 階層的なメモリアーキテクチャを設計する(短期/長期)
  • ベクトルデータベースを使った意味的検索を活用する
  • マルチターン対話の重複排除と圧縮を扱う

Shannon コード読み解きガイド

Shannon/
├── docs/memory-system-architecture.md  # メモリシステム設計
├── python/llm-service/                 # Qdrant統合
└── go/orchestrator/                    # セッション管理

主要概念

  • スライディングウィンドウ: トークン認識型のコンテキスト管理
  • 意味的重複排除: 95%相似度閾値
  • 階層的メモリ: 最近のメッセージ + ベクトル検索

前提知識

  • Part 1-2 完了済み
  • ベクトルデータベース基礎(Embedding概念)
この記事を引用する / Cite
Zhang, W. (2026). Part 3 - コンテキストとメモリの概要. In AI Agent アーキテクチャ:単体からエンタープライズ級マルチエージェントへ. https://waylandz.com/ai-agent-book-ja/Part3概要
@incollection{zhang2026aiagent_ja_Part3概要,
  author = {Zhang, Wayland},
  title = {Part 3 - コンテキストとメモリの概要},
  booktitle = {AI Agent アーキテクチャ:単体からエンタープライズ級マルチエージェントへ},
  year = {2026},
  url = {https://waylandz.com/ai-agent-book-ja/Part3概要}
}