章一覧

章	タイトル	コア質問
07	コンテキストウィンドウの管理	限られたトークン数で、最も重要な情報をどう保ちつづけるか？
08	メモリアーキテクチャ	エージェントに短期メモリと長期メモリをどう持たせるか？
09	マルチターン対話の設計	高品質な会話の永続化をどう設計するか？

学習目標

このPartを終えると、以下ができるようになる：

インテリジェントなコンテキスト切り詰め戦略を実装する
階層的なメモリアーキテクチャを設計する（短期/長期）
ベクトルデータベースを使った意味的検索を活用する
マルチターン対話の重複排除と圧縮を扱う

Shannon コード読み解きガイド

Shannon/
├── docs/memory-system-architecture.md  # メモリシステム設計
├── python/llm-service/                 # Qdrant統合
└── go/orchestrator/                    # セッション管理

主要概念

スライディングウィンドウ: トークン認識型のコンテキスト管理
意味的重複排除: 95%相似度閾値
階層的メモリ: 最近のメッセージ + ベクトル検索

前提知識

Part 1-2 完了済み
ベクトルデータベース基礎（Embedding概念）

@incollection{zhang2026aiagent_ja_Part3概要, author = {Zhang, Wayland}, title = {Part 3 - コンテキストとメモリの概要}, booktitle = {AI Agent アーキテクチャ：単体からエンタープライズ級マルチエージェントへ}, year = {2026}, url = {https://waylandz.com/ai-agent-book-ja/Part3概要} }