最新のホットトピック:Computer Use、Agentic Coding、Background Agents、階層型モデル戦略

章一覧

タイトルコア課題Shannonとの関連
27Computer Useどうやってエージェントがブラウザやデスクトップを操作するか?config/models.yaml multimodal
28Agentic Codingどうやってコード生成エージェントを構築するか?file_ops.py, wasi_sandbox.rs
29Background Agents非同期な長時間タスクをどう実装するか?schedules/manager.go
30階層型モデル戦略どうやって50〜70%のコスト削減を実現するか?config/models.yaml, manager.py

章節の概要

第27章:Computer Use

エージェントが「目」と「手」を手に入れるとき:APIの呼び出しから実際のUIの操作へ

コアコンテンツ:

  • 知覚-判断-実行ループ:スクリーンショット理解 → 座標計算 → クリック/入力 → 結果検証
  • マルチモーダルモデル統合:ビジョン理解がComputer Useの重要な能力
  • 座標キャリブレーション:異なる解像度とDPIスケーリングの差異を処理
  • セキュリティ対策:危険エリア検出、入力コンテンツフィルタリング、OPAポリシー拡張
  • 検証ループ:毎回操作後にスクリーンショットで結果を検証し、失敗時に自動リトライ

Shannonコードconfig/models.yaml (multimodal_models)、ツール拡張パターンを推奨


第28章:Agentic Coding

エージェントをあなたのプログラミングパートナーに:コード生成から完全な開発ワークフローまで

コアコンテンツ:

  • 安全なファイル操作:ホワイトリストディレクトリ、パス検証、シンボリックリンク対策
  • WASI サンドボックス実行:Fuel/Epoch制限、メモリ分離、タイムアウト制御
  • コード反思ループ:生成 → レビュー → 改善の反復プロセス
  • マルチファイル編集調整:アトミック変更、バックアップロールバック機構
  • Git統合:ブランチ管理、自動コミット、PR作成

Shannonコードpython/llm-service/llm_service/tools/builtin/file_ops.pyrust/agent-core/src/wasi_sandbox.rsgo/orchestrator/internal/workflows/patterns/reflection.go


第29章:Background Agents

タスクをバックグラウンドで実行し続ける:Temporalスケジューリングと定期実行タスクシステム

コアコンテンツ:

  • Temporal Schedule API:ネイティブCronスケジューリング、一時停止/再開、タイムゾーン対応
  • リソース制限:MaxPerUser (50)、MinCronInterval (60分)、MaxBudgetPerRunUSD ($10)
  • ScheduledTaskWorkflow:ラッパーワークフロー、実行メタデータ記録(モデル、トークン、コスト)
  • 孤立検出:Temporalとデータベース状態の不整合を定期的に検出し、自動クリーンアップ
  • 予算インジェクション:各実行のコスト追跡と制限

Shannonコードschedules/manager.goscheduled_task_workflow.go


第30章:階層型モデル戦略

インテリジェントルーティングで50〜70%のコスト削減を実現:すべてのタスクが最強モデルを必要とするわけではないよね

コアコンテンツ:

  • 3層アーキテクチャ:Small (50%) / Medium (40%) / Large (10%) の目標分布
  • 優先度ベースルーティング:同じレベル内で複数Providerが優先度で選択され、自動フォールバック
  • 複雑度分析:タスク特性に基づいてモデル層を自動選択
  • 能力マトリックス:multimodal、thinking、coding、long_contextの能力マーク
  • サーキットブレーカー降級:Circuit Breaker + 代替Providerへの自動降級
  • コスト追跡:集中型の価格設定、リアルタイムコスト監視

Shannonコードconfig/models.yamlllm_provider/manager.py


学習目標

このPartを完了すれば、以下ができるようになる:

  • Computer Useの知覚-判断-実行ループを理解する
  • 安全なAgentic Codingワークフロー(サンドボックス + 反思)を設計する
  • Temporal Schedule APIを使って定期バックグラウンドタスクを実装する
  • 3層モデル戦略を設定して50〜70%のコスト削減を実現する
  • Research エージェントに最先端能力を追加する (v0.9)

Shannonコード一覧

Shannon/
├── config/
   └── models.yaml                    # 3層モデル設定、価格設定、能力マトリックス
├── go/orchestrator/
   └── internal/
       ├── schedules/
          └── manager.go             # 定期実行タスクマネージャー (CRUD、リソース制限)
       └── workflows/scheduled/
           └── scheduled_task_workflow.go  # ラッパーワークフロー
├── python/llm-service/
   ├── llm_provider/
      └── manager.py                 # LLMマネージャー (ルーティング、サーキットブレーカー、フォールバック)
   └── llm_service/tools/builtin/
       ├── file_ops.py                # 安全なファイル読み書きツール
       └── python_wasi_executor.py    # Pythonサンドボックス実行
└── rust/agent-core/src/sandbox/
    └── wasi_sandbox.rs                # WASIサンドボックス実装

ホットトピック関連

トピック代表的なプロダクトShannon実装
Computer UseClaude Computer Use、Manusマルチモーダル + ツール拡張Ch27
Agentic CodingClaude Code、Cursor、WindsurfWASIサンドボックス + ファイルツールCh28
Background AgentsClaude Code Ctrl+BTemporal Schedule APICh29
Cost Optimizationエンタープライズ向け低コスト化需要階層型モデル戦略Ch30

コスト削減の例

階層化なし (全部Large使用):
  1M リクエスト × $0.09/リクエスト = $90,000/

階層化戦略 (50/40/10):
  Small:  500K × $0.0006  = $300
  Medium: 400K × $0.0018  = $720
  Large:  100K × $0.09    = $9,000
  合計: $10,020/

節減: $79,980/ (89%)

前提知識

  • Part 1〜8を完了(特にPart 7〜8の本番アーキテクチャとエンタープライズ機能)
  • ブラウザ自動化の基本 (Playwright/Puppeteer) - オプション
  • Cron表現の基本 - オプション
  • マルチモデルAPI経験 - オプション

Research エージェント v0.9

このPartで扱う最先端能力モジュール:

モジュール能力
Computer Use第27章ウェブブラウジング、コンテンツ抽出
Agentic Coding第28章分析スクリプト生成
Background Agents第29章定期研究レポート
Tiered Models第30章インテリジェントモデル選択

最終形態:

ユーザー:「毎日朝9時にAI業界の日報を生成してほしい」

Research エージェント v0.9:
1. [Schedule] Cronスケジューリングタスク作成 (0 9 * * *)
2. [Tiered] Smallモデルで複雑度評価を実施
3. [Multi-Agent] 検索/分析/執筆を並列実行
4. [Browser] API未対応サイトにアクセスしてコンテンツ抽出
5. [Coding] データビジュアライゼーションスクリプト生成
6. [Budget] 各実行のコストを < $2 に制御
7. [Output] 構造化されたレポートを発送
この記事を引用する / Cite
Zhang, W. (2026). Part 9 - 最先端プラクティスの概要. In AI Agent アーキテクチャ:単体からエンタープライズ級マルチエージェントへ. https://waylandz.com/ai-agent-book-ja/Part9概要
@incollection{zhang2026aiagent_ja_Part9概要,
  author = {Zhang, Wayland},
  title = {Part 9 - 最先端プラクティスの概要},
  booktitle = {AI Agent アーキテクチャ:単体からエンタープライズ級マルチエージェントへ},
  year = {2026},
  url = {https://waylandz.com/ai-agent-book-ja/Part9概要}
}