ドメインの位置付け
Context Management & Reliability は CCAF 5ドメイン中で15% を占めるドメインです。 公式ページに記載された範囲としては、「長期対話における重要情報の保持」「エスカレーションパターン設計」 「エラー伝播戦略」が中心トピックです。
配点としては最小ですが、軽視できないドメイン。 D1(agentic architecture)と組み合わせで出題されることが多く、 「エージェントが実運用で壊れない設計」を問う領域です。
このドメインで扱う技術概念
コンテキスト窓の管理パターン
長期対話・大量ツール結果・複数 subagent の出力が累積すると、コンテキスト窓が逼迫します。 公式ドキュメントで言及されているリスクと対策パターン:
- Progressive summarization の罠: 履歴を反復的に要約していくと、 数値・日付・顧客の具体的期待が“曖昧な要約”に圧縮されてしまう
- “Lost in the middle” 効果: 長い入力の冒頭と末尾は重要視されるが、 中央部分の情報は無視されがち
- Tool result accumulation: ツール出力が無条件に蓄積されると、 関連性に対して不釣り合いに大きいトークンを消費する
Context Editing と Compaction
Claude API には、長期対話の context window 圧迫を緩和する2つの異なる機構があります:
- Context editing — 古い tool 結果や thinking ブロックを消す(clear)方式。`clear_tool_uses_20250919` 等の strategy 指定
- Compaction — 古い文脈をサマリで置き換える(summarize)方式
両者は別機能。試験では「消す」と「要約する」を取り違えないことが重要です。
エスカレーション設計
自律エージェントが人間にエスカレーションするべき場面の設計判断:
- 顧客が明示的に人間対応を求めた場合 → 即エスカレーション
- ポリシーが沈黙している領域(規定外)→ エスカレーション
- 進捗が得られない場合 → エスカレーション
- 顧客の感情だけで判断するのはアンチパターン(複雑度の代理にならない)
- モデルの self-reported confidence もアンチパターン(calibration が悪い)
エラー伝播戦略
マルチエージェント環境での error propagation:
- 構造化エラーコンテキスト: 失敗種別・試したクエリ・部分結果・代替案を coordinator に返す。これにより coordinator が intelligent な復旧判断ができる
- Access failure vs valid empty result: タイムアウト等の access 失敗と、 成功したが結果が空の状態を明確に区別する必要がある
- Generic error suppression のアンチパターン: “検索失敗”だけ返すのは coordinator から context を奪う。何が attempted されたかも返すべき
Memory tool / Scratchpad
長期セッションで重要な発見を保持するために、scratchpad ファイルへ書き出すパターン。 エージェントが explore phase で発見した重要 fact を構造化して保持し、 context window から落ちても次のフェーズで再注入できるようにする設計です。
このドメインの主題的な問い(Fyveの解釈)
- 「長期エージェントは壊れる前提」で設計する
Context window は有限、ツール結果は累積、要約は劣化する。これらすべてを織り込んで設計する。 - エスカレーション基準は明文化する
モデルの “感じ” に任せない。明示的な criteria + few-shot で示す。 - エラーは “何ができなかった” ではなく “何が起きた” を返す
coordinator が次の action を選べる情報量を持たせる。
このドメインが関わるシナリオ
- Customer Support Resolution Agent — エスカレーション設計が主題
- Code Generation with Claude Code — 長期セッションの context 保持
- Multi-Agent Research System — エラー伝播
- Structured Data Extraction — confidence calibration
配点は最小ですが、 4シナリオに登場する横断ドメインです。
学習リソース(公式)
Fyveの実戦から見た D5
「長期エージェントは "最後に何があったか" を忘れる」。 長時間動作するエージェントで、後半の動作品質が下がる現象を頻繁に観察します。 Lost-in-the-middle 効果と context 累積が原因。Scratchpad パターンで重要事実を引き継ぐのが有効。
「エラーは抑制するな、構造化せよ」。 初期実装でつい “エラー = 失敗扱い” にしがちですが、これだと coordinator が 何が attempted されたか分からず、復旧判断できません。 エラーの “なぜ” と “何を試したか” を構造化して返す設計が長期的に効きます。
「エスカレーション criteria は few-shot で示す」。 顧客対応エージェントで「複雑な場合はエスカレーション」だけ書くと曖昧で機能しません。 具体的な “エスカレーションすべき” ケース と “自律解決すべき” ケース の対比例を入れることで精度が上がります。
Sources(情報源)
Fyveの実戦経験・独自情報
- AI業務自動化30件以上の長期エージェント運用観察 — context decay とエラー伝播の実戦パターン
不掲載情報
本ページは Exam Guide PDF の Task Statement、Knowledge of / Skills in リスト、Sample Questions を一切引用していません。