Fable 5を司令塔に|Claude Codeマルチモデル運用術
「Fable 5は圧倒的に賢いが、遅くて高い」「利用枠の減りが速すぎる」——Claude Codeで最上位モデルを日常使いし始めた方の多くがこの壁に当たり、マルチモデル運用という答えに行き着きます。
結論から言うと、Fable 5には「作業」をさせないのが現実解です。Fable 5は司令塔(オーケストレーター=全体の指揮役)に据え、実際に手を動かす作業はOpusやSonnetのサブエージェント、そして別視点のCodexに委譲する。この構成なら、最上位モデルの頭脳を使いながら利用枠の消費を大幅に抑えられます。
株式会社Fyveは日々の業務のほぼ全てをClaude Code上で回しており、この記事では私自身がこの構成を実運用して得た実測トークン数と体感を基に、設定手順から運用の注意点までを解説します。
Claude Codeのマルチモデル運用(オーケストレーター方式)とは
マルチモデル運用とは、1つのClaude Codeセッションの中で複数のAIモデルに役割を分担させる使い方です。核になる考え方はシンプルで、「最も賢いモデルは作業者ではなく司令塔にする」というものです。
私が実際に使っている役割分担は次の通りです。
- Fable 5(司令塔): 計画立案、タスク分解、各エージェントの結果統合、最終判断。自分では手を動かさない
- Opus 4.8(深い推論の担当): 設計、複雑な不具合の調査、込み入ったロジックの検討など「考える仕事」
- Sonnet(機械的作業の担当): 定型的な修正、テスト、ファイル整理、フォーマット調整など「手を動かす仕事」
- Codex(別視点の相棒): OpenAIのGPT-5.5系で動く同格のエンジニア役。行き詰まった問題や、セカンドオピニオンが欲しい場面で投入
ポイントは、CodexをClaude配下の「部下」ではなく別会社の同僚のように扱うことです。同じ問題でも学習の系統が違うモデルは違う角度から答えを出してくるため、レビュー役ではなく対等な相談相手として位置づけると効果が出やすくなります。
この構成は海外の実務者の間でも定番になりつつあり、私自身の使い分けの結論——重く長い自律タスクはFable 5、日常開発はOpus 4.8、軽量な定型作業はSonnet、コスト勝負の作業はCodex——とも一致します。
Fable 5というモデル自体の性能・価格・Opus 4.8との比較は、こちらの記事で詳しく解説しています。

なぜ最上位モデルに「作業」をさせないのか
理由1: 料金と利用枠の現実
Fable 5のAPI価格は入力$10・出力$50(100万トークンあたり、2026年6月の公開時点)で、Opus 4.8の約2倍です。定額プランで使う場合も消費の重さは同じで、Fable 5に単純作業までやらせると利用枠があっという間に減っていきます。
私は過去に、LP改修とSEO記事14本の並列処理を1セッションに詰め込み、Maxプランの5時間制限に一瞬で到達した経験があります。あの失敗から「モデルの格に合わない作業を上位モデルにやらせない」が私の運用原則になりました。
理由2: 実測で約38.8万トークンをサブエージェントに逃がせた
効果は実測で確認できています。2026年7月に、社内リポジトリ全体の棚卸し調査をFable 5の指揮で実行したときの数字がこちらです。
- Sonnetのサブエージェント4体を並列起動し、領域別に調査を分担
- 4体の消費トークンは104,903・99,507・73,427・110,558で、合計388,395トークン(約38.8万)をSonnet側に委譲
- Fable 5本体が消費したのは、方針文書の読み込みと最終の統合判断のみ
- 所要時間は4体並列で約3分
もしこの約38.8万トークンをFable 5本体で処理していたら、コストは単純計算で数倍、利用枠の消費も比になりません。「大量に読む・大量に書く」仕事を下位モデルに逃がすだけで、最上位モデルの頭脳を安く長く使えるようになります。
理由3: 司令塔のコンテキストを汚さない
もう1つの利点が精度面です。サブエージェントは大量のファイルを読み込んでも、司令塔には「結論の要約」だけを返します。つまりFable 5本体の作業記憶(コンテキスト)が細かい作業ログで埋まらず、常に全体像の判断に集中できる状態を保てます。長いセッションほど、この差は品質に効いてきます。

FREE GIFT / 読者特典Fable 5に「作業」をさせるな無料でPDFを受け取る →Claude Codeでの設定手順(4ステップ)
ステップ1: メインモデルをFable 5にする
Claude Codeで /model と入力し、Fable 5を選択します。あわせて /effort で推論の深さを高めに設定しておくと、司令塔としての判断の質が安定します。Fable 5は思考の深さを自動調整するモデルのため、思考量の指定はこのeffort設定で行う仕組みです。
ステップ2: サブエージェントを2体作る
次に /agents からサブエージェントを作成します。手作業で設定画面を操作してもよいですが、Claude Code自身に次のように頼むのが早いです。
「深い推論用のサブエージェント deep-reasoner(モデルはOpus固定。設計・複雑な調査を担当し、深く考えて結論だけ簡潔に返す)と、機械的作業用のサブエージェント fast-worker(モデルはSonnet固定。定型修正・テスト・整形を効率よく実行)を作って」
ポイントは各エージェントにモデルを固定で指定することです。これを省くとメインと同じモデル(=Fable 5)で動いてしまい、枠の節約になりません。サブエージェントの基本的な仕組みは、こちらの記事で詳しく解説しています。
ステップ3: Codexをプラグインで繋ぐ(任意)
OpenAIが公式に配布しているClaude Code用プラグインを使うと、Claude CodeからCodexへタスクを渡せるようになります。
導入は、Codex CLIを入れた環境のClaude Code上で /plugin marketplace add openai/codex-plugin-cc → /plugin install codex@openai-codex → /codex:setup の順に実行するだけです。
Codex側の処理はChatGPTの契約枠で動くため、Claude側の利用枠を一切消費しないのが実務上の大きな利点です。ChatGPT Plusを既に契約しているなら、追加コストなしで「第2の頭脳」を並べられます。
ステップ4: CLAUDE.mdに委譲ルールを書く
最後に、プロジェクトのCLAUDE.md(Claude Codeが毎回読む指示書)へ委譲ルールを明文化します。私が使っている記述の要点は次の通りです。
- あなた(Fable 5)は司令塔。計画・分解・統合に徹し、自分では作業しない
- 推論が重い工程は deep-reasoner へ、機械的作業は fast-worker へ委譲する
- Codexは同格のエンジニアとして扱い、別視点が欲しい問題を渡す
- 重要な判断は、OpusとCodexに同じ問題を独立に解かせ、互いの答えを見せずに統合する
特に最後の「互いの答えを見せずに統合」は効果的です。片方の答えを見せると、もう片方がそれに引きずられて独立した視点が消えてしまうためです。日々の指示は「ゴールと前提を伝えて、まず計画を見せてから実行して」と頼むだけで、あとは司令塔が振り分けてくれます。
私の環境では、このルールを明文化してから「この作業はどのモデルにやらせるべきか」を毎回考える必要がなくなりました。人間側は業務の依頼と成果物の確認に集中し、振り分けは司令塔に任せる——モデル選択という管理業務そのものを自動化できたのが、想定していなかった副次効果です。
実運用で見えた注意点
この構成を回す中で、つまずきやすい点もいくつか見えてきました。
- 並列は5〜6体までに抑える: サブエージェントは並べるほど速くなりますが、トークン消費も倍々で増えます。私は方針が明確で数だけ多い作業に限って並列化しています
- いきなり全業務を移行しない: まず「重くて長い1業務」だけをこの構成に載せ、効果を確認してから広げるのが安全です
- 単一モデル依存を避ける: Fable 5は2026年6月に一時提供停止となった時期があり(現在は再開)、私は1つのモデル前提で組んだワークフローが止まる怖さを実地で経験しました。「司令塔が使えないときはOpus 4.8で代替する」というフォールバック先を決めておくべきです
- 検収は司令塔に必ず戻す: サブエージェントの結果を鵜呑みにせず、司令塔が統合・検証するという原則を崩さないことが品質の生命線です
もう1つのコツは、委譲するときに「何を・どの形式で返すか」を明確に指定することです。返答形式が曖昧なままだと、司令塔が結果を統合する段階で確認の往復が発生し、せっかく節約したトークンを食い潰してしまいます。
Fable 5の一時停止から再開までの経緯と、再導入するかどうかの判断材料は、こちらの記事にまとめています。
なお、Claude CodeとCodexをそもそもどう使い分けるかという全体像は、こちらの記事でも整理しています。
まとめ|賢いモデルほど「考える仕事」に専念させる
Claude Codeのマルチモデル運用について、要点をまとめます。
- Fable 5は作業者ではなく司令塔(オーケストレーター)に据える
- 深い推論はOpus、機械的作業はSonnetのサブエージェントに委譲し、モデルを固定指定する
- Codexは別視点の同僚として繋ぐ。ChatGPT側の枠で動くためClaudeの利用枠を消費しない
- 実測では約38.8万トークンをSonnet側に逃がし、司令塔は統合判断だけに集中できた
- 並列は5〜6体まで、フォールバック先の確保、司令塔での検収を運用原則にする
最上位モデルの価値は「何でもやらせること」ではなく、「最も重要な判断に集中させること」で最大化されます。人間の組織で優秀な管理職に単純作業をさせないのと同じ理屈です。まずは1つの重い業務から、司令塔と実行部隊の分業を試してみてください。
Fable 5に「作業」をさせるな
1人会社を丸ごとAIで回している実運用から、Fable 5の使いどころだけをまとめた全29ページの配置設計図。参謀=Fable 5/実装=Sonnet/監査=Haiku——実測データと、コピペで導入できる設定ファイル付き。
- Fable 5に任せるべき仕事の4象限と、任せてはいけない仕事
- 実運用している1人会社の「業務 × モデル」配置表
- オーケストレーター方式の実測データ(Sonnet 4体並列・約3分)
- CLAUDE.mdに書くエスカレーション基準の雛形
ニュースレター「ひとりAI経営」の購読特典です。未購読の方はメールアドレス登録で、その場で受け取れます。
御社の業務に合わせたClaude Code導入支援
「AIツールを導入したが、現場で使われない」を終わらせる。
業務課題のヒアリングから設計、ハンズオン実践、運用定着まで一貫して支援します。