Date
2026/05/24
Category
Hermes Agent
Title
Hermes Agentで planner/coder/QA の3エージェント並列パイプラインを組む|@gkisokayの事例
3つのエージェント(planner / coder / QA)を並列で走らせ、自律的にコードをビルド・検証するパイプライン。X 上で「Day 10 AGI build」と銘打って公開された @gkisokay 氏の Hermes Agent 活用事例は、マルチエージェント編成の実装イメージを掴むうえで参考になる一次情報です。本記事では、株式会社Fyveが受託開発で扱ってきたエージェント設計の知見を踏まえ、この3エージェントパイプラインの構造、役割分担、運用の判断軸を実務目線で解説します。「複数エージェントを連携させたいが設計の指針が見えない」という方の判断材料を一気に揃えます。
@gkisokay 氏は 2026年4月15日〜17日にかけて、Hermes Agent を使った「Day 10 AGI build」を X 上で公開しました。10日間のビルドログ形式で、自身が組み上げたplanner / coder / QA の3エージェント並列パイプラインと、それらを Codex runtime monitor で監視する構成を紹介しています。
3エージェントの役割は明確に分かれています。
そして、これら3エージェントの稼働状況を Codex runtime monitor が監視し、暴走・無限ループ・コスト超過などの異常を検知する役割を担います。エージェント本体ではなく、その「上位の監視レイヤー」を別建てで用意している点が、設計上の特徴です。

このパイプラインの肝は、3エージェントの「並列性」と「同期点」を分けて設計している点にあります。
planner → coder → QA という流れ自体は直列(前の出力を次の入力にする)ですが、coder の内部では複数インスタンスが並列に動きます。具体的には次のような流れになります。
このフェーズ分割により、独立性の高い作業は並列化してスループットを稼ぎ、依存関係のあるフェーズは直列に保って整合性を守る、というハイブリッド構成が成立します。
Hermes Agent はサブエージェント機能と中期メモリを組み合わせることで、エージェント間の状態共有を実現します。@gkisokay 氏の構成では、以下のような通信パターンが想定されます。
中期メモリを「共有ホワイトボード」として使うこの設計は、Hermes Agent の3層メモリ(短期・中期・永続)の特性を活かした実装パターンです。各エージェントが自分のセッションを持ちつつ、プロジェクト単位の共有情報を中期層に集約することで、独立性と連携性を両立できます。
3エージェント本体とは別に走る Codex runtime monitor は、いわば「監督役」です。各エージェントの稼働時間、トークン消費、再帰深度、エラー頻度などをリアルタイムで監視し、しきい値を超えたら警告またはエージェント停止を発動します。
マルチエージェント構成を本番運用に乗せる場合、この監視レイヤーがあるかないかで運用の安心感が大きく変わります。エージェント自身に「自分の異常を検知させる」のは難しいため、外部の監視プロセスを別建てするのは合理的な判断です。
この事例から、私たちは3つの設計思想を読み取っています。
planner / coder / QA という分け方は、いわゆる「役割分担」ですが、より正確には「ソフトウェア開発のフェーズ」を分割しています。計画フェーズ、実装フェーズ、検証フェーズ——人間の開発チームでも自然に存在する区分です。
マルチエージェント設計で陥りがちな落とし穴は、「フロントエンド担当」「バックエンド担当」「DB担当」のように領域で分けてしまうことです。領域で分けると、ひとつのタスクが複数領域にまたがるたびにエージェント間の調整コストが膨らみます。一方、フェーズで分けると、ひとつのタスクは1人の planner が計画 → 複数の coder が並列実装 → 1人の QA が検証、という流れで素直に進みます。
coder フェーズだけを並列化し、planner と QA は直列に保つ設計は、並列化の鉄則を踏まえています。並列実行できるのは、互いに依存しない作業のみ。依存関係のあるフェーズを無理に並列化すると、競合・矛盾・整合性の崩壊が起きます。
planner は全体像を1か所で把握する必要があるため並列化しない。QA も最終判定の一貫性を保つために並列化しない。実装だけが独立性を持つから並列化できる——この判断軸は、自社の受託開発でマルチエージェントを設計する際にも応用できる原則です。
Codex runtime monitor を3エージェントとは別建てにしている点は、特に重要です。エージェント同士が相互監視する設計(A が B を監視し、B が C を監視し、C が A を監視する)は一見冗長性が高そうに見えますが、実際には全員が同じ前提で動いているため、共通の暴走パターンに対しては全員が同時に騙されます。
上位レイヤーに監視を置くことで、エージェントの「外側」から客観的に状態を観測できる構造になります。これは Kubernetes の control plane と worker node の関係に似た発想で、システム設計として筋がよいパターンです。
この事例を自社の業務自動化に応用する場合、エージェントの役割をどう分けるかが最初の判断ポイントになります。私たちが実案件で使っている判断軸は次の通りです。

業務を観察したときに、「計画 → 実行 → 検証」のような明確なフェーズが存在する場合、それをそのままエージェントの役割境界にできます。例えば次のような業務はフェーズ分割が効きます。
逆に、フェーズが明確でない作業(例:チャット応対のように1往復で完結する処理)は、無理に複数エージェントに分けず、単一エージェント+スキルで構成したほうがシンプルです。
planner 相当の役割がサブタスクを切り出したときに、それらが互いに独立して進められるかを確認します。独立していれば並列化、依存関係があれば直列のまま——これを最初に整理しておかないと、並列実行したつもりが実は競合で停まる、という事態が起きます。
分かりやすい目安は、「サブタスクA を完了させずに B を開始できるか」を問うことです。Yes なら並列化候補、No なら直列です。
マルチエージェント構成では、コスト超過・無限ループ・暴走を止めるための「強制停止権限」を誰が持つかを最初に決める必要があります。@gkisokay 氏の構成では Codex runtime monitor がそれを担っていますが、自社実装の場合は次のいずれかになります。
初期検証段階では人間の承認ゲートで始め、安定運用フェーズで監視エージェントに切り替える、という段階的な導入が現実的です。
マルチエージェント構成は @gkisokay 氏の事例以外にも、海外のビルド事例が複数公開されています。役割分担の設計を比較するための参考として、いくつか紹介します。
Hermes Agent の開発元である Nous Research の Teknium 氏は、2026年4月25日に「Hermes Agent 自身の開発に Hermes Agent を12並列で使っている」と公開しました。バックエンド監視・post-training・RL環境の3チーム編成で、各チームが複数のサブエージェントを抱える構造です。@gkisokay 氏の3エージェント構成より大規模ですが、「チーム=担当領域」「サブエージェント=実作業者」という階層構造は共通しています。
2026年4月24日に @codewithimanshu 氏が公開した UGC 広告生成パイプラインは、「商品URL → スクレイピング → 広告ライブラリ調査 → ブリーフ生成」を約4分で完結させる構成です。役割分担としては「情報収集」「分析」「生成」のフェーズ分割で、@gkisokay 氏のパターンと類似の設計思想です。
autonovel は79,456語の英語小説を世界構築 → 章執筆 → adversarial編集 → Opusレビュー → LaTeX組版 → カバーアート生成 → ランディング公開まで自律実行する公式リファレンス実装です。7段階以上のフェーズ分割で、各フェーズが専用のサブエージェントを持つ構造になっています。@gkisokay 氏の3エージェント構成の発展形と捉えると、設計の連続性が見えます。

マルチエージェント構成は「すごそう」という雰囲気だけで採用すると、調整コストで沈みます。本事例のように、フェーズ分割・並列性の制限・監視レイヤーの分離という3つの軸で設計を整えてから取り組むことを推奨します。私たちもエージェント自動化案件では、まずこの設計レビューを最初に行うようにしています。
Company
株式会社Fyve
Address
〒810-0001
福岡県福岡市中央区天神4丁目6-28
天神ファーストビル7階
Tel
080-1460-2728
info@fyve.co.jp