Date
2026/05/24
Category
Hermes Agent
Title
Hermes AgentでRenPy視覚小説を10分自動生成|@ExileAI_0の事例
AIエージェントは小説や記事だけでなく、画像とコードを束ねた「ゲームコンテンツ」までその場で組み上げられる段階に入っています。2026年4月20日にXの開発者 @ExileAI_0 が公開した事例は、Hermes AgentとComfyUI・RenPyを連携させ、10枚の画像とシナリオを含む視覚小説(ビジュアルノベル)を約10分で自動生成したものです。本記事では、株式会社Fyveとして、この事例の中身、技術的な仕組み、そして中小企業のコンテンツ業務にどう応用できるかを実務目線で読み解きます。
まず事実を3点で押さえます。
視覚小説は、立ち絵・背景・テキスト・選択肢で構成される対話型のコンテンツ形式です。日本でいう「ノベルゲーム」に近く、海外ではインディーズゲームや教育コンテンツで広く使われています。RenPyはこのジャンル制作のデファクト標準で、Python製のOSSとして長年運用されてきました。
今回の事例で生成されたメトリックは次のとおりです。
指標 | 数値 | 備考 |
|---|---|---|
所要時間 | 約10分 | Hermes Agent起動から実行可能なゲームファイル完成まで |
画像枚数 | 10枚 | 立ち絵・背景・カットインなどの素材一式 |
使用エンジン | RenPy | 視覚小説制作用Pythonフレームワーク |
画像生成バックエンド | ComfyUI | ノードベースの画像生成スイート |
出典は @ExileAI_0 のXポストおよび Hermes Agent ユースケース集(aliaihub/awesome-hermes-usecases)です。第三者によるベンチマーク再現は確認できていないため、所要時間は本人申告として扱います。それでも重要なのは、「画像生成 × ゲームエンジン × エージェント」という三層連携が個人の手元で成立した実例である点です。

この事例の核心は、Hermes Agentが「指揮者」として ComfyUI と RenPy を順に駆動した点にあります。それぞれの役割を整理します。
Hermes Agentは、Nous Researchが2026年2月に公開したオープンソースのエージェントランタイムです(GitHub Star 16万超)。70以上のビルトインツールと並列実行可能なサブエージェント機構を持ち、外部ツールはMCP(Model Context Protocol)経由で呼び出します。
今回のパイプラインでHermes Agentが担うのは次の工程です。
Hermes Agent v0.11.0以降はサブエージェントの再帰呼び出しが無制限化されており、「シナリオ生成」「画像生成」「コード生成」を並列で走らせることが構造的に可能です。
ComfyUIはノードベースのGUIを持つ画像生成スイートで、Stable Diffusion系のモデルを柔軟に組み合わせられる点が強みです。APIモード(ヘッドレス)で起動すれば、Hermes Agent側からHTTP経由で画像生成リクエストを送れます。
視覚小説で必要になる画像は性質が異なります。立ち絵は背景透過、背景は16:9のワイド、カットインは特定の構図というように、シーンごとに別ワークフローを呼び分ける必要があります。Hermes AgentはここでComfyUIのワークフローJSONを切り替えながら、10枚分のリクエストを処理しました。
RenPyは長年使われてきたPython製のビジュアルノベルエンジンです。シナリオはDSL(ドメイン固有言語)で記述しますが、構造はシンプルで、LLMがコード生成しやすい部類に入ります。Hermes Agentは生成済みの画像ファイルパスを参照しながら、定型に近い .rpy ソースを書き出し、`renpy.sh` 系のコマンドでビルドまで一気通貫で実行できます。
つまり今回の事例は、「画像生成エンジン × ゲームエンジン × エージェント」という3層をHermes Agentが束ねた最小完成形と言えます。

株式会社Fyveは中小企業向けのAI業務効率化を主業務にしていますが、コンテンツ生成領域も顧客課題の隣接領域として常に観察しています。その立場からこの事例を読むと、本質はスピードそのものより、「複数モダリティの統合」が個人規模で完結したことです。
従来、視覚小説1本を作るには、シナリオライター・イラストレーター・スクリプター(プログラマ)・ディレクターの最低4ロールが必要でした。私たちが過去に観察してきたインディーズ制作の現場では、習作レベルの短編でも実働で40〜80時間が一般的なレンジです。
これを10分の自動生成に圧縮できることの意味は、「品質の代替」ではなく「プロトタイピングの民主化」です。完成品として商用配信できるレベルかは別問題ですが、企画段階のラフ案・社内向けデモ・教育素材のドラフト程度であれば、すでに実用レンジに入っています。
第二の論点は、「ローカル完結」が成立している点です。Hermes Agentはセルフホスト前提のランタイムで、ComfyUIもローカルGPUで動かせます。クラウドAPI課金の従量制ではなく、自分のマシン上で繰り返し試行できるため、試作の回数を制限なく回せます。中小企業が「外部に出したくない素材」を扱う領域では、この性質が決定的に効きます。
第三に、「コンテンツ生成 × エージェント」の組み合わせはHermes Agent公式のautonovel(79,456語の長編小説を自律生成する公式リファレンス実装)と同じ系譜です。autonovelがテキスト中心の縦長コンテンツであるのに対し、今回の事例は画像とコードを束ねた横の広がりを示した点で補完関係にあります。
「視覚小説」と聞くと一般向けゲームが想起されますが、実際にはビジネス用途への応用余地が広い形式です。私たちが顧客企業の業務を観察して見えてきた、現実的な応用先を整理します。
従来は外部制作会社に数十万円〜数百万円で発注していた領域です。コンテンツの賞味期限が短い(年度ごとに更新が必要)ケースでは、内製化のコスト効果が大きく出ます。
視覚小説形式は、選択肢×結果のフィードバックが構造に組み込まれており、研修効果の測定に向いています。
これまで企画書だけで判断していた工程に、「動くもの」を10分で挟めるようになる意味は大きく、ゴーサイン判断の精度が変わります。

魅力的な事例ですが、現場に下ろすときに詰まるポイントもあります。
「自動生成すれば全部解決」ではなく、「初稿の生成コストをほぼゼロにし、人間が仕上げに集中する」という構図に落とすのが現実解です。
今回の視覚小説事例は単発の派手な事例というより、Hermes Agentが進めている「コンテンツ自動生成」系の系譜の一部です。代表例を挙げます。
視覚小説事例の位置づけは、「画像 × コード × ゲームエンジン」を束ねる小型実装例として参照しやすい点にあります。autonovelのような巨大パイプラインに踏み出す前に、まずこの規模で社内に提示するのが現実的です。

Company
株式会社Fyve
Address
〒810-0001
福岡県福岡市中央区天神4丁目6-28
天神ファーストビル7階
Tel
080-1460-2728
info@fyve.co.jp