Hermes AgentでRenPy視覚小説を10分自動生成|@ExileAI_0の事例
AIエージェントは小説や記事だけでなく、画像とコードを束ねた「ゲームコンテンツ」までその場で組み上げられる段階に入っています。2026年4月20日にXの開発者 @ExileAI_0 が公開した事例は、Hermes AgentとComfyUI・RenPyを連携させ、10枚の画像とシナリオを含む視覚小説(ビジュアルノベル)を約10分で自動生成したものです。本記事では、株式会社Fyveとして、この事例の中身、技術的な仕組み、そして中小企業のコンテンツ業務にどう応用できるかを実務目線で読み解きます。
事例の概要 — 10分で10枚構成の視覚小説が立ち上がる
まず事実を3点で押さえます。
- 誰: @ExileAI_0(X上で活動する個人開発者)
- いつ: 2026年4月20日のX投稿
- 何: Hermes Agent から ComfyUI を呼び出し、RenPy(ビジュアルノベル制作用Pythonエンジン)で動く視覚小説を約10分で自動生成
視覚小説は、立ち絵・背景・テキスト・選択肢で構成される対話型のコンテンツ形式です。日本でいう「ノベルゲーム」に近く、海外ではインディーズゲームや教育コンテンツで広く使われています。RenPyはこのジャンル制作のデファクト標準で、Python製のOSSとして長年運用されてきました。
今回の事例で生成されたメトリックは次のとおりです。
指標 | 数値 | 備考 |
|---|---|---|
所要時間 | 約10分 | Hermes Agent起動から実行可能なゲームファイル完成まで |
画像枚数 | 10枚 | 立ち絵・背景・カットインなどの素材一式 |
使用エンジン | RenPy | 視覚小説制作用Pythonフレームワーク |
画像生成バックエンド | ComfyUI | ノードベースの画像生成スイート |
出典は @ExileAI_0 のXポストおよび Hermes Agent ユースケース集(aliaihub/awesome-hermes-usecases)です。第三者によるベンチマーク再現は確認できていないため、所要時間は本人申告として扱います。それでも重要なのは、「画像生成 × ゲームエンジン × エージェント」という三層連携が個人の手元で成立した実例である点です。

仕組み解説 — Hermes Agent × ComfyUI × RenPy の連携
この事例の核心は、Hermes Agentが「指揮者」として ComfyUI と RenPy を順に駆動した点にあります。それぞれの役割を整理します。
Hermes Agent の役割(オーケストレーション)
Hermes Agentは、Nous Researchが2026年2月に公開したオープンソースのエージェントランタイムです(GitHub Star 16万超)。70以上のビルトインツールと並列実行可能なサブエージェント機構を持ち、外部ツールはMCP(Model Context Protocol)経由で呼び出します。
今回のパイプラインでHermes Agentが担うのは次の工程です。
- シナリオプロット・キャラクター設定・分岐構造の生成(LLM推論)
- 各シーン用の画像プロンプトを生成し ComfyUI に送出
- 生成画像のファイル名・保存場所を管理
- RenPyスクリプト(.rpyファイル)の自動生成と画像の貼り付け
- ビルドコマンドの実行と動作確認
Hermes Agent v0.11.0以降はサブエージェントの再帰呼び出しが無制限化されており、「シナリオ生成」「画像生成」「コード生成」を並列で走らせることが構造的に可能です。
ComfyUI の役割(画像生成)
ComfyUIはノードベースのGUIを持つ画像生成スイートで、Stable Diffusion系のモデルを柔軟に組み合わせられる点が強みです。APIモード(ヘッドレス)で起動すれば、Hermes Agent側からHTTP経由で画像生成リクエストを送れます。
視覚小説で必要になる画像は性質が異なります。立ち絵は背景透過、背景は16:9のワイド、カットインは特定の構図というように、シーンごとに別ワークフローを呼び分ける必要があります。Hermes AgentはここでComfyUIのワークフローJSONを切り替えながら、10枚分のリクエストを処理しました。
RenPy の役割(ゲーム化・ビルド)
RenPyは長年使われてきたPython製のビジュアルノベルエンジンです。シナリオはDSL(ドメイン固有言語)で記述しますが、構造はシンプルで、LLMがコード生成しやすい部類に入ります。Hermes Agentは生成済みの画像ファイルパスを参照しながら、定型に近い .rpy ソースを書き出し、`renpy.sh` 系のコマンドでビルドまで一気通貫で実行できます。
つまり今回の事例は、「画像生成エンジン × ゲームエンジン × エージェント」という3層をHermes Agentが束ねた最小完成形と言えます。

私たちの解釈 — 10分という時間の意味
株式会社Fyveは中小企業向けのAI業務効率化を主業務にしていますが、コンテンツ生成領域も顧客課題の隣接領域として常に観察しています。その立場からこの事例を読むと、本質はスピードそのものより、「複数モダリティの統合」が個人規模で完結したことです。
従来、視覚小説1本を作るには、シナリオライター・イラストレーター・スクリプター(プログラマ)・ディレクターの最低4ロールが必要でした。私たちが過去に観察してきたインディーズ制作の現場では、習作レベルの短編でも実働で40〜80時間が一般的なレンジです。
これを10分の自動生成に圧縮できることの意味は、「品質の代替」ではなく「プロトタイピングの民主化」です。完成品として商用配信できるレベルかは別問題ですが、企画段階のラフ案・社内向けデモ・教育素材のドラフト程度であれば、すでに実用レンジに入っています。
第二の論点は、「ローカル完結」が成立している点です。Hermes Agentはセルフホスト前提のランタイムで、ComfyUIもローカルGPUで動かせます。クラウドAPI課金の従量制ではなく、自分のマシン上で繰り返し試行できるため、試作の回数を制限なく回せます。中小企業が「外部に出したくない素材」を扱う領域では、この性質が決定的に効きます。
第三に、「コンテンツ生成 × エージェント」の組み合わせはHermes Agent公式のautonovel(79,456語の長編小説を自律生成する公式リファレンス実装)と同じ系譜です。autonovelがテキスト中心の縦長コンテンツであるのに対し、今回の事例は画像とコードを束ねた横の広がりを示した点で補完関係にあります。
実務落とし込み — ゲーム・教育・社内研修への応用
「視覚小説」と聞くと一般向けゲームが想起されますが、実際にはビジネス用途への応用余地が広い形式です。私たちが顧客企業の業務を観察して見えてきた、現実的な応用先を整理します。
教育・eラーニング教材
- 新入社員向けの業務シミュレーション教材 — 「クレーム対応の選択肢分岐」など、テキストPDFでは伝えにくい状況判断教材
- 医療・介護現場のケーススタディ教材 — 患者対応の分岐シナリオを視覚化
- 子供向けの道徳・安全教育コンテンツ — 物語に没入させながら判断軸を学ばせる
従来は外部制作会社に数十万円〜数百万円で発注していた領域です。コンテンツの賞味期限が短い(年度ごとに更新が必要)ケースでは、内製化のコスト効果が大きく出ます。
社内オンボーディング・コンプライアンス研修
- 社内規定・コンプライアンス研修の分岐型シナリオ — テキストの読み物より理解度が上がる
- 製品マニュアルのシーン別解説 — 「お客様からこう質問されたら」のロールプレイ教材
- 営業フロー・店舗オペレーションの仮想体験
視覚小説形式は、選択肢×結果のフィードバックが構造に組み込まれており、研修効果の測定に向いています。
ゲーム・エンタメ業界のプロトタイピング
- 企画段階のピッチ用デモ — テキスト企画書より圧倒的に伝わる
- シナリオ会議で分岐パターンの即興検証
- クラウドファンディング前の体験版ドラフト
これまで企画書だけで判断していた工程に、「動くもの」を10分で挟めるようになる意味は大きく、ゴーサイン判断の精度が変わります。

運用上の落とし穴
魅力的な事例ですが、現場に下ろすときに詰まるポイントもあります。
- キャラクター一貫性 — 同じ登場人物を異なるシーンで描き分けるにはLoRA・Reference画像・キャラシート固定など追加工夫が必要
- 商用利用の権利関係 — 使用する画像生成モデルのライセンス確認は必須(商用可否がモデルごとに大きく異なる)
- テキストの語彙・トーン — 業界特有の言い回しや法令文言はLLM単体だと外しやすく、レビュー工程は省けない
- GPUコスト — ComfyUIの大量生成にはローカルGPU or クラウドGPUの確保が要る
「自動生成すれば全部解決」ではなく、「初稿の生成コストをほぼゼロにし、人間が仕上げに集中する」という構図に落とすのが現実解です。
関連事例 — Hermes Agentのコンテンツ生成パイプライン群
今回の視覚小説事例は単発の派手な事例というより、Hermes Agentが進めている「コンテンツ自動生成」系の系譜の一部です。代表例を挙げます。
- autonovel(公式リファレンス実装) — 79,456語の長編英語小説『The Second Son of the House of Bells』を、世界構築→章執筆→敵対的編集→Opusレビュー→LaTeX組版→fal.aiカバーアート→ElevenLabs音声書→ランディングページ公開まで完全自律生成。視覚小説事例の「文章+画像」系の完成形版です
- UGC広告スタジオ(@codewithimanshu, 2026-04-24) — 商品URL投入→Web スクレイピング→広告ライブラリ調査→ブリーフ生成までを約4分。ゲーム以外のコンテンツ業務でも同じパターンが成立する例です
- LinkedIn個人ボイス投稿(@Saboo_Shubham_, 2026-04-29) — 過去記事の文体分析+Mac Mini常駐+永続記憶で投稿を自動化。「個性のあるコンテンツ生成」が継続運用フェーズで何を要求するかの参考事例
- Postiz Agent for Hermes Agent — 28+プラットフォーム横断投稿のCLI(Reddit / LinkedIn / Instagram / YouTube / TikTok など)。生成側ではなく配信側の自動化
視覚小説事例の位置づけは、「画像 × コード × ゲームエンジン」を束ねる小型実装例として参照しやすい点にあります。autonovelのような巨大パイプラインに踏み出す前に、まずこの規模で社内に提示するのが現実的です。

まとめ
- @ExileAI_0 の事例は、Hermes Agent + ComfyUI + RenPy で10画像構成の視覚小説を約10分で自動生成した実例である
- 本質はスピードそのものより、「画像生成エンジン × ゲームエンジン × エージェント」の三層連携が個人の手元で完結したこと
- RenPyはOSSで運用実績が長く、LLMがコード生成しやすいDSLを持つため、エージェントとの相性が良い
- 視覚小説形式は、教育教材・社内研修・コンプライアンスシミュレーション・企画ピッチ用デモなどビジネス用途への応用余地が広い
- キャラ一貫性・モデルライセンス・GPUコストといった運用上の壁は残るため、「初稿生成のコストゼロ化+人間の仕上げ」という構図に落とすのが現実解
- 株式会社Fyveとしては、autonovel系の長編生成パイプラインと並ぶ「コンテンツ自動生成事例の標準ピース」として注視している
Hermes Agent を本気で活用するなら
「Hermes Agent を自分で使いこなしたい」「自社の業務に組み込みたい」
— そんな方は、まず初回無料相談でお話ししてみませんか。