CC for Biz
2026/06/29Claude Code
AI活用非エンジニア向け

Claude Codeで会議・セミナー動画を文字起こし要約

Claude Codeで会議・セミナー動画を文字起こし要約

「1時間の会議を録画したのに、議事録を起こすだけで午後がつぶれる」「セミナーの録画が何本もたまっているが、見返す時間がない」——会議やセミナーの動画を前にして、誰もがこの徒労感を抱えます。

結論から言うと、Claude Codeに動画ファイルを渡して「文字起こしして、決定事項とToDoだけ要約して」と頼めば、この作業は数分で片づきます。動画から音声を抜き、文字に起こし、要点を整理する——この一連の流れを、ほぼ会話だけで回せるようになりました。

株式会社Fyveは、中小企業のAI活用を月額で伴走する会社です。私自身、クライアントとの打ち合わせ録画やセミナー動画をこの方法で日常的にさばいています。本記事では、エンジニアでない経営者・個人事業主の方が同じ仕組みを使えるよう、実際の頼み方とつまずきどころを具体的にお伝えします。

Claude Codeはツールを束ねる「司令塔」

そもそもClaude Codeは動画を文字起こしできるのか

まず誤解を解いておきます。Claude Code自体に、動画や音声を直接文字起こしする機能はありません。これは公式ドキュメントを読んでも明確で、Claude Codeはあくまで「指示を受けて手元のツールを動かす司令塔」です。

では何が起きているのか。Claude Codeは、パソコンの中にある専用ツールを自動で呼び出して処理しています。具体的には、動画から音声を取り出す「ffmpeg(エフエムペグ・動画や音声を変換する定番の無料ツール)」と、音声を文字に変換する「Whisper(ウィスパー・OpenAIが公開した文字起こしAI)」の2つです。

この「ツールを束ねて作業を代行する」仕組みは、Claude Codeの公式機能であるAgent Skills(手順書とスクリプトをまとめておき、必要なときにClaudeが読み込んで実行する標準の枠組み)として整理されています。つまり、私たちは個別のツールの使い方を覚えるのではなく、Claudeに日本語で頼むだけでよいのです。詳しくはAnthropic公式のAgent Skills解説で確認できます。

基本の流れは「動画→音声→文字→要約」の4ステップ

会議・セミナー動画を要約するまでの流れは、どの解説でもほぼ同じ4ステップに落ち着きます。中身を知っておくと、うまくいかないときに原因を切り分けやすくなります。

ステップ1:動画から音声を抜き出す

mp4やmovといった動画ファイルは、そのままでは文字起こしに使えません。先に音声だけを取り出す必要があります。ここを担うのがffmpegです。

とはいえ、コマンドを覚える必要はありません。Claude Codeに「このフォルダのmp4から音声を抜き出して」と頼めば、適切な変換を自動で実行してくれます。

ステップ2:Whisperで文字起こしする

取り出した音声を、Whisperが文字に変換します。日本語の会議であれば「日本語で文字起こしして」と添えるだけで精度が安定します。出力は通常のテキストのほか、時間情報つきの字幕ファイルとしても保存できます。

Whisperには種類があり、ローカル(自分のパソコン内)で完結するものを選べばインターネットに音声を送らずに処理できます。機密性の高い会議でも安心して使える、という点が実務では大きな利点です。実際の手順はnote上の解説記事ffmpegとWhisperを組み合わせた英語チュートリアルでも紹介されており、複数の解説で流れが一致しています。

ステップ3:Claudeが要点を整理する

文字起こしされたテキストは、そのままでは読みにくい話し言葉の羅列です。ここでようやくClaude本来の出番になります。「決定事項とToDoだけ箇条書きにして」と頼めば、長い議事録が一気に読める要約に変わります。

私の場合、45分の打ち合わせ録画でも、文字起こしから要約まで含めて5分前後で手元に整った議事録が残ります。これまで手作業で40分以上かけていた工程が、待ち時間だけになりました。

ステップ4:出力の「型」を先に渡すのがコツ

ここが品質を左右する最大のポイントです。要約のフォーマット(型)を先に指定すると、毎回ブレない議事録が出ます。

私が使っている指定はシンプルで、次の3つだけです。

  • ①決定事項:その会議で決まったこと
  • ②次のアクション:担当者と期日をセットで
  • ③保留・持ち越し:結論が出なかった論点

この型を渡さずに「要約して」とだけ頼むと、毎回まとめ方が変わって使いづらくなります。逆に型さえ固定すれば、議事録の体裁が安定し、そのままチームに共有できる品質になります。

動画から議事録まで4ステップ

一度作ったら「1語」で呼び出せるようにする

毎回同じ指示を打ち込むのは面倒です。Claude Codeには、よく使う指示をコマンドとして登録しておく仕組みがあります。たとえば「会議動画を文字起こしして、決定事項・次アクション・保留の3点でまとめる」という一連の指示を /meeting のような短い名前で登録しておけば、次からはその一語を打つだけで全工程が走ります。

さらに、Claude Codeには CLAUDE.md という「覚え書きファイル」を置けます。ここに自社の議事録フォーマットや、よく出る固有名詞(社名・サービス名・人名)を書いておくと、文字起こしの誤変換が減り、要約の精度も上がります。

つまり、最初の一回だけ型と辞書を整えておけば、二回目以降は「動画を放り込んで一語で呼ぶ」だけの作業になります。使うほど自分の現場に最適化されていくのが、この仕組みの強みです。

実務でつまずく5つのポイントと対処

便利な一方で、実際に運用すると必ずいくつかの壁にぶつかります。私や他の実務家が経験したつまずきと、その対処をまとめます。

1. 固有名詞が誤変換される

社名や専門用語、小声の発言は、Whisperが聞き取り違えることがあります。対処は2段階です。まずClaudeに「固有名詞を正しい表記に直して」と辞書を渡して一括修正させ、最後に人の目で重要箇所だけ確認します。完全自動を狙わず、最終チェックは残すのが安全です。

2. 長時間の動画で精度が落ちる

2時間を超えるような長尺の録画は、一気に処理すると精度やメモリの面で不安定になりがちです。10〜30分ごとに区切って文字起こしし、後でClaudeにつなぎ合わせてもらうと安定します。これも「30分ずつに分けて処理して」と頼めば自動で分割してくれます。

3. 誰の発言か区別できない

標準のWhisperは「話者の区別」が得意ではありません。誰が何を言ったかを明確にしたい場合は、話者分離に対応したツールを併用します。とはいえ会議の議事録であれば、決定事項とToDoが拾えれば十分なケースも多く、必須ではありません。

4. 機密会議をクラウドに出したくない

顧客情報や経営判断を含む会議は、外部のクラウドサービスに音声を送ること自体がリスクです。前述のとおり、ローカルで完結するWhisperを使えば、音声もテキストも自分のパソコンの中だけで処理が終わります。情報管理の観点から、私は機密会議では必ずこの構成を使っています。

5. 毎回フォーマットがバラつく

これはステップ4で触れたとおり、型を固定すれば解決します。曖昧な指示が原因なので、コマンド登録とCLAUDE.mdへの蓄積で根本から防げます。

実務でつまずく壁と対処法

どれくらい時間が減るのか(実務家の声)

効果の感じ方は人それぞれですが、参考までにX上で見かける報告を挙げておきます。いずれも個人の体験談で数字は検証前のものですが、傾向としては一致しています。

  • 毎月8時間かかっていた議事録作成が、テンプレートを登録して数分に短縮できたという報告
  • 外注していた文字起こし費用を、自分のパソコン内での処理に切り替えてゼロにできたという声
  • 60分の動画の整理が、手作業の3時間から30分弱に減ったという例

数字そのものは鵜呑みにできませんが、「録画を見返す時間」「議事録を手で打つ時間」という、これまで当たり前に発生していたコストが大きく圧縮される、という方向性は私の実感とも合います。会議が多い経営者ほど、削減幅は大きくなります。

非エンジニアが最初の一歩を踏み出すには

ここまで読んで「自分にもできそう」と感じた一方で、「ffmpegやWhisperの準備が難しそう」と身構えた方もいるはずです。正直に言えば、最初の環境づくりだけは少しハードルがあります。

ただ、それも一度きりです。準備さえ済めば、あとは動画を渡して日本語で頼むだけ。プログラミングの知識は要りません。Claude Codeの導入そのものから始めたい方は、まず環境構築の手順から押さえるのが近道です。

Claude Codeのインストール方法【2026年最新】完全ガイド
Claude CodeClaude Codeのインストール方法【2026年最新】完全ガイド

また、本記事は会議・セミナー動画の「文字起こしと要約」に絞って解説しましたが、同じくClaude Codeから動画ツールを操る応用として、ショート動画の編集を自動化した記録もまとめています。あわせて読むと、Claude Codeが動画作業全般の司令塔になりうることがイメージしやすくなります。

Claude Codeでショート動画編集を自動化した実装記録
Claude CodeClaude Codeでショート動画編集を自動化した実装記録

まとめ

会議・セミナー動画の文字起こしと要約は、Claude Codeが最も費用対効果を出しやすい使い方のひとつです。要点を整理すると次のとおりです。

  • Claude Code単体に文字起こし機能はなく、ffmpegとWhisperを呼び出す司令塔として働く
  • 流れは「動画→音声抽出→文字起こし→要約」の4ステップで、すべて日本語で頼める
  • 「決定事項・次アクション・保留」のように出力の型を先に渡すと品質が安定する
  • コマンド登録とCLAUDE.mdへの蓄積で、二回目以降は一語で呼び出せる
  • 機密会議はローカル完結型のWhisperで、音声を外に出さずに処理できる

まずは手元にたまっている録画を1本、Claude Codeに渡して「文字起こしして、決定事項とToDoだけまとめて」と頼んでみてください。その一回で、議事録に費やしていた時間が何のためのものだったのか、きっと実感できるはずです。

← 記事一覧に戻る

御社の業務に合わせたClaude Code導入支援

「AIツールを導入したが、現場で使われない」を終わらせる。
業務課題のヒアリングから設計、ハンズオン実践、運用定着まで一貫して支援します。

無料AI活用診断を受ける料金とサービス一覧を見る →
© 2025 Fyve Inc. All rights reserved.