Claude Codeで動画の仕上げ|色調補正とBGM
「カットや字幕まではAIで進んだのに、色味がカットごとにバラついて素人っぽい」「BGMを足したら話し声が消えた」「書き出したら音が割れていた」——動画づくりは、最後の仕上げ工程でつまずく人がとても多いところです。
結論から言うと、Claude Code(クロードコード/AIに作業を頼める開発ツール)に「動画の仕上げ」を任せるコツは、Claude Code単体で動画を編集させようとしないことです。無料の動画処理ツール「ffmpeg(エフエムペグ)」を日本語の指示で呼び出す形にすれば、色調補正・BGMミックス・音量調整・書き出しまでを一気に任せられます。
株式会社Fyveは中小企業のAI活用を伴走する会社で、私自身も日々の発信動画の仕上げをかなりの部分AIに任せています。この記事では、エンジニアでない方に向けて「仕上げ工程をどこまでAIに渡せるのか」「逆にどこは人がやるべきか」を、実際のツールと出典を示しながら整理します。

なぜ動画の「仕上げ工程」でつまずくのか
カットや文字起こし、テロップ入れまでは、最近のAI編集でかなり自動化できるようになりました。それでも多くの人が手前で止まるのが、色・音・書き出しという最後の3つの壁です。
1つ目は色のバラつきです。撮影日や照明が違うと、カットごとに色味や明るさが揃わず、つなげると一気に素人っぽく見えます。2つ目は音のバランスです。BGMを足すと話し声が埋もれたり、逆にBGMがうるさすぎたりします。3つ目は書き出し(レンダリング)です。せっかく整えても、書き出すと音が割れたり、SNSにアップすると動画ごとに音量がバラバラだったりします。
これらは「センスがないから」ではなく、調整の理屈と道具を知らないだけのことが多いです。そして、その理屈と道具の操作こそ、Claude Codeに任せやすい領域なのです。
そもそもClaude Codeは動画を直接編集しない
最初に前提を整理します。意外に思われるかもしれませんが、Claude Code自体は動画のコマ(フレーム)を直接いじりません。色を塗ったり波形を切ったりするのは、あくまで外部の処理ツールの役割です。
では何をするのか。Claude Codeには「Skill(スキル)」という公式の仕組みがあります。これは「こういう手順でこの道具を使ってね」という指示書(手順書とスクリプト)をあらかじめ用意しておき、AIが場面に応じて自動で呼び出せるようにするものです(出典:Claude公式ドキュメント Agent Skills)。
つまりClaude Codeは「指揮者」で、実際に色や音を処理する「演奏者」が前出のffmpegです。私たちがやることは、楽器を直接弾くことではなく、日本語で「この曲をこう仕上げて」と指揮することだと考えると分かりやすいです。
色調補正をClaude Codeに任せる
色調補正(カラーグレーディング)は、明るさ・コントラスト・彩度などを整えて、映像全体のトーンを揃える工程です。ここを自動化する代表例が、ブラウザ操作AIで知られるチームが公開しているオープンソースのスキル「video-use」です(出典:browser-use/video-use)。
video-useは映像をカット(セグメント)ごとに解析し、「warm cinematic(温かみのある映画調)」「neutral punch(自然なまま少し締める)」といったルック(見た目の方向性)を当てていきます。重要なのは、明るさ・コントラスト・彩度をおおむね±8%以内に抑える設計になっている点です。これは「いかにも加工しました」という不自然さを出さず、あくまで整えるための配慮です。
もう少し凝った使い方では、フレームを何枚かサンプリングして候補を採点し、再利用できる色味の設定を組み立てる「vex」というスキルもあります(出典:AKMessi/vex)。auto(自動)・natural・vibrant・cinematic・warm・cool など、目的別のルックを選べるものも公開されています。
実際にはどう頼むのか
非エンジニアの方が身構える必要はありません。コードを書くのはAIの仕事です。あなたがやるのは、素材を入れて言葉で頼むことだけです。たとえば次のようなイメージです。
- 「このフォルダの動画を、カットごとに色味を揃えて、少し映画っぽい温かいトーンにして」
- 「やりすぎないで。加工したと分からない範囲で明るさと彩度だけ整えて」
- 「全体を統一したいので、3カット目の色味を基準に他のカットを合わせて」
Claude Codeはこの指示を受けて、裏側でffmpegの設定を組み立て、各カットに色補正を当てて書き出します。「映画っぽく」「やりすぎない」といった曖昧な言葉を、具体的な数値設定に翻訳してくれるのが、このやり方の最大の利点です。

BGMと音声の仕上げ
音の仕上げは、視聴体験を大きく左右します。ここでよく使われるのが、BGMミックスと音量の自動調整です。
video-useでは、生成したBGMや手持ちの音源を映像に重ね、話し声に合わせてBGMの音量を自動で下げるダッキング(ducking)という処理が定番として実装されています。人が話しているときはBGMが控えめになり、話していないときは盛り上がる、あの自然な聞こえ方を自動でつくるものです(出典:browser-use/video-use)。
さらに、カットのつなぎ目には30ミリ秒ほどの短いフェード(音をなめらかに出し入れする処理)を入れて、「プツッ」というノイズを防ぎます。X上でも、生成したBGMをffmpegで重ね、縦型への変換や字幕の焼き込みまで一気通貫でこなしている実務家の声が見られます(出典:映像制作者のX投稿)。日本語で「1.5倍速にして字幕を焼き込んで」と頼むだけで処理が進み、浮いた時間を演出や色づくりに回せた、という趣旨の報告です。
音量の「正規化」がSNS時代の肝
もうひとつ覚えておきたいのがラウドネス正規化です。これは動画全体の音量を一定の基準に揃える処理で、SNSにアップしたとき「この動画だけ音が小さい・大きい」という事故を防ぎます。
実装では「-14 LUFS(ラウドネスの単位)/ピークは-1dBより下/音量の幅は適度に」という基準が定番です。話し声は-14〜-16前後、BGMはそれより小さい-18前後に置き、ピークを-1.5あたりで止めて音割れを防ぐ、という設計がよく使われます。これらはすべて、Claude Codeに「SNS向けの標準的な音量に揃えて、音割れしないようにして」と頼めば適用してもらえます。
なお、より高品質な文字起こしを求める場合、video-useはWhisperではなくElevenLabsという有料の文字起こしAPI(単語ごとの時間情報や話者の識別ができる)を使っています。コストを抑えたいなら、無料で動くWhisperで字幕を作る一般的な手法もあり、用途と予算で選べます。
書き出し(レンダリング)で気をつけること
最後の書き出しは「ボタンを押すだけ」に見えて、実は落とし穴があります。事前に押さえておくと、後で作業をやり直さずに済みます。
- 道具の準備:ffmpegには種類があり、字幕を映像に焼き込むには「libass」という機能付きのものが必要です。導入時にClaude Codeへ「字幕の焼き込みに対応した構成で揃えて」と伝えておくと確実です。
- 音量と音割れ:書き出し時にラウドネス正規化を効かせると、SNS各所で音量が安定します。一方で意図と違う調整になることもあるので、最初の1本は確認してから本数を回します。
- 大きいファイルはローカルで:長尺・高画質の素材は、クラウド経由よりも手元のパソコンで処理するほうが速く、安全だという声が実務家から出ています。
これらの段取りは、毎回口頭で指示しなくても、プロジェクトに「CLAUDE.md」という設定ファイル(AIへの常設メモ)を置いておけば、好みのトーンや音量基準を覚えさせておけます。2本目以降は「いつもの仕上げで」と言うだけで揃うようになります。

「AIが8割・人が2割」——差がつくのは仕上げの最後
ここまで自動化の話をしてきましたが、現場の総意は「AIが8割(カット・字幕・BGM・色の下地)をやり、人が残りの2割(色と演出)で差をつける」というものです。仕上げ工程は、まさにこの境目にあります。
実際、自動の色補正やエフェクトは、明滅(点滅しがち)やカットの境目での音割れといった粗が出やすいと報告されています。テロップとBGMの同期がずれることもあり、人による最終チェックは欠かせません。「一発で完璧」を期待せず、節目で確認しながら進めるのが現実的です(出典:browser-use/video-use)。
もうひとつ大事な区別として、これらの仕上げスキルはClaude Codeの公式標準機能ではなく、有志が公開したコミュニティ製の道具が中心だという点があります。公式は「スキルという仕組み」を提供しているだけで、動画仕上げの具体的な中身はオープンソースや解説記事が支えている、という現状です。導入の際は、出典や更新状況を確認したうえで使うと安心です。
非エンジニアが今日から始める進め方
難しく考えず、小さく試すのがおすすめです。私が人に勧めるときの順番はこうです。
- 1. 環境を整える:Claude Codeとffmpegを入れ、「字幕焼き込み対応で」とAIに頼んで準備を任せる。
- 2. 1カットで色だけ試す:短い動画で「やりすぎない色補正」を頼み、ビフォー・アフターを見比べる。
- 3. BGMと音量を足す:ダッキングとラウドネス正規化を頼み、声が埋もれないか耳で確認する。
- 4. 書き出して実機で見る:実際にSNSへ非公開アップして、音量と色を最終チェックする。
- 5. 好みをCLAUDE.mdに記録:気に入った設定を覚えさせ、2本目から時短する。
この流れなら、専門用語を覚えなくても「頼んで・見て・直す」を繰り返すだけで、仕上げの質が上がっていきます。仕上げ全体ではなく、ショート動画づくりの工程全体を知りたい方は、次の記事も参考にしてください。
色や音を担うツールそのものの設計思想を比べたい方は、こちらの比較記事が役立ちます。
まとめ
動画の仕上げでつまずくのは、色・音・書き出しという最後の3つの壁です。これらは理屈と道具の問題であり、Claude Codeにffmpegを日本語で指揮させることで、その大半を任せられます。
- Claude Codeは指揮者、実処理はffmpeg。スキルが両者をつなぐ
- 色調補正は「やりすぎない」設計のスキルで、カット間のトーンを自動で統一できる
- BGMはダッキング+フェード、音量はラウドネス正規化でSNS事故を防ぐ
- 書き出しは道具の準備(字幕焼き込み対応)と最終チェックが肝
- AIが8割・人が2割。最後の色と演出、粗の確認は人がやる
「全部を完璧に自動化する」のではなく、「面倒な調整をAIに渡して、人は最後の見極めに集中する」。この役割分担こそ、株式会社Fyveが中小企業の皆さまにお伝えしている、無理なく続くAI活用のかたちです。
御社の業務に合わせたClaude Code導入支援
「AIツールを導入したが、現場で使われない」を終わらせる。
業務課題のヒアリングから設計、ハンズオン実践、運用定着まで一貫して支援します。