Claude Codeで動画を生成する方法:2026年版 完全ガイド

Claude Code単体では動画を生成できません。DIY API、MCPサーバー、または1つのCLIで動画生成を組み込む方法を解説します。Veo 3.1、Kling 3.0、Seedance 1.5 Pro、Sora 2 Proをエージェントワークフロー向けに比較します。

by AnyCap

Claude Codeにランディングページを作ってと頼みます。HTMLを書き、スタイルを当て、インタラクションも追加します。次にこう言います。「では、ヒーローセクション用の製品デモ動画を作って。」

そこで止まります。Claude Codeは単体では動画を生成できません。

これはClaudeだけの制限ではありません。Cursor、Codex、Windsurf、そしてすべてのコーディングエージェントに共通します。動画生成は別のAPIの向こう側にあり、認証方法も、レート制限も、出力形式もそれぞれ異なります。手作業でつなぐということは、エージェントが1フレームも作る前に4つのサービスを設定するということです。

それを解決する方法を紹介します。最も手作業が多い方法から、1コマンドで済む方法まで3通りです。

CursorやCodexも使っていますか? このガイドはClaude Codeに焦点を当てていますが、方法とCLIコマンドはすべてのエージェントで同じように動作します。エージェント別の導入手順はCursorの動画生成ガイドまたはCodexの動画生成ガイドを参照してください。


なぜClaude Codeは動画を生成できないのか、そしてそれが普通である理由

コーディングエージェントはコードを推論します。もともとメディア生成は組み込まれていませんが、それには理由があります。画像・動画モデルは巨大で、ホスティングコストも高く、LLMとは別のリリースサイクルで動きます。Anthropic、OpenAI、Cursorはいずれも同じ判断をしました。最強の推論エージェントを作り、メディアはエコシステムに任せる、という考え方です。

PRを書くときは問題ありません。しかし、エージェントが視覚的なものを作るときには困ります。デモクリップが必要な製品ページ、アニメーション付きの説明が必要な変更履歴、動きのあるピッチデッキなどです。

機能自体はあります。エージェントにつなぐ橋が必要なだけです。


Claude Codeと動画生成で何ができるようになるのか

方法に入る前に、この組み合わせで何が可能になるかを見ておきましょう。

  • 製品デモ。 エージェントが台本を書き、映像を生成し、クリップをレンダリングします。すべて1セッションで完了します。製品を説明するだけで、動画が出てきます。
  • ストーリーボードからモーションへ。 スクリーンショット、デザインフレーム、参照用の静止画を持っていれば、エージェントがそれをアニメーション化してレビュー用のドラフト動画にします。
  • ソーシャルコンテンツの量産。 1つのプロンプト → 1本の短尺動画。バリエーションを繰り返し生成できます。バッチ処理はあなたではなくエージェントが行います。
  • 高速プロトタイピング。 本格制作に入る前に、動きのあるビジュアルコンセプトを素早く試せます。10秒の動画は、10段落の説明より多くを伝えます。

方法1:動画APIを手動でつなぐ、いちばん大変なやり方

最も直接的なのは、動画モデルの提供元を選び、登録し、APIキーを取得して、Claude Codeから呼べるようにする方法です。実際には次のようになります。

ステップ1:提供元を選ぶ。 GoogleのVeo 3.1は洗練された出力向け。OpenAIのSora 2 Proは物語性のある作業向け。Kling 3.0はシネマティックな動き向けです。どれも個別のアカウントが必要です。

ステップ2:APIキーを取得する。 提供元の開発者コンソールに進みます。プロジェクトを作成し、認証情報を生成し、キーをコピーします。

ステップ3:Claude Codeを設定する。 Claude Codeに動画エンドポイントの呼び出し方を教えるMCPサーバー設定やskillファイルを書きます。エンドポイントURL、認証方法、リクエスト形式、期待されるレスポンス形状を指定します。

ステップ4:出力を処理する。 動画生成は非同期です。エージェントはリクエストを送信し、完了までポーリングし、終わったらファイルをダウンロードします。各ステップが失敗点になりえます。

ステップ5:画像から動画にも繰り返す。 ワークフローが静止画から始まるなら、別のエンドポイントと別の設定が必要です。あるいは、別の提供元を使うことになります。

これは動きます。実際にこの方法で動画を出荷しているチームもあります。ただし、提供元ごと、機能ごとに5ステップ必要です。提供元が2つなら統合は10個、3つなら15個。保守負荷は野心に比例して増えていきます。


方法2:動画用MCPサーバーを使う、中間のやり方

MCPサーバーは、特定の機能を再利用可能な統合としてまとめます。動画用途の選択肢は次のとおりです。

  • HeyGen MCP — 顔出し動画やアバター主導のコンテンツ向け
  • HyperFrames MCP — アニメーションビジュアルやモーショングラフィックス向け
  • Firecrawl Video — プログラムによる画面録画やページキャプチャ向け

MCPサーバーは認証とエンドポイント管理を内部で処理します。1回設定すれば、Claude Codeは他のツールと同じように呼び出せます。APIを直結するより設定は軽いですが、それでも機能ごとに1つのMCPサーバーを管理する必要がありますし、動画専用サーバーだけでは、動画作業の前段でよく必要になる画像生成ステップはカバーできません。


方法3:1つのCLIですべての動画モデルを使う、AnyCap方式

この方法では、エージェントはVeo、Kling、Seedanceを個別には知りません。知っているのは1つのコマンドだけです。

anycap video generate --prompt "a drone shot flying over a mountain range at sunset" --model veo-3.1 -o hero.mp4

以上です。インストールは1回、認証フローも1回、コマンド面も1つだけ。内部では、AnyCapがリクエストを適切な動画モデルへルーティングします。Veo 3.1、Seedance 2.0、Kling 3.0、Sora 2 Pro、あるいはプロンプトに最適なモデルです。

ランタイムがエージェントの代わりに処理するもの:

  • モデル選択。 エージェントは明示的にモデルを指定してもよいですし、ランタイムにプロンプトから選ばせてもよいです。「シネマティックな製品動画」は「素早いSNS用クリップ」とは別ルートになります。
  • 認証。 APIキーは1つで済みます。提供元ごとに持つ必要はありません。ランタイムが認証情報を内部管理します。
  • 出力形式。 エージェントが受け取るのはファイルパスまたはURLです。multipartレスポンスの解析や、非同期ジョブのポーリングは不要です。
  • 画像から動画が標準搭載。 --mode image-to-video --param images=./frame.jpgを追加すれば、同じコマンドで静止画を入力できます。別エンドポイントも別設定も不要です。
  • エージェント横断。 同じCLIコマンドがClaude Code、Cursor、Codexで動きます。動画パイプラインを再設定せずにエージェントを切り替えられます。エージェント別の導入手順はCursorガイドCodexガイドを参照してください。

Claude Codeへのインストール方法:

npm i -g anycap
anycap login
anycap skill install --target ~/.claude/skills/anycap-cli/

その後、Claude Codeセッションはanycap video generateを利用可能なツールとして認識します。MCPサーバー設定は不要。提供元ごとのAPIキーも不要。ただ1つのコマンドだけです。

AnyCapを無料で導入 — 新規ユーザーに250クレジット


テキストから動画へ:プロンプトからクリップを生成する

最もシンプルなワークフローです。エージェントには説明があり、あなたは動画が欲しい。

anycap video generate \
  --prompt "a product unboxing sequence on a clean white table, soft studio lighting, 1080p" \
  --model veo-3.1 \
  -o unboxing.mp4

実例: 新機能をリリースするとします。エージェントが変更履歴を書き、告知ページを作り、さらにヒーローセクション用の10秒ティーザー動画を生成します。1セッションで完結し、ツールの切り替えは不要です。

どのプロンプトにどのモデルを使うか:

プロンプトの種類 最適モデル 理由
洗練された製品デモ、ストーリー重視 Veo 3.1 テキストからの初回品質が最も高い
シネマティックな動き、劇的なシーン Kling 3.0 モーション表現とカメラワークが優秀
再現性が高く、制作向き Seedance 1.5 Pro 出力が安定し、予測外が少ない
高品質な物語性、リアルなシーン Sora 2 Pro OpenAIの最も高性能な動画モデル
すばやいプレビュー、バッチ反復 Veo 3.1 Fast / Seedance 2.0 Fast アイデア出し向けに高速

画像から動画へ:静止画を動きに変える

ここでエージェントワークフローは本当に役立ちます。エージェントが製品スクリーンショット、デザインモック、参照フレームの画像を生成し、それをアニメーション化します。

# ステップ1: 静止画を生成する
anycap image generate \
  --prompt "a clean product hero shot of a dashboard on a desk setup" \
  --model seedream-5 \
  -o hero-frame.jpg

# ステップ2: 動画にアニメーション化する
anycap video generate \
  --prompt "subtle camera push-in with soft parallax on the screen reflection" \
  --model seedance-1.5-pro \
  --mode image-to-video \
  --param images=./hero-frame.jpg \
  -o hero-animated.mp4

実例: エージェントがSaaSのランディングページを構築します。Seedream 5でヒーロー画像を生成し、次にSeedance 1.5 Proで画像から動画を実行して、さりげないカメラの寄りを加えます。ヒーローセクションは静的なものから生きたものへ変わります。After Effectsを開く必要も、ターミナルを離れる必要もありません。

画像から動画のモデル組み合わせガイド:

元画像モデル 最適動画モデル 結果
Seedream 5(洗練) Veo 3.1 高品質な静止画からプレミアムなモーション
Nano Banana Pro(修正ループ) Seedance 1.5 Pro 安定した制作向け出力
FLUX.1 Kontext Max(デザイン重視) Kling 3.0 豊かなビジュアルをシネマティックに処理
Nano Banana 2(高速反復) Seedance 2.0 Fast 大量の素早いモーション下書き

完全なパイプライン:テキスト → 画像 → 動画を1セッションで

Claude Codeの1回のセッションで、エージェントが実行できる完全なワークフローはこちらです。

# 1. リサーチ: 参考スタイルを検索する
anycap search --prompt "SaaS product demo video styles 2026" --citations

# 2. キーフレームを生成する
anycap image generate \
  --prompt "a modern SaaS dashboard on a laptop, floating UI elements, clean lighting" \
  --model seedream-5 \
  -o keyframe.jpg

# 3. A/Bテスト用のバリエーションを生成する
anycap image generate \
  --prompt "same dashboard, dark mode variant with neon accents" \
  --model nano-banana-2 \
  -o keyframe-dark.jpg

# 4. 選んだバリエーションをアニメーション化する
anycap video generate \
  --prompt "slow zoom-in with UI elements fading in sequentially" \
  --model veo-3.1 \
  --mode image-to-video \
  --param images=./keyframe.jpg \
  -o demo-video.mp4

# 5. 結果を保存する
anycap drive upload demo-video.mp4

エージェントはスタイルを調査し、静止画を作り、バリエーションを試し、勝ち案をアニメーション化し、結果を保存しました。最初のプロンプトを書いたのはあなたです。それ以外はすべてエージェントループの中で起きました。


エージェント横断:同じCLI、別のエージェント

このガイドの動画生成コマンドは、Claude Code、Cursor、Codexで同じように動きます。違うのはskillファイルのインストール先だけです。

エージェント skillインストール先 完全ガイド
Claude Code ~/.claude/skills/anycap-cli/ いま読んでいるものです
Cursor ~/.cursor/skills/anycap-cli/ Cursorの動画生成ガイド →
Codex ~/.codex/skills/anycap-cli/ Codexの動画生成ガイド →

どの動画モデルを使うべきか?判断フレームワーク

答えは、何を作るかによって変わります。こう考えるとよいでしょう。

Veo 3.1を使う場合:

  • テキストプロンプトから最も高い初回品質が欲しい
  • 出力が顧客向けである、例えばデモ、ティーザー、告知
  • 高い忠実度のために生成ごとのコストを上げてもよい

Seedance 1.5 Proを使う場合:

  • 既存の静止画から画像から動画を行う
  • 制作向けに一貫性があり、再現可能な出力が必要
  • プロンプトごとのモデル選択が不要な安定した既定値が欲しい

Kling 3.0を使う場合:

  • 生の忠実度よりシネマティックな動きが重要
  • パン、ズーム、トラッキングなどのカメラワークを制御したい
  • テンプレート型ではなく、創造的または探索的なプロジェクトである

Sora 2 Proを使う場合:

  • チームがOpenAIの動画モデルファミリーを好む
  • 高品質な物語表現やリアルなシーン生成が必要
  • 1つの動画モデルから最大限の能力を引き出したい

Veo 3.1 FastやSeedance 2.0 FastなどのFast版を使う場合:

  • 最終出力ではなく、プレビューやアイデア出しをしている
  • バッチ生成で素早いターンアラウンドが必要
  • 速度が仕上がりより重要

FAQ

Claude Codeはネイティブに動画を生成できますか?

いいえ。Cursor、Codex、Windsurfも同じです。これらは推論とコーディングのエージェントです。動画生成には外部モデルが必要です。AnyCapはそれらのモデルを1つのCLIの裏にまとめるので、エージェントに個別統合は不要です。

テキストから動画と画像から動画の違いは何ですか?

テキストから動画は、テキストプロンプトだけからクリップを生成します。画像から動画は、スクリーンショット、デザインフレーム、写真などの静止画から始めて、それをアニメーション化します。多くの制作ワークフローでは両方を使います。まず静止画を作り、次に動かします。

動画生成にはどれくらい時間がかかりますか?

モデルと複雑さによります。Fast版は数秒から1分程度で返ってきます。Veo 3.1やSora 2 Proのような高品質モデルは1〜3分かかることがあります。ランタイムがポーリングを処理し、準備できたらファイルを返します。

動画モデルごとに別々のAPIキーが必要ですか?

AnyCapでは必要ありません。アカウント1つ、キー1つ、すべてのモデルに対応します。ランタイムが提供元の認証情報を内部で管理します。

動画のバリエーションをまとめて生成できますか?

はい。エージェントは異なるプロンプト、異なるモデル、異なる元画像でanycap video generateをループ実行できます。ランタイムは各リクエストを個別に処理します。

CursorやCodexも使っている場合でも動きますか?

はい。同じanycap video generateコマンドが3つのエージェントすべてで動作します。各エージェントの導入手順は上の表を参照してください。


まとめ

Claude Codeはスクリプトを書き、ページを作り、レイアウトを整えられます。ただ、動画は作れません。それは欠点ではなく、設計上の選択です。動画生成は別レイヤーに属します。

問題は、エージェントとそのレイヤーの間にどれだけ摩擦を置くかです。5つのAPIキーと5つの設定なのか、それとも1つのCLIコマンドなのか。


Claude Codeに動画生成を追加する — 1回の導入、1回の認証、すべてのモデル


📖 次に読むもの


関連記事


AnyCapチームによる執筆です。私たちは、AIエージェントに動画生成、画像生成、Web検索、クラウド保存、公開機能を1つのCLIで与える機能レイヤーを構築しています。だから、あなたのエージェントは「それはできません」で止まりません。