DeepSeek V4 機能ガイド:できること・できないこと完全解説(2026年)

DeepSeek V4 のできること・できないこと、そしてギャップを埋める方法を徹底解説。100万トークンコンテキスト、エージェントコーディング、セルフホスティング、マルチモーダル制限、AnyCap による機能拡張を網羅。

by AnyCap

DeepSeek V4 は1兆6000億パラメータの Mixture-of-Experts 言語モデルであり、エージェントコーディングベンチマークで GPT-5.5 に匹敵する性能を、わずか1/18のコストで実現します。 コンテキストウィンドウは100万トークンで、あらゆるフロンティアモデルの中で最長です。Apache 2.0ライセンスで提供されており、制限なしにセルフホスティング、ファインチューニング、デプロイが可能です。ただし、テキストのみのモデルです。ネイティブの画像生成、動画、音声、ウェブ検索、ストレージ、パブリッシング機能はありません。

このガイドでは、DeepSeek V4 ができること、できないこと、そしてエージェントが実際に完全なタスクを完遂できるようギャップを埋める方法を網羅的に解説します。アーキテクチャ、ベンチマーク、API に関する詳細な技術解説は、DeepSeek V4 開発者ガイドをご覧ください。

DeepSeek V4 にできること

1/18のコストでフロンティアレベルの推論

DeepSeek V4 Pro は SWE-bench Verified で81%、MMLU-Pro で85.2%、MATH-500 で96.8%を達成しており、GPT-5.5 および Claude Opus 4.7 に匹敵します。違いはコストです。DeepSeek V4 Pro の料金は入力100万トークンあたり$0.28、出力100万トークンあたり$1.12。GPT-5.5 は入力$5/1M、出力$30/1Mです。

典型的なエージェントコーディングセッション(入力1万トークン、出力2千トークン)では、DeepSeek V4 Pro は約$0.005。GPT-5.5 は約$0.11です。毎日使用した場合、1ヶ月で数百ドルの差が生じます。ベンチマーク、価格、機能の直接比較は DeepSeek V4 vs GPT-5.5 をご覧ください。

100万トークンのコンテキストウィンドウ

DeepSeek V4 は1回のパスで100万トークンを処理できます。これは約75万語、小説3冊分に相当します。開発者にとっては、チャンキング、要約、検索なしにコードベース全体をモデルに入力できることを意味します。DeepSeek V4 を経由してルーティングされた Claude Code は、1回のセッションで大規模なモノレポをインデックス化して理解できます。

これは DeepSeek の Multi-head Latent Attention(MLA)アーキテクチャによって実現されています。長いコンテキスト推論中のメモリ使用量を削減するため、キーバリューキャッシュを圧縮します。結果は実用的です。API 予算を圧迫しないコストで100万トークンのコンテキストを活用できます。

エージェントコーディング — オープンソース SOTA

DeepSeek V4 Pro はエージェントコーディングベンチマークでオープンソースモデル中、最先端の結果を達成しています。ツール呼び出し、マルチステップ計画、エラー回復、コード実行といったエージェントタスク向けに特別に追加学習されています。CNBC はリリース当日、V4 が Claude Code および OpenClaw との使用に向けて最適化されていると報道しました。

実際に、DeepSeek V4 ベースのエージェントは以下が可能です:

  • リポジトリ全体を読み込み、コードベースの内部マップを構築する
  • 数十ファイルにまたがるマルチステップの変更を計画する
  • 変更を実行し、テストを走らせ、失敗時に反復する
  • ファンクションコーリングまたは MCP を通じて外部ツールを呼び出す

セットアップの完全ガイドは DeepSeek V4 × Claude Code:エージェント統合ガイド をご覧ください。

セルフホスティングとデータ主権

DeepSeek V4 は Apache 2.0 ライセンスでリリースされています。ウェイトをダウンロードし、自社ハードウェアでモデルを動かし、エアギャップ環境にデプロイできます。4ビットに量子化された V4 Flash は、コンシューマー向けの単一 GPU で動作します。V4 Pro はより多くの VRAM を必要としますが、ワークステーション級ハードウェアで運用可能です。

コンプライアンス要件、データ主権上の制約、またはインフラ所有を優先するチームにとって、これは GPT-5.5 や Claude のような API 専用モデルに対する決定的な優位点となります。

マルチモデルルーティング

DeepSeek V4 は OpenRouter などのルーティングレイヤーを通じて、他のモデルと組み合わせて使用できます。一般的なパターン:単純なタスクには DeepSeek V4 Flash($0.14/1Mトークン)、複雑な推論には DeepSeek V4 Pro、ネイティブな画像理解が必要なタスクにはマルチモーダルモデルを使用します。マルチモデルルーティングは標準的な手法となりつつあり、DeepSeek V4 の価格はコスト重視のルーティング層でのデフォルト選択肢となっています。

DeepSeek V4 にできないこと

ネイティブのマルチモーダルサポートなし

これが最大の制限です。DeepSeek V4 はテキスト専用です。公式ドキュメントには「プレビューではネイティブの画像・音声・動画の入出力はない」と明記されています。

具体的に、DeepSeek V4 ベースのエージェントは標準状態では以下ができません:

  • 画像の生成や写真の編集
  • 動画の作成や動画コンテンツの分析
  • 音声処理 — 文字起こし、音声合成、音楽生成
  • 画像の理解 — 写真の説明、スクリーンショットからのテキスト抽出、図に関する質問への回答
  • 最新情報のためのライブウェブ検索
  • クラウドストレージへのファイル保存や共有リンクの生成
  • ウェブへのコンテンツ公開

音声・オーディオ処理なし

GPT-5.5 と Gemini 3.1 は音声モードとオーディオ理解をサポートしています。DeepSeek V4 はサポートしていません。会議の文字起こし、音声エージェントの構築、音声ファイルの処理を含むワークフローには、DeepSeek V4 単体では適していません。

知識のカットオフ

すべての大規模言語モデルと同様に、DeepSeek V4 にはトレーニングデータのカットオフがあります。トレーニング日以降の出来事を知りません。100万トークンのコンテキストウィンドウが助けになります。最新のドキュメントや検索結果を入力できますが、モデル自体にリアルタイムの認識機能はありません。

API エコシステムの成熟度

DeepSeek の API エコシステムは、OpenAI や Anthropic より新しく、規模も小さいです。Assistants API、構造化出力、ファインチューニング API、マネージドデプロイオプションの成熟度は低めです。マネージド AI インフラに強く依存するチームには考慮事項となりますが、Apache 2.0 ライセンスにより、モデルの上に必要なインフラを自由に構築できます。

機能ギャップを埋める方法

上記のすべての制限には解決策があります。アーキテクチャはシンプルです。DeepSeek V4 が推論とコード生成を担い、他のツールが残りを担います。

画像生成、動画、検索、ストレージ、パブリッシング

これらの機能は MCP(Model Context Protocol)— AI エージェントを外部ツールに接続するオープン標準 — を通じて追加できます。Claude Code、Cursor、OpenClaw はいずれも MCP をネイティブにサポートしています。 最速の方法:1つのコマンドで AnyCap をインストールする。1つのランタイムが MCP 対応エージェントに5つの機能をすべて追加します:

npx -y skills add anycap-ai/anycap -a claude-code

インストール後、DeepSeek V4 ベースのエージェントで以下が可能になります:

機能 コマンド
画像を生成する anycap image generate "説明"
動画を作成する anycap video generate "説明"
ウェブを検索する anycap search "クエリ"
ファイルを保存する anycap drive upload ./パス
コンテンツを公開する anycap page publish ./ファイル.md

完全ガイド:DeepSeek V4 エージェントにマルチモーダル機能を追加する方法

Claude Code および OpenClaw との統合

DeepSeek V4 はエージェントツール向けに最適化されています。CNBC がリリース時に確認しました。Claude Code を DeepSeek V4 経由でルーティングするには:

export OPENROUTER_API_KEY=sk-or-your-key
claude --model openrouter/deepseek/deepseek-v4-pro

エージェントは推論とコード生成に DeepSeek V4 を、エージェント実行(ファイル読み込み、コマンド実行、git 管理)に Claude Code を、マルチモーダル機能に AnyCap を使用します。

完全ガイド:DeepSeek V4 × Claude Code:エージェント統合ガイド

ウェブ検索とリアルタイム情報

DeepSeek V4 の100万トークンコンテキストウィンドウは、検索補強ワークフローに特に適しています。AnyCap のウェブ検索から検索結果を入力すると、モデルはチャンキングや RAG パイプラインなしに、1回のパスで全出力を処理・統合できます。

モデル比較:DeepSeek V4 vs GPT-5.5

DeepSeek V4 と GPT-5.5 を具体的に比較したい場合 — ベンチマーク、価格、マルチモーダルのギャップ、デプロイの柔軟性 — 完全な比較をご覧ください。

完全比較:DeepSeek V4 vs GPT-5.5:機能比較

ユースケース別おすすめスタック

コスト重視のエージェント開発

DeepSeek V4 Flash ($0.14/1Mトークン)
  + Claude Code(エージェント実行)
  + AnyCap(マルチモーダル機能)
= 毎日の使用で月額~$5-10のフルエージェントスタック

最高パフォーマンス・最良コスト

DeepSeek V4 Pro ($0.28/1Mトークン) — 複雑な推論
DeepSeek V4 Flash ($0.14/1Mトークン) — 単純なタスク
  + Claude Code または OpenClaw(エージェント実行)
  + AnyCap(マルチモーダル機能)
  + マルチモデルルーター(OpenRouter)
= 月額~$15-30でフロンティアレベルのエージェントコーディング

セルフホスト・エアギャップ

DeepSeek V4 Pro(ワークステーション GPU にセルフホスト)
  + Claude Code(エージェント実行)
  + AnyCap(マルチモーダル機能)
  + ローカルネットワークのみ
= データがインフラ外に出ない

エンタープライズ OpenAI エコシステム

GPT-5.5 — ネイティブマルチモーダルタスク
DeepSeek V4 Flash — コスト効率の高いコード生成
  + マルチモデルルーター
  + AnyCap(両モデルにまたがる統合機能レイヤー)
= 両エコシステムのベストを組み合わせ

よくある質問

DeepSeek V4 は本当に無料ですか?

モデルの重みは Apache 2.0 ライセンスで無料のオープンソースです。自分で動かすには計算コスト — 電気代とハードウェア — がかかります。DeepSeek API の使用は V4 Pro で入力100万トークンあたり$0.28、V4 Flash で$0.14です。OpenRouter や他のプロバイダー経由での使用は、価格が異なる場合があります。

DeepSeek V4 で画像を生成できますか?

ネイティブではできません。テキスト専用モデルです。MCP サーバーや AnyCap のような機能ランタイムを通じて画像生成機能を追加できます。モデルは推論とコードを担い、機能レイヤーがマルチモーダル出力を担います。DeepSeek V4 にマルチモーダル機能を追加するガイドをご覧ください。

V4 Pro と V4 Flash の違いは何ですか?

V4 Pro はフルモデルです。総パラメータ数1.6兆、トークンあたり490億のアクティブパラメータ、最高の推論性能。V4 Flash はより小さく高速なバリアントです。低レイテンシ、低コスト($0.14 vs $0.28/1Mトークン)、若干低いベンチマークスコア。素早いイテレーションや単純なタスクには Flash を、複雑なマルチファイルリファクタリングやアーキテクチャ推論には Pro を使用してください。

DeepSeek V4 は Cursor で動作しますか?

はい。Cursor の設定で DeepSeek V4 をモデルプロバイダーとして追加してください。AnyCap は MCP スキルとして同様にインストールされます。同じスタックが Claude Code、Cursor、OpenClaw すべてで動作します。特定のエージェントシェルに縛られることはありません。

DeepSeek V4 と Claude Opus 4.7 はどう違いますか?

ベンチマークでは互角です。主な違い:Claude Opus 4.7 はより高価(サブスクリプションまたは API 価格)で、Claude Code との統合がより緊密(ルーティングではなくネイティブ)であり、Anthropic の extended thinking 機能の恩恵を受けます。DeepSeek V4 はコストが1/35、オープンソースで、セルフホスティングが可能です。統合のスムーズさとコスト・デプロイの柔軟性のどちらを重視するかによって選択が変わります。


関連記事


DeepSeek V4 を始める:

# Claude Code を DeepSeek V4 経由でルーティング
export OPENROUTER_API_KEY=sk-or-your-key
claude --model openrouter/deepseek/deepseek-v4-pro

# マルチモーダル機能を追加
npx -y skills add anycap-ai/anycap -a claude-code

DeepSeek V4 開発者ガイド · V4 にマルチモーダルを追加 · V4 + Claude Code · V4 vs GPT-5.5