DeepSeek V4 + Claude Code: Guia de Integração de Agentes IA

Roteie o Claude Code pelo DeepSeek V4 e programe com agentes a 1/35 do custo. Configuração passo a passo com OpenRouter, extensão de capacidades com AnyCap e dicas de otimização de custos.

O DeepSeek V4 foi otimizado para o Claude Code. A CNBC reportou isso no dia do lançamento. A documentação oficial confirma que os benchmarks de programação agêntica do V4 são SOTA de código aberto. Mas há uma lacuna entre "este modelo funciona com agentes" e "aqui está exatamente como configurá-lo." Este guia fecha essa lacuna — passo a passo, com comandos reais, cobrindo roteamento de modelos, extensão de capacidades e otimização de custos.

Por que DeepSeek V4 + Claude Code é uma combinação poderosa

O DeepSeek V4 Pro iguala o GPT-5.5 e o Claude Opus 4.7 nos benchmarks de programação agêntica a uma fração do custo: $0,28/1M tokens de entrada vs $5/1M para o GPT-5.5. Suporta uma janela de contexto de 1 milhão de tokens — suficiente para ingerir bases de código completas em uma única passagem. É licenciado sob Apache 2.0, o que significa que você pode hospedá-lo sem restrições de uso. Para uma análise completa das capacidades e limitações do DeepSeek V4, consulte nosso guia de capacidades do DeepSeek V4.

O Claude Code é o agente de programação autônomo nativo de terminal da Anthropic. Ele lê seu repositório, planeja alterações em várias etapas, edita arquivos, executa testes e itera sobre falhas. Suporta MCP (Model Context Protocol) nativamente, o que significa que você pode estendê-lo com capacidades além do código. Se você é novo no Claude Code, comece com nosso guia de instalação e nossa comparação Claude Code vs Cursor.

A combinação é direta: o DeepSeek V4 cuida do raciocínio e da geração de código. O Claude Code cuida da execução do agente — leitura de arquivos, execução de comandos, gerenciamento do git. O AnyCap (ou servidores MCP) cuida das capacidades multimodais — geração de imagens, vídeo, pesquisa na web, armazenamento, publicação.

Pré-requisitos

Antes de começar, confirme que você tem:

Acesso à API do DeepSeek V4 — via plataforma DeepSeek (api.deepseek.com), OpenRouter ou hospedagem própria. Consulte nosso guia do desenvolvedor do DeepSeek V4 para opções de configuração.
Claude Code instalado — claude --version deve retornar um número de versão. Se não: curl -fsSL https://claude.ai/install.sh | bash
Node.js 18+ — para o Claude Code e ferramentas baseadas em npm
Uma chave de API ou chave OpenRouter — para rotear o Claude Code pelo DeepSeek V4

Passo 1: Rotear o Claude Code pelo DeepSeek V4

O Claude Code usa por padrão os modelos Claude da Anthropic. Para usar o DeepSeek V4 como motor de raciocínio, você precisa rotear por um provedor de modelos que suporte tanto o protocolo de agente do Claude Code quanto a API do DeepSeek V4.

Opção A: OpenRouter (recomendado para configuração rápida)

O OpenRouter fornece acesso unificado via API aos modelos da Anthropic e do DeepSeek. Cadastre-se em openrouter.ai, obtenha uma chave de API e configure o Claude Code:

export OPENROUTER_API_KEY=sk-or-your-key-here
claude --model openrouter/deepseek/deepseek-v4-pro

Para a variante Flash (mais rápida, mais barata a $0,14/1M tokens):

claude --model openrouter/deepseek/deepseek-v4-flash

Opção B: API DeepSeek direta + endpoint personalizado

Se você tem acesso direto à API do DeepSeek, configure um endpoint personalizado. Nas configurações do Claude Code ou nas variáveis de ambiente:

export ANTHROPIC_BASE_URL=https://api.deepseek.com/v1
export ANTHROPIC_API_KEY=sk-your-deepseek-key
claude --model deepseek-v4-pro

Observação: O roteamento direto via API pode ter diferenças de compatibilidade. Teste primeiro com um prompt simples: "Explique a arquitetura deste projeto em três frases."

Opção C: DeepSeek V4 hospedado localmente

Se você está executando o DeepSeek V4 localmente (via llama.cpp, vLLM ou similar), aponte o Claude Code para seu endpoint local:

export ANTHROPIC_BASE_URL=http://localhost:8000/v1
claude

O DeepSeek V4 Flash quantizado para 4 bits roda em uma única GPU de consumidor. O V4 Pro requer mais VRAM, mas é viável em hardware de nível workstation.

Verificar o roteamento

Inicie uma sessão do Claude Code e confirme qual modelo está ativo:

> What model are you running on?

O Claude Code deve responder indicando que está rodando no DeepSeek V4 via sua rota configurada.

Passo 2: Adicionar capacidades multimodais com o AnyCap

O DeepSeek V4 é um modelo somente de texto. Ele não consegue gerar imagens, criar vídeos, pesquisar na web, armazenar arquivos ou publicar conteúdo. O Claude Code fornece a camada de execução do agente — leitura de arquivos, execução de comandos, gerenciamento do git — mas também não adiciona essas capacidades.

O AnyCap preenche essa lacuna. Instale-o como um skill MCP. Para um guia detalhado das opções de configuração MCP, consulte nosso guia para adicionar capacidades ao Claude Code com MCP:

npx -y skills add anycap-ai/anycap -a claude-code

Autentique uma vez:

anycap login

Seu agente DeepSeek V4 + Claude Code agora pode:

Capacidade	Comando na sessão do agente
Gerar imagens	`anycap image generate "descrição"`
Criar vídeos	`anycap video generate "descrição"`
Pesquisar na web	`anycap search "consulta"`
Armazenar arquivos	`anycap drive upload ./caminho`
Publicar páginas	`anycap page publish ./arquivo.md`

Passo 3: Configurar o contexto do projeto

O Claude Code lê um arquivo CLAUDE.md no início de cada sessão para contexto persistente do projeto. Crie um adaptado à sua configuração do DeepSeek V4:

# CLAUDE.md

## Configuração do modelo
- Rodando no DeepSeek V4 Pro via OpenRouter
- Janela de contexto de 1 milhão de tokens disponível
- Modelo somente de texto — use o AnyCap para tarefas multimodais

## Extensões de capacidades
- Geração de imagens: anycap image generate
- Geração de vídeo: anycap video generate
- Pesquisa na web: anycap search
- Armazenamento de arquivos: anycap drive upload
- Publicação: anycap page publish

Gere uma versão inicial com /init dentro do Claude Code e personalize-a com as seções acima. Para mais informações sobre a configuração do Claude Code, consulte nosso guia de funcionalidades avançadas.

Passo 4: Executar um fluxo de trabalho real do início ao fim

Aqui está um fluxo de trabalho completo que testa cada componente do stack:

1. Construir uma landing page para um produto SaaS chamado "AgentMetrics"
   - Backend FastAPI com um endpoint
   - Frontend HTML/CSS simples
   - Usar o DeepSeek V4 para toda a geração de código

2. Gerar uma imagem hero para a landing page
   - Usar anycap image generate

3. Armazenar os assets gerados
   - Usar anycap drive upload

4. Publicar a landing page
   - Usar anycap page publish

Seu agente — alimentado pelo DeepSeek V4 para raciocínio — constrói a landing page. Chama o AnyCap para a imagem hero. Armazena os assets no Drive. Publica o resultado. Uma sessão, três componentes trabalhando juntos.

Otimização de custos: V4 Flash vs V4 Pro

O DeepSeek V4 vem em dois níveis. Escolha com base no seu fluxo de trabalho:

Variante	Custo (entrada)	Custo (saída)	Melhor para
V4 Flash	$0,14/1M tokens	$0,56/1M tokens	Iteração rápida, refatorações simples, fluxos de trabalho sensíveis a custo
V4 Pro	$0,28/1M tokens	$1,12/1M tokens	Refatorações complexas de múltiplos arquivos, raciocínio arquitetural, depuração

Para a maioria das sessões do Claude Code, o V4 Flash é suficiente. O modelo é rápido, barato e lida bem com a maioria das tarefas de programação. Mude para o V4 Pro quando precisar de raciocínio mais profundo — depurar uma race condition complexa, projetar uma nova arquitetura ou refatorar mais de 20 arquivos.

Comparação de custos com alternativas:

Stack	Custo aproximado por sessão de programação intensa
Claude Code + Claude Opus 4.7	$5–15 (assinatura ou API)
Claude Code + GPT-5.5	$3–10 (API por token)
Claude Code + DeepSeek V4 Flash	$0,50–2 (API por token)
Claude Code + DeepSeek V4 Pro	$1–4 (API por token)

O DeepSeek V4 Flash a $0,14/1M tokens de entrada custa aproximadamente 1/35 do Claude Opus 4.7. Ao longo de um mês de uso diário do agente, a diferença chega a centenas de dólares. Para uma análise completa de preços do Claude Code, consulte nossa comparação de planos. Para uma comparação direta entre o DeepSeek V4 e o GPT-5.5, consulte nossa comparação de capacidades.

O que este stack faz de melhor

Refatoração em grande escala. A janela de contexto de 1 milhão de tokens do DeepSeek V4 significa que o Claude Code pode ingerir um monorepo inteiro em uma única passagem. Renomear uma interface em mais de 50 arquivos, atualizar imports e executar a suíte de testes acontece em uma única sessão autônoma.

Fluxos de trabalho de agentes com orçamento limitado. Se você quer agentes de programação autônomos mas o Claude Max a $100–200/mês está fora do orçamento, o DeepSeek V4 Flash + Claude Code + AnyCap oferece a mesma arquitetura de agente a uma fração do custo.

Desenvolvimento self-hosted e isolado. O DeepSeek V4 é licenciado sob Apache 2.0. Execute-o no seu próprio hardware. Combine com o Claude Code para execução de agentes. Adicione o AnyCap para capacidades que permanecem dentro da sua infraestrutura. Nenhum dado sai do seu ambiente.

Fluxos de trabalho de agentes multimodais com orçamento enxuto. O DeepSeek V4 cuida do raciocínio. O AnyCap cuida de imagens, vídeo, pesquisa, armazenamento e publicação. Você obtém um agente totalmente multimodal sem pagar por um modelo multimodal. Consulte nosso guia para adicionar capacidades multimodais ao DeepSeek V4 para mais detalhes.

FAQ

O DeepSeek V4 funciona com o Cursor em vez do Claude Code?

Sim. O mesmo padrão de roteamento se aplica. No Cursor, adicione o DeepSeek V4 como provedor de modelo em Configurações → Modelos → Adicionar Modelo Personalizado. O AnyCap se instala da mesma forma como um skill MCP. O shell do agente é intercambiável.

Posso usar o DeepSeek V4 com o OpenClaw?

Sim. A CNBC reportou especificamente que o DeepSeek V4 foi otimizado para o OpenClaw. O padrão de configuração é similar: configure o endpoint do modelo no OpenClaw e instale o AnyCap para as capacidades.

O desempenho de programação agêntica do DeepSeek V4 é realmente competitivo?

Sim. O V4 Pro obtém 81% no SWE-bench Verified, igualando o GPT-5.5 e o Claude Opus 4.7. Nos benchmarks de programação agêntica especificamente, a DeepSeek reivindica SOTA de código aberto. Relatos de desenvolvedores do mundo real confirmam um desempenho sólido, especialmente considerando a diferença de preço. Para uma análise completa de benchmarks, consulte nosso guia do desenvolvedor do DeepSeek V4.

Quais são as limitações?

O DeepSeek V4 é somente texto — sem multimodal nativo. O protocolo de agente do Claude Code foi projetado para modelos Anthropic, então algumas funcionalidades específicas do Claude (extended thinking, certos modelos de permissão) podem não se traduzir perfeitamente para o roteamento do DeepSeek V4. Teste seu fluxo de trabalho específico antes de se comprometer com o stack. Consulte nosso guia de capacidades do DeepSeek V4 para uma visão geral completa do que o V4 pode e não pode fazer.

Como isso se compara a usar o Claude Opus 4.7 diretamente?

Claude Opus 4.7 + Claude Code é a experiência mais integrada — tudo é projetado para funcionar em conjunto. DeepSeek V4 + Claude Code é mais barato mas requer configuração de roteamento. O tradeoff é custo vs fluidez de integração. Se o orçamento não é uma restrição, mantenha o nativo. Se você quer programação agêntica de nível frontier a 1/35 do custo, o DeepSeek V4 é a escolha certa.

DeepSeek V4 com Claude Code: O Guia Completo de Integração de Agentes (2026)