DeepSeek V4 已针对 Claude Code 进行了专项优化。 CNBC 在发布当天就报道了这一消息。官方文档确认,V4 在智能体编程基准测试中达到了开源 SOTA 水准。但"这个模型可以与智能体协作"和"具体如何配置"之间还存在一段距离。本指南将逐步填补这一空白——提供完整的实战命令,涵盖模型路由、能力扩展和成本优化。
为什么 DeepSeek V4 + Claude Code 是极具吸引力的组合
DeepSeek V4 Pro 在智能体编程基准测试中与 GPT-5.5 和 Claude Opus 4.7 持平,成本却低得多:输入 token 价格为 $0.28/1M,而 GPT-5.5 为 $5/1M。它支持 100 万 token 的上下文窗口——足以在单次处理中摄取整个代码库。采用 Apache 2.0 开源协议,可以不受使用限制地自托管。有关 DeepSeek V4 能力与局限的完整解析,请参阅我们的 DeepSeek V4 能力指南。
Claude Code 是 Anthropic 推出的终端原生自主编程智能体。它读取你的代码仓库,规划多步骤变更,编辑文件,运行测试,并在失败时迭代优化。它原生支持 MCP(模型上下文协议),可以扩展代码以外的各种能力。如果你是 Claude Code 新手,请先阅读我们的安装指南和 Claude Code vs Cursor 对比。
这个组合的逻辑很直接:DeepSeek V4 负责推理和代码生成;Claude Code 负责智能体执行——读取文件、运行命令、管理 git;AnyCap(或 MCP 服务器)负责多模态能力——图片生成、视频、网络搜索、存储、内容发布。
前置条件
开始之前,请确认以下条件已满足:
- DeepSeek V4 API 访问权限 — 通过 DeepSeek 平台(api.deepseek.com)、OpenRouter 或自托管方式。配置选项请参阅我们的 DeepSeek V4 开发者指南。
- 已安装 Claude Code —
claude --version应返回版本号。若未安装:curl -fsSL https://claude.ai/install.sh | bash - Node.js 18 及以上 — Claude Code 和 npm 工具所需
- API 密钥或 OpenRouter 密钥 — 用于将 Claude Code 路由至 DeepSeek V4
第一步:将 Claude Code 路由至 DeepSeek V4
Claude Code 默认使用 Anthropic 的 Claude 模型。若要使用 DeepSeek V4 作为推理引擎,需要通过同时支持 Claude Code 智能体协议和 DeepSeek V4 API 的模型提供商进行路由。
方案 A:OpenRouter(推荐,快速配置)
OpenRouter 为 Anthropic 和 DeepSeek 模型提供统一的 API 访问。在 openrouter.ai 注册,获取 API 密钥,然后配置 Claude Code:
export OPENROUTER_API_KEY=sk-or-your-key-here
claude --model openrouter/deepseek/deepseek-v4-pro
使用 Flash 版本(更快,价格更低,$0.14/1M token):
claude --model openrouter/deepseek/deepseek-v4-flash
方案 B:直接调用 DeepSeek API + 自定义端点
如果你有 DeepSeek API 直接访问权限,可以配置自定义端点。在 Claude Code 设置或环境变量中:
export ANTHROPIC_BASE_URL=https://api.deepseek.com/v1
export ANTHROPIC_API_KEY=sk-your-deepseek-key
claude --model deepseek-v4-pro
注意:直接 API 路由可能存在兼容性差异。建议先用简单的提示词测试:"用三句话解释这个项目的架构。"
方案 C:本地自托管 DeepSeek V4
如果你在本地运行 DeepSeek V4(通过 llama.cpp、vLLM 或类似工具),将 Claude Code 指向本地端点:
export ANTHROPIC_BASE_URL=http://localhost:8000/v1
claude
量化为 4-bit 的 DeepSeek V4 Flash 可在单张消费级 GPU 上运行。V4 Pro 需要更多显存,但在工作站级硬件上完全可行。
验证路由
启动 Claude Code 会话,确认当前使用的模型:
> What model are you running on?
Claude Code 应返回提示,表明它正通过你配置的路由运行在 DeepSeek V4 上。
第二步:通过 AnyCap 添加多模态能力
DeepSeek V4 是纯文本模型。它无法生成图片、创建视频、搜索网络、存储文件或发布内容。Claude Code 提供智能体执行层——读取文件、运行命令、管理 git——但同样不具备这些能力。
AnyCap 填补了这一空缺。将其作为 MCP 技能安装。有关 MCP 配置选项的详细说明,请参阅我们的通过 MCP 为 Claude Code 添加能力指南:
npx -y skills add anycap-ai/anycap -a claude-code
一次性认证:
anycap login
你的 DeepSeek V4 + Claude Code 智能体现在可以:
| 能力 | 在智能体会话中的命令 |
|---|---|
| 生成图片 | anycap image generate "描述" |
| 创建视频 | anycap video generate "描述" |
| 搜索网络 | anycap search "关键词" |
| 存储文件 | anycap drive upload ./路径 |
| 发布页面 | anycap page publish ./文件.md |
第三步:配置项目上下文
Claude Code 在每次会话开始时读取 CLAUDE.md 文件,作为持久化的项目上下文。创建一个针对 DeepSeek V4 配置的文件:
# CLAUDE.md
## 模型配置
- 通过 OpenRouter 运行 DeepSeek V4 Pro
- 可用 100 万 token 上下文窗口
- 纯文本模型 — 多模态任务请使用 AnyCap
## 能力扩展
- 图片生成:anycap image generate
- 视频生成:anycap video generate
- 网络搜索:anycap search
- 文件存储:anycap drive upload
- 内容发布:anycap page publish
在 Claude Code 内使用 /init 生成初始版本,然后按上述内容自定义。有关 Claude Code 配置的更多信息,请参阅我们的高级功能指南。
第四步:端到端运行真实工作流
以下是一个完整的工作流,用于测试技术栈的每个组件:
1. 为名为 "AgentMetrics" 的 SaaS 产品构建落地页
- 包含一个端点的 FastAPI 后端
- 简单的 HTML/CSS 前端
- 所有代码生成使用 DeepSeek V4
2. 为落地页生成主视觉图片
- 使用 anycap image generate
3. 存储生成的资源
- 使用 anycap drive upload
4. 发布落地页
- 使用 anycap page publish
你的智能体——由 DeepSeek V4 提供推理能力——构建落地页,调用 AnyCap 生成主视觉图片,将资源存储到 Drive,最后发布结果。一次会话,三个组件协同工作。
成本优化:V4 Flash 与 V4 Pro
DeepSeek V4 提供两个版本,根据工作流选择:
| 版本 | 成本(输入) | 成本(输出) | 最适合 |
|---|---|---|---|
| V4 Flash | $0.14/1M token | $0.56/1M token | 快速迭代、简单重构、成本敏感型工作流 |
| V4 Pro | $0.28/1M token | $1.12/1M token | 复杂的多文件重构、架构设计、调试 |
大多数 Claude Code 会话使用 V4 Flash 已足够。该模型速度快、成本低,能够很好地处理大多数编程任务。当需要更深层推理时切换到 V4 Pro——例如调试复杂的竞态条件、设计新架构或跨 20 个以上文件的重构。
与其他方案的成本对比:
| 技术栈 | 每次重度编程会话的大致成本 |
|---|---|
| Claude Code + Claude Opus 4.7 | $5–15(订阅或 API) |
| Claude Code + GPT-5.5 | $3–10(按 token 计费 API) |
| Claude Code + DeepSeek V4 Flash | $0.50–2(按 token 计费 API) |
| Claude Code + DeepSeek V4 Pro | $1–4(按 token 计费 API) |
DeepSeek V4 Flash 的输入 token 价格为 $0.14/1M,约为 Claude Opus 4.7 的 1/35。如果每天使用智能体,一个月下来可以节省数百美元。有关 Claude Code 定价的完整分析,请参阅我们的套餐对比。有关 DeepSeek V4 与 GPT-5.5 的直接对比,请参阅我们的能力对比。
这个技术栈的核心优势
大规模重构。 DeepSeek V4 的 100 万 token 上下文窗口意味着 Claude Code 可以一次性处理整个 monorepo。跨 50 多个文件重命名接口、更新导入并运行测试套件,都可以在单次自主会话中完成。
预算受限的智能体工作流。 如果你想要自主编程智能体,但每月 $100–200 的 Claude Max 费用过高,DeepSeek V4 Flash + Claude Code + AnyCap 可以以极低的成本实现同等的智能体架构。
自托管、隔离网络开发。 DeepSeek V4 采用 Apache 2.0 协议。在自有硬件上运行,结合 Claude Code 执行智能体任务,添加 AnyCap 以提供留在你基础设施内的能力。数据不会离开你的环境。
低成本多模态智能体工作流。 DeepSeek V4 负责推理,AnyCap 负责图片、视频、搜索、存储和发布。无需为多模态模型付费,即可获得完整的多模态智能体能力。详见我们的 DeepSeek V4 多模态能力添加指南。
常见问题
DeepSeek V4 能与 Cursor 配合使用而非 Claude Code 吗?
可以。相同的路由模式适用。在 Cursor 中,通过设置 → 模型 → 添加自定义模型,将 DeepSeek V4 添加为模型提供商。AnyCap 同样作为 MCP 技能以相同方式安装。智能体 shell 可以互换使用。
我可以将 DeepSeek V4 与 OpenClaw 结合使用吗?
可以。CNBC 特别报道了 DeepSeek V4 已针对 OpenClaw 进行了优化。设置模式类似:在 OpenClaw 中配置模型端点,安装 AnyCap 以添加能力。
DeepSeek V4 的智能体编程性能真的有竞争力吗?
有。V4 Pro 在 SWE-bench Verified 上得分 81%,与 GPT-5.5 和 Claude Opus 4.7 持平。在智能体编程基准测试方面,DeepSeek 宣称达到开源 SOTA。实际开发者的反馈也证实了其强劲性能,尤其考虑到价格差距。详细的基准测试分析请参阅我们的 DeepSeek V4 开发者指南。
有哪些局限性?
DeepSeek V4 是纯文本模型,没有原生多模态能力。Claude Code 的智能体协议是为 Anthropic 模型设计的,因此部分 Claude 专有功能(扩展思考、特定权限模型)在路由至 DeepSeek V4 时可能无法完美支持。在决定采用该技术栈之前,请先测试你的具体工作流。有关 V4 能力与限制的全面概述,请参阅 DeepSeek V4 能力指南。
与直接使用 Claude Opus 4.7 相比如何?
Claude Opus 4.7 + Claude Code 是集成度最高的体验——一切都被设计为协同工作。DeepSeek V4 + Claude Code 更便宜,但需要配置路由。权衡点在于成本与集成流畅度之间。如果预算不是限制,保持原生方案即可。如果你想以 1/35 的成本实现前沿的智能体编程,DeepSeek V4 是明智之选。
相关文章
- DeepSeek V4:完整开发者指南 — 架构、基准测试、API 集成、自托管以及集成 DeepSeek V4 所需的一切。
- DeepSeek V4 vs GPT-5.5:完整能力对比 — 基准测试、定价、多模态差距与部署灵活性的并排比较。
- 如何为 DeepSeek V4 智能体添加多模态能力 — 在 2 分钟内为你的 DeepSeek V4 智能体添加图片生成、视频、网络搜索和云存储。
- Claude Code vs Cursor:2026 年 AI 编程智能体谁更胜一筹? — 终端原生智能体 vs IDE 分支。对比自主性、上下文处理、定价与实际任务表现。
- 如何通过 MCP 为 Claude Code 添加智能体能力 — 分步 MCP 配置指南以及 AnyCap 一键快速路径。
立即配置 DeepSeek V4 与 Claude Code:
# 将 Claude Code 路由至 DeepSeek V4
export OPENROUTER_API_KEY=sk-or-your-key
claude --model openrouter/deepseek/deepseek-v4-pro
# 添加多模态能力
npx -y skills add anycap-ai/anycap -a claude-code