简短回答
如果你想把 DeepSeek V4 和 Claude Code 一起使用,最清晰的配置是:DeepSeek V4 负责推理,Claude Code 负责智能体循环,AnyCap 负责补上缺失的 capability layer。 这种组合适合这样的场景:你希望用 DeepSeek V4 获得更低成本的编码能力,同时又需要智能体能够搜索实时网页、生成图片或视频、存储文件并发布结果。
DeepSeek V4 会推理。Claude Code 会执行。但大多数团队仍然缺少把这两者真正变成现实世界智能体的那一层。
缺失的这一层不是“再多写一点提示词”,也不是再堆一批一次性的集成,而是 capability layer:也就是为智能体提供编码 shell 默认不具备能力的运行时,包括实时网页搜索、图像生成、视频、存储和发布。
AnyCap 就是在这里发挥作用。DeepSeek V4 负责模型推理,Claude Code 负责你仓库里的智能体循环,AnyCap 则补上这两部分仍然缺失的 capability runtime。
这篇指南会告诉你如何把这套栈清晰地搭起来:先让 Claude Code 通过 DeepSeek V4 路由,再加上 AnyCap,让智能体不只是会读文件和执行命令。
为什么 DeepSeek V4 + Claude Code 是一套有吸引力的组合
DeepSeek V4 有吸引力,原因很简单:它以显著更低的成本提供接近前沿水平的编码性能。它拥有较大的上下文窗口、强劲的智能体式编码基准成绩,以及通过托管服务商或自托管进行部署的灵活选项。
Claude Code 仍然是自主编码工作中最强的 shell 之一。它可以检查你的仓库、规划修改、编辑文件、运行测试并持续迭代。换句话说,它给模型提供了一个有纪律的执行循环。
但这仍然不足以让整套栈完整。
如果你让这套配置去研究一个在线竞品页面、生成一张发布视觉图、存储供审核的产物,或者发布一份完成的报告,你会立刻遇到同样的限制:模型可以推理任务,Claude Code 可以编排步骤,但它们都不是 capability runtime。
因此,更准确的架构应该是这样:
- DeepSeek V4 — 推理模型
- Claude Code — 智能体 shell 与执行循环
- AnyCap — 用于媒体、搜索、存储和发布的 capability runtime / 更强的智能体 CLI
哪些地方表现好,哪些地方会出问题
表现好的地方:
- 面向重编码智能体工作流的低成本模型路由
- Claude Code 在真实仓库中的强执行循环
- 推理、编排和能力执行之间更清晰的分层
没有 capability layer 会出问题的地方:
- 需要网页搜索和抓取的实时研究任务
- 需要生成图片或视频的媒体工作流
- 需要存储、共享或发布的产物交付任务
这就是为什么从实用角度看,这套栈需要的是 AnyCap,而不只是模型路由加一个 shell。
前置条件
开始之前,请确认你已经具备:
- DeepSeek V4 API 访问权限 — 通过 DeepSeek、OpenRouter 或你自己的托管端点
- 已安装 Claude Code —
claude --version应该返回版本号 - Node.js 18+ — Claude Code 和常见智能体工具都需要
- 模型路由的 API Key — OpenRouter 或直接访问 DeepSeek 的密钥
第一步:让 Claude Code 通过 DeepSeek V4 路由
Claude Code 默认使用 Anthropic 托管模型。要让 DeepSeek V4 负责推理,需要把 Claude Code 路由到一个提供 DeepSeek 兼容端点的服务商。
方案 A:OpenRouter
export OPENROUTER_API_KEY=sk-or-your-key-here
claude --model openrouter/deepseek/deepseek-v4-pro
如果你想要一个更便宜、更快的默认选项:
claude --model openrouter/deepseek/deepseek-v4-flash
方案 B:直接使用兼容 DeepSeek 的端点
export ANTHROPIC_BASE_URL=https://api.deepseek.com/v1
export ANTHROPIC_API_KEY=sk-your-deepseek-key
claude --model deepseek-v4-pro
方案 C:自托管端点
export ANTHROPIC_BASE_URL=http://localhost:8000/v1
claude
启动后,可以在会话中验证当前使用的路由:
> What model are you running on?
第二步:用 AnyCap 补上缺失的 capability layer
这是大多数文章都会写模糊的一步。
AnyCap 不是“模型本身”,也不是“Claude Code 本身”。它是 capability runtime,为你的智能体提供 Claude Code 和 DeepSeek V4 单独都还不能提供的动作能力。
这里有两个部分:
- 安装 AnyCap CLI — 这是执行界面
- 把 AnyCap skill 添加到 Claude Code — 这样智能体才能学会高效使用这个 CLI
安装 CLI
curl -fsSL https://anycap.ai/install.sh | sh
export PATH="$HOME/.local/bin:$PATH"
认证一次
anycap login
将 skill 添加到 Claude Code
npx -y skills add anycap-ai/anycap -a claude-code
现在,你的栈就拥有了之前缺失的 capability layer。
在实际使用中,这意味着你的 DeepSeek V4 + Claude Code 智能体可以做这些事情:
- 搜索实时网页
- 生成图片
- 生成视频
- 将产物上传到云存储
- 发布最终输出
这里最重要的区分是:
- DeepSeek V4 决定做什么
- Claude Code 管理智能体工作流
- AnyCap CLI 执行现实世界能力
- AnyCap skill 教会智能体如何更好地调用这些能力
第三步:配置项目上下文
Claude Code 会在每次会话开始时读取 CLAUDE.md。你可以用它把架构写清楚:
# CLAUDE.md
## Model route
- Running on DeepSeek V4 Pro via OpenRouter
- Use Flash for cheaper routine tasks
## Architecture
- DeepSeek V4 = reasoning model
- Claude Code = agent shell
- AnyCap = capability runtime for search, media, storage, and publishing
## Capability commands
- Search: anycap search
- Image generation: anycap image generate
- Video generation: anycap video generate
- Storage: anycap drive upload
- Publishing: anycap page publish
这可以避免一种常见失败模式:智能体把这套栈理解成“模型加一堆随机工具”,而不是一个连贯的模型—shell—runtime 架构。
第四步:跑一次真正端到端的工作流
一个好的测试任务应该同时需要这三层:
Build a landing page for a product called AgentMetrics.
- Use DeepSeek V4 for coding and reasoning
- Use Claude Code to edit files and run the workflow
- Use AnyCap to generate the hero visual
- Upload the assets
- Publish the finished page
这正是编码配置和真正智能体配置之间的关键差异。
没有 capability layer 时,你的智能体会停在“我已经把代码写好了”。
有了 capability layer,它就能完成调研、生成配套媒体、存储输出并真正交付结果。
成本优化:Flash vs Pro
选择模型层级时,应根据推理深度,而不是品牌名称。
| Variant | Best for |
|---|---|
| DeepSeek V4 Flash | 快速迭代、更简单的编码工作、更低成本的智能体会话 |
| DeepSeek V4 Pro | 多文件重构、更复杂的调试、架构决策 |
一个实用的模式是:
- 日常任务默认使用 Flash
- 需要更深推理时切换到 Pro
- 无论选择哪个模型层级,都让 AnyCap 作为固定的 capability layer 保持不变
这样一来,你就不需要每次切换模型时都重建整套能力栈。
这套栈真正擅长什么
1. 以更低成本处理大型代码库智能体工作
DeepSeek V4 负责推理,Claude Code 负责仓库级循环。你可以获得强劲的编码表现,而不必每次会话都支付高价模型成本。
2. 产出真正的智能体结果,而不只是代码建议
这正是 AnyCap 最重要的地方。很多“智能体”配置仍然只是 shell 加文本。它们可以检查和编辑代码,却无法完成工作中那些非代码部分。
如果你的工作流需要研究、媒体、文件交付或发布,那么缺失的部分就是 capability runtime。
3. 比堆叠零散 MCP 服务器更清晰的架构
你当然仍然可以在合适的地方使用 MCP,尤其是内部工具和专有系统场景。但对于常见的跨职能能力,更清晰的思路不是“再加一个服务器”,而是“一次性补上缺失的 runtime layer”。
FAQ
在这套配置里,AnyCap 只是另一个 MCP 服务器吗?
不是。更准确的说法是,AnyCap 是 capability runtime。Claude Code 可以通过 skill 学会如何使用它,MCP 也仍然可以是周边工具架构的一部分,但产品价值在于统一的执行层,而不是一堆松散、互不相连的服务器配置。
为什么不直接用 DeepSeek V4 加几个脚本?
因为脚本解决不了协同问题。你仍然需要一种一致的方式,让智能体去搜索、生成媒体、存储输出并发布结果。runtime 正是以一个统一接口,把这套能力面提供给智能体。
我还需要 MCP 吗?
有时需要。MCP 对内部数据库、专有 API 和团队专用工具仍然很有价值。但 MCP 是协议层,它并不等同于智能体在日常生产工作中所使用的更广义 capability runtime。
团队在这套栈上最常犯的错误是什么?
把 Claude Code 当成已经自带完整 capability layer。其实并没有。Claude Code 是 shell,DeepSeek V4 是模型。如果你想要一个真正面向现实世界的智能体,仍然需要 runtime。
相关文章
快速开始:
# Route Claude Code through DeepSeek V4
export OPENROUTER_API_KEY=sk-or-your-key
claude --model openrouter/deepseek/deepseek-v4-pro
# Install the capability runtime
curl -fsSL https://anycap.ai/install.sh | sh
export PATH="$HOME/.local/bin:$PATH"
anycap login
# Teach Claude Code how to use it
npx -y skills add anycap-ai/anycap -a claude-code