在 AnyCap 中选择 DeepSeek V4
DeepSeek V4 非常适合 AnyCap 中的低成本推理、代码代理和大上下文分析。它的核心优势是 100 万 token 上下文窗口、强劲的基准成绩,以及对自托管的支持。但它也有明显短板:单靠它本身,无法提供可靠的图像、视频、实时搜索、云存储或发布工作流。最实用的搭配方式是:让 DeepSeek V4 负责推理,让 AnyCap 负责多模态、Web、存储和发布层。
基准概览
| Benchmark | DeepSeek V4 Pro | GPT-5.5 | Claude Opus 4.7 |
|---|---|---|---|
| SWE-bench Verified | 81% | 82.7% | ~80% |
| MMLU-Pro | 85.2% | ~86% | ~84% |
| MATH-500 | 96.8% | ~97% | ~96% |
| 输入成本(每 100 万 token) | $0.28 | $5.00 | API 定价 |
| 上下文窗口 | 100 万 token | 100 万 token | 200K token |
| 开源 | 是(Apache 2.0) | 否 | 否 |
DeepSeek V4 在 AnyCap 中适合什么场景
以极低成本获得前沿推理能力
DeepSeek V4 Pro 在 SWE-bench Verified 上达到 81%,在 MMLU-Pro 上达到 85.2%,在 MATH-500 上达到 96.8%。这些成绩已经非常接近 GPT-5.5 和 Claude Opus 4.7,但输入 100 万 token 只需 $0.28。GPT-5.5 则大约需要 $5。
以一次典型的代码代理会话为例:输入 1 万 token,输出 2000 token。DeepSeek V4 Pro 的成本大约是 $0.005,而 GPT-5.5 大约是 $0.11。按每天使用计算,一个月下来差距可能达到数百美元。
100 万 token 上下文窗口
DeepSeek V4 可以一次性摄入 100 万 token,大约相当于 75 万个单词。你可以把整个代码库直接喂给模型,而不需要分块、摘要或检索管线。当 Claude Code 路由到 DeepSeek V4 时,一个大型 monorepo 可以在一次会话中完成索引与理解。
面向代理式编码的开源第一梯队
DeepSeek V4 Pro 在代理式编码基准上,是开源模型中的第一梯队。它专门针对代理任务进行了后训练,包括工具调用、多步规划、错误恢复和代码执行。
自托管与数据主权
DeepSeek V4 采用 Apache 2.0 许可。你可以下载权重,在自有硬件上运行模型,并部署到隔离环境中。对于有合规要求或希望掌控基础设施的团队来说,这是一项决定性优势。
多模型路由
DeepSeek V4 可以通过 OpenRouter 这样的路由层与其他模型配合使用。常见模式是:简单任务用 V4 Flash,复杂推理用 V4 Pro,再由 AnyCap 提供多模态能力。凭借价格优势,DeepSeek V4 很适合作为成本敏感路由层的默认模型。
DeepSeek V4 在 AnyCap 中的不足
缺少可靠的内置多模态工作流
这是它最大的限制。实际使用中,基于 DeepSeek V4 的工作流默认仍然无法稳定完成以下任务:
- 以生产可用的方式生成图像或编辑照片
- 端到端生成视频或分析视频内容
- 处理音频,包括转写、语音合成和音乐生成
- 理解图像,例如描述照片或从截图中提取文字
- 访问实时 Web,获取最新信息
- 将文件保存到云存储并生成分享链接
- 将内容发布到 Web
不支持语音和音频处理
GPT-5.5 和 Gemini 3.1 支持语音模式和音频理解,DeepSeek V4 不支持。如果你的工作流涉及会议转写或语音代理,仅靠 DeepSeek V4 并不合适。
存在知识截止点
和所有大语言模型一样,DeepSeek V4 也有训练数据截止时间。100 万 token 上下文窗口确实有帮助,因为你可以喂入最新文档或搜索结果,但模型本身并不具备原生的实时感知能力。
AnyCap 如何补齐这些短板
上面每一项限制都有对应解法。整体架构很简单:DeepSeek V4 负责推理和代码生成,AnyCap 负责其他能力。
安装一次,补齐工作流缺口
AnyCap 是统一能力运行时:通过一个 CLI,就能为任何兼容 MCP 的代理补充图像生成、视频、Web 搜索、云存储和发布能力。
npx -y skills add anycap-ai/anycap -a claude-code
安装后,你的 DeepSeek V4 代理可以完成:
| 能力 | 命令 |
|---|---|
| 生成图像 | anycap image generate "描述" |
| 创建视频 | anycap video generate "描述" |
| 带引用搜索 Web | anycap search "查询" --citations |
| 上传文件到云端 | anycap drive upload ./path |
| 发布内容到 Web | anycap page publish ./file.md |
完整指南:如何为 DeepSeek V4 代理添加多模态能力
Claude Code + DeepSeek V4 + AnyCap
DeepSeek V4 针对代理工具进行了优化。你可以让 Claude Code 通过 DeepSeek V4 运行,再配合 AnyCap:
# 让 Claude Code 通过 DeepSeek V4 路由
export OPENROUTER_API_KEY=sk-or-your-key
claude --model openrouter/deepseek/deepseek-v4-pro
# 添加多模态能力
npx -y skills add anycap-ai/anycap -a claude-code
在这个组合中,DeepSeek V4 以每 100 万 token 0.28 美元的成本负责推理,Claude Code 负责代理执行,AnyCap 负责多模态能力。
Web 搜索与实时信息
DeepSeek V4 的 100 万 token 上下文窗口,非常适合搜索增强工作流。把 anycap search 的结果喂给模型后,它可以在一次处理中吸收并综合全部输出,不需要分块,也不需要复杂的 RAG 管线。
推荐技术栈
预算敏感型代理开发(约 $5–10 / 月)
DeepSeek V4 Flash($0.14 / 每 100 万 token)
+ Claude Code(代理执行)
+ AnyCap(多模态能力)
追求最高性能且控制成本(约 $15–30 / 月)
复杂推理使用 DeepSeek V4 Pro
简单任务使用 DeepSeek V4 Flash
+ Claude Code 或 OpenClaw
+ AnyCap
+ OpenRouter(多模型路由)
自托管隔离环境
DeepSeek V4 Pro(在工作站 GPU 上自托管)
+ Claude Code
+ AnyCap(仅本地网络)
= 数据不会离开你的基础设施
FAQ
DeepSeek V4 真的是免费的吗?
模型权重在 Apache 2.0 许可下免费提供。API 使用则收费:V4 Pro 输入 100 万 token 为 $0.28,V4 Flash 为 $0.14。
DeepSeek V4 能生成图像吗?
对大多数团队来说,它还不能作为一个可靠的内置工作流来使用。你可以通过 AnyCap 增加图像生成能力。anycap image generate 可以配合任何兼容 MCP 的代理使用,包括基于 DeepSeek V4 的配置。
V4 Pro 和 V4 Flash 有什么区别?
V4 Pro 是完整模型:总参数 1.6T,每个 token 激活 49B 参数,输入 100 万 token 成本为 $0.28。V4 Flash 更小、更快,输入 100 万 token 成本为 $0.14。快速迭代用 Flash,复杂推理用 Pro。
DeepSeek V4 能配合 Cursor 使用吗?
可以。在 Cursor 设置中把 V4 添加为自定义模型即可。AnyCap 作为 MCP 技能安装,在 Claude Code、Cursor 和 OpenClaw 中都能以相同方式工作。
DeepSeek V4 和 Claude Opus 4.7 相比怎么样?
它的基准表现很有竞争力。主要差别在于:Claude Opus 4.7 与 Claude Code 的集成更紧密,并且支持 extended thinking。DeepSeek V4 成本低得多、是开源模型、还能自托管。AnyCap 则可以补上 DeepSeek V4 在多模态方面的短板。
相关文章
- DeepSeek V4:完整开发者指南
- DeepSeek V4 vs GPT-5.5:完整能力对比
- DeepSeek V4 配合 Claude Code:代理集成指南
- 如何为 DeepSeek V4 代理添加多模态能力
# 快速开始
export OPENROUTER_API_KEY=sk-or-your-key
claude --model openrouter/deepseek/deepseek-v4-pro
npx -y skills add anycap-ai/anycap -a claude-code