如何用 Claude Code 生成图片(2026):3 种方法

Claude Code 本身不能生成图片。本文讲清楚如何通过 MCP 服务器、能力运行时 CLI 或直接 API 集成,把图片生成能力加入 Claude Code,并附步骤与示例。

by AnyCap

抽象数字艺术:一个发光的像素光标正在变成五彩霓虹碎片,整体是深紫和蓝色的开发者风格

先说结论:Claude Code 本身不能生成图片。 它是一个基于终端的编码代理,擅长代码推理、文件操作和 shell 执行,而不是像素生成。但如果你想给 Claude Code 加上图片生成能力,现在有三种实用方案:MCP 服务器、能力运行时 CLI,或者直接 API 集成。

这篇指南会把三种方法都讲清楚,并附上真实命令和输出示例,帮助你选择最适合自己工作流的方案。


Claude Code 能生成图片吗?简短回答

Claude Code,也就是 Anthropic 面向终端的 AI 编码代理,完全没有内置图片生成能力。它可以帮你写 <Image> 组件、配置懒加载、优化响应式断点,但它不能真正产出图片文件本身。

这不是 bug。Claude Code 的设计目标就是把代码这件事做到极致:规划、重构、调试、交付,仅此而已。如果你的任务始终停留在 .tsx.py 文件里,Claude Code 几乎无可匹敌。但一旦你需要 hero 图、示意图或社交媒体视觉图,你就会撞上一堵墙。

实际体验通常是这样的:

你:"给我们的 SaaS 落地页生成一张 hero 图。"

Claude Code:我不能生成图片。
我可以帮你写 hero 区块的 HTML/CSS 和占位组件,
但图片本身需要你另外获取。

这篇指南就是告诉你,怎么补上这块能力缺口。


为什么图片生成对 Claude Code 用户很重要

如果你只是用 Claude Code 修 bug、补 boilerplate,那图片生成不是刚需。但 Claude Code 最高效的工作流,往往是把一个功能从头到尾完整交付,而完整功能几乎都离不开视觉素材:

  • 落地页 需要 hero 图、Logo 和分区插图
  • 文档 需要示意图、架构图和截图
  • 社交媒体发布 需要配图、横幅和缩略图
  • UI 原型 需要 mockup 图片来表达设计意图
  • 营销网站 需要产品图、对比图和图标集

没有图片生成能力,这些任务每一个都会把你从终端里“拽出去”,打断 Claude Code 最有价值的那种自主代理工作流。


方法 1:MCP 服务器(Replicate、Fal.ai 或 Bannerbear)

最适合: 已经在使用 MCP 服务器的团队,以及希望精细控制模型选择的开发者。

Model Context Protocol,也就是 MCP,是把外部工具接入 Claude Code 的标准方式。现在已经有一些 MCP 服务器提供图片生成模型。

选项 A:Replicate MCP Server

Replicate 通过 API 托管开源图片模型,比如 Stable Diffusion、FLUX 和 SDXL。它的 MCP 服务器会把这些模型暴露为 Claude Code 可调用的工具。

安装方式:

# Install the Replicate MCP server
claude mcp add replicate -- npx -y @replicate/mcp-server \
  --env REPLICATE_API_TOKEN=r8_your_token_here

在 Claude Code 中使用:

你:"用 Replicate 工具生成一张图片:
      一个现代感的 SaaS 仪表盘,深色主题、蓝色点缀,
      使用 black-forest-labs/flux-schnell 模型。"

Claude Code:[调用 Replicate MCP 工具]
  已生成图片:output.png (1024x1024)

优点:

  • 可以使用开源模型,比如 FLUX、SDXL
  • 按量计费,不需要月费承诺
  • MCP 服务器有活跃社区在维护

缺点:

  • 配置大约要 15 分钟,包括注册 Replicate、获取 API Key、配置 MCP
  • 仅工具描述就会给 Claude Code 上下文增加约 6000 token 开销
  • 模型选择完全靠你自己,你得知道该填哪个模型 ID
  • 输出只是原始图片文件,如果不另外上传,就没有 CDN URL

选项 B:Fal.ai MCP Server

Fal.ai 更擅长生成式模型的快速推理,配置方式也类似:

claude mcp add fal -- npx -y @fal-ai/mcp-server \
  --env FAL_KEY=your_fal_key_here

取舍点: 它通常比 Replicate 更快,但模型选择更少,社区规模也更小。

选项 C:Bannerbear MCP(适合模板化图片)

如果你要做的是程序化图片生成,比如社交媒体模板图、OG 图或动态横幅,Bannerbear 的 MCP 服务器就是专门为这类场景设计的:

claude mcp add bannerbear -- npx -y @bannerbear/mcp-server \
  --env BANNERBEAR_API_KEY=your_key_here

方法 2:AnyCap CLI(一条命令,无需配置)

最适合: 个人开发者和小团队,他们要的是“现在就能生成图片”,而不是先花 15 分钟配 MCP。

AnyCap 是一个能力运行时,把图片生成、视频、网页搜索等能力整合到一个 CLI 里。Claude Code 可以直接在终端里调用它:一次安装、一条命令、一次登录。

安装(30 秒)

# One command installs the skill and CLI
npx -y skills add anycap-ai/anycap -a claude-code -y
curl -fsSL https://anycap.ai/install.sh | sh
anycap login

在 Claude Code 里生成图片

安装完成后,Claude Code 就可以直接通过 anycap CLI 生成图片:

基础图片生成:

anycap image generate \
  --model seedream-5 \
  --prompt "浅色背景的极简 SaaS 仪表盘,干净的 UI,圆角,蓝色点缀" \
  -o dashboard-hero.png

输出示例:

Generating image with seedream-5...
Image saved to dashboard-hero.png (1024x1024, 487KB)
CDN URL: https://cdn.anycap.ai/v1/images/abc123/dashboard-hero.png

CDN URL 会立刻返回,不需要额外上传,也不用配置 S3。Claude Code 可以直接把它嵌入到 HTML 或 markdown 里。

进阶:一次生成多个变体

anycap image generate \
  --model nano-banana-pro \
  --prompt "一位开发者在深色终端前工作,紫色氛围光,广角镜头" \
  --variants 3 \
  -o dev-terminal

这会生成 dev-terminal-1.pngdev-terminal-2.pngdev-terminal-3.png 三个版本,方便你直接挑选。

图生图微调:

anycap image generate \
  --model seedream-5 \
  --prompt "保持相同构图,但把蓝光改成温暖的橙色光线" \
  --reference dashboard-hero.png \
  -o dashboard-hero-v2.png

AnyCap 提供的模型

模型 最适合 风格 速度
Seedream 5 高质量写实与设计图 写实、UI、产品 中等
Nano Banana Pro 快速迭代、概念图、草稿 通用
Nano Banana 2 落地页、Hero 图、营销素材 干净、商业化

Claude Code 不需要知道模型 ID。如果你不指定,运行时会根据提示词自动选择最合适的模型。

优点:

  • 2 分钟完成配置:一次安装、一次登录、一套凭证
  • 大约 2000 token 开销:相比 5 个独立 MCP 服务器合计约 24000 token 更轻量
  • 内置 CDN:生成后的图片会自动获得公开 URL
  • 多模型切换方便:Seedream 5、Nano Banana Pro 等模型切换无需重配
  • 一个登录覆盖全部能力:图片、视频、搜索、存储、发布都能共用同一套凭证
  • 原生适配 Claude Code:命令直接在终端会话中执行,输出是结构化 JSON

缺点:

  • 按量计费:不是固定月费模式,起始提供 5 美元免费额度
  • 模型是精选集合:你使用的是 AnyCap 提供的模型,而不是任意 HuggingFace 模型
  • 必须联网:不支持纯本地生成

方法 3:直接 API 集成(OpenAI、Stability AI)

最适合: 需要最大控制权,并且愿意自己写集成代码的开发者。

你也可以通过自己写一个调用图片 API 的工具,把图片生成能力接进 Claude Code:

# tools/generate_image.py
import requests
import sys

API_KEY = "your-openai-api-key"

def generate(prompt: str, output_path: str = "output.png"):
    response = requests.post(
        "https://api.openai.com/v1/images/generations",
        headers={"Authorization": f"Bearer {API_KEY}"},
        json={"prompt": prompt, "n": 1, "size": "1024x1024"}
    )
    url = response.json()["data"][0]["url"]
    
    # Download the image
    img = requests.get(url)
    with open(output_path, "wb") as f:
        f.write(img.content)
    
    return output_path

if __name__ == "__main__":
    prompt = sys.argv[1]
    path = sys.argv[2] if len(sys.argv) > 2 else "output.png"
    result = generate(prompt, path)
    print(f"Image saved to {result}")

然后再通过 MCP 把它注册成 Claude Code 工具。这样你可以完全控制 API、模型和输出处理方式,但代价就是集成代码得你自己写、自己维护。

优点:

  • 完全掌控模型选择
  • 可以自定义错误处理
  • 除了 API 本身,没有额外外部依赖

缺点:

  • 集成代码需要自己开发和维护
  • API Key 需要手动管理
  • 没有内置 CDN,存储和 URL 需要自己处理
  • 输出格式完全取决于 API 返回内容

对比:到底该选哪种方法?

MCP 服务器 AnyCap CLI 直接 API
配置时间 15–30 分钟 2 分钟 30–60 分钟
需要管理的 API Key 每个服务器 1 个 总共 1 个 每个 API 1 个
上下文 token 开销 ~6000 ~2000 ~3000(你的自定义工具)
模型选择 手动,需要知道模型 ID 精选模型或自动选择 完全手动控制
CDN / 分享 手动上传 内置 手动
多模型切换 需要重配 MCP 服务器 命令行参数切换 重写集成逻辑
最适合 已经在用 MCP 的团队 个人开发者和小团队 需要全栈级控制的开发者

真实工作流:Claude Code + 图片生成的端到端流程

下面是一个把图片生成整合进来后的完整落地页构建流程:

你:"帮我为一个新的 AI 开发者工具 'CodeLens' 做一个落地页。
      包括一张生成的 hero 图、一个三列功能区,以及 CTA。"

Claude Code:
  1. 先在网上搜索类似的开发者工具落地页
  2. 用 Tailwind CSS 搭起一个 Next.js 项目
  3. 编写落地页组件
  4. 调用 anycap image generate 生成 hero 图:
     "未来感代码分析仪表盘,深色主题,
      发光的数据可视化,开发者工具风格"
  5. 把生成的 CDN URL 嵌入 `<Image>` 组件
  6. 为每个区块生成功能图标
  7. 启动开发服务器做预览
  8. 提交并推送到 GitHub

你:"部署它。"

Claude Code:
  构建项目,发布页面,并返回线上 URL。

一次会话,一个终端,零工具切换。 这就是“编码助手”和“完整开发代理”之间的差别。


FAQ

Claude Code 可以自己生成图片吗?

不可以。Claude Code 是一个纯文本编码代理。它能读写代码和文件,但没有内置的图片生成模型、运行时或 API。所有图片生成能力都必须来自外部工具,比如 MCP 服务器、AnyCap 这样的能力运行时,或者直接 API 调用。

为什么 Claude Code 不能直接调用图片 API?

其实可以,只要你先把它配好。Claude Code 拥有完整的 shell 访问能力,可以执行 curl 命令或 Python 脚本。问题不在于 Claude Code 被禁止调用 API,而在于工具配置、API Key 管理和输出格式处理都需要额外设置,而这些并不是 Claude Code 自己会自动完成的。上面的方案 1 和方案 2,本质上就是把这些配置工作自动化了。

Anthropic 会给 Claude Code 加上图片生成吗?

Anthropic 目前没有公布要为 Claude Code 增加图片生成能力的计划。Claude Code 的核心定位是代码推理和终端执行,图片、视频和媒体生成不在它的产品范围内,这也正是为什么外部能力层会存在。

从 Claude Code 生成图片,最便宜的方式是什么?

AnyCap 提供 5 美元免费额度,无需先付款,之后按模型提供商原价按量计费,不额外加价。像 Replicate 这样的 MCP 服务器也是按量计费。对于低频使用场景,比如一次会话生成几张图,两种方式基本都是每张图片只要几分钱到几毛钱人民币。

我能在 Claude Code 里用 Midjourney 或 DALL-E 吗?

不能直接用。Midjourney 和 DALL-E 都没有官方 MCP 服务器或 CLI。你当然可以按方案 3 自己写集成,直接调用它们的 API,但这意味着你要自己开发和维护工具代码。AnyCap 提供的精选模型,比如 Seedream 5 和 Nano Banana Pro,在不需要额外集成工作的前提下,也能提供接近的生成质量。

从 Claude Code 生成图片需要 GPU 吗?

不需要。三种方案都是通过云端 API 完成生成,真正的推理发生在远程服务器,而不是你的本地机器。你的终端会话只需要发送提示词,然后接收 URL 或文件即可。不需要本地 GPU,不需要下载模型,也没有额外硬件要求。

生成后的图片怎么放进项目里?

在方案 2,也就是 AnyCap CLI 中,图片会保存到你指定的本地路径,同时 也会上传到 CDN。Claude Code 可以直接把 CDN URL 嵌进项目里:

<Image src="https://cdn.anycap.ai/v1/images/abc123/dashboard-hero.png"
       alt="SaaS 仪表盘 Hero 图" width={1200} height={600} />

而在方案 1,也就是 MCP 方式中,图片只会先保存在本地。如果你需要公开 URL,还得自己另外处理 CDN 上传。


下一步