OpenAI Codex CLI:完整开发者指南(2026)

OpenAI Codex CLI 详细教程:安装配置、核心功能、扩展视频生成与网络搜索能力,一篇文章搞定 2026 年 Codex CLI 全栈工作流。

by AnyCap

OpenAI Codex CLI 是运行在终端中的智能编程助手——它能规划功能、跨整个代码库编写代码、执行 Shell 命令,并将成果交付给你。

与 GitHub Copilot(提供行内建议)不同,Codex CLI 以自主方式运行。你描述目标,它读取代码库、规划实现方案、编写文件、运行测试,然后向你汇报结果。整个闭环,全在终端内完成。

以下是你在 2026 年需要了解的关于 Codex CLI 的一切——安装、配置、扩展与集成。


什么是 OpenAI Codex CLI?

Codex CLI 是 OpenAI 于 2025 年 4 月推出的智能编程工具,并持续更新至 2026 年。它与早期「Codex」产品(API 模型)有一个核心区别:它会执行操作,而不仅仅是给出建议。

Codex CLI 能做什么:

  • 将整个代码仓库作为上下文(而不仅仅是当前打开的文件)
  • 在编写任何代码之前,先规划多步骤实现方案
  • 执行 Shell 命令(npm testgit commitmake build
  • 跨目录编写、编辑和重构文件
  • 循环运行,直到测试通过或出现阻塞性问题

它原生不支持的功能:

  • 生成图片或视频
  • 搜索网络
  • 在云端存储或共享文件
  • 在没有自定义集成的情况下调用外部 API

这些限制是有意设计的——同时也是可扩展的。下文详述。


使用 Codex CLI 在终端智能编程环境中工作的开发者

如何安装 Codex CLI

环境要求: Node.js 18+、OpenAI API 密钥、macOS 或 Linux(Windows 通过 WSL 支持)。推荐使用 Node.js 20 LTS 以获得最佳兼容性。

npm i -g @openai/codex

设置 API 密钥:

export OPENAI_API_KEY=sk-...

或将其添加到 Shell 配置文件(~/.zshrc~/.bashrc)以在会话间持久保存。

验证安装:

codex --version

MacBook 终端中 Codex CLI 正在执行多步骤智能任务

如何配置 Codex CLI

Codex CLI 从 ~/.codex/config.json 读取配置。创建或编辑此文件:

{
  "model": "gpt-4.5",
  "notify": true,
  "approvalMode": "suggest"
}

主要配置项说明:

选项 可选值 作用
model gpt-4.5o3o4-mini 用于规划和代码生成的模型
approvalMode suggestauto-editfull-auto Codex 在无需你审批的情况下自主操作的程度
notify true / false 任务完成后发送桌面通知
context 路径或 auto 额外引入的上下文文件

approvalMode 详解:

  • suggest——Codex 提出每项更改,由你手动审批。适合生产环境代码仓库。
  • auto-edit——Codex 无需审批即可编辑文件,但在执行 Shell 命令前会询问。
  • full-auto——Codex 自主完成整个规划和执行闭环。最适合隔离的任务或干净的分支。

Codex CLI 核心功能

以下是 Codex 开箱即用的能力——无需任何扩展:

1. 智能代码实现

codex "Add a rate limiter middleware to the Express API — 100 req/min per IP, return 429 with Retry-After header"

Codex 读取项目结构,定位正确的文件,编写中间件,将其接入 app.js,并添加测试。

2. 全仓库重构

codex "Migrate all fetch() calls in /src to use the axios wrapper in lib/http.js"

Codex 在整个代码库中找到所有实例,统一改写,并运行测试套件。

3. 测试生成

codex "Generate Jest tests for every exported function in /src/utils — aim for 80% branch coverage"

4. Shell 命令链式执行

Codex 可以自然地链式执行命令:

npm run build && anycap video generate --prompt "product demo" --model veo-3.1 -o demo.mp4 && git add . && git commit -m "add demo"

它了解每条命令的输出并据此调整策略。如果 npm run build 失败,它会诊断错误,而不是继续执行。

5. 文档生成

codex "Write a README for this project — setup instructions, API reference, and examples"

扩展 Codex CLI:能力层

Codex 有意将自身限定在编程任务范围内。视频生成、图片创作、网络搜索和云存储并不内置——它们存在于一个能力层中,Codex 通过技能(Skills)或 MCP 服务器来调用。

MCP 服务器

模型上下文协议(Model Context Protocol)服务器让 Codex 能够调用外部工具,就像这些工具是内置的一样。每个 MCP 服务器负责一项能力——视频 API、数据库、浏览器自动化工具等。

代价是:每个服务器都需要独立的配置、认证和维护。如果你需要视频 + 图片 + 搜索 + 存储,那就是四个服务器。

技能(CLI 方式)

技能是 Codex 能够识别并通过 Shell 命令调用的 CLI 工具。这是最简单的扩展方式:安装一个 CLI,Codex 就能调用它。

AnyCap 是一次安装即可填补全部能力空缺的技能——配置时间不超过 60 秒:

  • 视频生成(Veo 3.1、Sora 2 Pro、Kling 3.0、Seedance 2.0)
  • 图片生成(GPT Image 2、Seedream 5、Flux)
  • 带引用的网络搜索
  • 云存储与文件共享
npm i -g anycap
anycap login
anycap skill install --target ~/.codex/skills/anycap-cli/

安装完成后,Codex 会将所有 anycap 命令识别为可用操作。


Codex + AnyCap 能做什么

生成产品演示视频

anycap video generate \
  --prompt "a smooth walkthrough of a SaaS dashboard, clean UI, soft lighting" \
  --model veo-3.1 \
  -o demo.mp4

Codex 实现功能,AnyCap 生成演示视频。同一个终端会话内完成。

→ 完整指南:如何用 Codex 生成视频

为构建生成图片

anycap image generate \
  --prompt "product hero shot, dark UI, floating interface, product photography" \
  --model gpt-image-2 \
  -o hero.png

→ 完整指南:如何用 Codex 生成图片

搜索网络获取最新信息

anycap search --prompt "best practices for API rate limiting 2026" --citations

Codex 获得带引用的结构化搜索结果,为代码生成提供真实可靠的依据。

→ 完整指南:Codex 网络搜索指南 2026

存储和共享生成的文件

anycap drive upload demo.mp4

返回可共享链接。Codex 可将其嵌入它生成的文档中。


Codex CLI vs. Claude Code vs. Cursor

Codex CLI Claude Code Cursor
主要界面 终端 终端 IDE(VS Code)
模型 GPT-4.5 / o3 / o4-mini Claude 3.7 / 4 GPT-4o / Claude
仓库上下文 完整仓库 完整仓库 文件/文件夹范围
Shell 执行 支持 支持 有限支持
生态系统 OpenAI 原生 Anthropic 原生 多模型
AnyCap 支持 ~/.codex/skills/ ~/.claude/skills/ ~/.cursor/skills/
最适合 OpenAI 生态、自主循环 长推理任务、子代理并行 IDE 内编辑 + 生成

相同的 anycap 命令在三款工具中均可使用——安装路径不同,能力完全一致。


Codex CLI + OpenAI 生态:完整技术栈

如果你正在使用 OpenAI 进行端到端开发:

# 1. Research (web-grounded)
anycap search --prompt "competitor features for project management SaaS 2026" --citations

# 2. Plan + implement (Codex)
codex "Add the top 3 missing features identified in the research to our roadmap page"

# 3. Generate visuals (GPT Image 2, via AnyCap)
anycap image generate --prompt "roadmap hero, timeline graphic, product UI" --model gpt-image-2 -o roadmap-hero.png

# 4. Generate demo video (Sora 2 Pro, via AnyCap)
anycap video generate --prompt "product roadmap walkthrough" --model sora-2-pro --mode image-to-video --param images=./roadmap-hero.png -o demo.mp4

# 5. Store and share
anycap drive upload demo.mp4

Codex + GPT Image 2 + Sora 2 Pro + AnyCap 搜索——全部 OpenAI 原生或兼容,通过一个 CLI 统一调度。


常见问题

Codex CLI 免费吗?

Codex CLI 本身免费安装。你需要为 OpenAI 账户的 API 用量付费。费用取决于模型选择——o4-mini 处理典型任务约为每次会话 $0.003–0.01,而 o3 更适合复杂推理任务,约为每次会话 $0.05–0.15。AnyCap 为新用户提供 250 个免费额度,足够体验约 22 次图片生成或 5 个短视频。

Codex CLI 和 Codex API 有什么区别?

Codex API(2021–2023 年可用)是代码补全模型——你发送提示,得到补全结果。Codex CLI(2025 年起)是一个智能系统:它读取你的代码库、规划实现方案、执行 Shell 命令,并端到端交付代码。两者是完全不同的范式。

Codex CLI 支持 Windows 吗?

支持,通过 WSL(适用于 Linux 的 Windows 子系统)。原生 Windows 支持有限;推荐使用 WSL 2 + Ubuntu。

approvalMode: full-auto 是什么,何时使用?

Full-auto 意味着 Codex 执行整个计划——文件编辑、Shell 命令、测试运行——每一步都无需你审批。建议在隔离的功能分支上使用,不要在主分支或生产仓库上未经审查直接使用。

Codex CLI 可以与 Claude Code 并行使用吗?

可以。它们是拥有各自配置的独立工具。一些团队用 Codex 处理主要实现循环(OpenAI 模型),用 Claude Code 处理较长的推理任务或并行子代理工作流。AnyCap 对两者的支持完全一致。

如何为 Codex CLI 添加视频生成能力?

安装 AnyCap(npm i -g anycap && anycap login),然后运行 anycap skill install --target ~/.codex/skills/anycap-cli/。之后,Codex 就能识别 anycap video generate 为可用命令。完整指南:Codex 视频生成


总结

Codex CLI 是 2026 年最强大的终端原生编程智能体。安装配置完成后,它能自主完成整个编程闭环——在一次无人值守的会话中完成规划、编写、测试和提交。

能力缺口——媒体生成、网络搜索、云存储——通过安装一次 AnyCap 即可填补。同一个 CLI,同一个会话,完整的流水线。使用 Codex + AnyCap 的团队反映,他们能在单个终端会话中完成从功能到演示的完整循环(代码 → 图片 → 视频),而此前这需要 3–4 个独立工具。


为 Codex 添加完整能力——免费安装 AnyCap


📖 推荐延伸阅读


相关文章


由 AnyCap 团队撰写。我们构建 Capability Runtime,通过一个 CLI 为 Codex、Claude Code 和 Cursor 提供视频、图片、搜索和存储能力。