OpenAI Codex CLI 是运行在终端中的智能编程助手——它能规划功能、跨整个代码库编写代码、执行 Shell 命令,并将成果交付给你。
与 GitHub Copilot(提供行内建议)不同,Codex CLI 以自主方式运行。你描述目标,它读取代码库、规划实现方案、编写文件、运行测试,然后向你汇报结果。整个闭环,全在终端内完成。
以下是你在 2026 年需要了解的关于 Codex CLI 的一切——安装、配置、扩展与集成。
什么是 OpenAI Codex CLI?
Codex CLI 是 OpenAI 于 2025 年 4 月推出的智能编程工具,并持续更新至 2026 年。它与早期「Codex」产品(API 模型)有一个核心区别:它会执行操作,而不仅仅是给出建议。
Codex CLI 能做什么:
- 将整个代码仓库作为上下文(而不仅仅是当前打开的文件)
- 在编写任何代码之前,先规划多步骤实现方案
- 执行 Shell 命令(
npm test、git commit、make build) - 跨目录编写、编辑和重构文件
- 循环运行,直到测试通过或出现阻塞性问题
它原生不支持的功能:
- 生成图片或视频
- 搜索网络
- 在云端存储或共享文件
- 在没有自定义集成的情况下调用外部 API
这些限制是有意设计的——同时也是可扩展的。下文详述。

如何安装 Codex CLI
环境要求: Node.js 18+、OpenAI API 密钥、macOS 或 Linux(Windows 通过 WSL 支持)。推荐使用 Node.js 20 LTS 以获得最佳兼容性。
npm i -g @openai/codex
设置 API 密钥:
export OPENAI_API_KEY=sk-...
或将其添加到 Shell 配置文件(~/.zshrc、~/.bashrc)以在会话间持久保存。
验证安装:
codex --version

如何配置 Codex CLI
Codex CLI 从 ~/.codex/config.json 读取配置。创建或编辑此文件:
{
"model": "gpt-4.5",
"notify": true,
"approvalMode": "suggest"
}
主要配置项说明:
| 选项 | 可选值 | 作用 |
|---|---|---|
model |
gpt-4.5、o3、o4-mini |
用于规划和代码生成的模型 |
approvalMode |
suggest、auto-edit、full-auto |
Codex 在无需你审批的情况下自主操作的程度 |
notify |
true / false |
任务完成后发送桌面通知 |
context |
路径或 auto |
额外引入的上下文文件 |
approvalMode 详解:
suggest——Codex 提出每项更改,由你手动审批。适合生产环境代码仓库。auto-edit——Codex 无需审批即可编辑文件,但在执行 Shell 命令前会询问。full-auto——Codex 自主完成整个规划和执行闭环。最适合隔离的任务或干净的分支。
Codex CLI 核心功能
以下是 Codex 开箱即用的能力——无需任何扩展:
1. 智能代码实现
codex "Add a rate limiter middleware to the Express API — 100 req/min per IP, return 429 with Retry-After header"
Codex 读取项目结构,定位正确的文件,编写中间件,将其接入 app.js,并添加测试。
2. 全仓库重构
codex "Migrate all fetch() calls in /src to use the axios wrapper in lib/http.js"
Codex 在整个代码库中找到所有实例,统一改写,并运行测试套件。
3. 测试生成
codex "Generate Jest tests for every exported function in /src/utils — aim for 80% branch coverage"
4. Shell 命令链式执行
Codex 可以自然地链式执行命令:
npm run build && anycap video generate --prompt "product demo" --model veo-3.1 -o demo.mp4 && git add . && git commit -m "add demo"
它了解每条命令的输出并据此调整策略。如果 npm run build 失败,它会诊断错误,而不是继续执行。
5. 文档生成
codex "Write a README for this project — setup instructions, API reference, and examples"
扩展 Codex CLI:能力层
Codex 有意将自身限定在编程任务范围内。视频生成、图片创作、网络搜索和云存储并不内置——它们存在于一个能力层中,Codex 通过技能(Skills)或 MCP 服务器来调用。
MCP 服务器
模型上下文协议(Model Context Protocol)服务器让 Codex 能够调用外部工具,就像这些工具是内置的一样。每个 MCP 服务器负责一项能力——视频 API、数据库、浏览器自动化工具等。
代价是:每个服务器都需要独立的配置、认证和维护。如果你需要视频 + 图片 + 搜索 + 存储,那就是四个服务器。
技能(CLI 方式)
技能是 Codex 能够识别并通过 Shell 命令调用的 CLI 工具。这是最简单的扩展方式:安装一个 CLI,Codex 就能调用它。
AnyCap 是一次安装即可填补全部能力空缺的技能——配置时间不超过 60 秒:
- 视频生成(Veo 3.1、Sora 2 Pro、Kling 3.0、Seedance 2.0)
- 图片生成(GPT Image 2、Seedream 5、Flux)
- 带引用的网络搜索
- 云存储与文件共享
npm i -g anycap
anycap login
anycap skill install --target ~/.codex/skills/anycap-cli/
安装完成后,Codex 会将所有 anycap 命令识别为可用操作。
Codex + AnyCap 能做什么
生成产品演示视频
anycap video generate \
--prompt "a smooth walkthrough of a SaaS dashboard, clean UI, soft lighting" \
--model veo-3.1 \
-o demo.mp4
Codex 实现功能,AnyCap 生成演示视频。同一个终端会话内完成。
→ 完整指南:如何用 Codex 生成视频
为构建生成图片
anycap image generate \
--prompt "product hero shot, dark UI, floating interface, product photography" \
--model gpt-image-2 \
-o hero.png
→ 完整指南:如何用 Codex 生成图片
搜索网络获取最新信息
anycap search --prompt "best practices for API rate limiting 2026" --citations
Codex 获得带引用的结构化搜索结果,为代码生成提供真实可靠的依据。
→ 完整指南:Codex 网络搜索指南 2026
存储和共享生成的文件
anycap drive upload demo.mp4
返回可共享链接。Codex 可将其嵌入它生成的文档中。
Codex CLI vs. Claude Code vs. Cursor
| Codex CLI | Claude Code | Cursor | |
|---|---|---|---|
| 主要界面 | 终端 | 终端 | IDE(VS Code) |
| 模型 | GPT-4.5 / o3 / o4-mini | Claude 3.7 / 4 | GPT-4o / Claude |
| 仓库上下文 | 完整仓库 | 完整仓库 | 文件/文件夹范围 |
| Shell 执行 | 支持 | 支持 | 有限支持 |
| 生态系统 | OpenAI 原生 | Anthropic 原生 | 多模型 |
| AnyCap 支持 | ✅ ~/.codex/skills/ |
✅ ~/.claude/skills/ |
✅ ~/.cursor/skills/ |
| 最适合 | OpenAI 生态、自主循环 | 长推理任务、子代理并行 | IDE 内编辑 + 生成 |
相同的 anycap 命令在三款工具中均可使用——安装路径不同,能力完全一致。
Codex CLI + OpenAI 生态:完整技术栈
如果你正在使用 OpenAI 进行端到端开发:
# 1. Research (web-grounded)
anycap search --prompt "competitor features for project management SaaS 2026" --citations
# 2. Plan + implement (Codex)
codex "Add the top 3 missing features identified in the research to our roadmap page"
# 3. Generate visuals (GPT Image 2, via AnyCap)
anycap image generate --prompt "roadmap hero, timeline graphic, product UI" --model gpt-image-2 -o roadmap-hero.png
# 4. Generate demo video (Sora 2 Pro, via AnyCap)
anycap video generate --prompt "product roadmap walkthrough" --model sora-2-pro --mode image-to-video --param images=./roadmap-hero.png -o demo.mp4
# 5. Store and share
anycap drive upload demo.mp4
Codex + GPT Image 2 + Sora 2 Pro + AnyCap 搜索——全部 OpenAI 原生或兼容,通过一个 CLI 统一调度。
常见问题
Codex CLI 免费吗?
Codex CLI 本身免费安装。你需要为 OpenAI 账户的 API 用量付费。费用取决于模型选择——o4-mini 处理典型任务约为每次会话 $0.003–0.01,而 o3 更适合复杂推理任务,约为每次会话 $0.05–0.15。AnyCap 为新用户提供 250 个免费额度,足够体验约 22 次图片生成或 5 个短视频。
Codex CLI 和 Codex API 有什么区别?
Codex API(2021–2023 年可用)是代码补全模型——你发送提示,得到补全结果。Codex CLI(2025 年起)是一个智能系统:它读取你的代码库、规划实现方案、执行 Shell 命令,并端到端交付代码。两者是完全不同的范式。
Codex CLI 支持 Windows 吗?
支持,通过 WSL(适用于 Linux 的 Windows 子系统)。原生 Windows 支持有限;推荐使用 WSL 2 + Ubuntu。
approvalMode: full-auto 是什么,何时使用?
Full-auto 意味着 Codex 执行整个计划——文件编辑、Shell 命令、测试运行——每一步都无需你审批。建议在隔离的功能分支上使用,不要在主分支或生产仓库上未经审查直接使用。
Codex CLI 可以与 Claude Code 并行使用吗?
可以。它们是拥有各自配置的独立工具。一些团队用 Codex 处理主要实现循环(OpenAI 模型),用 Claude Code 处理较长的推理任务或并行子代理工作流。AnyCap 对两者的支持完全一致。
如何为 Codex CLI 添加视频生成能力?
安装 AnyCap(npm i -g anycap && anycap login),然后运行 anycap skill install --target ~/.codex/skills/anycap-cli/。之后,Codex 就能识别 anycap video generate 为可用命令。完整指南:Codex 视频生成。
总结
Codex CLI 是 2026 年最强大的终端原生编程智能体。安装配置完成后,它能自主完成整个编程闭环——在一次无人值守的会话中完成规划、编写、测试和提交。
能力缺口——媒体生成、网络搜索、云存储——通过安装一次 AnyCap 即可填补。同一个 CLI,同一个会话,完整的流水线。使用 Codex + AnyCap 的团队反映,他们能在单个终端会话中完成从功能到演示的完整循环(代码 → 图片 → 视频),而此前这需要 3–4 个独立工具。
📖 推荐延伸阅读
- 如何用 Codex 生成视频:2026 完整指南 — 视频生成流水线:Veo 3.1、Sora 2 Pro、Kling 3.0、Seedance 2.0。
- 如何用 Codex 生成图片:2026 完整指南 — Codex 图片生成:GPT Image 2、Seedream 5 及更多。
- Codex 网络搜索指南 2026 — 为 Codex 工作流添加实时网络研究能力。
- 2026 年最佳 AI 视频模型对比 — Veo 3.1 vs Seedance vs Kling vs Sora:哪个模型最适合你的工作流。
- 什么是 Capability Runtime? — 为 Codex 提供媒体和搜索能力的基础设施层。
相关文章
- 智能 AI 与传统 AI:5 大核心差异 — 为什么工具调用和自主性定义了下一代 AI。
- 什么是 AI 智能体?完整开发者指南 — 智能体架构、工具层以及 Codex 在其中的位置。
由 AnyCap 团队撰写。我们构建 Capability Runtime,通过一个 CLI 为 Codex、Claude Code 和 Cursor 提供视频、图片、搜索和存储能力。