Codex CLI로 개발하고 있습니다. 구현을 계획하고, 코드를 작성하고, 테스트를 실행합니다. 그런데 제품 히어로 이미지나 UI 목업을 생성해 달라고 하면?
Codex가 멈춥니다. 이미지 생성은 기본 툴킷에 포함되어 있지 않습니다——Claude Code, Cursor, 그리고 다른 모든 코딩 에이전트와 동일한 한계입니다.
Codex에 이미지 생성을 추가하는 방법을 소개합니다. 수동 통합부터 단일 명령어까지, 세 가지 방법입니다.
Codex에 기본 이미지 생성이 없는 이유
Codex는 OpenAI의 에이전틱 코딩 도구입니다. 클라우드 샌드박스에서 작업을 실행하고, 파일 전반을 계획하고, 터미널 명령어를 실행하며, 전체 개발 루프를 처리합니다. 이미지 생성은 별도의 모델 패밀리——GPT Image 2, Seedream 5, FLUX.1, DALL-E——로, 다른 인프라에서 실행되고, 독립적으로 업데이트되며, 자체 API를 필요로 합니다.
이 격차는 의도적입니다. Codex는 코드에 집중하고, 기능 레이어는 외부에 있습니다. 문제는 그 기능이 얼마나 깔끔하게 연결되느냐입니다.
Codex + 이미지 생성으로 무엇이 가능한가
Codex에 이미지 생성을 추가하면, 비주얼이 빌드 파이프라인의 일부가 됩니다——나중에 추가하는 게 아니라:
- 랜딩 페이지 히어로 이미지. Codex가 페이지를 빌드하고, 히어로 이미지를 생성하고, URL을 삽입합니다——같은 세션에서.
- UI 목업과 디자인 레퍼런스. 디자인 방향을 설명하면 터미널을 벗어나지 않고 시각적 레퍼런스를 얻습니다.
- 온디맨드 런치 에셋. 소셜 그래픽, 공지 비주얼, OG 이미지——에이전트가 홍보할 것을 빌드할 때 함께 생성합니다.
- 이미지-투-비디오 파이프라인. 스틸 이미지를 생성한 뒤 애니메이션으로 만들어보세요. 동일한 CLI가 두 단계를 모두 처리합니다. 이미지-투-비디오 파이프라인 완전 가이드를 확인하세요.
방법 1: 직접 API 통합
Codex는 셸 명령어를 실행할 수 있습니다. 이미지 생성 API에 직접 연결할 수 있습니다.
1단계: 공급자 선택. GPT Image 2(OpenAI), Seedream 5(ByteDance), FLUX.1 Kontext Max(Black Forest Labs), DALL-E 3(OpenAI). 각각 고유한 API 형식이 있습니다.
2단계: API 인증 정보 획득. 공급자마다 별도의 개발자 콘솔, 별도의 API 키, 별도의 청구 계정이 있습니다.
3단계: 통합 스크립트 작성. Codex가 프롬프트와 함께 스크립트를 호출합니다. 스크립트는 인증, POST 요청, 생성 작업에 대한 비동기 폴링, 파일 다운로드, 출력 처리를 담당합니다.
4단계: 형식 차이 처리. 공급자마다 다른 응답 형식을 반환합니다. Base64, URL, 서명된 CDN 링크——정규화는 직접 처리해야 합니다.
작동은 합니다. 하지만 결국 이미지를 생성하는 대신 통합 코드를 유지 관리하게 됩니다.
방법 2: 이미지 생성을 위한 MCP 서버
MCP 서버를 사용하면 Codex가 표준 프로토콜을 통해 외부 기능을 호출할 수 있습니다:
- Replicate MCP — 수백 개의 이미지 모델에 액세스
- FAL.ai MCP — Flux 모델의 빠른 추론
- Stability MCP — Stable Diffusion 변형 모델
서버당 한 번만 설정하면 됩니다. Codex가 다른 도구처럼 호출합니다. 직접 API 연결보다 가볍습니다.
한계: 단일 공급자 MCP 서버는 해당 공급자의 모델 선택에 묶입니다. GPT Image 2 출력과 Seedream 5를 비교하려면 두 번째 서버를 추가해야 합니다.
방법 3: Codex, Claude Code, Cursor를 위한 단일 CLI
에이전트가 원하는 이미지 모델에 관계없이 하나의 명령어를 호출하는 방법입니다:
anycap image generate \
--prompt "a modern SaaS dashboard on a MacBook, floating UI elements, soft studio lighting, product photography style" \
--model seedream-5 \
-o hero.jpg
--model seedream-5를 --model gpt-image-2, --model flux-kontext-max, 또는 --model nano-banana-2로 변경하면——같은 명령어, 다른 모델. Codex, Claude Code, Cursor 모두 같은 CLI를 호출합니다.
Codex용 설치:
npx -y skills add anycap-ai/anycap -a codex -y
anycap login && anycap status
설치 후 Codex는 셸 환경에서 anycap image generate를 사용 가능한 명령어로 인식합니다.
→ AnyCap 무료 설치 — 신규 사용자 250 크레딧 제공
AnyCap으로 이용 가능한 이미지 모델
| 모델 | 공급자 | 최적 용도 |
|---|---|---|
| Seedream 5 | ByteDance | 최고 품질 초안. 제품 사진, 히어로 이미지, 상세한 장면. |
| GPT Image 2 | OpenAI | 네이티브 OpenAI 생태계 적합성. UI 스크린샷과 깔끔한 제품 샷에 강점. |
| FLUX.1 Kontext Max | Black Forest Labs | 디자인 중심 작업, 타이포그래피, 그래픽 요소. |
| Nano Banana Pro | 수정 루프에 최적——빠르게 생성하고 편집 내용을 잘 유지합니다. | |
| Nano Banana 2 | 빠른 탐색. 최종 모델을 결정하기 전 볼륨 생성과 방향 테스트용. |
Codex에서 텍스트-투-이미지: 프롬프트로 이미지 생성
가장 간단한 경우——필요한 것을 설명하고 이미지를 받습니다:
anycap image generate \
--prompt "a developer dashboard interface, dark theme, neon blue accent color, floating data cards, clean modern UI, product screenshot style" \
--model seedream-5 \
-o dashboard-hero.jpg
Codex 사용자를 위한 모델 선택 가이드:
| Codex 작업 | 최적 모델 | 이유 |
|---|---|---|
| 제품 스크린샷, 히어로 이미지 | Seedream 5 | 최고의 초안 품질——Codex가 코딩했다면, 이미지도 그 품질에 맞아야 합니다 |
| UI 목업, 디자인 레퍼런스 | Nano Banana Pro | 최종 비주얼을 결정하기 전 반복 작업을 위한 빠른 생성 |
| 소셜 그래픽, 공지 | GPT Image 2 | OpenAI 생태계 적합성——Codex + GPT Image 2는 OpenAI 스택에서 엔드-투-엔드 유지 |
| 디자인 중심, 타이포그래피 | FLUX.1 Kontext Max | 사진 최적화 모델보다 그래픽 디자인 요소 처리 우수 |
| 볼륨, 빠른 탐색 | Nano Banana 2 | 하나를 선택하기 전에 5가지 방향이 빠르게 필요할 때 |
Codex에서 이미지 편집: 기존 이미지 수정
승인된 제품 스크린샷이나 디자인 에셋이 있고, 처음부터 다시 생성하지 않고 수정이 필요할 때——배경 변경, 텍스트 업데이트, 색상 조정:
anycap image generate \
--prompt "replace the background with a clean white studio background, keep the product interface exactly as-is" \
--model nano-banana-pro \
--mode edit \
--param images=./dashboard-screenshot.jpg \
-o dashboard-clean.jpg
재생성보다 편집이 나은 경우:
- 승인된 제품 스크린샷이 있지만 다른 시장을 위해 배경이 필요
- 기존 그래픽의 텍스트나 레이블을 업데이트하고 싶을 때
- 완성된 에셋의 여러 색상 변형이 필요할 때
완전한 Codex 파이프라인: 코드 → 이미지 → 비디오 → 배포
Codex는 셸 명령어를 자연스럽게 연결합니다. AnyCap CLI가 이 패턴에 딱 맞습니다:
# 1. Codex가 랜딩 페이지 빌드
# ...(Codex 자체 작업)
# 2. 히어로 이미지 생성 (OpenAI 네이티브: GPT Image 2)
anycap image generate \
--prompt "product hero shot for a developer tool, dark background, code editor interface, neon accents" \
--model gpt-image-2 \
-o hero.jpg
# 3. 히어로를 모션 티저로 애니메이션 (OpenAI 네이티브: Sora 2 Pro)
anycap video generate \
--prompt "slow camera push-in, code highlights animate, subtle parallax background" \
--model sora-2-pro \
--mode image-to-video \
--param images=./hero.jpg \
-o teaser.mp4
# 4. 저장 및 공유
anycap drive upload hero.jpg teaser.mp4
Codex가 생성, 애니메이션, 저장을 완료했습니다——원한다면 모두 OpenAI 네이티브로, 또는 하나의 플래그를 변경해 공급자를 혼합할 수 있습니다.
Codex + AnyCap이 자연스러운 조합인 이유
AnyCap 통합이 Codex 워크플로우에 특히 깔끔한 세 가지 이유:
1. CLI 네이티브 설계. Codex는 셸 명령어를 실행합니다. anycap image generate는 그냥 또 다른 셸 명령어입니다. 새로운 패러다임 없음. 초기화할 API 클라이언트 없음. Codex가 npm test나 git push와 같은 방식으로 &&로 연결합니다.
2. OpenAI 생태계 정렬. 팀이 이미 OpenAI 우선——코드에 Codex, 이미지에 GPT Image 2, 비디오에 Sora 2 Pro——이라면, AnyCap이 세 가지 모두를 하나의 CLI를 통해 라우팅합니다. 하지만 혼합도 가능: 새 API 키 없이 다른 출력을 원할 때 --model seedream-5 또는 --model flux-kontext-max.
3. 에이전트 간 동일한 명령어. 설치 대상이 바뀌지만(~/.codex/skills/ vs ~/.claude/skills/), 명령어는 동일합니다:
anycap image generate --prompt "..." --model seedream-5 -o output.jpg
같은 CLI. 같은 인증. 같은 모델. 재구성 없이 Codex, Claude Code, Cursor 간 전환.
크로스 에이전트: 같은 명령어, 다른 에이전트
| 에이전트 | 스킬 디렉토리 | 이미지 생성의 고유 장점 |
|---|---|---|
| Codex | ~/.codex/skills/ |
CLI 네이티브, OpenAI 생태계 정렬, 원활한 셸 체이닝 |
| Claude Code | ~/.claude/skills/ |
서브에이전트 병렬 처리——여러 모델 동시 비교 |
| Cursor | ~/.cursor/skills/ |
IDE 내부: 하나의 에이전트 액션으로 이미지 생성, 삽입, 확인 |
자주 묻는 질문
Codex가 이미지 생성을 기본 지원하나요?
아니요. Codex는 OpenAI의 에이전틱 코딩 도구——계획, 구현, 코드 배포를 합니다. 이미지 생성은 외부 모델이 필요합니다. AnyCap은 GPT Image 2, Seedream 5, FLUX.1, Nano Banana를 하나의 CLI 뒤에 묶습니다.
Codex 사용자는 어떤 이미지 모델부터 시작해야 하나요?
제품 이미지의 최고 품질 초안에는 Seedream 5. OpenAI 생태계에 완전히 머물고 싶다면 GPT Image 2(Codex → GPT Image 2 → Sora 2 Pro는 깔끔한 OpenAI 네이티브 파이프라인). 완벽함보다 볼륨이 필요할 때 빠른 탐색에는 Nano Banana 2.
이미지와 비디오 생성 모두에 같은 AnyCap 설치를 사용할 수 있나요?
네. 같은 CLI가 두 가지를 모두 처리합니다. anycap image generate와 anycap video generate는 같은 인증, 같은 크레딧, 같은 출력 처리를 공유합니다. 이미지-투-비디오 파이프라인은 두 개의 별도 도구 설정이 아닌 하나의 워크플로우입니다.
다른 이미지 모델에 별도의 API 키가 필요한가요?
AnyCap으로는 필요하지 않습니다. 하나의 키로 GPT Image 2(OpenAI), Seedream 5(ByteDance), FLUX.1(Black Forest Labs), Nano Banana(Google)를 모두 커버합니다. 런타임이 공급자 인증 정보를 내부적으로 관리합니다.
Codex가 이미지 생성을 다른 셸 명령어와 연결할 수 있나요?
네——Codex는 이를 위해 만들어졌습니다. npm run build && anycap image generate --prompt "..." -o hero.jpg && git add . && git commit -m "add hero". Codex는 셸 파이프라인으로 생각합니다. 이미지 생성은 그냥 또 다른 단계입니다.
Codex 자동화나 CI 파이프라인에서 이미지 생성을 사용할 수 있나요?
네. AnyCap은 헤드리스——UI 불필요. ANYCAP_API_KEY 환경 변수를 설정하고 Codex가 자동화 작업을 실행하는 모든 셸 컨텍스트에서 anycap image generate를 호출하세요.
결론
Codex는 기능을 계획하고, 코드를 작성하고, 테스트를 실행하고, 배포합니다. 이미지는 만들 수 없습니다——그것은 의도된 설계입니다.
문제는 두 가지를 어떻게 연결하느냐입니다. 공급자마다 별도의 API 키와 모델마다 통합 스크립트, 아니면 기존 Codex 셸 워크플로우에 자연스럽게 연결되는 하나의 CLI 명령어.
→ Codex에 이미지 생성 추가——한 번 설치로 모든 모델
📖 다음에 읽을 글
- Codex로 비디오 생성하는 방법: 2026 완전 가이드 — 다음 단계: 생성한 이미지를 비디오 클립으로 애니메이션화.
- AI 이미지-투-비디오: 코딩 에이전트를 위한 완전 파이프라인 — 이미지-투-비디오 워크플로우의 모델 페어링 매트릭스.
- 코딩 에이전트를 위한 최고의 AI 비디오 모델 비교 — 이미지를 애니메이션화할 비디오 모델 선택.
- Claude Code로 이미지 생성하는 방법 (2026) — 이 가이드의 Claude Code 버전.
- Capability Runtime이란 무엇인가? — 이미지, 비디오, 검색, 스토리지를 하나의 CLI로 묶는 인프라.
관련 글
- 터미널 에이전트 대결: Claude Code vs Codex CLI vs Windsurf — Codex와 다른 터미널 에이전트 비교.
- AI 에이전트란 무엇인가? 개발자 완전 가이드 — 에이전트 기초: 왜 도구가 에이전트를 만드는가.
- Claude Code에 클라우드 스토리지 추가하는 방법 — 생성한 이미지를 저장하고 에이전트에서 공유.
AnyCap 팀이 작성했습니다. 저희는 하나의 CLI를 통해 Codex에 이미지 생성 기능을 제공하는 Capability Runtime을 구축합니다——에이전트가 "비주얼을 만들 수 없습니다"에서 멈추지 않도록.