Model
Terakhir diperbarui 5 April 2026
Pilih model yang tepat
untuk pekerjaan agen.
AnyCap menampilkan model multimodal melalui satu runtime kapabilitas dan satu CLI. Halaman ini membantu tim memilih model yang tepat untuk alur kerja agen tertentu, bukan memperlakukan setiap permintaan gambar atau video dengan cara yang sama.
Ringkasan langsung ke inti
Katalog model publik AnyCap saat ini mencakup model pembuatan gambar untuk output awal dan putaran revisi, model pembuatan video untuk pekerjaan gerakan yang lebih premium atau ramah produksi, serta model musik berbasis prompt untuk draf soundtrack. Pilihan yang tepat biasanya bergantung pada apakah pekerjaan dimulai dari prompt kosong atau aset yang sudah ada, seberapa rapi hasil pertama yang dibutuhkan, dan seberapa penting kecepatan atau efisiensi biaya di alur kerja.
Cara memilih model yang tepat
- Mulailah dari jenis output: gambar, video, atau musik.
- Lalu tentukan apakah tugas membutuhkan hasil awal yang lebih rapi, iterasi yang lebih cepat, atau revisi dari aset yang sudah ada.
- Gunakan halaman panduan model saat pilihannya bergantung pada gaya gerak, alur pengeditan, atau tradeoff biaya.
Panduan visual

Ilustrasi ini adalah peta visual cepat dari katalog saat ini: model gambar di satu sisi, model video di sisi lain, dan pembuatan musik sebagai jalur kapabilitas terpisah di dalam runtime agen yang sama. Ilustrasi ini dibuat dengan Nano Banana 2 agar bahasa visual halaman tetap selaras dengan katalog model itu sendiri.
Perbandingan model saat ini
Ini adalah model publik saat ini yang diekspos melalui AnyCap. Rentang kredit berasal dari inventaris harga yang sama yang dipakai di halaman harga, sehingga hub dan halaman harga tetap selaras.
Pembuatan gambar
Dikenakan per panggilan. Mendukung mode text-to-image dan image-to-image.
| Model | Mode | Kredit / panggilan | Paling cocok untuk |
|---|---|---|---|
| Nano Banana Pro | teks ke gambar, gambar ke gambar | ~7 | Pengeditan gambar yang terarah dan putaran revisi dari visual yang sudah ada. |
| Nano Banana 2 | teks ke gambar, gambar ke gambar | ~4 | Pembuatan gambar yang cepat, skala besar, dan iterasi berulang dalam volume tinggi. |
| Seedream 5 | teks ke gambar, gambar ke gambar | ~2 | Pembuatan gambar pertama yang rapi dari prompt teks. |
Pembuatan video
Dikenakan per detik output yang dihasilkan. Mendukung mode text-to-video dan image-to-video.
| Model | Mode | Kredit / dtk | Paling cocok untuk |
|---|---|---|---|
| Veo 3.1 | teks ke video, gambar ke video | ~20 | Output text-to-video premium saat versi pertama perlu terlihat lebih kuat. |
| Seedance 1.5 Pro | teks ke video, gambar ke video | ~14 | Alur video yang stabil, ramah produksi, dan pekerjaan image-to-video yang berulang. |
| Kling 3.0 | teks ke video, gambar ke video | ~9 | Gerakan sinematik dan alur image-to-video yang fleksibel. |
Pembuatan musik
Dikenakan per detik audio yang dihasilkan.
| Model | Mode | Kredit / dtk | Paling cocok untuk |
|---|---|---|---|
| ElevenLabs Music | teks ke musik | ~1 | Draf soundtrack berbasis prompt di dalam runtime agen yang sama. |
Pembuatan gambar
Pembuatan video
Pembuatan musik
FAQ
Bagaimana memilih antara Seedream 5, Nano Banana Pro, dan Nano Banana 2?
Gunakan Seedream 5 ketika alurnya membutuhkan gambar awal yang lebih kuat dari prompt, Nano Banana Pro ketika pekerjaan dimulai dari gambar yang sudah ada dan perlu revisi, dan Nano Banana 2 ketika kecepatan, throughput, atau iterasi berulang lebih penting.
Bagaimana memilih antara Veo 3.1, Kling 3.0, dan Seedance 1.5 Pro?
Gunakan Veo 3.1 ketika versi video pertama perlu terlihat lebih premium dari brief teks, Kling 3.0 ketika alurnya lebih menekankan gerakan sinematik atau kerja image-to-video yang fleksibel, dan Seedance 1.5 Pro ketika tim menginginkan default yang lebih stabil dan berorientasi produksi.
Apakah semua model AnyCap memakai CLI dan alur autentikasi yang sama?
Ya. AnyCap menampilkan model-model ini melalui runtime kapabilitas, CLI, dan alur autentikasi yang sama, jadi tim tidak perlu jalur integrasi penyedia yang terpisah untuk setiap halaman model di sini.