
Pengembang yang membangun dengan agen AI menghadapi keputusan berulang: ketika agen Anda membutuhkan kemampuan di luar kode — pencarian web, pembuatan gambar, video, penyimpanan — bagaimana cara menambahkannya?
Tiga pendekatan mendominasi percakapan: server MCP, Skills, dan capability runtime. Mereka sering diposisikan sebagai pesaing. Padahal tidak. Mereka menyelesaikan masalah berbeda di lapisan stack yang berbeda.
Berikut cara memilihnya.
Tiga Lapisan, Didefinisikan
Server MCP: Lapisan Transport
MCP (Model Context Protocol) adalah standar terbuka tentang bagaimana agen AI terhubung ke alat eksternal. Server MCP adalah program ringan yang mengekspos sekumpulan alat — pencarian, kueri database, operasi file — yang dapat dipanggil oleh agen yang kompatibel dengan MCP.
MCP menyelesaikan masalah koneksi: bagaimana agen menemukan dan memanggil alat eksternal? Ini menstandarisasi antarmuka. Alih-alih setiap alat memiliki protokolnya sendiri, semuanya menggunakan MCP.
Skills: Lapisan Instruksi
Skills (juga disebut agent skills atau file SKILL.md) adalah dokumen markdown yang mengajarkan agen cara menggunakan alat atau melakukan tugas. Sebuah Skill berkata: "ini cara menginstal CLI, ini perintah yang tersedia, ini yang harus dilakukan saat Anda mendapatkan error."
Skills menyelesaikan masalah instruksi: bagaimana agen tahu apa yang harus dilakukan dengan alat setelah terhubung? Tanpa Skill, agen melihat alat tetapi tidak memahami alur kerjanya.
Capability Runtime: Lapisan Bundling
Capability runtime adalah CLI (atau API) tunggal yang menggabungkan beberapa kemampuan — pembuatan gambar, video, pencarian web, penyimpanan cloud, penerbitan — di balik satu endpoint. Alih-alih mengonfigurasi lima server MCP terpisah, Anda cukup menginstal satu alat.
Capability runtime menyelesaikan masalah konsolidasi: bagaimana Anda memberi agen banyak kemampuan tanpa tenggelam dalam konfigurasi, kredensial, dan overhead token?
Diagram Lapisan
┌─────────────────────────────────────────────┐
│ Agen AI Anda │
│ (Claude Code, Cursor, Codex, Windsurf) │
├─────────────────────────────────────────────┤
│ │
│ ┌─────────┐ ┌─────────┐ ┌─────────────┐ │
│ │ MCP │ │ Skills │ │ Capability │ │
│ │ Server │ │ (SKILL) │ │ Runtime │ │
│ │ │ │ │ │ │ │
│ │Hubungkan│ │ Ajarkan │ │ Gabungkan │ │
│ │ alat │ │ agen │ │ kemampuan │ │
│ └─────────┘ └─────────┘ └─────────────┘ │
│ │
│ Transport Instruksi Konsolidasi │
│ Lapisan Lapisan Lapisan │
└─────────────────────────────────────────────┘
Tidak ada lapisan yang menggantikan yang lain. Bahkan, mereka bekerja paling baik bersama-sama:
- MCP menghubungkan agen Anda ke capability runtime
- Skills mengajarkan agen Anda cara menggunakan perintah runtime
- Runtime menggabungkan kemampuan sehingga hanya ada satu hal yang perlu dihubungkan dan diajarkan
Kapan Menggunakan Masing-Masing
Gunakan Server MCP Saja Ketika:
Anda membutuhkan satu atau dua alat spesifik yang memiliki server MCP yang terawat baik. Misalnya, menghubungkan agen Anda ke database internal perusahaan melalui server MCP kustom. Atau menambahkan integrasi GitHub melalui server MCP yang sudah ada.
MCP saja masuk akal ketika:
- Anda hanya membutuhkan 1–2 kemampuan
- Kemampuannya terspesialisasi (database Anda, API Anda, Jira Anda)
- Anda memiliki dukungan DevOps untuk memelihara konfigurasi server
- Overhead token dari 1–2 server dapat diabaikan
Gunakan Skills Ketika:
Anda ingin agen Anda memahami alur kerja, bukan hanya mengakses alat. Sebuah Skill tidak hanya mencantumkan perintah — ia mengajarkan agen urutannya: instal, autentikasi, konfigurasi, verifikasi, gunakan.
Skills sangat penting ketika:
- Alat memiliki proses setup multi-langkah
- Penanganan error penting ("jika Anda mendapat error X, coba Y")
- Anda ingin agen mandiri dengan alat tersebut
- Anda membagikan alur kerja ke seluruh tim
Gunakan Capability Runtime Ketika:
Anda membutuhkan 4+ kemampuan dan overhead konfigurasi mulai tidak terkendali. Ini adalah skenario paling umum untuk pengembang individu dan tim kecil.
Capability runtime masuk akal ketika:
- Agen Anda membutuhkan gambar, video, pencarian, penyimpanan, dan penerbitan
- Anda tidak ingin mengelola 6 kunci API dan 5 konfigurasi server MCP
- Overhead token dari banyak server mulai memengaruhi kinerja agen
- Anda ingin satu instalasi, satu kredensial, satu format output
Pendekatan Hibrida (Yang Sebenarnya Digunakan Kebanyakan Tim)
Dalam praktiknya, pengaturan terbaik biasanya adalah hibrida:
Server MCP (alat khusus) + Capability Runtime (kemampuan umum) + Skills (instruksi alur kerja)
Agen Anda terhubung ke:
- 1–2 server MCP untuk alat internal atau khusus (database, Slack, Jira)
- 1 capability runtime untuk kemampuan umum (gambar, video, pencarian, penyimpanan, penerbitan)
- 1 file Skill yang mengajarkan agen cara menggunakan runtime
Ini memberi Anda yang terbaik untuk kebutuhan unik dan overhead minimal untuk yang lainnya.
Realita Token
Pendekatan hibrida tidak hanya lebih bersih secara konseptual — tetapi memiliki dampak yang terukur. Setiap server MCP menambahkan deskripsi alat ke konteks agen Anda. Dengan 5 server MCP, Anda membakar 15.000–40.000 token hanya untuk deskripsi alat.
Pengaturan hibrida dengan 2 server MCP + 1 capability runtime menurunkannya menjadi sekitar 8.000–14.000 token. Itu berarti 10–15% lebih banyak konteks yang terbebas untuk pekerjaan nyata.
Kesalahan Umum
Kesalahan 1: Mengira MCP Sudah Cukup
MCP menghubungkan alat. Ia tidak menggabungkannya, mengelola kredensialnya, atau mengurangi overhead token-nya. Jika Anda menjalankan 5+ server MCP, agen Anda membayar pajak pada setiap server.
Kesalahan 2: Mengira Skills Menggantikan Alat
Skills mengajarkan alur kerja. Mereka tidak menyediakan kemampuan. Sebuah Skill dapat memberi tahu agen Anda cara membuat gambar — tetapi agen tetap membutuhkan alat pembuat gambar yang sebenarnya di baliknya.
Kesalahan 3: Mengira Runtime Menggantikan MCP
Capability runtime mengkonsolidasikan kemampuan umum. Mereka tidak menggantikan kebutuhan akan integrasi khusus. Agen Anda tetap membutuhkan MCP untuk terhubung ke database internal atau Jira Anda. Runtime menangani kemampuan generik yang dimiliki bersama oleh kebanyakan agen.
Keputusan dalam Satu Tabel
| Anda membutuhkan... | Gunakan... |
|---|---|
| 1–2 alat khusus | Server MCP |
| Agen memahami alur kerja | Skills |
| 4+ kemampuan umum | Capability runtime |
| Semua di atas | Hibrida: MCP + Runtime + Skills |
Intinya
Perdebatan MCP vs Skills vs Capability Runtime melewatkan intinya. Ini adalah tiga lapisan dari stack yang sama, bukan tiga pendekatan yang bersaing.
MCP adalah port USB-C. Skills adalah buku panduan. Capability runtime adalah perangkat yang dicolokkan.
Agen Anda membutuhkan ketiganya. Pertanyaannya bukan yang mana — tetapi seberapa banyak masing-masing.
Terakhir diperbarui: Mei 2026