
Entwickler, die mit KI-Agenten arbeiten, stehen immer wieder vor derselben Entscheidung: Wenn Ihr Agent Fähigkeiten jenseits von Code benötigt — Websuche, Bildgenerierung, Video, Speicher — wie fügen Sie diese hinzu?
Drei Ansätze dominieren die Diskussion: MCP-Server, Skills und Capability Runtimes. Sie werden oft als Konkurrenten dargestellt. Das sind sie nicht. Sie lösen unterschiedliche Probleme auf verschiedenen Ebenen des Stacks.
So treffen Sie die richtige Wahl.
Die drei Schichten, definiert
MCP-Server: Die Transportschicht
MCP (Model Context Protocol) ist ein offener Standard dafür, wie KI-Agenten sich mit externen Werkzeugen verbinden. Ein MCP-Server ist ein schlankes Programm, das eine Reihe von Tools bereitstellt — Suche, Datenbankabfragen, Dateioperationen — die jeder MCP-kompatible Agent aufrufen kann.
MCP löst das Verbindungsproblem: Wie entdeckt und nutzt ein Agent externe Werkzeuge? Es standardisiert die Schnittstelle. Statt dass jedes Tool sein eigenes Protokoll hat, sprechen alle MCP.
Skills: Die Anleitungsschicht
Skills (auch Agent Skills oder SKILL.md-Dateien genannt) sind Markdown-Dokumente, die einem Agenten beibringen, wie er ein Werkzeug einsetzt oder eine Aufgabe erledigt. Ein Skill sagt: "So installierst du die CLI, das sind die verfügbaren Befehle, und das tust du, wenn ein Fehler auftritt."
Skills lösen das Anleitungsproblem: Woher weiß ein Agent, was er mit einem Werkzeug tun soll, sobald es verbunden ist? Ohne einen Skill sieht der Agent ein Tool, versteht aber den Arbeitsablauf nicht.
Capability Runtimes: Die Bündelungsschicht
Eine Capability Runtime ist eine einzige CLI (oder API), die mehrere Fähigkeiten — Bildgenerierung, Video, Websuche, Cloud-Speicher, Publishing — hinter einem Endpunkt bündelt. Statt fünf separate MCP-Server zu konfigurieren, installieren Sie ein einziges Tool.
Capability Runtimes lösen das Konsolidierungsproblem: Wie geben Sie Ihrem Agenten viele Fähigkeiten, ohne in Konfiguration, Zugangsdaten und Token-Overhead zu ertrinken?
Das Schichtendiagramm
┌─────────────────────────────────────────────┐
│ Ihr KI-Agent │
│ (Claude Code, Cursor, Codex, Windsurf) │
├─────────────────────────────────────────────┤
│ │
│ ┌─────────┐ ┌─────────┐ ┌─────────────┐ │
│ │ MCP │ │ Skills │ │ Capability │ │
│ │ Server │ │ (SKILL) │ │ Runtime │ │
│ │ │ │ │ │ │ │
│ │Verbinden│ │ Anleiten│ │ Bündeln │ │
│ │ Tools │ │ Agent │ │ Fähigkeiten │ │
│ └─────────┘ └─────────┘ └─────────────┘ │
│ │
│ Transport Anleitung Konsolidierung │
│ Schicht Schicht Schicht │
└─────────────────────────────────────────────┘
Keine dieser Schichten ersetzt die anderen. Tatsächlich funktionieren sie am besten zusammen:
- MCP verbindet Ihren Agenten mit einer Capability Runtime
- Skills lehren Ihren Agenten, wie er die Befehle der Runtime nutzt
- Die Runtime bündelt die Fähigkeiten, sodass es nur eine Sache zu verbinden und zu erklären gibt
Wann Sie welche Schicht einsetzen
Nutzen Sie MCP-Server allein, wenn:
Sie ein oder zwei spezifische Tools benötigen, für die es gut gewartete MCP-Server gibt. Zum Beispiel: Verbinden Sie Ihren Agenten über einen benutzerdefinierten MCP-Server mit Ihrer internen Unternehmensdatenbank. Oder fügen Sie eine GitHub-Integration über einen bestehenden MCP-Server hinzu.
MCP allein ist sinnvoll, wenn:
- Sie genau 1–2 Fähigkeiten benötigen
- Die Fähigkeiten spezialisiert sind (Ihre Datenbank, Ihre API, Ihr Jira)
- Sie DevOps-Unterstützung für die Wartung der Serverkonfigurationen haben
- Der Token-Overhead von 1–2 Servern vernachlässigbar ist
Nutzen Sie Skills, wenn:
Sie Ihren Agenten einen Arbeitsablauf verstehen lassen wollen, nicht nur ein Tool nutzen. Ein Skill listet nicht nur Befehle auf — er lehrt den Agenten die Reihenfolge: installieren, authentifizieren, konfigurieren, verifizieren, verwenden.
Skills sind essenziell, wenn:
- Das Tool einen mehrstufigen Einrichtungsprozess hat
- Fehlerbehandlung wichtig ist ("Wenn Fehler X auftritt, versuche Y")
- Der Agent mit dem Tool selbstständig arbeiten soll
- Sie den Arbeitsablauf im Team teilen möchten
Nutzen Sie eine Capability Runtime, wenn:
Sie 4+ Fähigkeiten benötigen und der Konfigurationsaufwand nicht mehr handhabbar ist. Das ist das häufigste Szenario für einzelne Entwickler und kleine Teams.
Eine Capability Runtime ist sinnvoll, wenn:
- Ihr Agent Bild, Video, Suche, Speicher und Publishing benötigt
- Sie keine 6 API-Schlüssel und 5 MCP-Server-Konfigurationen verwalten möchten
- Der Token-Overhead mehrerer Server die Agent-Leistung beeinträchtigt
- Sie eine Installation, einen Zugang, ein Ausgabeformat wünschen
Der hybride Ansatz (was die meisten Teams tatsächlich nutzen)
In der Praxis ist das beste Setup meist ein Hybrid:
MCP-Server (spezialisierte Tools) + Capability Runtime (Standardfähigkeiten) + Skills (Arbeitsanleitungen)
Ihr Agent verbindet sich mit:
- 1–2 MCP-Servern für interne oder spezialisierte Tools (Datenbank, Slack, Jira)
- 1 Capability Runtime für Standardfähigkeiten (Bild, Video, Suche, Speicher, Publishing)
- 1 Skill-Datei, die dem Agenten beibringt, wie er die Runtime nutzt
Das gibt Ihnen Best-of-Breed für einzigartige Anforderungen und minimalen Overhead für alles andere.
Die Token-Realität
Der hybride Ansatz ist nicht nur konzeptionell sauberer — er hat messbare Auswirkungen. Jeder MCP-Server fügt Werkzeugbeschreibungen zum Kontext Ihres Agenten hinzu. Bei 5 MCP-Servern verbrennen Sie 15.000–40.000 Token allein für Werkzeugbeschreibungen.
Ein Hybrid-Setup mit 2 MCP-Servern + 1 Capability Runtime reduziert das auf etwa 8.000–14.000 Token. Das sind 10–15 % mehr Kontext, der für echte Arbeit frei wird.
Häufige Fehler
Fehler 1: Zu glauben, MCP sei genug
MCP verbindet Werkzeuge. Es bündelt sie nicht, verwaltet ihre Zugangsdaten nicht und reduziert nicht ihren Token-Overhead. Wenn Sie 5+ MCP-Server betreiben, zahlt Ihr Agent bei jedem einzelnen eine Steuer.
Fehler 2: Zu glauben, Skills ersetzen Werkzeuge
Skills lehren Arbeitsabläufe. Sie stellen keine Fähigkeiten bereit. Ein Skill kann Ihrem Agenten erklären, wie er Bilder generiert — aber der Agent braucht trotzdem ein echtes Bildgenerierungswerkzeug dahinter.
Fehler 3: Zu glauben, Runtimes ersetzen MCP
Capability Runtimes konsolidieren Standardfähigkeiten. Sie ersetzen nicht den Bedarf an spezialisierten Integrationen. Ihr Agent braucht weiterhin MCP, um sich mit Ihrer internen Datenbank oder Jira zu verbinden. Die Runtime übernimmt die generischen Fähigkeiten, die die meisten Agenten gemeinsam haben.
Die Entscheidung in einer Tabelle
| Sie benötigen... | Nutzen Sie... |
|---|---|
| 1–2 spezialisierte Tools | MCP-Server |
| Ihren Agenten, um einen Arbeitsablauf zu verstehen | Skills |
| 4+ Standardfähigkeiten | Capability Runtime |
| Alles davon | Hybrid: MCP + Runtime + Skills |
Fazit
Die Debatte MCP vs Skills vs Capability Runtime geht am Kern vorbei. Es handelt sich um drei Schichten desselben Stacks, nicht um drei konkurrierende Ansätze.
MCP ist der USB-C-Anschluss. Skills sind die Bedienungsanleitung. Die Capability Runtime ist das Gerät, das eingesteckt wird.
Ihr Agent braucht alle drei. Die Frage ist nicht, welche — sondern wie viel von jeder.
Letzte Aktualisierung: Mai 2026