
Jedes große KI-Unternehmen bietet mittlerweile eine „Deep Research"-Funktion an. Google hat sie. OpenAI hat sie. Perplexity hat sie. Sie alle beeindrucken in Demos — stelle eine komplexe Frage, warte ein paar Minuten und erhalte einen mehrseitigen Bericht mit Quellen.
Das Problem liegt nicht in der Qualität. Das Problem ist, dass keines dieser Tools für den Einsatz durch deinen Agenten entwickelt wurde.
Sie leben in Chat-Oberflächen. Sie produzieren Berichte, die für Menschen lesbar sind, keine strukturierten Daten für die Weiterverarbeitung. Und wenn dein Agent ein Tool nicht programmgesteuert aufrufen kann, existiert dieses Tool für deinen Workflow schlicht nicht.
Was Deep Research anders macht
Reguläre Suche — selbst fundierte Suche — beantwortet eine Frage in einem Durchgang. Du fragst, es ruft ab, es synthetisiert.
Deep Research zerlegt eine komplexe Frage in Teilfragen, führt mehrere Suchrunden durch, vergleicht widersprüchliche Quellen und fasst die Ergebnisse in einem strukturierten Bericht zusammen. Es ist der Unterschied zwischen „Was kostet Acme?" und „Analysiere die Wettbewerbslandschaft für KI-Suchwerkzeuge für Unternehmen, einschließlich Preisgestaltung, Differenzierung und Entwickler-Sentiment."
Das Ergebnis ist kein Absatz. Es sind 20–100+ Quellen, synthetisiert zu etwas, das einem Analystenbericht näherkommt. Die Latenz ist entsprechend höher — 2 bis 15 Minuten statt Sekunden. Die Kosten sind höher — 0,50 bis 5+ USD pro Bericht statt Bruchteile eines Cents.
Die Tools, gerankt danach, ob dein Agent sie wirklich nutzen kann
AnyCap Deep Research ist das einzige, das speziell für Agenten entwickelt wurde. Du installierst es als Skill (claude mcp add anycap-cli-nightly), und dein Agent ruft es wie jedes andere Tool auf. Die Ausgabe ist strukturiert — JSON mit Abschnitten, Zitaten und Konfidenzwerten, nicht nur ein Textbericht. Dein Agent kann es parsen, filtern und in den nächsten Schritt eines Workflows einspeisen:
anycap research \
--query "AI agent capability runtime market Q2 2026" \
--depth comprehensive --output market-analysis.md
Google Gemini Deep Research liefert gute Berichte. Dahinter steckt Googles Suchindex, was für die Abrufqualität wichtig ist. Aber die API-Ausgabe ist formatierter Text — keine strukturierten Zitate, keine JSON-Abschnitte. Dein Agent kann es aufrufen, aber das Parsen der Ausgabe ist fragil. Google ändert die Formatierung, dein Parser bricht zusammen.
Perplexity Deep Research hat saubere Zitate und Echtzeit-Webzugriff — Perplexitys Kernstärke. Aber Deep Research ist nur über die UI verfügbar. Kein API-Endpunkt. Dein Agent kann es buchstäblich nicht aufrufen.
OpenAI Deep Research erfordert ein ChatGPT-Pro-Abonnement für 200 USD/Monat und ist ebenfalls nur über die UI verfügbar. Die Berichte sind gründlich — das o3-basierte Reasoning ist wirklich gut bei mehrstufiger Recherche. Aber es gibt keine API. Dein Agent hat keine Möglichkeit, es zu nutzen.
GPT Researcher und STORM sind Open-Source-Alternativen, die du selbst hostest. Volle Kontrolle, keine Kosten pro Abfrage. Der Kompromiss: Self-hosted Web-Crawling ist deutlich schlechter als das, was Google- oder Bing-gestützte Tools abrufen können. Die Einrichtung ist nicht trivial. Wenn du ein Team hast, das es warten kann, und dein Volumen die Infrastruktur rechtfertigt, ist es eine Option. Die meisten Teams haben das nicht.
Worauf du über die Demo hinaus achten solltest
Consumer-Deep-Research wirkt beeindruckend in Demos, weil sie imposant aussehende Berichte produzieren. Wenn du Tools für den Agenten-Einsatz bewertest, verschieben sich die Kriterien:
Kann der Agent strukturierte Ausgaben erhalten? Nicht „Kann ich den Bericht lesen?" Kann der Agent Abschnitte parsen, Zitate extrahieren und die Ergebnisse im nächsten Schritt einer Pipeline nutzen? Wenn das Tool einen Textblock zurückliefert, lautet die Antwort Nein.
Wie dicht sind die Zitate? Ein Deep-Research-Bericht ohne Zitate, die jede Behauptung mit einer Quelle verknüpfen, ist nur selbstbewusste Halluzination mit besserer Formatierung. Überprüfe zufällig einige Zitate in deinen ersten Berichten. Du wirst überrascht sein, wie oft sie die Behauptung gar nicht stützen.
Kannst du die Tiefe steuern? Ein schneller Wettbewerbsüberblick benötigt 5–10 Quellen und 2 Minuten. Eine umfassende Landschaftsanalyse benötigt 50+ Quellen und 10+ Minuten. Das Tool sollte dir die Wahl lassen und dir die Kosten mitteilen, bevor es startet.
Ist es eine CLI oder eine UI? Das ist der Filter, der den Großteil des Feldes eliminiert. Wenn ein Tool in einer Chat-Oberfläche lebt, kann dein Agent es nicht nutzen. Ende der Bewertung.
Wo Deep Research in einen echten Workflow passt
Der Wert von Deep Research liegt nicht in der Recherche selbst. Er liegt darin, was danach passiert.
Ein Agent, der eine Wettbewerbsanalyse durchführt, startet zunächst mit Deep Research zur Marktlandschaft. Dann sucht er nach Preisinformationen für jeden gefundenen Wettbewerber. Dann generiert er eine Vergleichsinfografik. Dann fasst er alles in einem Bericht zusammen und veröffentlicht ihn.
Das sind vier CLI-Befehle, verkettet von einem Agenten, der das Ziel versteht:
anycap research --query "AI search tools market 2026" --depth comprehensive --output landscape.md
anycap search "competitor-name pricing 2026" --citations --output pricing.json
anycap image generate --prompt "comparison infographic from landscape.md" -o comparison.png
anycap page publish report.md --title "AI Search Tools: Market Analysis 2026"
Kein SDK. Kein Middleware. Nur Tools, die der Agent aufrufen kann, weil sie in seiner Runtime leben.
Starte mit einem Deep-Research-Workflow
Wähle die Aufgabe, die dein Team heute manuell erledigt: Wettbewerbslandschaftsanalyse, wöchentlicher Branchen-Digest, Dependency-Health-Check vor einem Release. Übergib sie deinem Agenten mit AnyCap:
npm install -g @anycap/cli && anycap login
anycap research --query "dein Recherchethema hier" --depth comprehensive --output report.md
Der Bericht kommt strukturiert, zitiert und bereit zurück, in den nächsten Schritt deiner Pipeline eingespeist zu werden. Kein Copy-Paste. Keine manuelle Synthese. Der Agent macht die Recherche; du überprüfst die Ergebnisse.
Weiterführende Lektüre:
- KI-gestützte Suche für KI-Agenten: Grounded Search vs. RAG — Wie Grounded Search und Deep Research sich ergänzen
- KI-Workflow-Automatisierung: Eine agentische Pipeline aufbauen — Vollständige Pipeline: recherchieren → generieren → veröffentlichen
- Agentische Analyse-Tools 2026 — Wie Deep Research in Analyse-Workflows passt
- KI-gestützte Datenanalyse 2026: Agentische Analytik — Wenn Deep Research auf deine internen Daten trifft: die agentische Analytikstufe