Setiap perusahaan AI besar kini meluncurkan fitur "deep research". Google memilikinya. OpenAI memilikinya. Perplexity memilikinya. Semuanya mengesankan dalam demo — ajukan pertanyaan kompleks, tunggu beberapa menit, dapatkan laporan multi-halaman dengan sumber.
Masalahnya bukan kualitas. Masalahnya adalah tidak satu pun dari alat ini dibangun untuk digunakan oleh agen Anda.
Mereka terjebak di dalam antarmuka chat. Mereka menghasilkan laporan yang diformat untuk dibaca manusia, bukan data terstruktur untuk diproses lebih lanjut. Dan jika agen Anda tidak bisa memanggil alat secara terprogram, alat itu sama saja tidak ada untuk alur kerja Anda.
Apa yang benar-benar berbeda dari deep research
Pencarian biasa — bahkan grounded search — menjawab satu pertanyaan dalam satu langkah. Anda bertanya, sistem mengambil data, lalu mensintesis.
Deep research memecah pertanyaan kompleks menjadi sub-pertanyaan, menjalankan beberapa putaran pencarian, melakukan referensi silang pada sumber yang saling bertentangan, dan menyusun temuan ke dalam laporan terstruktur. Ini perbedaan antara "berapa harga Acme" dan "analisis lanskap kompetitif alat pencarian AI enterprise, termasuk harga, diferensiasi, dan sentimen pengembang."
Outputnya bukan satu paragraf. Ini adalah 20-100+ sumber yang disintesis menjadi sesuatu yang mendekati laporan analis. Latensinya pun lebih lama — 2 hingga 15 menit, bukan detik. Biayanya lebih tinggi — $0,50 hingga $5+ per laporan, bukan sepersekian sen.
Alat-alatnya, diperingkat berdasarkan apakah agen Anda benar-benar bisa menggunakannya
AnyCap Deep Research adalah satu-satunya yang dibangun khusus untuk agen. Anda menginstalnya sebagai skill (claude mcp add anycap-cli-nightly), dan agen Anda memanggilnya seperti alat lainnya. Outputnya terstruktur — JSON dengan bagian, kutipan, dan skor kepercayaan, bukan hanya laporan teks. Agen Anda bisa menguraikannya, memfilternya, dan memasukkannya ke langkah berikutnya dalam alur kerja:
anycap research \
--query "AI agent capability runtime market Q2 2026" \
--depth comprehensive --output market-analysis.md
Google Gemini Deep Research menghasilkan laporan yang baik. Didukung indeks pencarian Google, yang penting untuk kualitas pengambilan. Tapi output API adalah teks terformat — tidak ada kutipan terstruktur, tidak ada bagian JSON. Agen Anda bisa memanggilnya, tapi menguraikan outputnya rapuh. Google mengubah format, parser Anda rusak.
Perplexity Deep Research memiliki kutipan yang bersih dan akses web real-time — kekuatan inti Perplexity. Tapi deep research hanya tersedia di UI. Tidak ada endpoint API. Agen Anda benar-benar tidak bisa memanggilnya.
OpenAI Deep Research memerlukan langganan ChatGPT Pro $200/bulan dan juga hanya UI. Laporannya menyeluruh — penalaran berbasis o3 benar-benar bagus untuk riset multi-langkah. Tapi tidak ada API. Agen Anda tidak punya cara untuk menggunakannya.
GPT Researcher dan STORM adalah alternatif open-source yang bisa Anda host sendiri. Kontrol penuh, tanpa harga per kueri. Komprominya: web crawling self-hosted secara signifikan lebih buruk daripada apa yang bisa diambil oleh alat yang didukung Google atau Bing. Setup tidak sepele. Jika Anda punya tim yang bisa memeliharanya dan volume Anda membenarkan infrastrukturnya, ini layak. Sebagian besar tim tidak.
Apa yang dicari di luar demo
Deep research konsumen tampil baik dalam demo karena menghasilkan laporan yang terlihat mengesankan. Saat Anda mengevaluasi alat untuk penggunaan agen, kriterianya bergeser:
Bisakah agen mendapatkan output terstruktur? Bukan "bisakah saya membaca laporannya." Bisakah agen menguraikan bagian, mengekstrak kutipan, dan menggunakan temuan di langkah berikutnya dalam pipeline? Jika alat mengembalikan dinding teks, jawabannya tidak.
Seberapa padat kutipannya? Laporan deep research tanpa kutipan yang menghubungkan setiap klaim ke sumber hanyalah halusinasi percaya diri dengan format yang lebih baik. Ambil sampel kutipan secara acak pada beberapa laporan pertama Anda. Anda akan terkejut betapa seringnya kutipan itu tidak benar-benar mendukung klaim.
Bisakah Anda mengontrol kedalamannya? Gambaran kompetitif cepat membutuhkan 5-10 sumber dan 2 menit. Analisis lanskap komprehensif membutuhkan 50+ sumber dan 10+ menit. Alat harus memungkinkan Anda memilih, dan memberi tahu biayanya sebelum berjalan.
Apakah ini CLI atau UI? Ini adalah filter yang mengeliminasi sebagian besar opsi. Jika alat berada di antarmuka chat, agen Anda tidak bisa menggunakannya. Evaluasi selesai.
Di mana deep research cocok dalam alur kerja nyata
Nilai deep research bukanlah riset itu sendiri. Melainkan apa yang terjadi setelahnya.
Seorang agen yang melakukan analisis kompetitif pertama-tama melakukan deep research tentang lanskap pasar. Kemudian mencari spesifik harga untuk setiap pesaing yang ditemukan. Lalu menghasilkan infografis perbandingan. Kemudian menyusun semuanya menjadi laporan dan menerbitkannya.
Itu empat perintah CLI, dirangkai bersama oleh agen yang memahami tujuannya:
anycap research --query "AI search tools market 2026" --depth comprehensive --output landscape.md
anycap search "competitor-name pricing 2026" --citations --output pricing.json
anycap image generate --prompt "comparison infographic from landscape.md" -o comparison.png
anycap page publish report.md --title "AI Search Tools: Market Analysis 2026"
Tanpa SDK. Tanpa middleware. Hanya alat yang bisa dipanggil agen karena mereka berada di runtime-nya.
Bacaan lebih lanjut:
- Pencarian AI untuk Agen AI: Grounded Search vs RAG — Bagaimana grounded search dan deep research saling melengkapi
- Otomatisasi Alur Kerja AI: Bangun Pipeline Agentik — Pipeline lengkap: riset → generate → publish
- Alat Analitik Agentik di 2026 — Bagaimana deep research cocok dalam alur kerja analitik