Agen AI kamu perlu mencari di web. Bukan merayapi. Bukan mengikis. Mencari — ajukan pertanyaan, dapatkan jawaban beserta sumber.
Kamu punya banyak pilihan: Google Programmable Search, Perplexity API, Bing Web Search, Tavily, Exa, dan AnyCap grounded search. Masing-masing bekerja dengan cara berbeda, dengan pertukaran yang berbeda antara kualitas pengambilan data, sintesis jawaban, penanganan kutipan, dan pengalaman pengembang.
Inilah yang benar-benar penting saat kamu memberi agen akses ke web — dan API mana yang cocok untuk workflow mana.
Dua arsitektur: retrieval vs. grounded search
Semua API pencarian web masuk ke salah satu dari dua arsitektur:
API retrieval-only mengembalikan tautan. Agen kamu mendapatkan URL, judul, dan cuplikan — lalu harus mengunjungi setiap halaman, mengekstrak konten, dan menyintesis jawaban sendiri. Google Custom Search, Bing Web Search, dan Exa bekerja dengan cara ini.
Alur retrieval:
Agent: search("query") → URL + cuplikan
Agent: crawl setiap URL → ekstrak konten
Agent: kirim konten ke LLM → sintesis jawaban
Agent: buat daftar kutipan secara manual
API grounded search mengembalikan jawaban. Agen kamu mendapatkan respons yang disintesis dengan kutipan inline — pengambilan data, ekstraksi konten, dan sintesis semuanya terjadi dalam satu panggilan API. Perplexity API dan AnyCap grounded search bekerja dengan cara ini.
Alur grounded:
Agent: search("query") → jawaban + kutipan
Agent: teruskan jawaban ke pengguna atau langkah berikutnya
Perbedaan ini bukan sekadar akademis. API retrieval-only memberi agen daftar tautan. API grounded search memberi agen sebuah jawaban. Jarak antara keduanya adalah semua infrastruktur yang harus kamu bangun sendiri.
Perbandingan API
AnyCap Grounded Search
Arsitektur: Grounded search (jawaban + kutipan dalam satu panggilan)
Akses: CLI — anycap search "query" --citations
Cara kerja: Agen menjalankan satu perintah. AnyCap mencari web secara langsung, mengambil hasil teratas, merayapi halaman sumber untuk konten lengkap, menyintesis jawaban berdasarkan sumber tersebut, dan mengembalikannya dengan kutipan inline dan URL sumber.
Karakteristik utama:
- Mengembalikan jawaban yang disintesis, bukan daftar tautan
- Kutipan inline dengan URL sumber — setiap klaim dapat dilacak
- Output terstruktur, dapat di-pipe ke jq untuk ekstraksi field
- Satu CLI. Antarmuka yang sama dengan semua kemampuan AnyCap lainnya.
- Tier gratis: 250 kredit untuk pengguna baru
Terbaik untuk: Workflow agen yang membutuhkan jawaban, bukan proyek riset. Pipeline di mana pencarian langsung masuk ke analisis, pembuatan, atau penerbitan — semuanya melalui satu CLI.
Contoh:
anycap search "latest Go 1.25 changes" --citations | jq '.data.content'
Perplexity API (Sonar Pro)
Arsitektur: Grounded search (jawaban + kutipan)
Akses: REST API dengan dukungan SDK. POST /chat/completions dengan model yang mendukung pencarian.
Cara kerja: API Perplexity mengintegrasikan pencarian web real-time ke dalam respons LLM. Model mengambil informasi terkini dan mengembalikan jawaban dengan kutipan inline.
Karakteristik utama:
- Cepat — respons dalam hitungan detik
- Penanganan kutipan yang baik dengan tautan sumber inline
- Ramah API dengan respons terstruktur
- Berbagai model: Sonar (cepat), Sonar Pro (lebih mendalam), Sonar Reasoning Pro
- Akses web real-time — bagus untuk berita terkini dan kueri faktual
Keterbatasan:
- Penjawaban berbasis pencarian, bukan riset multi-sumber yang mendalam
- Relatif mahal pada skala besar
- API terpisah dari kemampuan lainnya — riset, pembuatan gambar, penerbitan memerlukan integrasi terpisah
Terbaik untuk: Pengecekan fakta real-time, kueri berita terkini, pengambilan informasi cepat. Aplikasi berbasis chatbot di mana kecepatan lebih penting daripada kedalaman.
Contoh:
import requests
response = requests.post(
"https://api.perplexity.ai/chat/completions",
headers={"Authorization": "Bearer $PERPLEXITY_API_KEY"},
json={
"model": "sonar-pro",
"messages": [{"role": "user", "content": "Latest Go 1.25 changes"}]
}
)
Google Programmable Search Engine
Arsitektur: Retrieval-only (tautan + cuplikan)
Akses: REST API. Sebelumnya disebut "Custom Search API." Memerlukan pengaturan proyek Google Cloud.
Cara kerja: Agen kamu mengkueri indeks pencarian Google melalui mesin pencari yang dikonfigurasi. Mengembalikan URL, judul, dan cuplikan teks. Agen kamu kemudian harus merayapi setiap halaman, mengekstrak konten, dan menyintesis jawaban — tiga langkah terpisah.
Karakteristik utama:
- Indeks pencarian Google — kualitas pengambilan data terbaik yang tersedia
- Dapat dikonfigurasi: batasi ke situs tertentu atau cari seluruh web
- Tier gratis: 100 kueri/hari
- REST API yang terdokumentasi dengan baik
Keterbatasan:
- Mengembalikan tautan, bukan jawaban. Agen kamu membutuhkan pipeline terpisah untuk ekstraksi konten dan sintesis.
- Custom Search Engine dibatasi 10 situs kecuali kamu membayar untuk Site Search.
- Tidak ada sintesis AI — kamu menyediakan LLM untuk pembuatan jawaban.
- Pengaturan kompleks: proyek GCP, pengaktifan API, manajemen kredensial.
Terbaik untuk: Workflow di mana indeks pencarian Google tidak bisa digantikan dan kamu memiliki infrastruktur untuk menangani ekstraksi konten dan sintesis secara terpisah.
Contoh:
# Langkah 1: Ambil tautan dari Google
results = google_search("latest Go 1.25 changes")
urls = [r['link'] for r in results['items']]
# Langkah 2: Crawl setiap halaman (tool atau layanan terpisah)
contents = [crawl(url) for url in urls]
# Langkah 3: Sintesis jawaban (panggilan LLM terpisah)
answer = llm.generate(f"Summarize: {contents}", citations=urls)
Bing Web Search API
Arsitektur: Retrieval-only (tautan + cuplikan)
Akses: REST API melalui Azure Cognitive Services.
Cara kerja: Indeks pencarian Microsoft. Mengembalikan halaman web, gambar, video, dan hasil berita dengan cuplikan. Kualitas pengambilan data sebanding dengan Google untuk banyak kueri.
Karakteristik utama:
- Kualitas pengambilan data yang baik — indeks pencarian Microsoft
- Multi-modal: web, gambar, video, hasil berita dalam satu API
- Tier gratis yang cukup besar: 1.000 kueri/bulan di beberapa tier
- Integrasi Azure yang terdokumentasi dengan baik
Keterbatasan:
- Retrieval-only — agen kamu yang menangani sintesis.
- Memerlukan langganan Azure dan pengaturan sumber daya.
- Alur autentikasi khusus Azure.
Terbaik untuk: Tim ekosistem Microsoft. Workflow yang membutuhkan pencarian gambar dan berita bersamaan dengan pencarian web.
Tavily
Arsitektur: Hybrid — retrieval + sintesis ringan
Akses: REST API. Dibuat khusus untuk pencarian agen AI.
Cara kerja: Tavily mencari berbagai sumber, mengekstrak konten yang relevan, dan mengembalikan hasil mentah sekaligus ringkasan yang disintesis. Dirancang khusus sebagai API pencarian untuk agen AI dan sistem RAG.
Karakteristik utama:
- Dibuat untuk agen AI — desain API lebih bersih daripada API pencarian umum
- Mengembalikan hasil mentah dan jawaban yang disintesis
- Kedalaman pencarian dan inklusi/eksklusif domain yang dapat dikonfigurasi
- Dokumentasi yang ramah pengembang
Keterbatasan:
- Indeks pencarian lebih kecil dari Google atau Bing
- Kualitas sintesis bervariasi tergantung kompleksitas kueri
- Integrasi terpisah dari kemampuan lain
- Harga per kueri bertambah pada skala besar
Terbaik untuk: Aplikasi AI yang membutuhkan API pencarian khusus dengan pengalaman pengembang yang lebih baik dari Google atau Bing. Sistem RAG yang membutuhkan data eksternal.
Exa
Arsitektur: Retrieval dengan pemahaman semantik
Akses: REST API. Pencarian berbasis konten untuk AI.
Cara kerja: Exa berfokus pada pengambilan konten dengan pemahaman semantik — menemukan halaman berdasarkan makna, bukan sekadar kata kunci. Mengembalikan konten halaman penuh (bukan hanya cuplikan) dengan ekstraksi teks yang bersih.
Karakteristik utama:
- Pencarian semantik: temukan halaman berdasarkan makna, bukan kata kunci
- Mengembalikan konten halaman penuh, bukan cuplikan
- Bagus untuk menemukan jenis konten tertentu (halaman perusahaan, dokumentasi, makalah penelitian)
- Berfokus pada konten: dirancang untuk konsumsi AI
Keterbatasan:
- Retrieval-only — sintesis adalah tanggung jawabmu.
- Fokus semantik berarti kueri berbasis kata kunci spesifik mungkin memberikan hasil berbeda.
- Indeks lebih kecil dari Google atau Bing.
Terbaik untuk: Workflow di mana menemukan konten yang tepat lebih penting dari sintesis jawaban. Riset yang membutuhkan konten halaman penuh untuk analisis mendalam.
Matriks perbandingan
| AnyCap GS | Perplexity | Google PSE | Bing | Tavily | Exa | |
|---|---|---|---|---|---|---|
| Tipe | Grounded | Grounded | Retrieval | Retrieval | Hybrid | Retrieval |
| Mengembalikan | Jawaban + kutipan | Jawaban + kutipan | Tautan + cuplikan | Tautan + cuplikan | Tautan + ringkasan | Tautan + konten |
| Akses agen | CLI | REST API | REST API | REST API | REST API | REST API |
| Kutipan | ✅ Inline | ✅ Inline | ❌ Tidak ada | ❌ Tidak ada | ⚠️ Sebagian | ❌ Tidak ada |
| Pengaturan | 1 perintah | API key + SDK | Proyek GCP | Sumber Azure | API key | API key |
| Komposabilitas | ✅ Penuh | ❌ Terpisah | ❌ Terpisah | ❌ Terpisah | ❌ Terpisah | ❌ Terpisah |
| Tier gratis | 250 kredit | Tidak ada | 100/hari | 1.000/bln | Terbatas | Terbatas |
| Kecepatan | Detik | Detik | Milidetik | Milidetik | Detik | Detik |
| Kualitas sintesis | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | T/A (tanpa sintesis) | T/A (tanpa sintesis) | ⭐⭐⭐ | T/A (tanpa sintesis) |
Cara memilih
Agen kamu membutuhkan jawaban dengan kutipan dalam satu panggilan: → AnyCap atau Perplexity. AnyCap jika agen kamu berjalan di lingkungan CLI dan membutuhkan komposabilitas (cari → riset → buat → terbitkan dalam satu workflow). Perplexity jika kamu membangun aplikasi berbasis chat.
Agen kamu membutuhkan kualitas pengambilan data terbaik dan kamu memiliki infrastruktur sintesis: → Google PSE atau Bing. Google untuk kualitas indeks terbaik. Bing jika kamu menggunakan Azure.
Agen kamu membutuhkan ekstraksi konten yang bersih, bukan sintesis: → Exa atau Tavily. Exa untuk penemuan konten semantik. Tavily untuk pendekatan seimbang dengan sintesis ringan.
Agen kamu membutuhkan pencarian sebagai salah satu dari banyak kemampuan dalam workflow terpadu: → AnyCap. Nilainya bukan hanya pada pencarian — melainkan bahwa pencarian, riset mendalam, pembuatan gambar, dan penerbitan semuanya ada di bawah satu CLI dan satu autentikasi.
Kerangka: retrieval adalah standar dasar, sintesis adalah diferensiatornya
Setiap API pencarian mengembalikan tautan. Perbedaannya ada pada apa yang terjadi setelahnya.
API retrieval-only berhenti di "ini 10 URL." Agen kamu harus melakukan sisanya. API grounded search berkata "ini jawabannya, dan ini asal setiap informasinya." Agen kamu meneruskannya.
Jika agen kamu melakukan pengecekan fakta bervolume tinggi di mana kecepatan penting dan kamu tidak ingin membangun pipeline retrieval-to-synthesis, grounded search adalah pilihan pragmatis. Jika kamu membutuhkan indeks pencarian Google secara spesifik dan memiliki infrastruktur untuk sisanya, retrieval-only juga bisa — kamu hanya perlu membangun bagian tengahnya sendiri.
Bacaan lanjutan:
- Pencarian Bertenaga AI untuk Agen AI: Grounded Search vs RAG — Mengapa RAG bukan jawaban untuk akses web langsung
- Cara Memberi Agen AI Kemampuan Pencarian Web — Tutorial CLI langkah demi langkah
- Alat CLI Terbaik untuk Agen AI 2026 — Ekosistem CLI untuk agen