Anda meminta Claude Code meneliti halaman harga pesaing. Ia mencari di web dan hanya mengembalikan cuplikan: “Mulai dari $29/bulan.” Itu belum cukup. Anda butuh tabel harga lengkap, perbandingan fitur, paket enterprise — isi halaman yang sebenarnya.
Pencarian web memberi ringkasan. Web crawl memberi halamannya.
Berikut cara menambahkan web crawling ke Claude Code — supaya agen Anda bisa membaca halaman web secara penuh, mengekstrak data terstruktur, dan memasukkan hasil riset itu langsung ke alur kerjanya.
Pencarian web vs web crawl: apa bedanya?
Keduanya saling terkait, tetapi tugasnya berbeda:
| Pencarian web | Web crawl | |
|---|---|---|
| Yang dikembalikan | Cuplikan, tautan, sitasi | Isi halaman lengkap dalam Markdown yang bersih |
| Paling cocok untuk | Jawaban cepat, penemuan, pengecekan fakta | Riset mendalam, ekstraksi konten, analisis kompetitor |
| Kecepatan | Hitungan detik | Detik hingga satu menit (mengambil halaman penuh) |
| Kedalaman data | Permukaan | Lengkap — setiap heading, paragraf, tabel |
| Kasus penggunaan | “Berapa harga X?” | “Ekstrak seluruh halaman harga dan bandingkan dengan harga kita” |
Agen Anda butuh keduanya. Cari untuk menemukan halaman yang tepat. Crawl untuk membacanya dengan benar.
Mengapa Claude Code butuh web crawl
Claude Code menalar basis kode Anda. Ia bisa me-refactor fungsi, menulis tes, dan men-debug masalah lintas file. Namun saat perlu meneliti sesuatu — dokumentasi API pesaing, changelog sebuah library, daftar fitur sebuah produk — ia mentok.
Pencarian web membantu, tetapi cuplikan hanya sejauh itu. Halaman harga bisa punya 12 tingkatan. Halaman dokumentasi bisa punya 40 bagian. Changelog bisa mencakup rilis selama 3 tahun. Cuplikan 150 karakter hanya memberi Anda satu hal. Halaman penuh memberi Anda semuanya.
Web crawl memberi agen Anda halaman lengkap. Lalu agen bisa:
- mengekstrak data terstruktur (tingkatan harga, daftar fitur, endpoint API)
- membandingkan penawaran kompetitor poin demi poin
- memasukkan dokumentasi ke generasi kode (“implementasikan autentikasi persis seperti yang dijelaskan di dokumentasi”)
- memantau perubahan dari waktu ke waktu (crawl halaman yang sama setiap minggu, lalu bandingkan hasilnya)
Metode 1: web scraping manual (cara yang rapuh)
Anda bisa mengonfigurasi Claude Code untuk memanggil layanan scraping secara langsung. Pilih penyedia (Firecrawl, Jina, ScrapingBee), daftar, dapatkan API key, dan hubungkan ke agen Anda.
Pendekatan manual:
- Daftar ke layanan scraping
- Dapatkan API key
- Tulis skrip shell atau konfigurasi MCP yang bisa dipanggil Claude Code
- Tangani rate limit, retry, dan kegagalan fetch
- Parse respons dan kirim kembali ke konteks agen
Ini cocok untuk pemakaian sesekali. Tetapi akan rapuh saat skala membesar — situs yang berbeda memblokir scraper yang berbeda, rate limit bervariasi menurut penyedia, dan memelihara integrasinya memakan waktu yang seharusnya dipakai untuk membangun.
Metode 2: server MCP untuk crawling
Server MCP untuk web crawling mengemas logika scraping menjadi integrasi yang bisa dipakai ulang. Server MCP Firecrawl adalah yang paling umum — Claude Code memanggilnya, lalu ia mengembalikan Markdown yang bersih dari URL mana pun.
Setup-nya lebih ringan daripada menyambungkan API secara manual, tetapi Anda tetap harus mengelola:
- satu server MCP per kemampuan (crawl terpisah dari search)
- rate limit dan autentikasi spesifik penyedia
- inkonsistensi format saat berpindah antara penyedia scraping
Metode 3: satu CLI untuk search + crawl (cara AnyCap)
Pendekatan ini menggabungkan search dan crawl ke dalam satu antarmuka perintah. Agen Anda mencari untuk menemukan halaman, lalu crawl untuk membacanya secara penuh — semuanya lewat CLI yang sama.
# Langkah 1: cari halaman yang relevan
anycap search --prompt "competitor pricing pages SaaS 2026" --citations
# Langkah 2: crawl hasil yang paling relevan untuk konten lengkap
anycap crawl --url "https://competitor.com/pricing" -o pricing.md
Runtime menangani:
- Output terstruktur. Halaman diubah menjadi Markdown yang bersih — heading, paragraf, tabel, dan blok kode dipertahankan.
- Rendering JavaScript. Halaman dinamis (SPA, aplikasi React) dirender sebelum ekstraksi.
- Konten bersih. Navigasi, iklan, dan boilerplate dihapus. Yang tersisa adalah isi artikel.
- Format konsisten. Setiap halaman yang dicrawl mengembalikan struktur Markdown yang sama, apa pun sumbernya.
Instal:
npm i -g anycap
anycap login
anycap skill install --target ~/.claude/skills/anycap-cli/
→ Instal AnyCap gratis — 250 kredit untuk pengguna baru
Kasus nyata: pipeline riset kompetitor
Agen Anda perlu membandingkan harga produk Anda dengan tiga kompetitor. Berikut alur lengkapnya:
# 1. Cari halaman harga kompetitor
anycap search --prompt "competitor A pricing plans 2026" --citations
anycap search --prompt "competitor B pricing plans 2026" --citations
anycap search --prompt "competitor C pricing plans 2026" --citations
# 2. Crawl setiap halaman harga untuk konten penuh
anycap crawl --url "https://competitor-a.com/pricing" -o competitor-a.md
anycap crawl --url "https://competitor-b.com/pricing" -o competitor-b.md
anycap crawl --url "https://competitor-c.com/pricing" -o competitor-c.md
# 3. Beri konten hasil crawl ke Claude Code untuk dianalisis
# Sekarang Claude Code punya data harga lengkap dan bisa menghasilkan:
# - tabel perbandingan
# - rekomendasi positioning harga
# - analisis kesenjangan fitur
Agen Anda meneliti, melakukan crawl, menganalisis, dan memberi rekomendasi — semuanya dalam satu sesi. Tanpa tab browser manual. Tanpa copy-paste.
Kasus nyata: pengembangan berbasis dokumentasi
Agen Anda perlu mengimplementasikan integrasi API. Alih-alih menebak alur autentikasi, ia crawl dokumentasi resminya:
# Crawl dokumentasi autentikasi API
anycap crawl --url "https://api.provider.com/docs/auth" -o auth-docs.md
# Crawl referensi endpoint
anycap crawl --url "https://api.provider.com/docs/endpoints" -o endpoints.md
# Claude Code sekarang mengimplementasikan integrasi dari dokumentasi asli,
# bukan dari data latihnya yang mungkin sudah usang
Inilah bedanya antara “Claude Code, implementasikan integrasi Stripe” (bekerja dari data latih, mungkin sudah usang) dan “Claude Code, crawl dokumentasi Stripe terbaru dan implementasikan integrasi persis seperti yang dijelaskan” (akurat, terkini, andal).
Kasus nyata: pemantauan kompetitor
Buat alur riset berkala. Agen Anda melakukan crawl halaman kompetitor sesuai jadwal dan membandingkan hasilnya:
# Crawl changelog kompetitor
anycap crawl --url "https://competitor.com/changelog" -o competitor-changelog-$(date +%Y%m%d).md
# Crawl halaman fitur kompetitor
anycap crawl --url "https://competitor.com/features" -o competitor-features-$(date +%Y%m%d).md
# Bandingkan dengan crawl minggu lalu
diff competitor-features-20260511.md competitor-features-20260518.md
Jalankan setiap minggu. Agen Anda akan menandai fitur baru, perubahan harga, dan pesan yang diperbarui — sebelum tim produk Anda mendengarnya dari pelanggan.
Search + crawl: stack riset lengkap
Pencarian web menemukan. Web crawl membaca. Bersama-sama, keduanya membentuk kemampuan riset lengkap untuk agen Anda:
| Langkah | Perintah | Fungsinya |
|---|---|---|
| 1. Temukan | anycap search |
Menemukan halaman relevan dengan sitasi yang kuat |
| 2. Ekstrak | anycap crawl |
Mengambil isi halaman penuh sebagai Markdown yang bersih |
| 3. Analisis | Claude Code | Menalar konten yang diekstrak |
| 4. Bertindak | Claude Code | Mengimplementasikan, membandingkan, atau melaporkan berdasarkan temuan |
Inilah riset berbasis bukti — agen Anda tidak bergantung pada data latih atau cuplikan parsial. Ia bekerja dari konten nyata dan terbaru dari halaman yang penting.
Kapan crawl vs kapan search
| Gunakan search ketika... | Gunakan crawl ketika... |
|---|---|
| Anda butuh jawaban cepat | Anda butuh halaman lengkap |
| Anda sedang mencari halaman apa saja yang ada | Anda sudah tahu halaman mana yang dibutuhkan dan ingin semuanya |
| Anda butuh ringkasan dengan sitasi yang kuat | Anda butuh ekstraksi data terstruktur |
| Kecepatan jadi prioritas | Kedalaman jadi prioritas |
| Jawaban muat dalam cuplikan | Jawaban berupa tabel, daftar, atau tersebar di beberapa bagian |
Kebanyakan alur riset memakai keduanya: search untuk menemukan, crawl untuk mengekstrak.
FAQ
Apakah web crawl bekerja pada halaman yang dirender JavaScript?
Ya. Runtime merender konten dinamis (React, Vue, SPA) sebelum ekstraksi. Apa yang Anda lihat di browser adalah apa yang diterima agen Anda.
Apa bedanya web crawl dengan web search bawaan Claude Code?
Web search bawaan Claude Code mengembalikan cuplikan dan ringkasan. Web crawl mengembalikan isi halaman penuh dalam Markdown — setiap heading, paragraf, tabel, dan blok kode. Gunakan search untuk jawaban cepat. Gunakan crawl saat Anda butuh kedalaman.
Bisakah saya crawl beberapa halaman dalam satu sesi?
Bisa. Jalankan anycap crawl satu kali per URL. Agen Anda dapat memproses daftar URL dan crawl satu per satu secara berurutan. Semua hasil disimpan sebagai file Markdown lokal.
Bagaimana kalau sebuah halaman memblokir crawler?
Beberapa halaman memblokir akses otomatis. Runtime menghormati robots.txt dan menangani pembatasan akses dengan mulus. Jika halaman tidak bisa dicrawl, agen Anda akan mendapat pesan error yang jelas — tidak gagal diam-diam.
Apakah ini juga bekerja di Cursor dan Codex?
Ya. anycap crawl memakai CLI yang sama dan bekerja di Claude Code, Cursor, dan Codex. Sekali instal, untuk semua agen.
Intinya
Pencarian web memberi tahu agen Anda apa yang ada. Web crawl memungkinkan agen Anda membacanya. Untuk riset kompetitor, pengembangan berbasis dokumentasi, dan ekstraksi konten, search saja tidak cukup.
Berikan keduanya kepada agen Anda. Search untuk menemukan. Crawl untuk memahami.
→ Berikan akses web penuh ke Claude Code — search + crawl lewat satu CLI
📖 Bacaan berikutnya
- Cara Memberi Agen AI Anda Kemampuan Pencarian Web — Satu Perintah CLI — Pendamping pencarian web untuk panduan crawl ini.
- Pemantauan Kompetitor dengan Agen AI — Bangun cron job yang memantau kompetitor Anda secara otomatis.
- Pencarian Bertenaga AI untuk Agen AI: Pencarian Berbasis Bukti vs RAG Tradisional — Kapan memakai pencarian berbasis bukti vs pencarian vektor.
Artikel terkait
- Cara Menghasilkan Video dengan Claude Code: Panduan Lengkap 2026 — Kemampuan terus bertambah.
- Apa itu Capability Runtime? — Infrastruktur yang menggabungkan search, crawl, gambar, video, dan storage dalam satu CLI.
Ditulis oleh tim AnyCap. Kami membangun capability runtime yang memberi agen Anda pencarian web dengan sitasi, crawling halaman penuh, dan semua yang dibutuhkan untuk riset tanpa Anda.