Pengindeksan situs lanjutan dikenai biaya penyimpanan data
bulanan berdasarkan ukuran data web yang Anda impor ke penyimpanan data. Untuk mendapatkan perkiraan ukuran data web sebelum mengimpornya, Anda
dapat memanggil metode estimateDataSize dan menentukan halaman web
yang ingin diimpor. Metode estimateDataSize adalah operasi
yang berjalan lama yang berjalan hingga proses perkiraan
ukuran data selesai. Proses ini dapat berlangsung dari beberapa menit hingga lebih dari satu jam, bergantung pada jumlah halaman web yang Anda tentukan. Setelah mendapatkan perkiraan ukuran data web, Anda dapat memperoleh perkiraan biaya penyimpanan data bulanan menggunakan halaman harga Agent Search (lihat bagian harga Indeks Data) atau kalkulator harga Google Cloud (telusuri Agent Search).
Sebelum memulai
Tentukan pola URL untuk situs yang ingin Anda sertakan (dan secara opsional dikecualikan) saat mengimpor data web ke penyimpanan data. Anda menentukan pola URL ini saat memanggil metode estimateDataSize.
Prosedur
Untuk mendapatkan perkiraan ukuran data web, ikuti langkah-langkah berikut:
Panggil metode
estimateDataSize.curl -X POST \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ -H "Content-Type: application/json" \ "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global:estimateDataSize" \ -d '{ "website_data_source": { "estimator_uri_patterns": { provided_uri_pattern: "URI_PATTERN_TO_INCLUDE", exact_match: EXACT_MATCH_BOOLEAN }, "estimator_uri_patterns": { provided_uri_pattern: "URI_PATTERN_TO_EXCLUDE", exact_match: EXACT_MATCH_BOOLEAN, exclusive: EXCLUSIVE_BOOLEAN } } }'Ganti kode berikut:
PROJECT_ID: ID project Anda.URI_PATTERN_TO_INCLUDE: pola URL untuk situs yang ingin Anda sertakan dalam perkiraan ukuran data.URI_PATTERN_TO_EXCLUDE: (Opsional) Pola URL untuk situs yang ingin Anda kecualikan dari perkiraan ukuran data.Untuk
URI_PATTERN_TO_INCLUDEdanURI_PATTERN_TO_EXCLUDE, Anda dapat menggunakan pola yang mirip dengan berikut:- Seluruh situs:
www.mysite.com - Bagian dari situs:
www.mysite.com/faq - Seluruh domain:
mysite.comatau*.mysite.com
- Seluruh situs:
EXCLUSIVE_BOOLEAN: (Opsional) Jikatrue, pola URI yang diberikan akan mewakili halaman web yang dikecualikan dari perkiraan ukuran data. Nilai defaultnya adalahfalse, yang berarti pola URI yang diberikan mewakili halaman web yang disertakan dalam perkiraan ukuran data.EXACT_MATCH_BOOLEAN: (Opsional) Jikatrue, pola URI yang diberikan akan mewakili satu halaman web, bukan halaman web dan semua turunannya. Nilai defaultnya adalahfalse, yang berarti pola URI yang diberikan mewakili halaman web dan semua turunannya.
Outputnya mirip dengan hal berikut ini:
{ "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789", "metadata": { "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata" } }Output ini mencakup kolom
name, yang merupakan nama operasi yang berjalan lama. Simpan nilainameuntuk digunakan pada langkah berikutnya.Polling metode
operations.get.curl -X GET \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ "https://discoveryengine.googleapis.com/v1/OPERATION_NAME"Ganti
OPERATION_NAMEdengan nilainameyang Anda simpan pada langkah sebelumnya. Anda juga bisa mendapatkan nama operasi dengan mencantumkan operasi yang berjalan lama.Evaluasi setiap respons.
Jika respons tidak berisi
"done": true, proses untuk memperkirakan ukuran data belum selesai. Lanjutkan polling.Outputnya mirip dengan hal berikut ini:
{ "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789", "metadata": { "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata", "createTime": "2025-10-29T21:59:59.976752Z" } }Jika respons berisi
"done": true, proses perkiraan ukuran data akan selesai. Simpan nilaiDATA_SIZE_BYTESdari respons untuk digunakan pada langkah berikutnya.Outputnya mirip dengan hal berikut ini:
{ "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789", "metadata": { "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata", "createTime": "2025-10-29T21:59:59.976752Z" }, "done": true, "response": { "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeResponse", "dataSizeBytes": DATA_SIZE_BYTES, "documentCount": DOCUMENT_COUNT } }Output ini mencakup nilai-nilai berikut:
DATA_SIZE_BYTES: perkiraan ukuran data web Anda, dalam byte.DOCUMENT_COUNT: perkiraan jumlah halaman web dalam data web Anda.
Bagi nilai
DATA_SIZE_BYTESdari langkah sebelumnya dengan 1.000.000.000 untuk mendapatkan gigabyte. Simpan nilai ini untuk langkah berikutnya.Untuk mendapatkan perkiraan biaya penyimpanan data bulanan:
Klik Tambahkan ke estimasi.
Telusuri
Agent Search, lalu klik kotak Agent Search.Di kotak Indeks Data, masukkan perkiraan ukuran data web Anda, dalam gigabyte, dari langkah sebelumnya.
Lihat kotak Perkiraan biaya untuk mengetahui perkiraan biaya penyimpanan data.