Für die erweiterte Websiteindexierung fallen monatliche Kosten für die Daten
speicherung an, die von der Größe der Webdaten abhängen, die Sie in Ihren Daten
speicher importieren. Wenn Sie die Größe Ihrer Webdaten schätzen möchten, bevor Sie sie importieren, können Sie die
Methode estimateDataSize aufrufen und die Web
seiten angeben, die Sie importieren möchten. Die estimateDataSize Methode ist ein Vorgang mit langer Ausführungszeit, der so lange ausgeführt wird, bis der Prozess zur Schätzung
der Datengröße abgeschlossen ist. Je nach Anzahl der von Ihnen angegebenen Webseiten kann dies einige Minuten bis über eine Stunde dauern. Nachdem Sie eine
Schätzung der Größe Ihrer Webdaten erhalten haben, können Sie die voraussichtlichen monatlichen
Kosten für die Datenspeicherung auf der Preisseite für die Agent Search schätzen (siehe Abschnitt Preise für den Datenindex) oder mit dem Preisrechner von Google Cloud (suchen Sie nach „Agent Search“).
Hinweis
Bestimmen Sie die URL-Muster für die Websites, die Sie beim Import von Webdaten in Ihren Datenspeicher einbeziehen (und optional ausschließen) möchten. Sie geben diese URL-Muster an, wenn Sie die Methode estimateDataSize aufrufen.
Prozedur
So schätzen Sie die Größe Ihrer Webdaten:
Rufen Sie die
estimateDataSizeMethode auf.curl -X POST \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ -H "Content-Type: application/json" \ "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global:estimateDataSize" \ -d '{ "website_data_source": { "estimator_uri_patterns": { provided_uri_pattern: "URI_PATTERN_TO_INCLUDE", exact_match: EXACT_MATCH_BOOLEAN }, "estimator_uri_patterns": { provided_uri_pattern: "URI_PATTERN_TO_EXCLUDE", exact_match: EXACT_MATCH_BOOLEAN, exclusive: EXCLUSIVE_BOOLEAN } } }'Ersetzen Sie Folgendes:
PROJECT_ID: die Projekt-ID.URI_PATTERN_TO_INCLUDE: die URL-Muster für die Websites, die Sie in die Schätzung der Datengröße einbeziehen möchten.URI_PATTERN_TO_EXCLUDE: (Optional) Die URL-Muster für die Websites, die Sie aus der Schätzung der Datengröße ausschließen möchten.Für
URI_PATTERN_TO_INCLUDEundURI_PATTERN_TO_EXCLUDEkönnen Sie Muster wie die folgenden verwenden:- Gesamte Website:
www.mysite.com - Teile einer Website:
www.mysite.com/faq - Gesamte Domain:
mysite.comoder*.mysite.com
- Gesamte Website:
EXCLUSIVE_BOOLEAN: (Optional) Wenntrue, stellt das angegebene URI-Muster Webseiten dar, die aus der Schätzung der Datengröße ausgeschlossen werden. Der Standardwert istfalse. Das bedeutet, dass das angegebene URI-Muster Webseiten darstellt, die in die Schätzung der Datengröße einbezogen werden.EXACT_MATCH_BOOLEAN: (Optional) Wenntrue, stellt das angegebene URI-Muster eine einzelne Webseite dar und nicht die Webseite und alle ihre untergeordneten Elemente. Der Standardwert istfalse. Das bedeutet, dass das angegebene URI-Muster die Webseite und alle ihre untergeordneten Elemente darstellt.
Die Ausgabe sieht etwa so aus:
{ "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789", "metadata": { "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata" } }Diese Ausgabe enthält das Feld
name, das den Namen des Vorgangs mit langer Ausführungszeit angibt. Speichern Sie den Wertnamefür den nächsten Schritt.Rufen Sie die
operations.getMethode ab.curl -X GET \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ "https://discoveryengine.googleapis.com/v1/OPERATION_NAME"Ersetzen Sie
OPERATION_NAMEdurch den Wertname, den Sie im vorherigen Schritt gespeichert haben. Sie können den Vorgangsnamen auch durch Auflisten von Vorgängen mit langer Ausführungszeit abrufen.Werten Sie jede Antwort aus.
Wenn eine Antwort nicht
"done": trueenthält, ist der Prozess zur Schätzung der Datengröße noch nicht abgeschlossen. Fahren Sie mit dem Abrufen fort.Die Ausgabe sieht etwa so aus:
{ "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789", "metadata": { "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata", "createTime": "2025-10-29T21:59:59.976752Z" } }Wenn eine Antwort
"done": trueenthält, ist der Prozess zur Schätzung der Datengröße abgeschlossen. Speichern Sie den WertDATA_SIZE_BYTESaus der Antwort für den nächsten Schritt.Die Ausgabe sieht etwa so aus:
{ "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789", "metadata": { "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata", "createTime": "2025-10-29T21:59:59.976752Z" }, "done": true, "response": { "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeResponse", "dataSizeBytes": DATA_SIZE_BYTES, "documentCount": DOCUMENT_COUNT } }Diese Ausgabe enthält die folgenden Werte:
DATA_SIZE_BYTES: die geschätzte Größe Ihrer Webdaten in Byte.DOCUMENT_COUNT: die geschätzte Anzahl der Webseiten in Ihren Webdaten.
Teilen Sie den Wert
DATA_SIZE_BYTESaus dem vorherigen Schritt durch 1.000.000.000, um Gigabyte zu erhalten. Speichern Sie diesen Wert für den nächsten Schritt.So erhalten Sie eine Schätzung Ihrer monatlichen Kosten für die Datenspeicherung:
Rufen Sie den Preisrechner von Google Cloud auf.
Klicken Sie auf Der Schätzung hinzufügen.
Suchen Sie nach
Agent Searchund klicken Sie dann auf das Feld Agent Search.Geben Sie im Feld Datenindex die geschätzte Größe Ihrer Webdaten in Gigabyte aus dem vorherigen Schritt ein.
Im Feld Geschätzte Kosten sehen Sie die geschätzten Kosten für die Datenspeicherung.