Lakehouse für Apache Iceberg unterstützt das Erstellen, Verwalten und Abfragen von Lakehouse Iceberg REST-Katalogtabellen, die in Cloud Storage gespeichert sind.
Diese Tabellen werden über den Lakehouse-Laufzeitkatalog verwaltet und können von BigQuery und verbundenen Open-Source-Engines gelesen werden. Schreibvorgänge sind weiterhin auf die spezifische Engine beschränkt, mit der die Tabelle ursprünglich erstellt wurde.
Hinweis
In der Tabellenübersicht finden Sie Informationen zu den verschiedenen Arten von Tabellen und den Auswirkungen ihrer Verwendung.
Nur Apache Iceberg V2-Tabellen (allgemeine Verfügbarkeit) und V3-Tabellen (Vorschau) werden unterstützt. Iceberg V1-Tabellen werden nicht unterstützt. Informationen zum Upgrade vorhandener V1-Tabellen finden Sie unter Iceberg V1-Tabellen auf V2 aktualisieren.
-
Prüfen Sie, ob die Abrechnung für Ihr Google Cloud Projekt aktiviert ist.
-
Aktivieren Sie die BigLake API.
Rollen, die zum Aktivieren von APIs erforderlich sind
Zum Aktivieren von APIs benötigen Sie die IAM-Rolle „Service Usage-Administrator“ (
roles/serviceusage.serviceUsageAdmin), die die Berechtigungserviceusage.services.enableenthält. Informationen zum Zuweisen von Rollen.
Erforderliche Rollen
Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen für Ihr Projekt und Ihren Speicher-Bucket zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Verwalten von Lakehouse Iceberg REST-Katalogtabellen benötigen:
-
Tabellen erstellen und löschen:
- BigLake-Administrator (
roles/biglake.admin) – das Projekt - Storage-Administrator (
roles/storage.admin) – der Cloud Storage-Bucket
- BigLake-Administrator (
-
Tabellendaten im Modus für die Anmeldedatenerstellung lesen:
BigLake-Betrachter (
roles/biglake.viewer) – das Projekt -
Tabellendaten im Modus für die Anmeldedatenerstellung schreiben:
BigLake-Editor (
roles/biglake.editor) – das Projekt -
Tabellendaten im Modus ohne Anmeldedatenerstellung lesen:
- BigLake-Betrachter (
roles/biglake.viewer) – das Projekt - Storage-Objekt-Betrachter (
roles/storage.objectViewer) – der Cloud Storage-Bucket
- BigLake-Betrachter (
-
Tabellendaten im Modus ohne Anmeldedatenerstellung schreiben:
- BigLake-Editor (
roles/biglake.editor) – das Projekt - Storage Object User (
roles/storage.objectUser) – der Cloud Storage-Bucket
- BigLake-Editor (
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.
Verwaltungsaktionen
Sie können die folgenden Verwaltungsaktionen für Ihre Lakehouse Iceberg REST-Katalogtabellen ausführen:
- Tabelle erstellen: Erstellen Sie eine Apache Iceberg-Tabelle in einem Katalognamespace mit der Google Cloud Console, Spark, Trino oder der Iceberg REST Catalog API (
CreateIcebergTable). - Tabellen auflisten: Tabellen-IDs in einem Namespace mit der Google Cloud Console, Spark, Trino oder der Iceberg REST Catalog API (
ListIcebergTableIdentifiers) ansehen. - Tabellendetails abrufen: Tabellenschema, -eigenschaften und -anmeldedaten mit der Google Cloud Console, Spark, Trino oder der Iceberg REST Catalog API (
GetIcebergTable,LoadIcebergTableCredentials) prüfen. - Daten einfügen: Datenzeilen mit Spark oder Trino an Ihre Iceberg-Tabellen anhängen.
- Tabelle abfragen: Abfragen für Ihre Iceberg-Tabellen aus Spark, Trino oder BigQuery mit vierteiliger Tabellennamenkonvention ausführen.
- Tabelle ändern: Tabellenschema weiterentwickeln und Metadateneigenschaften mit der Google Cloud Console, Spark, Trino oder der Iceberg REST Catalog API (
UpdateIcebergTable) aktualisieren. - Tabelle löschen: Tabellenregistrierung aus dem Katalog entfernen, ohne die zugrunde liegenden Speicherdateien zu löschen, mit der Google Cloud Console, Spark, Trino oder der Iceberg REST Catalog API (
DeleteIcebergTable).
Nächste Schritte
- Informationen zum Apache Iceberg REST-Katalog