Lakehouse for Apache Iceberg supporta la creazione, la gestione e l'interrogazione di tabelle del catalogo REST di Lakehouse Iceberg archiviate in Cloud Storage.
Gestite tramite il catalogo runtime Lakehouse, queste tabelle sono leggibili da BigQuery e dai motori open source connessi. Le operazioni di scrittura rimangono limitate al motore specifico che ha creato originariamente la tabella.
Prima di iniziare
Consulta la panoramica delle tabelle per comprendere i diversi tipi di tabelle e le implicazioni del loro utilizzo.
Sono supportate solo le tabelle Apache Iceberg V2 (GA) e V3 (anteprima). Le tabelle Iceberg V1 non sono supportate. Per eseguire l'upgrade delle tabelle V1 esistenti, vedi Eseguire l'upgrade delle tabelle Iceberg V1 alla versione V2.
-
Verifica che la fatturazione sia attivata per il tuo progetto Google Cloud .
-
Abilita l'API BigLake.
Ruoli richiesti per abilitare le API
Per abilitare le API, devi disporre del ruolo IAM Amministratore utilizzo dei servizi (
roles/serviceusage.serviceUsageAdmin), che include l'autorizzazioneserviceusage.services.enable. Scopri come concedere i ruoli.
Ruoli obbligatori
Per ottenere le autorizzazioni necessarie per gestire le tabelle del catalogo REST Iceberg di Lakehouse, chiedi all'amministratore di concederti i seguenti ruoli IAM sul progetto e sul bucket di archiviazione:
-
Creare ed eliminare tabelle:
- BigLake Admin (
roles/biglake.admin) - the project - Amministratore Storage (
roles/storage.admin): il bucket Cloud Storage
- BigLake Admin (
-
Leggi i dati della tabella in modalità di distribuzione delle credenziali:
Visualizzatore BigLake (
roles/biglake.viewer): il progetto -
Scrivi i dati della tabella in modalità di distribuzione delle credenziali:
Editor BigLake (
roles/biglake.editor): il progetto -
Leggi i dati della tabella in modalità di distribuzione delle credenziali:
- BigLake Viewer (
roles/biglake.viewer) - il progetto - Storage Object Viewer (
roles/storage.objectViewer): il bucket Cloud Storage
- BigLake Viewer (
-
Scrivi i dati della tabella in modalità di distribuzione delle credenziali non attiva:
- BigLake Editor (
roles/biglake.editor) - the project - Storage Object User (
roles/storage.objectUser): il bucket Cloud Storage
- BigLake Editor (
Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.
Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.
Azioni di gestione
Puoi eseguire le seguenti azioni di gestione sulle tabelle del catalogo REST Lakehouse Iceberg:
- Crea una tabella: crea una tabella Apache Iceberg all'interno di uno spazio dei nomi del catalogo utilizzando la console Google Cloud , Spark, Trino o l'API REST Catalog Iceberg (
CreateIcebergTable). - Elenca tabelle: visualizza gli identificatori delle tabelle all'interno di uno spazio dei nomi utilizzando la console Google Cloud , Spark, Trino o l'API Iceberg REST Catalog (
ListIcebergTableIdentifiers). - Visualizza i dettagli della tabella: esamina lo schema, le proprietà e le credenziali della tabella utilizzando la console Google Cloud , Spark, Trino o l'API REST Catalog Iceberg (
GetIcebergTable,LoadIcebergTableCredentials). - Inserisci dati: aggiungi righe di dati alle tabelle Iceberg utilizzando Spark o Trino.
- Esegui query su una tabella: esegui query sulle tabelle Iceberg da Spark, Trino o BigQuery utilizzando la denominazione delle tabelle in quattro parti.
- Modifica di una tabella: fai evolvere lo schema della tabella e aggiorna le proprietà dei metadati utilizzando la console Google Cloud , Spark, Trino o l'API Iceberg REST Catalog (
UpdateIcebergTable). - Elimina una tabella: elimina la registrazione di una tabella dal catalogo senza eliminare i file di archiviazione sottostanti utilizzando la console Google Cloud , Spark, Trino o l'API REST Catalog Iceberg (
DeleteIcebergTable).
Passaggi successivi
- Consulta il catalogo REST Apache Iceberg.