Lakehouse para Apache Iceberg admite la creación, la administración y las consultas de tablas de catálogo de REST de Lakehouse Iceberg almacenadas en Cloud Storage.
Estas tablas, que se administran a través del catálogo del entorno de ejecución de Lakehouse, se pueden leer con BigQuery y los motores de código abierto conectados. Las operaciones de escritura siguen restringidas al motor específico que creó la tabla originalmente.
Antes de comenzar
Consulta el resumen de la tabla para comprender los diferentes tipos de tablas y las implicaciones de usarlas.
Solo se admiten las tablas de Apache Iceberg V2 (GA) y V3 (versión preliminar). No se admiten las tablas de Iceberg V1. Para actualizar las tablas de la versión 1 existentes, consulta Actualiza las tablas de Iceberg de la versión 1 a la versión 2.
-
Verifica que la facturación esté habilitada para tu proyecto de Google Cloud .
-
Habilita la API de BigLake.
Roles necesarios para habilitar las APIs
Para habilitar las APIs, necesitas el rol de IAM de administrador de Service Usage (
roles/serviceusage.serviceUsageAdmin), que contiene el permisoserviceusage.services.enable. Obtén más información para otorgar roles.
Roles obligatorios
Para obtener los permisos que necesitas para administrar las tablas del catálogo de REST de Iceberg de Lakehouse, pídele a tu administrador que te otorgue los siguientes roles de IAM en tu proyecto y bucket de almacenamiento:
-
Crear y borrar tablas:
- Administrador de BigLake (
roles/biglake.admin): El proyecto - Administrador de almacenamiento (
roles/storage.admin): El bucket de Cloud Storage
- Administrador de BigLake (
-
Leer datos de la tabla en el modo de venta de credenciales:
Visualizador de BigLake (
roles/biglake.viewer): el proyecto -
Escribe datos de la tabla en el modo de venta de credenciales:
Editor de BigLake (
roles/biglake.editor): El proyecto -
Lee datos de tablas en el modo de no venta de credenciales:
- Visualizador de BigLake (
roles/biglake.viewer): El proyecto - Visualizador de objetos de Storage (
roles/storage.objectViewer): El bucket de Cloud Storage
- Visualizador de BigLake (
-
Escribe datos de la tabla en el modo de no venta de credenciales:
- Editor de BigLake (
roles/biglake.editor): Es el proyecto. - Usuario de objetos de almacenamiento (
roles/storage.objectUser): El bucket de Cloud Storage
- Editor de BigLake (
Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.
También puedes obtener los permisos necesarios a través de roles personalizados o cualquier otro rol predefinido.
Acciones de administración
Puedes realizar las siguientes acciones de administración en tus tablas del catálogo de REST de Lakehouse Iceberg:
- Crea una tabla: Crea una tabla de Apache Iceberg dentro de un espacio de nombres del catálogo con la consola de Google Cloud , Spark, Trino o la API del catálogo de REST de Iceberg (
CreateIcebergTable). - List tables: Consulta los identificadores de tablas dentro de un espacio de nombres con la consola de Google Cloud , Spark, Trino o la API de Iceberg REST Catalog (
ListIcebergTableIdentifiers). - Obtén detalles de la tabla: Inspecciona el esquema, las propiedades y las credenciales de la tabla con la consola de Google Cloud , Spark, Trino o la API de Iceberg REST Catalog (
GetIcebergTable,LoadIcebergTableCredentials). - Insertar datos: Agrega filas de datos a tus tablas de Iceberg con Spark o Trino.
- Consultar una tabla: Ejecuta consultas en tus tablas de Iceberg desde Spark, Trino o BigQuery con nombres de tabla de cuatro partes.
- Alter a table: Evoluciona el esquema de la tabla y actualiza las propiedades de los metadatos con la consola de Google Cloud , Spark, Trino o la API de Iceberg REST Catalog (
UpdateIcebergTable). - Borra una tabla: Quita el registro de una tabla del catálogo sin purgar los archivos de almacenamiento subyacentes con la consola de Google Cloud , Spark, Trino o la API de REST de Iceberg Catalog (
DeleteIcebergTable).
¿Qué sigue?
- Consulta el catálogo de REST de Apache Iceberg.