Crea un catálogo

La creación de un catálogo (como un catálogo de REST de Apache Iceberg o un catálogo de Apache Hive) establece un extremo de administración dentro del catálogo de entornos de ejecución de Lakehouse. Este extremo apunta a un bucket de almacén de Cloud Storage subyacente, lo que proporciona una capa de metadatos que permite que los motores de consulta y las cargas de trabajo de código abierto interactúen directamente con tus tablas.

Cuando crees tu catálogo para Lakehouse para Apache Iceberg, puedes elegir entre las credenciales del usuario final o el modo de venta de credenciales para la delegación del acceso al almacenamiento.

Antes de comenzar

  1. Verifica que la facturación esté habilitada para tu Google Cloud proyecto.

  2. Habilita la API de BigLake.

    Roles necesarios para habilitar las APIs

    Para habilitar las APIs, necesitas el rol de IAM de administrador de Service Usage (roles/serviceusage.serviceUsageAdmin), que contiene el permiso serviceusage.services.enable. Obtén más información para otorgar roles.

    Habilitar la API

Roles obligatorios

Para obtener los permisos que necesitas para crear un catálogo, pídele a tu administrador que te otorgue los siguientes roles de IAM:

  • Todos:
  • Cuenta de servicio del catálogo de entornos de ejecución de Lakehouse aprovisionada automáticamente en el modo de venta de credenciales: Usuario de objetos de almacenamiento (roles/storage.objectUser) en el bucket de Cloud Storage de destino. Después de crear el catálogo, otorga de forma explícita el rol de Usuario de objetos de almacenamiento (roles/storage.objectUser) en tu bucket de almacenamiento a la cuenta de servicio del catálogo de entornos de ejecución de Lakehouse aprovisionada automáticamente de tu catálogo.

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

También puedes obtener los permisos necesarios a través de roles personalizados o cualquier otro rol predefinido.

Crea un catálogo

Crea un extremo de catálogo.

Console

  1. En el Google Cloud console, abre la página Lakehouse.

    Ir a Lakehouse

  2. Selecciona Crear catálogo. Se abrirá la página Crear catálogo.

  3. Selecciona el tipo de catálogo:

    • Para crear un catálogo de REST de Apache Iceberg, selecciona Catálogo de REST de Iceberg.
    • Para crear un catálogo de Apache Hive, selecciona Catálogo de Hive.
  4. En Selecciona un bucket de Cloud Storage, ingresa el nombre del bucket de Cloud Storage que se usará con tu catálogo. Como alternativa, selecciona Explorar para elegir de una lista de buckets existentes o crear uno. Solo puedes tener un catálogo por bucket de Cloud Storage.

  5. En Método de autenticación, selecciona Credenciales del usuario final o Modo de venta de credenciales.

    Si seleccionas Modo de venta de credenciales, la cuenta de servicio del catálogo de entornos de ejecución de Lakehouse aprovisionada automáticamente requiere el rol explícito de Usuario de objetos de almacenamiento (roles/storage.objectUser) en el bucket de Cloud Storage de destino. De forma predeterminada, se crea con acceso solo para lectores. Sin este rol, las credenciales vendidas no tienen un alcance suficiente para realizar escrituras de almacenamiento.

  6. Selecciona Crear.

    Se creará tu catálogo y se abrirá la página Detalles del catálogo.

  7. En Método de autenticación, selecciona Establecer permisos del bucket.

  8. En el diálogo, selecciona Confirmar.

    Esto verifica que la cuenta de servicio de tu catálogo tenga el rol de Administrador de objetos de almacenamiento en tu bucket de almacenamiento. Si creas catálogos con gcloud o Terraform, debes otorgar este rol de forma manual.

REST

Para crear un extremo de administración de catálogos con la API de REST, realiza una POST solicitud al CreateIcebergCatalog extremo:

POST /iceberg/v1/restcatalog/extensions/projects/PROJECT_ID/catalogs?icebergCatalogId=CATALOG_ID

El cuerpo de la solicitud debe contener una carga útil JSON IcebergCatalog que defina la configuración del catálogo, como el almacén de bucket de Cloud Storage subyacente y el modo de autenticación.

Reemplaza lo siguiente:

  • PROJECT_ID: Es el ID del Google Cloud proyecto de.
  • CATALOG_ID: Es el ID de tu catálogo de entornos de ejecución de Lakehouse.