Membuat katalog (seperti katalog REST Apache Iceberg atau katalog Apache Hive) akan membuat endpoint pengelolaan dalam katalog runtime Lakehouse. Endpoint ini mengarah ke bucket warehouse Cloud Storage yang mendasarinya, yang menyediakan lapisan metadata yang memungkinkan mesin kueri dan workload open source berinteraksi langsung dengan tabel Anda.
Saat membuat katalog untuk Lakehouse untuk Apache Iceberg, Anda dapat memilih antara kredensial pengguna akhir atau mode penyediaan kredensial untuk delegasi akses penyimpanan.
Sebelum memulai
-
Pastikan penagihan diaktifkan untuk Google Cloud project Anda.
-
Aktifkan BigLake API.
Peran yang diperlukan untuk mengaktifkan API
Untuk mengaktifkan API, Anda memerlukan peran IAM Service Usage Admin (
roles/serviceusage.serviceUsageAdmin), yang berisi izinserviceusage.services.enable. Pelajari cara memberikan peran.
Peran yang diperlukan
Untuk mendapatkan izin yang Anda perlukan untuk membuat katalog, minta administrator Anda untuk memberi Anda peran IAM berikut:
-
Semua:
- Admin BigLake (
roles/biglake.admin) di project Anda - Admin Penyimpanan (
roles/storage.admin) di project Anda
- Admin BigLake (
-
Akun layanan katalog runtime Lakehouse yang disediakan otomatis dalam mode penyediaan kredensial:
Pengguna Objek Penyimpanan (
roles/storage.objectUser) di bucket Cloud Storage target. Setelah membuat katalog, berikan peran Pengguna Objek Penyimpanan (roles/storage.objectUser) secara eksplisit di bucket penyimpanan Anda ke akun layanan katalog runtime Lakehouse yang disediakan otomatis di katalog Anda.
Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses ke project, folder, dan organisasi.
Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.
Membuat katalog
Buat endpoint katalog.
Konsol
Di Google Cloud konsol, buka halaman Lakehouse.
Pilih Buat katalog. Halaman Buat katalog akan terbuka.
Pilih jenis katalog:
- Untuk membuat katalog REST Apache Iceberg, pilih Katalog REST Iceberg.
- Untuk membuat katalog Apache Hive, pilih Katalog Hive.
Untuk Pilih bucket Cloud Storage, masukkan nama bucket Cloud Storage yang akan digunakan dengan katalog Anda. Atau, pilih Telusuri untuk memilih dari daftar bucket yang ada atau membuat bucket baru. Anda hanya dapat memiliki satu katalog per bucket Cloud Storage.
Untuk Metode autentikasi, pilih Kredensial pengguna akhir atau Mode penyediaan kredensial.
Jika Anda memilih Mode penyediaan kredensial, akun layanan katalog runtime Lakehouse yang disediakan otomatis memerlukan peran Pengguna Objek Penyimpanan (
roles/storage.objectUser) eksplisit di bucket Cloud Storage target. Secara default, akun ini dibuat dengan akses hanya pelihat. Tanpa peran ini, kredensial yang disediakan tidak memiliki cakupan yang memadai untuk melakukan penulisan penyimpanan.Pilih Buat.
Katalog Anda akan dibuat dan halaman Detail katalog akan terbuka.
Di bagian Metode autentikasi, pilih Tetapkan izin bucket.
Dalam dialog, pilih Konfirmasi.
Tindakan ini akan memverifikasi bahwa akun layanan katalog Anda memiliki peran Storage Object Admin di bucket penyimpanan Anda. Jika Anda membuat katalog menggunakan
gcloudatau Terraform, Anda harus memberikan peran ini secara manual.
REST
Untuk membuat endpoint pengelolaan katalog menggunakan REST API, buat POST
permintaan ke CreateIcebergCatalog endpoint:
POST /iceberg/v1/restcatalog/extensions/projects/PROJECT_ID/catalogs?icebergCatalogId=CATALOG_ID
Isi permintaan harus berisi payload JSON IcebergCatalog yang menentukan konfigurasi katalog, seperti warehouse bucket Cloud Storage yang mendasarinya dan mode autentikasi.
Ganti kode berikut:
PROJECT_ID: ID project Anda Google Cloud .CATALOG_ID: ID katalog runtime Lakehouse Anda.