Cómo usar Gemini Cloud Assist

En este documento, se describe cómo usar Gemini Cloud Assist, un producto de la cartera de Gemini para Google Cloud, para ayudarte a comprender y trabajar con tus metadatos, trabajos y consultas en BigQuery. Proporciona casos de uso admitidos y ejemplos de instrucciones que puedes usar en Gemini Cloud Assist.

Antes de comenzar

Antes de que puedas usar Gemini Cloud Assist, tu administrador debe realizar los pasos para configurar Gemini Cloud Assist para el proyecto o la carpeta en los que estás trabajando.

Para responder preguntas y solicitudes sobre tus recursos de Google Cloud , Gemini Cloud Assist necesita los permisos adecuados de Identity and Access Management (IAM) para esos recursos. Gemini Cloud Assist hereda tus permisos cuando le pides que consulte tus datos de BigQuery, por lo que, en muchos casos, los permisos de IAM necesarios ya se otorgan. Para obtener más información, consulta los requisitos de IAM para usar Gemini Cloud Assist.

Cómo usar Gemini Cloud Assist

  1. Ve a la página de BigQuery.

    Ir a BigQuery

  2. En la barra de herramientas de Google Cloud , haz clic en spark Abrir o cerrar chat de IA de Gemini para abrir el chat de Gemini Cloud Assist.

    Botón de Gemini Cloud Assist en la barra de herramientas de BigQuery.

  3. En el campo Ingresa una instrucción, escribe tu instrucción.

  4. Haz clic en Enviar Enviar.

En las siguientes secciones, se proporcionan ejemplos de tareas que puedes realizar con Gemini Cloud Assist, junto con ejemplos de instrucciones.

Descubre recursos

Busca y obtén información sobre los recursos de conjuntos de datos y tablas en un solo proyecto o en varios. Gemini Cloud Assist usa Knowledge Catalog para buscar tus recursos de BigQuery. Las búsquedas se realizan con tus permisos. Por ejemplo, si no tienes permiso para ver los metadatos de un recurso, no aparecerá en los resultados. Entre los casos de uso admitidos, se incluyen los siguientes:

  • Buscar un recurso por nombre En el panel de Cloud Assist, ingresa una instrucción similar a la siguiente:

    ¿Tengo algún conjunto de datos llamado ecommerce?

  • Preguntar sobre los metadatos de una tabla: Puedes preguntar sobre una tabla por su nombre o dejar que Gemini Cloud Assist infiera a qué tabla te refieres según tu historial de chat o qué tabla se menciona en tu pestaña de consulta activa. Si especificas una tabla por su nombre, debes usar el nombre completamente calificado. Puedes preguntar sobre el esquema de una tabla o sobre otros metadatos, como la partición y la agrupación. En el panel de Cloud Assist, ingresa una instrucción similar a la siguiente:

    ¿Cuál es el esquema de PROJECT_NAME.DATASET_NAME.TABLE_NAME?

  • Pregunta dónde encontrar información específica. En el panel de Cloud Assist, ingresa una instrucción similar a la siguiente:

    ¿Dónde puedo encontrar datos demográficos, como la edad y la ubicación, de los usuarios nuevos del último año?

Generar código

Puedes usar Gemini Cloud Assist para generar código de SQL y Python que te ayude a consultar y analizar tus datos.

Generar SQL

Genera una consulta en SQL describiendo lo que quieres que haga. Para obtener mejores resultados, incluye el nombre de la tabla que deseas consultar. Por ejemplo, en el panel de Cloud Assist, ingresa una instrucción similar a la siguiente:

Genera una consulta en SQL para mostrarme la duración y el tipo de suscriptor de los diez viajes más largos. Usa la tabla bigquery-public-data.san_francisco_bikeshare.bikeshare_trips.

Generar código de Python

Genera código de Python describiendo lo que quieres que haga. Por ejemplo, en el panel de Cloud Assist, puedes ingresar la siguiente instrucción para pedirle a Gemini que consulte la tabla penguins de un conjunto de datos públicos con la sintaxis de los comandos mágicos de BigQuery:

Genera código de Python para consultar la tabla bigquery-public-data.ml_datasets.penguins con los comandos mágicos de BigQuery.

Programa una consulta

Para programar una consulta, proporciona los siguientes detalles en tu instrucción:

  • Programación, como todos los lunes a las 5 p.m. o cada dos martes a las 2 a.m.
  • Nombre visible
  • ID de la tabla de destino y del conjunto de datos de destino
  • Hora de inicio
  • Hora de finalización
  • Disposición de escritura, como WRITE_EMPTY, WRITE_APPEND o WRITE_TRUNCATE

Por ejemplo, en el panel de Cloud Assist, puedes ingresar una instrucción similar a la siguiente:

Schedule the query open in the editor to run daily. The display name
should be "test query". Write the results to a new table in mydataset
called scheduled_results. Use WRITE_APPEND. Start it now.

Realiza un seguimiento del linaje de datos

Puedes usar Gemini Cloud Assist para explorar y analizar el linaje de los datos. Puede ayudarte a comprender las dependencias de los datos, evaluar el impacto de los cambios estructurales y resumir flujos de datos complejos. Para analizar el linaje, puedes hacerle preguntas a Gemini Cloud Assist en las siguientes áreas funcionales:

  • Obtén estadísticas de linaje. Pídele a Gemini Cloud Assist datos cuantitativos sobre un gráfico de linaje, como la cantidad total de recursos, conjuntos de datos o proyectos involucrados. En el panel de Cloud Assist, ingresa una instrucción similar a la siguiente:

    • ¿Cuántos recursos ascendentes tiene Customer_Master?
    • ¿Cuántos conjuntos de datos de BigQuery participan en el linaje ascendente de Customer_Interaction_Summary?
    • Proporciona un recuento de todos los recursos únicos en el gráfico upstream de Marketing_Interaction.
  • Analiza las dependencias inmediatas. Identificar los elementos superiores directos (fuentes) o los elementos secundarios directos (consumidores) de un activo específico analizando las relaciones de un solo salto En el panel de Cloud Assist, ingresa una instrucción similar a la siguiente:

    • ¿Cuáles son las fuentes inmediatas de Customer_Master?
    • ¿Cuáles son los consumidores directos de la tabla Card_Master?
    • ¿Cuáles son las fuentes directas de Web_Session_Validated?
  • Evalúa el impacto posterior. Comprende las consecuencias posteriores de modificar o quitar un recurso. Puedes definir el alcance de estas instrucciones según la profundidad (cantidad de saltos) o los límites específicos del proyecto. En el panel de Cloud Assist, ingresa una instrucción similar a la siguiente:

    • ¿Qué recursos se verán afectados si quito Customer_Master?
    • Muéstrame los recursos que se encuentran a 2 saltos de Customer_Master.
    • ¿Cambiar Customer_Master afectará algún recurso del proyecto "data-lineage-manual-tests"?
  • Identifica las fuentes raíz y los destinos finales. Encuentra los orígenes finales o los destinos terminales de tus datos, sin pasar por los pasos de transformación intermedios. En el panel de Cloud Assist, ingresa una instrucción similar a la siguiente:

    • ¿Cuáles son todas las fuentes definitivas de datos para Customer_Master?
    • ¿Cuáles son las fuentes de datos originales de Transaction_Data_Enriched, sin incluir las tablas intermedias?
    • ¿Cuáles son los destinos finales de los datos de Card_Data_Validated?
  • Realiza un seguimiento del flujo de datos entre los activos. Pídele a Gemini Cloud Assist que explique la conexión, la ruta o el flujo de datos específicos entre dos recursos conocidos. En el panel de Cloud Assist, ingresa una instrucción similar a la siguiente:

    • ¿Cómo depende Customer_Master de Customer_Data_Raw?
    • ¿Cómo fluye el flujo de datos de Customer_Data_Raw a Customer_Profile_Snapshot?
    • ¿Cuántos saltos hay entre Customer_Data_Raw y Alert_Fact?
  • Filtrar el linaje por tipo o nombre de recurso Busca tipos específicos de recursos conectados (como vistas de BigQuery o paneles de Looker) o recursos que coincidan con un patrón de nomenclatura específico. En el panel de Cloud Assist, ingresa una instrucción similar a la siguiente:

    • ¿Se usa Customer_Master en alguna vista de BigQuery?
    • ¿Hay paneles de Looker que dependan de Customer_Master?
    • ¿Qué tablas upstream de Customer_Master tienen "Country" en su nombre?
  • Resumir gráficos de linaje Solicita una descripción general en lenguaje natural del linaje de un activo en lugar de una lista o un recuento específicos. En el panel de Cloud Assist, ingresa una instrucción similar a la siguiente:

    • Dame un resumen de los recursos que dependen de Web_Session_Validated.
    • Resume el linaje de nivel inferior de esta tabla.
    • ¿Cuál es el linaje de bigquery:PROJECT_NAME.DATASET_NAME?

Analiza trabajos

Obtén más información sobre los trabajos ejecutados en tu proyecto, incluidos tu historial de trabajos personales y el historial de trabajos del proyecto, para admitir los siguientes casos de uso:

  • Depura consultas de larga duración. Obtén información sobre el estado actual de un trabajo y los motivos por los que podría tardar más de lo esperado, como la contención de ranuras, una gran cantidad de filas analizadas, un gran volumen de datos y otros. En el panel de Cloud Assist, ingresa una instrucción similar a la siguiente:

    ¿Por qué tarda tanto este trabajo? JOB_ID

  • Analiza la causa de un trabajo fallido. Obtén información sobre por qué falló una consulta específica. En el panel de Cloud Assist, ingresa una instrucción similar a la siguiente:

    ¿Por qué falló JOB_ID?

  • Encuentra las consultas que consumen muchos recursos. Obtén información sobre tus consultas más costosas según la cantidad estimada de bytes procesados. En el panel de Cloud Assist, ingresa una instrucción similar a la siguiente:

    ¿Cuáles fueron las 3 consultas más costosas que ejecuté en los últimos 2 días?

Administra BigQuery

En el Explorador de trabajos, puedes chatear con Gemini Cloud Assist para supervisar el rendimiento, analizar la capacidad y optimizar los costos. Por ejemplo, puedes usar Gemini Cloud Assist para las siguientes tareas:

  • Analiza las reservas y la capacidad. Supervisa el uso de tu procesamiento e identifica los cuellos de botella con lenguaje natural. En el panel de Cloud Assist, puedes ingresar instrucciones similares a las siguientes:

    • Analiza el rendimiento de mis reservas en las últimas 24 horas.
    • Mostrar los principales proyectos y usuarios que consumen mi reserva de "producción"
    • ¿Mi capacidad actual es suficiente para nuestra carga máxima?
  • Supervisa y compara trabajos: Compara cargas de trabajo para comprender los cambios en el rendimiento. Puedes obtener un resumen del rendimiento del trabajo que destaca los cuellos de botella y las oportunidades de optimización, o bien comparar directamente los detalles de ejecución de diferentes trabajos para identificar regresiones o mejoras.

  • Configuración de la administración de cargas de trabajo Inspecciona y administra la configuración de tus reservas de BigQuery, incluidas las asignaciones y los compromisos, con lenguaje natural. Esta capacidad proporciona visibilidad de los parámetros de configuración del ajuste de escala automático, la administración de ranuras inactivas y los detalles específicos de la edición. En el panel de Cloud Assist, puedes ingresar instrucciones similares a las siguientes:

    • Enumera mis reservas con ajuste de escala automático.
    • Obtén mis tareas para PROJECT_ID.
    • ¿Cuál es la configuración de mi reserva RESERVATION_NAME?
    • Enumera mis compromisos.
    • ¿Cuántas reservas tienen configurada la opción para ignorar las ranuras inactivas?
    • Enumera todas las reservas por edición Enterprise.
    • Enumera todas las reservas actuales y muéstrame los valores de slot_capacity y autoscale_max_slots para cada una.
  • Identificación de los principales recursos: Identifica los principales consumidores de recursos de BigQuery. El asistente puede mostrar los principales usuarios y trabajos según la utilización de ranuras en proyectos o reservas específicos. Esta asistencia proporciona un soporte administrativo integral en los recursos críticos de BigQuery, incluidos los trabajos, los usuarios, los proyectos y las reservas. Al analizar las métricas clave de rendimiento, como el uso de ranuras y la duración de los trabajos, el asistente ofrece estadísticas prácticas para optimizar la supervisión y la asignación de recursos. En el panel de Cloud Assist, puedes ingresar instrucciones similares a las siguientes:

    • ¿Cuáles son los principales usuarios con el mayor uso de ranuras en mi proyecto?
    • Muéstrame los trabajos principales que consumieron más ranuras en la reserva RESERVATION_NAME durante la última hora.

¿Qué sigue?