Supervisa y soluciona problemas con la asistencia de IA

En este documento, se describe cómo puedes usar la asistencia de IA para supervisar y solucionar problemas de tus recursos de AlloyDB para PostgreSQL. Puedes usar las herramientas de solución de problemas asistidas por IA de AlloyDB y Gemini Cloud Assist para solucionar problemas de consultas lentas y solucionar problemas de carga alta de la base de datos.

Limitaciones

Las siguientes limitaciones se aplican a la solución de problemas asistida por IA en AlloyDB:

  • La solución de problemas asistida por IA ofrece estadísticas valiosas basadas en las configuraciones estándar de PostgreSQL. La arquitectura única de AlloyDB, que incluye su almacenamiento desagregado, su motor de columnas y sus procesos en segundo plano optimizados, implica que ciertas verificaciones y recomendaciones pueden diferir de las métricas de rendimiento reales de AlloyDB. Te recomendamos que consideres las recomendaciones de solución de problemas asistidas por IA como puntos de partida y que consultes la documentación de AlloyDB para obtener orientación definitiva.
  • La solución de problemas asistida por IA no es compatible con las siguientes configuraciones de AlloyDB:

Antes de comenzar

Asegúrate de que Gemini Cloud Assist esté configurado para tu Google Cloud cuenta de usuario y proyecto.

Después de configurar Gemini Cloud Assist, es posible que debas esperar cinco minutos para que el servicio se propague antes de habilitar la solución de problemas asistida por IA en AlloyDB.

Roles y permisos requeridos

Para obtener los permisos que necesitas para usar la solución de problemas asistida por IA, pídele a tu administrador que te otorgue los siguientes roles de IAM en el proyecto que aloja la instancia de AlloyDB:

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

Estos roles predefinidos contienen los permisos necesarios para usar la solución de problemas asistida por IA. Para ver los permisos exactos que son necesarios, expande la sección Permisos requeridos:

Permisos necesarios

Se requieren los siguientes permisos para usar la solución de problemas asistida por IA:

  • databaseinsights.performanceIssues.detect
  • databaseinsights.performanceIssues.investigate

También puedes obtener estos permisos con roles personalizados o con otros roles predefinidos.

Para obtener más información sobre los roles y permisos necesarios para usar las investigaciones de Gemini Cloud Assist, consulta Soluciona problemas con las investigaciones de Gemini Cloud Assist.

Habilita la solución de problemas asistida por IA

Cuando habilitas la solución de problemas asistida por IA para tu instancia de AlloyDB, AlloyDB puede analizar el rendimiento de tus bases de datos y detectar anomalías en la ejecución de tus consultas. Cuando AlloyDB detecta anomalías en el rendimiento de las consultas o identifica una carga alta del sistema, la solución de problemas asistida por IA te ayuda a analizar la situación con evidencia y proporciona recomendaciones.

Para habilitar la solución de problemas asistida por IA en tu instancia de AlloyDB, haz lo siguiente:

  1. En la consola de Google Cloud , ve a la página Clústeres.

    Ir a los clústeres

  2. En la lista de clústeres e instancias, haz clic en una instancia.

  3. Haz clic en Estadísticas de consultas.

  4. Haz clic en Habilitar o Editar configuración.

  5. En la pestaña Editar la configuración de las estadísticas de consultas, selecciona la casilla de verificación Habilitar las funciones avanzadas de estadísticas de consultas para AlloyDB.

    De forma predeterminada, se activa la casilla de verificación Solución de problemas asistida por IA.

  6. Haz clic en Guardar.

  7. Para obtener los mejores resultados, espera 24 horas después de habilitar la solución de problemas asistida por IA en la consola de Google Cloud para permitir que AlloyDB cree un valor de referencia del rendimiento promedio de tu instancia, base de datos y consultas.

Si deseas obtener más información para habilitar las estadísticas de consultas avanzadas, consulta Mejora el rendimiento de las consultas con las estadísticas de consultas avanzadas.

Abre Gemini Cloud Assist

Para usar Gemini Cloud Assist con AlloyDB, haz lo siguiente:

  1. En la consola de Google Cloud , ve a la página Clústeres.
  2. Ir a los clústeres
  3. En la lista de clústeres e instancias, haz clic en una instancia.
  4. Haz clic en Estadísticas de consultas.
  5. Para abrir el panel de Cloud Assist, haz clic en Abrir o cerrar el chat de Gemini Cloud Assist.
  6. En el panel de Cloud Assist, ingresa una instrucción que describa la información que te interesa.
  7. Después de ingresar la instrucción, haz clic en Enviar instrucción. Gemini devuelve una respuesta a tu instrucción en función de la información de la última hora.

Soluciona problemas de consultas lentas

Para usar la asistencia basada en IA y solucionar problemas relacionados con tus consultas lentas, ve al panel de Estadísticas de consultas de tu instancia de AlloyDB en la consola de Google Cloud .

Tabla de búsquedas principales

Puedes comenzar a solucionar problemas de consultas lentas con la asistencia de IA en la sección Tabla de las principales consultas del panel Estadísticas de consultas.

AlloyDB puede ayudarte a identificar qué consultas tienen un rendimiento más lento que el promedio durante un período de detección específico. Después de seleccionar un período en el panel de Estadísticas de consultas, AlloyDB verifica si alguna consulta se ejecuta más lento que el promedio con un período de detección de 24 horas antes del final del período seleccionado.

Cuando ajustas el filtro de período del gráfico Carga de la base de datos o cualquier otro filtro, como base de datos o usuario, AlloyDB actualiza la tabla de consultas principales y vuelve a ejecutar la detección de anomalías según la nueva lista de consultas y un período de detección actualizado.

Cuando AlloyDB detecta una anomalía, sucede lo siguiente:

  • AlloyDB realiza un análisis de rendimiento de referencia para tu consulta.

  • Cada consulta que aparece en la tabla tiene un ícono de Investigar o un ícono de Advertencia warning_spark que se muestra junto al valor de Tiempo de ejecución promedio (ms) de la consulta.

Si una consulta se ejecuta más lento de lo esperado, se muestra un ícono de Advertencia warning_spark. Cuando haces clic en cualquiera de los íconos, se usa Gemini Cloud Assist para analizar la ejecución de la consulta y ofrecer observaciones sobre lo que podría haber causado algún problema. Según estas observaciones, Gemini Cloud Assist genera una hipótesis que puede ayudarte a abordar el problema.

Para solucionar problemas relacionados con las consultas lentas en la tabla Consultas principales del panel Estadísticas de consultas, haz lo siguiente:

  1. En la consola de Google Cloud , ve a la página Clústeres.
  2. Ir a los clústeres
  3. En la lista de clústeres e instancias, haz clic en una instancia.
  4. Haz clic en Estadísticas de consultas.
  5. En el gráfico Consultas ejecutadas, usa el filtro Intervalo de tiempo para seleccionar 1 hora, 6 horas, 1 día, 7 días, 30 días o un intervalo personalizado.
  6. En la tabla Consultas principales, en la pestaña Consultas, revisa la lista de consultas de tu base de datos.
  7. Si aparece un ícono de Advertencia warning_spark junto al valor de Tiempo de ejecución promedio (ms) de una consulta, significa que AlloyDB detectó una anomalía en el rendimiento de la consulta. AlloyDB verifica si hay anomalías en el período de las 24 horas que se produce antes del final del intervalo de tiempo seleccionado.
  8. Haz clic en el ícono de Advertencia warning_spark.
  9. En el diálogo La búsqueda es más lenta de lo habitual, haz clic en Nueva investigación para comenzar a solucionar el problema con la asistencia de IA de Gemini Cloud Assist. Después de unos dos minutos, se abrirá el panel Detalles de la investigación con las siguientes secciones:
    • Problema. Una descripción del problema que se investiga, incluidas la hora de inicio y finalización de la investigación
    • Observaciones. Es una lista de observaciones sobre el problema. Por ejemplo, pueden incluir detalles de la contención de bloqueo, como una proporción de espera de bloqueo más larga de lo esperado para la consulta.
    • Hipótesis. Es una lista de acciones recomendadas por la IA para abordar la consulta de ejecución lenta.
  10. Si deseas ver todas las investigaciones asociadas a la consulta, en el diálogo La consulta es más lenta de lo habitual, haz clic en Ver todas las investigaciones. Se abrirá la página Gemini Cloud Assist, en la que podrás ver todas las investigaciones en ejecución y las que se completaron anteriormente. Puedes filtrar la página por proyecto o etiqueta, por ejemplo, para encontrar la investigación específica que necesitas.

    Como alternativa, para ver todas las investigaciones anteriores, haz clic en el ícono de Notificaciones y, luego, selecciona una notificación asociada con cualquier investigación para abrir la página de Gemini Cloud Assist.

  11. También puedes completar los siguientes pasos si quieres investigar la latencia de cualquier consulta:
    1. Identifica la búsqueda específica que deseas investigar.
    2. En la columna Acciones, haz clic en el ícono de Acciones asociado con esa búsqueda.
    3. Selecciona Investigar la latencia en el menú para ejecutar una investigación de Gemini Cloud Assist.

Detalles de la consulta

También puedes solucionar problemas de una consulta lenta con la asistencia de IA desde la página Detalles de la consulta.

  1. En la consola de Google Cloud , ve a la página Clústeres.
  2. Ir a los clústeres
  3. En la lista de clústeres e instancias, haz clic en una instancia.
  4. Haz clic en Estadísticas de consultas para abrir el panel de Estadísticas de consultas.
  5. En el panel de Estadísticas de consultas, haz clic en la consulta que deseas ver en Consultas principales. Aparecerá la página Detalles de la consulta.
  6. Opcional: Usa el filtro de intervalo de tiempo para seleccionar 1 hora, 6 horas, 1 día, 7 días, 30 días o un intervalo personalizado. Cuando ajustas el filtro de período de la página Detalles de la consulta, AlloyDB vuelve a ejecutar la detección de anomalías.
  7. Si AlloyDB no detecta una anomalía en la consulta, puedes hacer clic en el botón Investigar de la tarjeta Latencia de la consulta para ejecutar un análisis de la consulta.

Analiza la latencia de las consultas

Con la ayuda de la IA, puedes analizar y solucionar problemas relacionados con los detalles de la latencia de tu búsqueda.

Período del análisis

El período de análisis consta de las 24 horas anteriores al final del intervalo que seleccionas en el gráfico Carga de la base de datos del panel Estadísticas de consultas o en la página Detalles de la consulta. AlloyDB usa este período para comparar las métricas de referencia con las métricas recuperadas durante el período de la anomalía.

En la página Detalles de la consulta, si AlloyDB detectó una anomalía en la consulta, después de que selecciones la consulta en el panel de Estadísticas de consultas, AlloyDB realizará un análisis del rendimiento de referencia para la consulta con las últimas 24 horas desde el final de la anomalía. Si AlloyDB no detectó una anomalía en la consulta y vuelve a ejecutar la detección de anomalías en ella, AlloyDB usa las 48 horas previas al final del período seleccionado como el modelo de referencia de rendimiento para el período de análisis.

Período de detección de anomalías

El período de anomalía detectado representa un período en el que AlloyDB encuentra un cambio anómalo en el rendimiento de las consultas. AlloyDB usa el rendimiento de referencia medido para la consulta durante el período de análisis.

Si AlloyDB detecta varias anomalías para una consulta dentro de un período seleccionado, usará la última anomalía detectada.

Ejemplos de instrucciones para mejorar el rendimiento de las búsquedas

También puedes usar Gemini Cloud Assist para ingresar instrucciones que te ayuden a mejorar el rendimiento de tus consultas. Gemini Cloud Assist responde preguntas sobre la instancia y la base de datos de AlloyDB seleccionadas.

Instrucción Tipo de respuesta
¿Cuáles son las principales consultas por latencia en mi base de datos?
  • Resúmenes de las búsquedas ordenadas por latencia. Gemini limita el alcance de la respuesta según el filtro de período seleccionado en el gráfico de carga de la base de datos de estadísticas de búsqueda.
  • Orientación para identificar y ordenar las consultas por latencia
¿Cuál es la consulta más lenta en esta instancia de base de datos? Orientación para identificar la consulta más lenta por latencia

Soluciona problemas de carga alta de la base de datos

Si accedes al panel de Estadísticas de consultas en la consola de Google Cloud , puedes analizar tu base de datos y solucionar problemas de eventos cuando tu sistema experimenta una carga de base de datos superior al promedio. AlloyDB usa las 24 horas de datos que se producen antes del período seleccionado para calcular la carga esperada de tu base de datos. Puedes investigar los motivos de los eventos de carga más altos y analizar la evidencia detrás del rendimiento reducido. AlloyDB también proporciona recomendaciones para optimizar tu base de datos y mejorar el rendimiento.

Para usar la asistencia de IA y solucionar problemas relacionados con la carga alta de la base de datos, ve a la página Descripción general de la instancia o al panel de Estadísticas de consultas en la consola de Google Cloud .

Página de descripción general de la instancia

Sigue estos pasos para solucionar problemas de carga alta de la base de datos con la asistencia de IA en la página Descripción general de la instancia:

  1. En la consola de Google Cloud , ve a la página Clústeres.
  2. Ir a los clústeres
  3. En la lista de clústeres e instancias, haz clic en una instancia.
  4. En la página Descripción general, en el menú Gráfico, selecciona una métrica para la base de datos. Puedes seleccionar cualquier métrica, por ejemplo, Uso de CPU.
  5. Opcional: Para seleccionar un período de análisis específico, usa el filtro Intervalo de tiempo y elige 1 hora, 6 horas, 1 día, 7 días, 30 días o un intervalo personalizado.

    Puedes acercar la vista a secciones específicas del gráfico en las que observes áreas de carga alta que quieras analizar. Por ejemplo, un área de carga alta podría mostrar niveles de uso de CPU cercanos al 100%. Para acercar la imagen, puedes hacer clic y seleccionar una parte del gráfico.

    Haz clic en el botón Investigate performance para comenzar a solucionar problemas de carga alta de la base de datos con la asistencia de IA de Gemini Cloud Assist.

    Después de unos dos minutos, se abrirá el panel Detalles de la investigación con las siguientes secciones:

    • Problema. Una descripción del problema que se investiga, incluidas la hora de inicio y finalización de la investigación
    • Observaciones. Es una lista de observaciones sobre el problema. Por ejemplo, pueden incluir detalles de la contención de bloqueo, como una proporción de espera de bloqueo más larga de lo esperado para la consulta.
    • Hipótesis. Es una lista de acciones recomendadas por la IA para abordar la consulta de ejecución lenta.

Panel de estadísticas de consultas

Sigue estos pasos para solucionar problemas relacionados con la carga alta de la base de datos con la asistencia de IA en el panel de Estadísticas de consultas:

  1. En la consola de Google Cloud , ve a la página Clústeres.
  2. Ir a los clústeres
  3. En la lista de clústeres e instancias, haz clic en una instancia.
  4. Haz clic en Estadísticas de consultas para abrir el panel de Estadísticas de consultas.
  5. Opcional: Usa el filtro Intervalo de tiempo para seleccionar 1 hora, 6 horas, 1 día, 7 días, 30 días o un intervalo personalizado.
  6. Puedes acercar la vista a secciones específicas del gráfico en las que observes áreas de mayor carga de la base de datos según el tiempo de ejecución de la consulta. Para acercar la imagen, puedes hacer clic y seleccionar una parte del gráfico.

    En el gráfico de carga de la base de datos, haz clic en el botón Investigar el rendimiento para comenzar a solucionar problemas de carga alta de la base de datos con la asistencia de IA de Gemini Cloud Assist.

    Después de unos dos minutos, se abrirá el panel Detalles de la investigación con las siguientes secciones:

    • Problema. Una descripción del problema que se investiga, incluidas la hora de inicio y finalización de la investigación
    • Observaciones. Es una lista de observaciones sobre el problema. Por ejemplo, pueden incluir detalles de la contención de bloqueo, como una proporción de espera de bloqueo más larga de lo esperado para la consulta.
    • Hipótesis. Es una lista de acciones recomendadas por la IA para abordar la consulta de ejecución lenta.

Analiza la carga alta de la base de datos

Con la asistencia de IA, puedes analizar y solucionar problemas relacionados con los detalles de la carga de tu base de datos.

Período del análisis

AlloyDB analiza tu base de datos durante el período que seleccionas en el gráfico de carga de la base de datos del panel de Estadísticas de consultas o la página Descripción general de la instancia. Si seleccionas un período de menos de 24 horas, AlloyDB analizará todo el período. Si seleccionas un período superior a 24 horas, AlloyDB solo seleccionará las últimas 24 horas del período para el análisis.

Para calcular el análisis del rendimiento de referencia de tu base de datos, AlloyDB incluye 24 horas de un período de referencia en su período de análisis. Si el período seleccionado ocurre en un día que no es lunes, AlloyDB usa un período de referencia de las 24 horas anteriores al período seleccionado. Si el período seleccionado ocurre un lunes, AlloyDB usa un período de referencia del 7º día anterior al período seleccionado.

Análisis de métricas

Cuando AlloyDB inicia el análisis, verifica si hay cambios significativos en las distintas métricas, incluidas, sin limitaciones, las siguientes:

  • Consultas por segundo (QPS)
  • CPU
  • Memoria
  • E/S de disco

AlloyDB compara los datos agregados de referencia de tu base de datos con los datos de rendimiento del período de análisis. Si AlloyDB detecta un cambio significativo en el umbral de una métrica clave, indicará una posible situación con tu base de datos. La situación identificada podría explicar una causa raíz de la alta carga en tu base de datos durante el período seleccionado.

Recomendaciones

Cuando Gemini Cloud Assist completa el análisis, la sección Hypotheses del panel Investigation details muestra estadísticas prácticas para ayudarte a solucionar el problema.

En algunas situaciones, según el análisis, es posible que no haya una recomendación.

Ejemplos de instrucciones sobre el rendimiento del sistema

También puedes usar Gemini Cloud Assist para ingresar instrucciones y recopilar información sobre el rendimiento de tu sistema. Gemini Cloud Assist responde preguntas sobre la instancia de AlloyDB seleccionada.

Instrucción Tipo de respuesta
¿Cuántas entradas de registro de errores hay para esta instancia de base de datos en los últimos 7 días? Es un resumen de las entradas de registro agrupadas por su tipo de gravedad. Gemini limita el alcance de la respuesta según el filtro de período seleccionado en el gráfico de rendimiento de la instancia.
¿Cuál fue el uso de CPU de esta instancia de base de datos alrededor de las 2 p.m. de hoy? Los resultados de las métricas en el rango de porcentaje para el uso de CPU dentro del intervalo.

Cómo obtener recomendaciones de índices

Puedes obtener recomendaciones de índices de AlloyDB en las estadísticas de consultas. Para obtener más información, consulta Descripción general del asesor de índices.

Ejemplos de instrucciones para obtener recomendaciones de índices

Usa Gemini Cloud Assist para obtener más información sobre cómo usar índices en tus bases de datos. Gemini Cloud Assist responde preguntas sobre la instancia de AlloyDB seleccionada.

Instrucción Tipo de respuesta
Mostrar recomendaciones de índice para las búsquedas realizadas en los últimos 7 días Orientación sobre los tipos de consultas que se pueden beneficiar de un índice

Supervisa las consultas activas

Usa el panel de Estadísticas de consultas para supervisar las consultas activas y, si es necesario, finalizar los procesos de larga duración. Para obtener más información, consulta Supervisa las consultas activas.

Ejemplos de instrucciones de búsqueda activa

Usa Gemini Cloud Assist para obtener más información sobre las consultas que provocan una latencia o una carga de CPU altas. Gemini Cloud Assist responde preguntas sobre la instancia de AlloyDB seleccionada.

Instrucción Tipo de respuesta
¿Cuáles son las principales consultas que se ejecutan actualmente en mi base de datos? Orientación para encontrar las consultas más largas y las que consumen más recursos

Soluciona problemas de retraso de la réplica de lectura

Puedes analizar el retraso de replicación con Gemini Cloud Assist o el panel Overview en la consola de Google Cloud .

La asistencia de IA evalúa los siguientes factores para determinar por qué una réplica de lectura se está quedando atrás de una instancia principal.

  • Volumen de escritura de la instancia principal

    Las altas tasas de modificación de datos en la instancia principal pueden generar registros de WAL más rápido de lo que la réplica puede reproducirlos. Gemini verifica si hay patrones de escritura "explosivos" que se correlacionan con picos de rezago.

  • Restricciones de recursos (CPU/memoria)

    La reproducción de la replicación es un proceso que requiere mucha CPU. Gemini analiza si el nivel de la máquina de la réplica es insuficiente para controlar la carga de reproducción actual o si las consultas de lectura simultáneas están privando al proceso de reproducción de recursos.

  • Rendimiento de la red y el almacenamiento

    En las implementaciones entre regiones, el rendimiento de la red puede afectar la rapidez con la que se envían los registros a la réplica. La IA evalúa los metadatos de la operación interna para identificar si el cuello de botella se encuentra en el transporte o en la aplicación de los registros.

Investiga el retraso de la réplica de lectura

Para usar la asistencia de IA y solucionar problemas de retraso de la réplica de lectura, haz lo siguiente:

  1. En la consola de Google Cloud , ve a la página Clústeres.
  2. Ir a los clústeres
  3. Navega a Estadísticas del sistema. En el menú Instancia, selecciona tu réplica de lectura.
  4. En el panel Resolve database issues with AI-assisted troubleshooting, haz clic en Explorar investigaciones.
  5. En la ventana Opciones de investigación, busca la sección Retraso de la réplica de lectura.
  6. Opcional: Selecciona un período de análisis específico con el filtro Intervalo de tiempo (Time range): 1 hora, 6 horas, 1 día, 7 días o un intervalo personalizado.
  7. Haga clic en Investigar.

    Gemini inicia un análisis de los indicadores específicos de la replicación, incluidas las tasas de generación de WAL (registro de escritura anticipada) y la velocidad de reproducción de la réplica. Una vez que se complete el análisis, el panel Detalles de la investigación mostrará las siguientes secciones:

    • Problema: Es un resumen de la duración del retraso y el "retraso de bytes" o "lapso de tiempo" actual entre el servidor principal y la réplica.
    • Observaciones: Métricas específicas, como la alta utilización de la CPU en la réplica o la contención de bloqueos durante la reproducción del WAL
    • Hipótesis: Son pasos recomendados por la IA, como optimizar las transacciones de escritura pesadas en la instancia principal o aumentar el nivel de la máquina de réplica.

Ejemplos de instrucciones sobre el retraso de la réplica de lectura

También puedes usar Gemini Cloud Assist y una consulta en lenguaje natural para solucionar problemas de retraso entre tu réplica de lectura y tu instancia principal.

Instrucción Tipo de respuesta
¿Por qué es tan alto el retraso de mi réplica de lectura de AlloyDB? Orientación para reducir el retraso de la réplica ajustando tu base de datos o configurando tu clúster.

¿Qué sigue?