Neste documento, descrevemos como usar a assistência de IA para monitorar e resolver problemas nos seus recursos do AlloyDB para PostgreSQL. Você pode usar as ferramentas de solução de problemas com tecnologia de IA do AlloyDB e do Gemini Cloud Assist para resolver problemas de consultas lentas e resolver problemas de alta carga do banco de dados.
Limitações
As seguintes limitações se aplicam à solução de problemas com a ajuda da IA no AlloyDB:
- A solução de problemas com tecnologia de IA oferece insights valiosos com base em configurações padrão do PostgreSQL. A arquitetura exclusiva do AlloyDB, incluindo armazenamento desagregado, cache, mecanismo colunar e processos em segundo plano otimizados, significa que determinadas verificações e recomendações podem ser diferentes das métricas de performance reais do AlloyDB. Recomendamos que você considere as recomendações de solução de problemas assistida por IA como pontos de partida e consulte a documentação do AlloyDB para orientações definitivas.
- A solução de problemas com a ajuda da IA não é compatível com as seguintes configurações do AlloyDB:
- Instâncias dentro de um perímetro do VPC Service Controls
- Instâncias ativadas com a Transparência no acesso
Antes de começar
Verifique se o Gemini Cloud Assist está configurado para sua conta de usuário e projeto do Google Cloud .Depois de configurar o Gemini Cloud Assist, talvez seja necessário esperar cinco minutos para que o serviço seja propagado antes de ativar a solução de problemas com a ajuda da IA no AlloyDB.
Papéis e permissões necessárias
Para receber as permissões necessárias a fim de usar a solução de problemas assistida por IA, peça que o administrador conceda a você os seguintes papéis do IAM no projeto que hospeda a instância do AlloyDB:
- Leitor de insights de banco de dados (
roles/databaseinsights.viewer) -
Usar investigações do Gemini Cloud Assist:
Proprietário de investigações do Gemini Cloud Assist (
roles/geminicloudassist.investigationOwner)
Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.
Esses papéis predefinidos contêm as permissões necessárias para usar a solução de problemas com a ajuda da IA. Para acessar as permissões exatas necessárias, expanda a seção Permissões necessárias:
Permissões necessárias
As seguintes permissões são necessárias para usar a solução de problemas com a ajuda da IA:
-
databaseinsights.performanceIssues.detect -
databaseinsights.performanceIssues.investigate
Essas permissões também podem ser concedidas com funções personalizadas ou outros papéis predefinidos.
Para mais informações sobre os papéis e permissões necessários para usar as investigações do Gemini Cloud Assist, consulte Solucionar problemas com as investigações do Gemini Cloud Assist.
Ativar a solução de problemas assistida por IA
Quando você ativa a solução de problemas assistida por IA na sua instância do AlloyDB, ele pode analisar o desempenho dos seus bancos de dados e detectar anomalias na execução das consultas. Quando o AlloyDB detecta anomalias no desempenho das consultas ou identifica uma carga alta no sistema, a solução de problemas assistida por IA ajuda você a analisar a situação com evidências e fornece recomendações.
Para ativar a solução de problemas com a ajuda da IA na sua instância do AlloyDB, faça o seguinte:
No Google Cloud console, acesse a página Clusters.
Na lista de clusters e instâncias, clique em uma instância.
Clique em Insights de consultas.
Clique em Ativar ou Editar configurações.
Na guia Editar configurações dos insights de consultas, marque a caixa de seleção Ativar recursos avançados dos insights de consultas para o AlloyDB.
Por padrão, isso ativa a caixa de seleção Solução de problemas assistida por IA.
Clique em Salvar.
Para ter os melhores resultados, aguarde 24 horas depois de ativar a solução de problemas assistida por IA no console do Google Cloud para permitir que o AlloyDB crie um valor de referência do desempenho médio da sua instância, banco de dados e consultas.
Para mais informações sobre como ativar os insights de consulta avançados, consulte Melhorar o desempenho da consulta usando insights de consulta avançados.
Abrir o Gemini Cloud Assist
Para usar o Gemini Cloud Assist com o AlloyDB, faça o seguinte:
- No Google Cloud console, acesse a página Clusters. Acessar Clusters
- Na lista de clusters e instâncias, clique em uma instância.
- Clique em Insights de consultas.
- Para abrir o painel do Cloud Assist, clique em Abrir ou fechar o chat do Gemini Cloud Assist.
- No painel do Cloud Assist, insira um comando que descreva as informações em que você tem interesse.
- Depois de inserir o comando, clique em Enviar comando. O Gemini retorna uma resposta à sua solicitação com base nas informações da última hora.
Resolver problemas de consultas lentas
Para usar a assistência de IA e resolver problemas com consultas lentas, acesse o painel Query Insights da sua instância do AlloyDB no console do Google Cloud .
Tabela das principais consultas
Você pode começar a resolver problemas de consultas lentas com a assistência da IA na seção Tabela das principais consultas do painel Query Insights.
O AlloyDB pode ajudar você a identificar quais consultas estão sendo executadas mais lentamente do que a média durante um período de detecção específico. Depois que você seleciona um período no painel Insights de consultas, o AlloyDB verifica se alguma consulta está sendo executada mais lentamente do que a média usando um período de detecção de 24 horas antes do fim do período selecionado.
Quando você ajusta o filtro de período do gráfico Carga do banco de dados ou qualquer outro filtro, como banco de dados ou usuário, o AlloyDB atualiza a Tabela de principais consultas e executa novamente a detecção de anomalias com base na nova lista de consultas e em um período de detecção atualizado.
Quando o AlloyDB detecta uma anomalia:O AlloyDB realiza uma análise de desempenho de linha de base para sua consulta.
Todas as consultas listadas na tabela têm um ícone Investigar ou Aviso warning_spark exibido ao lado do valor Tempo médio de execução (ms) da consulta.
Se uma consulta estiver sendo executada mais lentamente do que o esperado, um ícone de Aviso warning_spark será exibido. Quando você clica em um dos ícones, o Gemini Cloud Assist é usado para analisar a execução da consulta e oferece observações sobre o que pode ter causado o problema. Com base nessas observações, o Gemini Cloud Assist gera uma hipótese que pode ajudar você a resolver o problema.
Para resolver problemas de consultas lentas na tabela Principais consultas do painel Insights de consulta, faça o seguinte:
- No Google Cloud console, acesse a página Clusters. Acessar Clusters
- Na lista de clusters e instâncias, clique em uma instância.
- Clique em Query Insights.
- No gráfico Consultas executadas, use o filtro Intervalo de tempo para selecionar 1 hora, 6 horas, 1 dia, 7 dias, 30 dias ou um período personalizado.
- Na tabela Principais consultas, na guia Consultas, revise a lista de consultas do seu banco de dados.
- Se um ícone de Aviso warning_spark aparecer ao lado do valor Tempo médio de execução (ms) de uma consulta, o AlloyDB detectou uma anomalia no desempenho dela. O AlloyDB verifica anomalias no período de 24 horas que ocorre antes do fim do período selecionado.
- Clique no ícone Aviso warning_spark.
- Na caixa de diálogo A consulta está mais lenta do que o normal, clique em Nova investigação para começar a resolver problemas com a ajuda da IA do Gemini Cloud Assist.
Depois de cerca de dois minutos, o painel Detalhes da investigação será aberto com as seguintes seções:
- Problema. Uma descrição do problema que está sendo investigado, incluindo o horário de início e de término da investigação.
- Observações. Uma lista de observações sobre o problema. Por exemplo, esses detalhes podem incluir informações sobre disputa de bloqueio, como uma proporção de espera de bloqueio maior do que o esperado para a consulta.
- Hipóteses. Uma lista de ações recomendadas pela IA para ajudar a resolver a consulta lenta.
Se quiser ver todas as investigações associadas à consulta, na caixa de diálogo A consulta está mais lenta que o normal, clique em Ver todas as investigações. A página Gemini Cloud Assist é aberta, onde você pode conferir todas as investigações em andamento e concluídas. Você pode filtrar a página por projeto ou rótulo, por exemplo, para encontrar a investigação específica de que precisa.
Outra opção é clicar no ícone Notificações e selecionar uma notificação associada a qualquer investigação para abrir a página Gemini Cloud Assist.
- Como alternativa, se você quiser investigar a latência de qualquer consulta, siga estas etapas:
- Identifique a consulta específica que você quer investigar.
- Na coluna Ações, clique no ícone Ações associado a essa consulta.
- Selecione Investigar latência no menu para executar uma investigação do Gemini Cloud Assist.
Detalhes da consulta
Também é possível resolver problemas de uma consulta lenta com a assistência da IA na página Detalhes da consulta.
- No Google Cloud console, acesse a página Clusters. Acessar Clusters
- Na lista de clusters e instâncias, clique em uma instância.
- Clique em Insights de consulta para abrir o painel Insights de consulta.
- No painel Query insights, clique na consulta que você quer ver em Principais consultas. A página Detalhes da consulta é exibida.
- Opcional: use o filtro de período para selecionar 1 hora, 6 horas, 1 dia, 7 dias, 30 dias ou um período personalizado. Quando você ajusta o filtro de período da página Detalhes da consulta, o AlloyDB executa novamente a detecção de anomalias.
- Se o AlloyDB não detectar uma anomalia na consulta, você ainda poderá executar uma análise clicando no botão Investigar no card Latência da consulta.
Analisar a latência da consulta
Com a ajuda da IA, você pode analisar e resolver problemas nos detalhes da latência da consulta.
Período da análise
O período de análise consiste nas 24 horas anteriores ao fim do intervalo de tempo selecionado no gráfico Carga do banco de dados do painel Insights de consulta ou na página Detalhes da consulta. O AlloyDB usa esse período para comparar as métricas de valor de referência com as métricas recuperadas durante o período da anomalia.
Na página Detalhes da consulta, se o AlloyDB tiver detectado uma anomalia na consulta, depois que você selecionar a consulta no painel Insights de consultas, o AlloyDB vai realizar uma análise de performance de linha de base para a consulta usando as últimas 24 horas desde o fim da anomalia. Se o AlloyDB não tiver detectado uma anomalia com a consulta e executar a detecção de anomalias novamente, o AlloyDB usará 48 horas antes do fim do período selecionado como o valor de referência de desempenho para o período de análise.
Período da anomalia detectada
O período da anomalia detectada representa um período em que o AlloyDB encontra uma mudança anômala na performance da consulta. O AlloyDB usa o desempenho de base medido para a consulta durante o período de análise.
Se o AlloyDB detectar várias anomalias para uma consulta em um período selecionado, ele usará a última anomalia detectada.
Exemplos de comandos de desempenho da consulta
Você também pode usar o Gemini Cloud Assist para inserir comandos e melhorar o desempenho das suas consultas. O Gemini Cloud Assist responde a perguntas sobre a instância e o banco de dados do AlloyDB selecionados.
| Comando | Tipo de resposta |
|---|---|
| Quais são as principais consultas por latência no meu banco de dados? |
|
| Qual é a consulta mais lenta nesta instância de banco de dados? | Instruções sobre como identificar a consulta mais lenta por latência. |
Resolver problemas de alta carga do banco de dados
Ao acessar o painel Insights de consultas no console do Google Cloud , você pode analisar seu banco de dados e resolver problemas de eventos quando o sistema tiver uma carga maior do que a média. O AlloyDB usa os dados das 24 horas anteriores ao período selecionado para calcular a carga esperada do banco de dados. Você pode investigar os motivos dos eventos de carga mais altos e analisar as evidências por trás da redução na performance. O AlloyDB também oferece recomendações para otimizar seu banco de dados e melhorar a performance.
Para usar a assistência de IA na solução de problemas de alta carga do banco de dados, acesse a página Visão geral da instância ou o painel Insights de consultas no console do Google Cloud .
Página de visão geral da instância
Para resolver problemas de carga alta do banco de dados com a ajuda da IA na página Visão geral da instância, siga estas etapas:
- No Google Cloud console, acesse a página Clusters. Acessar Clusters
- Na lista de clusters e instâncias, clique em uma instância.
- Na página Visão geral, no menu Gráfico, selecione uma métrica para o banco de dados. Você pode selecionar qualquer métrica, por exemplo, Utilização da CPU.
- Opcional: para selecionar um período de análise específico, use o filtro Período e escolha 1 hora, 6 horas, 1 dia, 7 dias, 30 dias ou um período personalizado.
Você pode aumentar o zoom em seções específicas do gráfico em que notar áreas de alta carga que quer analisar. Por exemplo, uma área de alta carga pode mostrar níveis de uso da CPU mais próximos de 100%. Para aumentar o zoom, clique e selecione uma parte do gráfico.
Clique no botão Investigar desempenho para começar a resolver problemas de alta carga do banco de dados com a assistência de IA do Gemini Cloud Assist.
Depois de cerca de dois minutos, o painel Detalhes da investigação é aberto com as seguintes seções:
- Problema. Uma descrição do problema que está sendo investigado, incluindo o horário de início e de término da investigação.
- Observações. Uma lista de observações sobre o problema. Por exemplo, esses detalhes podem incluir informações sobre disputa de bloqueio, como uma proporção de espera de bloqueio maior do que o esperado para a consulta.
- Hipóteses. Uma lista de ações recomendadas pela IA para ajudar a resolver a consulta de execução lenta.
Painel do Query Insights
Resolva problemas de alta carga do banco de dados com a assistência da IA no painel Query Insights seguindo estas etapas:
- No Google Cloud console, acesse a página Clusters. Acessar Clusters
- Na lista de clusters e instâncias, clique em uma instância.
- Clique em Insights de consulta para abrir o painel Insights de consulta.
- Opcional: use o filtro Intervalo de tempo para selecionar 1 hora, 6 horas, 1 dia, 7 dias, 30 dias ou um período personalizado.
- Problema. Uma descrição do problema que está sendo investigado, incluindo o horário de início e de término da investigação.
- Observações. Uma lista de observações sobre o problema. Por exemplo, esses detalhes podem incluir informações sobre disputa de bloqueio, como uma proporção de espera de bloqueio maior do que o esperado para a consulta.
- Hipóteses. Uma lista de ações recomendadas pela IA para ajudar a resolver a consulta de execução lenta.
Você pode aumentar o zoom em seções específicas do gráfico em que notar áreas de maior carga do banco de dados por tempo de execução da consulta. Para aumentar o zoom, clique e selecione uma parte do gráfico.
No gráfico de carga do banco de dados, clique no botão Investigar desempenho para começar a resolver problemas de alta carga do banco de dados com a assistência de IA do Gemini Cloud Assist.
Depois de cerca de dois minutos, o painel Detalhes da investigação é aberto com as seguintes seções:
Analisar alta carga do banco de dados
Com a ajuda da IA, é possível analisar e resolver problemas nos detalhes da carga do banco de dados.
Período da análise
O AlloyDB analisa seu banco de dados no período selecionado no gráfico de carga do banco de dados do painel Insights de consultas ou da página Visão geral da instância. Se você selecionar um período de menos de 24 horas, o AlloyDB vai analisar todo o período. Se você selecionar um período maior que 24 horas, o AlloyDB vai escolher apenas as últimas 24 horas para análise.
Para calcular a análise de desempenho de referência do seu banco de dados, o AlloyDB inclui 24 horas de um período de referência no período de análise. Se o período selecionado ocorrer em um dia diferente de segunda-feira, o AlloyDB usará um período de base de 24 horas antes do período selecionado. Se o período selecionado ocorrer em uma segunda-feira, o AlloyDB usará um período de base de 7 dias antes do período selecionado.
Análise de métricas
Quando o AlloyDB inicia a análise, ele verifica mudanças significativas nas várias métricas, incluindo, entre outras:
- Consultas por segundo (QPS)
- CPU
- Memória
- E/S de disco
O AlloyDB compara os dados agregados de referência do seu banco de dados com os dados de performance do período de análise. Se o AlloyDB detectar uma mudança significativa no limite de uma métrica principal, ele vai indicar uma possível situação com seu banco de dados. A situação identificada pode explicar uma causa raiz para a alta carga no banco de dados durante o período selecionado.
Recomendações
Quando o Gemini Cloud Assist conclui a análise, a seção Hipóteses do painel Detalhes da investigação lista insights úteis para ajudar a corrigir o problema.
Em algumas situações, com base na análise, talvez não haja uma recomendação.
Exemplos de comandos de desempenho do sistema
Você também pode usar o Gemini Cloud Assist para inserir comandos e coletar informações sobre o desempenho do sistema. O Gemini Cloud Assist responde a perguntas sobre a instância do AlloyDB selecionada.
| Comando | Tipo de resposta |
|---|---|
| Quantas entradas de registro de erros existem para esta instância de banco de dados nos últimos sete dias? | Resumo das entradas de registro agrupadas por tipo de gravidade. O Gemini limita a resposta pelo filtro de período selecionado no gráfico de performance da instância. |
| Qual foi a utilização da CPU para esta instância de banco de dados por volta das 14h de hoje? | Resultados de métricas em um intervalo de porcentagem para a utilização da CPU dentro do intervalo de tempo. |
Receber recomendações de índice
Você pode receber recomendações de índice do AlloyDB nos insights de consulta. Para mais informações, consulte Visão geral do consultor de índice.
Exemplos de comandos de recomendação de índice
Use o Gemini Cloud Assist para saber mais sobre como usar índices nos seus bancos de dados. O Gemini Cloud Assist responde a perguntas sobre a instância do AlloyDB selecionada.
| Comando | Tipo de resposta |
|---|---|
| Mostrar recomendações de índice para consultas executadas nos últimos sete dias. | Orientação sobre os tipos de consultas que podem se beneficiar de um índice. |
Monitorar consultas ativas
Use o painel Query Insights para monitorar consultas ativas e, se necessário, encerrar processos de longa duração. Para mais informações, consulte Monitorar consultas ativas.
Exemplos de comandos de consulta ativa
Use o Gemini Cloud Assist para saber mais sobre consultas que causam alta latência ou carga de CPU. O Gemini Cloud Assist responde a perguntas sobre a instância do AlloyDB selecionada.
| Comando | Tipo de resposta |
|---|---|
| Quais são as principais consultas em execução no meu banco de dados? | Instruções sobre como encontrar as consultas mais longas e que consomem mais recursos. |
Resolver problemas de atraso da réplica de leitura
É possível analisar o atraso de replicação usando o Gemini Cloud Assist ou o painel Visão geral no console Google Cloud .
A assistência de IA avalia os seguintes fatores para determinar por que uma réplica de leitura está ficando atrás de uma instância principal.
Volume de gravação da instância principal
Altas taxas de modificação de dados na instância principal podem gerar registros WAL mais rápido do que a réplica pode reproduzi-los. O Gemini verifica padrões de gravação "rápidos" que se correlacionam com picos de atraso.
Restrições de recursos (CPU/memória)
A repetição da replicação é um processo com uso intensivo da CPU. O Gemini analisa se o nível da máquina da réplica é insuficiente para processar a carga de reprodução atual ou se consultas de leitura simultâneas estão privando o processo de reprodução de recursos.
Performance de rede e armazenamento
Em implantações entre regiões, a taxa de transferência de rede pode afetar a rapidez com que os registros são enviados para a réplica. A IA avalia os metadados de operação interna para identificar se o gargalo está no transporte ou na aplicação de registros.
Investigar o atraso da réplica de leitura
Para usar a assistência de IA na solução de problemas de atraso da réplica de leitura, faça o seguinte:
- No Google Cloud console, acesse a página Clusters. Acessar Clusters
- Acesse Insights do sistema. No menu Instância, selecione sua réplica de leitura.
- No painel Resolver problemas de banco de dados com a solução de problemas assistida por IA, clique em Explorar investigações.
- Na janela Opções de investigação, procure a seção Atraso da réplica de leitura.
- Opcional: selecione um período de análise específico usando o filtro Intervalo de tempo: 1 hora, 6 horas, 1 dia, 7 dias ou um período personalizado.
- Clique em Investigar.
O Gemini inicia uma análise de indicadores específicos da replicação, incluindo taxas de geração de WAL (Write Ahead Log) e velocidade de repetição da réplica. Depois que a análise for concluída, o painel Detalhes da investigação vai mostrar as seguintes seções:
- Problema: um resumo da duração do atraso e do "atraso de bytes" ou "atraso de tempo" atual entre o primário e a réplica.
- Observações: métricas específicas, como alta utilização da CPU na réplica ou disputa de bloqueio durante a repetição do WAL.
- Hipóteses: etapas recomendadas pela IA, como otimizar transações de gravação pesadas na réplica principal ou aumentar o nível da máquina.
Exemplos de comandos de atraso da réplica de leitura
Você também pode usar o Gemini Cloud Assist e uma consulta em linguagem natural para resolver problemas de atraso entre a réplica de leitura e a instância principal.
| Comando | Tipo de resposta |
|---|---|
| Por que o atraso da minha réplica de leitura do AlloyDB é tão alto? | Orientações sobre como reduzir o atraso da réplica ajustando o banco de dados ou configurando o cluster. |
A seguir
- Aprenda a escrever comandos melhores.
- Saiba como usar o painel do Gemini Cloud Assist.
- Leia Usar o Gemini para assistência e desenvolvimento de IA
-
Saiba como e quando o Gemini para Google Cloud usa seus dados.
- Otimizar instâncias subprovisionadas
- Monitorar instâncias
- Usar o consultor de índice
- Monitorar consultas ativas