Neste documento, descrevemos como visualizar a telemetria dos recursos de IA usados pelos aplicativos, serviços e cargas de trabalho registrados no App Hub.
Para gerar métricas como taxa de erros, latência e uso de tokens, o Application Monitoring consulta seus dados de rastreamento em busca de rótulos e eventos específicos do aplicativo que seguem as convenções semânticas de IA generativa do OpenTelemetry. Essas métricas quantificam a integridade, a performance e o custo dos seus recursos de IA e estão disponíveis como dados agregados para aplicativos ou como dados detalhados para serviços e cargas de trabalho individuais.
O painel a seguir mostra informações de recursos de IA para um aplicativo registrado:
Antes de começar
Os procedimentos neste documento exigem um Google Cloud projeto com recursos de IA ativos para análise. Além disso, é necessário que seus recursos de IA estejam associados a aplicativos, serviços e cargas de trabalho registrados no App Hub. O Application Monitoring precisa de dados de telemetria e rastreamento para produzir resultados significativos.
Configurar papéis, APIs e o monitoramento de aplicativos
- Conclua as etapas definidas em Investigar aplicativos, serviços e cargas de trabalho: antes de começar.
-
Ative as APIs Observability, Cloud Trace e Telemetry.
Funções necessárias para ativar APIs
Para ativar as APIs, é necessário ter o papel do IAM de administrador de uso do serviço (
roles/serviceusage.serviceUsageAdmin), que contém a permissãoserviceusage.services.enable. Saiba como conceder papéis. -
Para receber as permissões necessárias para visualizar informações de uso de recursos de IA, peça ao administrador para conceder a você os seguintes papéis do IAM:
- Leitor de observabilidade (
roles/observability.viewer) no seu projeto - Acessador de visualização de observabilidade (
roles/observability.viewaccessor) nas visualizações de observabilidade que você quer consultar. É possível restringir essa concessão a uma visualização específica.
Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.
Também é possível conseguir as permissões necessárias usando papéis personalizados ou outros papéis predefinidos.
- Leitor de observabilidade (
Desenvolver e registrar aplicativos, serviços e cargas de trabalho
Para mostrar dados de recursos de IA usados pelos seus aplicativos, serviços e cargas de trabalho, os dados de rastreamento precisam conter rótulos e eventos específicos do aplicativo que seguem as convenções semânticas de IA generativa do OpenTelemetry. Para receber esses rótulos, siga estas etapas:
- Registre seu aplicativo e os serviços e cargas de trabalho dele no App Hub.
- Use o framework do Kit de Desenvolvimento de Agente (ADK) ou instrumente seu aplicativo com o OpenTelemetry e envie os dados de rastreamento para a API Telemetry. Para exemplos de instrumentação, consulte Instrumentar aplicativos ADK com o OpenTelemetry e Visão geral de exemplos de instrumentação baseados em coletores.
Conferir recursos de IA para um aplicativo
Para conferir os recursos de IA associados a um aplicativo, faça o seguinte:
-
No console do Google Cloud , acesse a página Monitoramento de aplicativos:
Acessar Monitoramento de aplicativos
Se você usar a barra de pesquisa para encontrar essa página, selecione o resultado com o subtítulo Monitoring.
Na barra de ferramentas do console Google Cloud , selecione seu projeto host ou de gerenciamento do App Hub.
Selecione a guia Aplicativos e escolha o aplicativo na lista.
Selecione a guia Painéis.
No Sumário do painel, selecione Recursos de IA.
O sistema cria a entrada Recursos de IA quando você tem pelo menos um agente de IA associado ao seu aplicativo que está ativo. Se você não tiver agentes ou se todos estiverem inativos, a opção não será listada.
O painel vai para a seção Recursos de IA, que mostra informações como as seguintes:
- Total de consultas por segundo e contagem de tokens.
- Taxa média de erros, latência e taxa de erros de chamada de ferramenta.
- Uso de tokens.
- Taxas de erro e latência para agentes.
Ver recursos de IA para um serviço ou carga de trabalho
Para ver os recursos de IA associados a um serviço ou carga de trabalho, faça o seguinte:
Abra o painel do serviço ou da carga de trabalho:
-
No console do Google Cloud , acesse a página Monitoramento de aplicativos:
Acessar Monitoramento de aplicativos
Se você usar a barra de pesquisa para encontrar essa página, selecione o resultado com o subtítulo Monitoring.
Selecione a guia Serviços e cargas de trabalho e escolha o serviço ou a carga de trabalho.
O painel do serviço ou da carga de trabalho será aberto. O sumário lista as seções no painel, que podem depender do tipo de recurso de IA.
-
Para acessar a seção do painel com informações sobre seus recursos de IA, use o Sumário do painel:
Agente: disponível para agentes. Esta seção mostra informações sobre sessões, invocações de agentes e uso de tokens.
Ferramentas: disponível para agentes. Esta seção mostra informações sobre chamadas de função, incluindo taxa de erro, contagem de chamadas e latência P95.
Modelos: disponível para alguns agentes. Esta seção mostra informações sobre o número de chamadas de modelo feitas pelo agente, a taxa de erros e o uso de tokens.
Analisar a telemetria
As consultas SQL nos dados de rastreamento determinam os dados mostrados nos gráficos de recursos de IA. Essas consultas filtram dados de rastreamento por rótulos específicos do aplicativo e eventos de IA generativa que seguem as convenções semânticas do OpenTelemetry GenAI.
Para ver a consulta de um gráfico, na barra de ferramentas dele, selecione more_vert Mais opções de gráfico e, em seguida, Explorar no Observability Analytics.
A Análise de observabilidade é aberta e mostra a consulta SQL que gera dados para o gráfico. Siga uma destas instruções:
- Inspecione a consulta e volte ao Monitoramento de aplicativos.
- Execute a consulta.
- Modifique e execute a consulta.
- Crie um gráfico que mostre o resultado da consulta.
- Salve um gráfico que mostre o resultado da consulta em um painel personalizado.
Para saber mais, assista a estes vídeos: