Cotas

A estimativa precisa de cota se baseia no número de consultas por segundo (QPS) para cada API. As seções a seguir descrevem as cotas das APIs usadas com cada recurso do Agent Assist.

Tipos de projeto

As tabelas de cota a seguir listam dois tipos de projetos: consumidor e recurso. Consulte a documentação sobre como usar vários projetos para definições desses dois tipos de projetos.

Transcrição de voz

Esse recurso usa a integração de telefonia ou gRPC, que têm cotas de API diferentes.

Integração de telefonia

Consulte as cotas do Dialogflow para as APIs usadas com a integração de telefonia.

Integração do gRPC

Nome do limite de cota Valor padrão Região Recurso de cobrança/projeto do consumidor Descrição
AnalyzeContentOperationsPerMinutePerProject 300 solicitações/min Global Projeto do consumidor Solicitações de AnalyzeContent/StreamingAnalyzeContent. A cota é compartilhada entre o Dialogflow e o Agent Assist.
ConcurrentBidiStreamingSessionsPerProjectPerRegion 50 solicitações simultâneas Regional (o tráfego global é contado na região us-central1) Projeto do consumidor (projeto de recurso para integração de SipRec de telefonia) Sessões de streaming bidirecional simultâneas por região.

Transcrição com modelos do Chirp

Nome da cota Valor padrão Região Recurso de cobrança ou projeto consumidor Descrição
SttV2StreamingRequestsPerMinutePerResourceTypePerRegion 20 solicitações por minuto Regional (o tráfego global é contado na região us-central1) Projeto do consumidor (projeto de recurso para integração de SipRec de telefonia) Número de novas solicitações de StreamingRecognize enviadas para a STT V2 por tipo de recurso.

Análise de sentimento

Nome do limite de cota Valor padrão Região Recurso de cobrança/projeto do consumidor Descrição
AnalyzeSentimentOperationsPerVersion 300 solicitações/min Global Projeto do consumidor Solicitações de análise de sentimento usando AnalyzeContent ou StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerVersionPerRegion 300 solicitações/min Regional Projeto do consumidor Solicitações de análise de sentimento usando AnalyzeContent ou StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerMinutePerProject 300 solicitações/min Global Projeto do consumidor Solicitações de análise de sentimento usando AnalyzeContent ou StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion 300 solicitações/min Regional Projeto do consumidor Solicitações de análise de sentimento usando AnalyzeContent ou StreamingAnalyzeContent.

Crie sua própria assistência

Esse recurso usa os seguintes modelos de IA:

  • text-bison@001 (limite padrão 0)
  • text-bison@002
  • text-bison-32k@002
  • gemini-1.0-pro
  • gemini-1.5-pro
  • gemini-1.5-pro-001
  • gemini-1.5-flash-001
  • gemini-1.5-flash-002
  • gemini-2.0-flash-001
Nome do limite de cota Valor padrão Região Recurso de cobrança/projeto do consumidor Descrição
GeneratorSuggestionOperationsPerMinutePerModelType 10 solicitações/min Global Projeto do consumidor Operações de sugestão do gerador por tipo de modelo.
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 10 solicitações/min Regional Projeto do consumidor Operações de sugestão do gerador por tipo de modelo e região.

Resposta inteligente

Nome do limite de cota Valor padrão Região Recurso de cobrança/projeto do consumidor Descrição
SmartReplyBaselineModelOperationsPerMinutePerProject 120 solicitações/min Global Projeto do consumidor Receba solicitações de modelo de referência de resposta inteligente usando AnalyzeContent ou SuggestSmartReplies.
SmartReplyBaselineV2ModelOperationsPerMinutePerProject 60 solicitações/min Global Projeto do consumidor Receba solicitações do modelo de referência V2 de Resposta inteligente usando AnalyzeContent ou SuggestSmartReplies.
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion 60 solicitações/min Regional Projeto do consumidor Receba solicitações do modelo de referência V2 de Resposta inteligente usando AnalyzeContent ou SuggestSmartReplies.

Resposta inteligente generativa

Nome do limite de cota Valor padrão Região Recurso de cobrança/projeto do consumidor Descrição
SmartReplyBaselineModelOperationsPerMinutePerProject 120 solicitações/min Global Projeto do consumidor Receba solicitações de modelo de referência de resposta inteligente usando AnalyzeContent ou SuggestSmartReplies.
SmartReplyBaselineV2ModelOperationsPerMinutePerProject 60 solicitações/min Global Projeto do consumidor Receba solicitações do modelo de referência V2 de Resposta inteligente usando AnalyzeContent ou SuggestSmartReplies.
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion 60 solicitações/min Regional Projeto do consumidor Receba solicitações do modelo de referência V2 de Resposta inteligente usando AnalyzeContent ou SuggestSmartReplies.

Resumo

O resumo gerado com IA usa os seguintes modelos:

  • summarization-1.0
  • summarization-2.0
  • summarization-2.1
  • summarization-3.0
  • summarization-3.1
  • summarization-4.0
  • summarization-5.0

A tabela a seguir mostra o tipo de cota e o modelo usado para cada versão do resumo.


Versão do resumo

Tipo de cota

Modelo de back-end

Generator 5.0

Com base em gerador

Gemini-2.5-flash pré-treinado

Gerador 4.0

Com base em gerador

Gemini-2.0-flash-001 pré-treinado

Gerador 3.1

Com base em gerador

Lora-tuned gemini-1.5-flash-001

Generator 3.0

Com base em gerador

gemini-1.0-pro-002 ajustado com LoRA

Gerador 2.1

Com base em gerador

text-bison-32k@002 ajustado com Lora

Gerador 2.0

Com base em gerador

text-bison-32k@002 ajustado com Lora

Generator 1.0

Com base em gerador

text-bison@001 ajustado com Lora

Valor de referência v2

Modelo de referência v2

text-bison

Valor de referência v1

Não baseado em gerador

Modelo LongT5

Personalizado 2.0

Não baseado em gerador

Modelo LongT5

Os tipos de cota na tabela anterior são refletidos na lista de cotas a seguir para APIs usadas com resumo.


Tipo de cota

Nome do limite de cota

Valor padrão

Região

Recurso de cobrança/projeto do consumidor

Descrição

Com base em gerador

GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion

10 solicitações/min

Regional

Projeto do consumidor

Operações de sugestão do gerador por tipo de modelo e região

Com base em gerador

GeneratorSuggestionOperationsPerMinutePerModelType

10 solicitações/min

Global

Projeto do consumidor

Operações de sugestão do gerador por tipo de modelo

Com base em gerador

SuggestConversationSummaryOperationsPerMinutePerProject

60 solicitações/min

Global

Projeto de recursos

Sugerir operações de resumo de conversa

Não baseado em gerador

SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion

0 a 2 solicitações/min

Regional

Projeto de recursos

Sugerir operações de resumo de conversa em cada região

Modelo de referência v2

SuggestSummaryV2BaselineOperationsPerMinutePerProject

120 solicitações/min

Global

Projeto de recursos

Solicitações de pesquisa de base de sugestão de resumo de conversa V2

Modelo de referência v2

SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion

60 solicitações/min

Regional

Projeto de recursos

Solicitações de pesquisa de modelo de referência da sugestão de resumo de conversa V2 em cada região

Autoavaliação de resumo

Nome do limite de cota Valor padrão Região Recurso de cobrança/projeto do consumidor Descrição
ConcurrentSummarizationEvaluationsPerProject 1 solicitação por projeto Projeto do consumidor Pedidos de autoavaliação

Se você precisar de mais cotas simultâneas, faça uma solicitação pelo console Google Cloud . Esse recurso pode oferecer suporte a até quatro cotas simultâneas por projeto.

Assistência de conhecimento generativo

Nome do limite de cota Valor padrão Região Recurso de cobrança/projeto do consumidor Descrição
SearchKnowledgeRequestsPerMinutePerProject 60 solicitações/min Global Projeto do consumidor Solicitações SearchKnowledge.
SearchKnowledgeRequestsPerMinutePerProjectPerRegion 30 solicitações/min Regional Projeto do consumidor O SearchKnowledge solicita cada região.

Assistência de conhecimento generativo proativo V1

Nome do limite de cota Valor padrão Região Recurso de cobrança/projeto do consumidor Descrição
SuggestKnowledgeAssistOperationsPerMinutePerProject 60 solicitações/min Global Projeto de recursos Solicitações do KnowledgeAssist por AnalyzeContent ou SuggestKnowledgeAssist.
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion 30 solicitações/min Regional Projeto de recursos Solicitações do KnowledgeAssist por AnalyzeContent ou SuggestKnowledgeAssist em cada região.

Assistência de conhecimento generativo proativa V2

Nome do limite de cota Valor padrão Região Recurso de cobrança/projeto do consumidor Descrição
KnowledgeAssistOpsPerMinutePerProjectPerVersion 30 solicitações/min Global Projeto de recursos O KnowledgeAssist solicita uma versão específica do modelo quando a solicitação é direcionada ao endpoint de local global.
KnowledgeAssistOpsPerMinutePerProjectPerVersionPerRegion 30 solicitações/min Regional Projeto de recursos Solicitações do KnowledgeAssist direcionadas a uma única região específica Google Cloud , como us-central1 ou europe-west1.
KnowledgeAssistOpsPerMinutePerProjectPerVersionPerMultiRegion 30 solicitações/min MultiRegional Projeto de recursos Solicitações do KnowledgeAssist direcionadas a endpoints multirregionais, como EUA ou UE.

Coach de IA (LLM)

Esse recurso usa o modelo de IA agent-coaching-2.5.

Nome do limite de cota Valor padrão Região Recurso de cobrança ou projeto consumidor Descrição
GeneratorSuggestionOperationsPerMinutePerModelType 60 solicitações por minuto Global Projeto do consumidor Operações de sugestão do gerador por tipo de modelo.
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 60 solicitações por minuto Regional Projeto do consumidor Operações de sugestão do gerador por tipo de modelo e região.

Outras cotas de API

Nome do limite de cota Valor padrão Região Recurso de cobrança/projeto do consumidor Descrição
ConversationOperationsPerMinutePerProject 300 solicitações/min Global Projeto do consumidor Outras solicitações de conversa, exceto AnalyzeContent e StreamingAnalyzeContent, por exemplo, CreateConversation e CompleteConversation. A cota é compartilhada entre o Dialogflow e o Agent Assist.
MessagePollingOperationsPerMinutePerProject 1.200 solicitações / min Global Projeto do consumidor Solicitações ListMessages. A cota é compartilhada entre o Dialogflow e o Agent Assist.
AnswerRecordOperationsPerMinutePerProject 300 solicitações / min Global Projeto do consumidor Solicitações de AnswerRecord.

A seguir

  • Para mais informações sobre como solicitar um aumento de cota, consulte a página de cota.
  • Após o envio da sua solicitação, o Google poderá entrar em contato com você para mais informações e comunicar se a solicitação foi aprovada ou negada.