A estimativa precisa de cota se baseia no número de consultas por segundo (QPS) para cada API. As seções a seguir descrevem as cotas das APIs usadas com cada recurso do Agent Assist.
Tipos de projeto
As tabelas de cota a seguir listam dois tipos de projetos: consumidor e recurso. Consulte a documentação sobre como usar vários projetos para definições desses dois tipos de projetos.
Transcrição de voz
Esse recurso usa a integração de telefonia ou gRPC, que têm cotas de API diferentes.
Integração de telefonia
Consulte as cotas do Dialogflow para as APIs usadas com a integração de telefonia.
Integração do gRPC
| Nome do limite de cota | Valor padrão | Região | Recurso de cobrança/projeto do consumidor | Descrição |
|---|---|---|---|---|
AnalyzeContentOperationsPerMinutePerProject |
300 solicitações/min | Global | Projeto do consumidor | Solicitações de AnalyzeContent/StreamingAnalyzeContent. A cota é compartilhada entre o Dialogflow e o Agent Assist. |
ConcurrentBidiStreamingSessionsPerProjectPerRegion |
50 solicitações simultâneas | Regional (o tráfego global é contado na região us-central1) |
Projeto do consumidor (projeto de recurso para integração de SipRec de telefonia) | Sessões de streaming bidirecional simultâneas por região. |
Transcrição com modelos do Chirp
| Nome da cota | Valor padrão | Região | Recurso de cobrança ou projeto consumidor | Descrição |
|---|---|---|---|---|
SttV2StreamingRequestsPerMinutePerResourceTypePerRegion |
20 solicitações por minuto | Regional (o tráfego global é contado na região us-central1) |
Projeto do consumidor (projeto de recurso para integração de SipRec de telefonia) | Número de novas solicitações de StreamingRecognize enviadas para a STT V2 por tipo de recurso. |
Análise de sentimento
| Nome do limite de cota | Valor padrão | Região | Recurso de cobrança/projeto do consumidor | Descrição |
|---|---|---|---|---|
AnalyzeSentimentOperationsPerVersion |
300 solicitações/min | Global | Projeto do consumidor | Solicitações de análise de sentimento usando AnalyzeContent ou StreamingAnalyzeContent. |
AnalyzeSentimentOperationsPerVersionPerRegion |
300 solicitações/min | Regional | Projeto do consumidor | Solicitações de análise de sentimento usando AnalyzeContent ou StreamingAnalyzeContent. |
AnalyzeSentimentOperationsPerMinutePerProject |
300 solicitações/min | Global | Projeto do consumidor | Solicitações de análise de sentimento usando AnalyzeContent ou StreamingAnalyzeContent. |
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion |
300 solicitações/min | Regional | Projeto do consumidor | Solicitações de análise de sentimento usando AnalyzeContent ou StreamingAnalyzeContent. |
Crie sua própria assistência
Esse recurso usa os seguintes modelos de IA:
- text-bison@001 (limite padrão 0)
- text-bison@002
- text-bison-32k@002
- gemini-1.0-pro
- gemini-1.5-pro
- gemini-1.5-pro-001
- gemini-1.5-flash-001
- gemini-1.5-flash-002
- gemini-2.0-flash-001
| Nome do limite de cota | Valor padrão | Região | Recurso de cobrança/projeto do consumidor | Descrição |
|---|---|---|---|---|
GeneratorSuggestionOperationsPerMinutePerModelType |
10 solicitações/min | Global | Projeto do consumidor | Operações de sugestão do gerador por tipo de modelo. |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
10 solicitações/min | Regional | Projeto do consumidor | Operações de sugestão do gerador por tipo de modelo e região. |
Resposta inteligente
| Nome do limite de cota | Valor padrão | Região | Recurso de cobrança/projeto do consumidor | Descrição |
|---|---|---|---|---|
SmartReplyBaselineModelOperationsPerMinutePerProject |
120 solicitações/min | Global | Projeto do consumidor | Receba solicitações de modelo de referência de resposta inteligente usando AnalyzeContent ou SuggestSmartReplies. |
SmartReplyBaselineV2ModelOperationsPerMinutePerProject |
60 solicitações/min | Global | Projeto do consumidor | Receba solicitações do modelo de referência V2 de Resposta inteligente usando AnalyzeContent ou SuggestSmartReplies. |
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion |
60 solicitações/min | Regional | Projeto do consumidor | Receba solicitações do modelo de referência V2 de Resposta inteligente usando AnalyzeContent ou SuggestSmartReplies. |
Resposta inteligente generativa
| Nome do limite de cota | Valor padrão | Região | Recurso de cobrança/projeto do consumidor | Descrição |
|---|---|---|---|---|
SmartReplyBaselineModelOperationsPerMinutePerProject |
120 solicitações/min | Global | Projeto do consumidor | Receba solicitações de modelo de referência de resposta inteligente usando AnalyzeContent ou SuggestSmartReplies. |
SmartReplyBaselineV2ModelOperationsPerMinutePerProject |
60 solicitações/min | Global | Projeto do consumidor | Receba solicitações do modelo de referência V2 de Resposta inteligente usando AnalyzeContent ou SuggestSmartReplies. |
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion |
60 solicitações/min | Regional | Projeto do consumidor | Receba solicitações do modelo de referência V2 de Resposta inteligente usando AnalyzeContent ou SuggestSmartReplies. |
Resumo
O resumo gerado com IA usa os seguintes modelos:
- summarization-1.0
- summarization-2.0
- summarization-2.1
- summarization-3.0
- summarization-3.1
- summarization-4.0
- summarization-5.0
A tabela a seguir mostra o tipo de cota e o modelo usado para cada versão do resumo.
Versão do resumo |
Tipo de cota |
Modelo de back-end |
|---|---|---|
Generator 5.0 |
Com base em gerador |
Gemini-2.5-flash pré-treinado |
Gerador 4.0 |
Com base em gerador |
Gemini-2.0-flash-001 pré-treinado |
Gerador 3.1 |
Com base em gerador |
Lora-tuned gemini-1.5-flash-001 |
Generator 3.0 |
Com base em gerador |
gemini-1.0-pro-002 ajustado com LoRA |
Gerador 2.1 |
Com base em gerador |
text-bison-32k@002 ajustado com Lora |
Gerador 2.0 |
Com base em gerador |
text-bison-32k@002 ajustado com Lora |
Generator 1.0 |
Com base em gerador |
text-bison@001 ajustado com Lora |
Valor de referência v2 |
Modelo de referência v2 |
text-bison |
Valor de referência v1 |
Não baseado em gerador |
Modelo LongT5 |
Personalizado 2.0 |
Não baseado em gerador |
Modelo LongT5 |
Os tipos de cota na tabela anterior são refletidos na lista de cotas a seguir para APIs usadas com resumo.
Tipo de cota |
Nome do limite de cota |
Valor padrão |
Região |
Recurso de cobrança/projeto do consumidor |
Descrição |
|---|---|---|---|---|---|
Com base em gerador |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
10 solicitações/min |
Regional |
Projeto do consumidor |
Operações de sugestão do gerador por tipo de modelo e região |
Com base em gerador |
GeneratorSuggestionOperationsPerMinutePerModelType |
10 solicitações/min |
Global |
Projeto do consumidor |
Operações de sugestão do gerador por tipo de modelo |
Com base em gerador |
SuggestConversationSummaryOperationsPerMinutePerProject |
60 solicitações/min |
Global |
Projeto de recursos |
Sugerir operações de resumo de conversa |
Não baseado em gerador |
SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion |
0 a 2 solicitações/min |
Regional |
Projeto de recursos |
Sugerir operações de resumo de conversa em cada região |
Modelo de referência v2 |
SuggestSummaryV2BaselineOperationsPerMinutePerProject |
120 solicitações/min |
Global |
Projeto de recursos |
Solicitações de pesquisa de base de sugestão de resumo de conversa V2 |
Modelo de referência v2 |
SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion |
60 solicitações/min |
Regional |
Projeto de recursos |
Solicitações de pesquisa de modelo de referência da sugestão de resumo de conversa V2 em cada região |
Autoavaliação de resumo
| Nome do limite de cota | Valor padrão | Região | Recurso de cobrança/projeto do consumidor | Descrição |
|---|---|---|---|---|
ConcurrentSummarizationEvaluationsPerProject |
1 solicitação por projeto | Projeto do consumidor | Pedidos de autoavaliação |
Se você precisar de mais cotas simultâneas, faça uma solicitação pelo console Google Cloud . Esse recurso pode oferecer suporte a até quatro cotas simultâneas por projeto.
Assistência de conhecimento generativo
| Nome do limite de cota | Valor padrão | Região | Recurso de cobrança/projeto do consumidor | Descrição |
|---|---|---|---|---|
SearchKnowledgeRequestsPerMinutePerProject |
60 solicitações/min | Global | Projeto do consumidor | Solicitações SearchKnowledge. |
SearchKnowledgeRequestsPerMinutePerProjectPerRegion |
30 solicitações/min | Regional | Projeto do consumidor | O SearchKnowledge solicita cada região. |
Assistência de conhecimento generativo proativo V1
| Nome do limite de cota | Valor padrão | Região | Recurso de cobrança/projeto do consumidor | Descrição |
|---|---|---|---|---|
SuggestKnowledgeAssistOperationsPerMinutePerProject |
60 solicitações/min | Global | Projeto de recursos | Solicitações do KnowledgeAssist por AnalyzeContent ou SuggestKnowledgeAssist. |
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion |
30 solicitações/min | Regional | Projeto de recursos | Solicitações do KnowledgeAssist por AnalyzeContent ou SuggestKnowledgeAssist em cada região. |
Assistência de conhecimento generativo proativa V2
| Nome do limite de cota | Valor padrão | Região | Recurso de cobrança/projeto do consumidor | Descrição |
|---|---|---|---|---|
KnowledgeAssistOpsPerMinutePerProjectPerVersion |
30 solicitações/min | Global | Projeto de recursos | O KnowledgeAssist solicita uma versão específica do modelo quando a solicitação é direcionada ao endpoint de local global. |
KnowledgeAssistOpsPerMinutePerProjectPerVersionPerRegion |
30 solicitações/min | Regional | Projeto de recursos | Solicitações do KnowledgeAssist direcionadas a uma única região específica Google Cloud , como us-central1 ou europe-west1. |
KnowledgeAssistOpsPerMinutePerProjectPerVersionPerMultiRegion |
30 solicitações/min | MultiRegional | Projeto de recursos | Solicitações do KnowledgeAssist direcionadas a endpoints multirregionais, como EUA ou UE. |
Coach de IA (LLM)
Esse recurso usa o modelo de IA agent-coaching-2.5.
| Nome do limite de cota | Valor padrão | Região | Recurso de cobrança ou projeto consumidor | Descrição |
|---|---|---|---|---|
GeneratorSuggestionOperationsPerMinutePerModelType |
60 solicitações por minuto | Global | Projeto do consumidor | Operações de sugestão do gerador por tipo de modelo. |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
60 solicitações por minuto | Regional | Projeto do consumidor | Operações de sugestão do gerador por tipo de modelo e região. |
Outras cotas de API
| Nome do limite de cota | Valor padrão | Região | Recurso de cobrança/projeto do consumidor | Descrição |
|---|---|---|---|---|
ConversationOperationsPerMinutePerProject |
300 solicitações/min | Global | Projeto do consumidor | Outras solicitações de conversa, exceto AnalyzeContent e StreamingAnalyzeContent, por exemplo, CreateConversation e CompleteConversation. A cota é compartilhada entre o Dialogflow e o Agent Assist. |
MessagePollingOperationsPerMinutePerProject |
1.200 solicitações / min | Global | Projeto do consumidor | Solicitações ListMessages. A cota é compartilhada entre o Dialogflow e o Agent Assist. |
AnswerRecordOperationsPerMinutePerProject |
300 solicitações / min | Global | Projeto do consumidor | Solicitações de AnswerRecord. |
A seguir
- Para mais informações sobre como solicitar um aumento de cota, consulte a página de cota.
- Após o envio da sua solicitação, o Google poderá entrar em contato com você para mais informações e comunicar se a solicitação foi aprovada ou negada.