La stima accurata delle quote si basa sul numero di query al secondo (QPS) per ogni API. Le sezioni seguenti descrivono le quote per le API utilizzate con ogni funzionalità di Agent Assist.
Tipi di progetto
Le tabelle delle quote seguenti elencano due tipi di progetti: consumer e risorsa. Per le definizioni di questi due tipi di progetto, consulta la documentazione sull'utilizzo di più progetti.
Trascrizione vocale
Questa funzionalità utilizza l'integrazione di telefonia o gRPC, ognuna delle quali ha quote API diverse.
Integrazione della telefonia
Consulta le quote di Dialogflow per le API utilizzate con l'integrazione della telefonia.
Integrazione gRPC
| Nome del limite di quota | Valore predefinito | Regione | Risorsa di addebito/Progetto consumer | Descrizione |
|---|---|---|---|---|
AnalyzeContentOperationsPerMinutePerProject |
300 richieste/min | Globale | Progetto consumer | Richieste AnalyzeContent/StreamingAnalyzeContent. La quota è condivisa tra Dialogflow e Agent Assist. |
ConcurrentBidiStreamingSessionsPerProjectPerRegion |
50 richieste simultanee | Regionale (il traffico globale viene conteggiato nella regione us-central1) |
Progetto consumer (progetto di risorse per l'integrazione SipRec di telefonia) | Sessioni di streaming bidirezionale simultanee per regione. |
Trascrizione con i modelli Chirp
| Nome quota | Valore predefinito | Regione | Progetto consumer o risorsa di addebito | Descrizione |
|---|---|---|---|---|
SttV2StreamingRequestsPerMinutePerResourceTypePerRegion |
20 richieste al minuto | Regionale (il traffico globale viene conteggiato nella regione us-central1). |
Progetto consumer (progetto di risorse per l'integrazione SipRec di telefonia) | Numero di nuove richieste StreamingRecognize inviate a STT V2 per tipo di risorsa. |
Analisi del sentiment
| Nome del limite di quota | Valore predefinito | Regione | Risorsa di addebito/Progetto consumer | Descrizione |
|---|---|---|---|---|
AnalyzeSentimentOperationsPerVersion |
300 richieste/min | Globale | Progetto consumer | Richieste di analisi del sentiment tramite AnalyzeContent o StreamingAnalyzeContent. |
AnalyzeSentimentOperationsPerVersionPerRegion |
300 richieste/min | Regionale | Progetto consumer | Richieste di analisi del sentiment tramite AnalyzeContent o StreamingAnalyzeContent. |
AnalyzeSentimentOperationsPerMinutePerProject |
300 richieste/min | Globale | Progetto consumer | Richieste di analisi del sentiment tramite AnalyzeContent o StreamingAnalyzeContent. |
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion |
300 richieste/min | Regionale | Progetto consumer | Richieste di analisi del sentiment tramite AnalyzeContent o StreamingAnalyzeContent. |
Crea il tuo assist
Questa funzionalità utilizza i seguenti modelli di AI:
- text-bison@001 (limite predefinito 0)
- text-bison@002
- text-bison-32k@002
- gemini-1.0-pro
- gemini-1.5-pro
- gemini-1.5-pro-001
- gemini-1.5-flash-001
- gemini-1.5-flash-002
- gemini-2.0-flash-001
| Nome del limite di quota | Valore predefinito | Regione | Risorsa di addebito/Progetto consumer | Descrizione |
|---|---|---|---|---|
GeneratorSuggestionOperationsPerMinutePerModelType |
10 richieste/min | Globale | Progetto consumer | Operazioni di suggerimento del generatore per tipo di modello. |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
10 richieste/min | Regionale | Progetto consumer | Operazioni di suggerimento del generatore per tipo di modello e regione. |
Risposta rapida
| Nome del limite di quota | Valore predefinito | Regione | Risorsa di addebito/Progetto consumer | Descrizione |
|---|---|---|---|---|
SmartReplyBaselineModelOperationsPerMinutePerProject |
120 richieste/min | Globale | Progetto consumer | Ricevi richieste di modelli di base di risposta rapida tramite AnalyzeContent o SuggestSmartReplies. |
SmartReplyBaselineV2ModelOperationsPerMinutePerProject |
60 richieste/min | Globale | Progetto consumer | Ricevi richieste del modello di base V2 di Risposta rapida tramite AnalyzeContent o SuggestSmartReplies. |
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion |
60 richieste/min | Regionale | Progetto consumer | Ricevi richieste del modello di base V2 di Risposta rapida tramite AnalyzeContent o SuggestSmartReplies. |
Risposta rapida generativa
| Nome del limite di quota | Valore predefinito | Regione | Risorsa di addebito/Progetto consumer | Descrizione |
|---|---|---|---|---|
SmartReplyBaselineModelOperationsPerMinutePerProject |
120 richieste/min | Globale | Progetto consumer | Ricevi richieste di modelli di base di risposta rapida tramite AnalyzeContent o SuggestSmartReplies. |
SmartReplyBaselineV2ModelOperationsPerMinutePerProject |
60 richieste/min | Globale | Progetto consumer | Ricevi richieste del modello di base V2 di Risposta rapida tramite AnalyzeContent o SuggestSmartReplies. |
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion |
60 richieste/min | Regionale | Progetto consumer | Ricevi richieste del modello di base V2 di Risposta rapida tramite AnalyzeContent o SuggestSmartReplies. |
Riassunto
Il riassunto generato con l'AI utilizza i seguenti modelli:
- summarization-1.0
- summarization-2.0
- summarization-2.1
- summarization-3.0
- summarization-3.1
- summarization-4.0
- summarization-5.0
La tabella seguente mostra il tipo di quota e il modello utilizzato per ogni versione del riepilogo.
Versione del riassunto |
Tipo di quota |
Modello di backend |
|---|---|---|
Generatore 5.0 |
Basato sul generatore |
Pretrained Gemini-2.5-flash |
Generatore 4.0 |
Basato sul generatore |
Gemini-2.0-flash-001 preaddestrato |
Generatore 3.1 |
Basato sul generatore |
gemini-1.5-flash-001 ottimizzato per Lora |
Generator 3.0 |
Basato sul generatore |
gemini-1.0-pro-002 ottimizzato con Lora |
Generatore 2.1 |
Basato sul generatore |
Lora-tuned text-bison-32k@002 |
Generatore 2.0 |
Basato sul generatore |
Lora-tuned text-bison-32k@002 |
Generator 1.0 |
Basato sul generatore |
text-bison@001 ottimizzato per Lora |
Baseline v2 |
Modello di riferimento v2 |
text-bison |
Baseline v1 |
Non basato sul generatore |
Modello LongT5 |
Personalizzato 2.0 |
Non basato sul generatore |
Modello LongT5 |
I tipi di quota nella tabella precedente sono riportati nel seguente elenco di quote per le API utilizzate con il riepilogo.
Tipo di quota |
Nome limite di quota |
Valore predefinito |
Regione |
Risorsa di addebito/Progetto consumer |
Descrizione |
|---|---|---|---|---|---|
Basato sul generatore |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
10 richieste/min |
Regionale |
Progetto consumer |
Operazioni di suggerimento del generatore per tipo di modello e regione |
Basato sul generatore |
GeneratorSuggestionOperationsPerMinutePerModelType |
10 richieste/min |
Globale |
Progetto consumer |
Operazioni di suggerimento del generatore per tipo di modello |
Basato sul generatore |
SuggestConversationSummaryOperationsPerMinutePerProject |
60 richieste/min |
Globale |
Progetto risorsa |
Suggerisci operazioni di riepilogo della conversazione |
Non basato sul generatore |
SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion |
0-2 richieste/min |
Regionale |
Progetto risorsa |
Suggerisci operazioni di riepilogo delle conversazioni in ogni regione |
Modello di riferimento v2 |
SuggestSummaryV2BaselineOperationsPerMinutePerProject |
120 richieste/min |
Globale |
Progetto risorsa |
Richieste di polling di base per il suggerimento di riepilogo della conversazione V2 |
Modello di riferimento v2 |
SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion |
60 richieste/min |
Regionale |
Progetto risorsa |
Richieste di polling di base per il suggerimento di riepilogo delle conversazioni V2 in ogni regione |
Valutazione automatica del riepilogo
| Nome del limite di quota | Valore predefinito | Regione | Risorsa di addebito/Progetto consumer | Descrizione |
|---|---|---|---|---|
ConcurrentSummarizationEvaluationsPerProject |
1 richiesta per progetto | Progetto consumer | Richieste di autovalutazione |
Se hai bisogno di quote simultanee aggiuntive, invia una richiesta tramite la console Google Cloud . Questa funzionalità può supportare fino a quattro quote simultanee per progetto.
Assistenza knowledge base generativa
| Nome del limite di quota | Valore predefinito | Regione | Risorsa di addebito/Progetto consumer | Descrizione |
|---|---|---|---|---|
SearchKnowledgeRequestsPerMinutePerProject |
60 richieste/min | Globale | Progetto consumer | Richieste SearchKnowledge. |
SearchKnowledgeRequestsPerMinutePerProjectPerRegion |
30 richieste/min | Regionale | Progetto consumer | Richieste SearchKnowledge per regione. |
Assistenza proattiva basata sull'AI generativa V1
| Nome del limite di quota | Valore predefinito | Regione | Risorsa di addebito/Progetto consumer | Descrizione |
|---|---|---|---|---|
SuggestKnowledgeAssistOperationsPerMinutePerProject |
60 richieste/min | Globale | Progetto risorsa | Richieste di KnowledgeAssist tramite AnalyzeContent o SuggestKnowledgeAssist. |
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion |
30 richieste/min | Regionale | Progetto risorsa | Richieste di KnowledgeAssist tramite AnalyzeContent o SuggestKnowledgeAssist in ogni regione. |
Assistenza proattiva con l'IA generativa V2
| Nome del limite di quota | Valore predefinito | Regione | Risorsa di addebito/Progetto consumer | Descrizione |
|---|---|---|---|---|
KnowledgeAssistOpsPerMinutePerProjectPerVersion |
30 richieste/min | Globale | Progetto risorsa | Richieste KnowledgeAssist per una versione specifica del modello quando la richiesta è indirizzata all'endpoint della posizione globale. |
KnowledgeAssistOpsPerMinutePerProjectPerVersionPerRegion |
30 richieste/min | Regionale | Progetto risorsa | Richieste KnowledgeAssist indirizzate a una singola Google Cloud regione specifica, ad esempio us-central1 o europe-west1. |
KnowledgeAssistOpsPerMinutePerProjectPerVersionPerMultiRegion |
30 richieste/min | MultiRegional | Progetto risorsa | Richieste KnowledgeAssist indirizzate a endpoint multiregionali, come Stati Uniti o UE. |
Coach AI (LLM)
Questa funzionalità utilizza il modello di AI agent-coaching-2.5.
| Nome del limite di quota | Valore predefinito | Regione | Progetto consumer o risorsa di addebito | Descrizione |
|---|---|---|---|---|
GeneratorSuggestionOperationsPerMinutePerModelType |
60 richieste al minuto | Globale | Progetto consumer | Operazioni di suggerimento del generatore per tipo di modello. |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
60 richieste al minuto | Regionale | Progetto consumer | Operazioni di suggerimento del generatore per tipo di modello e regione. |
Altre quote API
| Nome del limite di quota | Valore predefinito | Regione | Risorsa di addebito/Progetto consumer | Descrizione |
|---|---|---|---|---|
ConversationOperationsPerMinutePerProject |
300 richieste/min | Globale | Progetto consumer | Altre richieste di conversazione, ad eccezione di AnalyzeContent e StreamingAnalyzeContent, ad esempio CreateConversation, CompleteConversation. La quota è condivisa tra Dialogflow e Agent Assist. |
MessagePollingOperationsPerMinutePerProject |
1200 richieste al minuto | Globale | Progetto consumer | Richieste ListMessages. La quota è condivisa tra Dialogflow e Agent Assist. |
AnswerRecordOperationsPerMinutePerProject |
300 richieste al minuto | Globale | Progetto consumer | Richieste AnswerRecord. |
Passaggi successivi
- Per ulteriori informazioni su come richiedere un aumento della quota, consulta la pagina delle quote.
- Dopo aver inviato la richiesta, Google potrebbe contattarti per ulteriori informazioni e comunicarti quando la richiesta viene approvata o rifiutata.