Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Quote

La stima accurata delle quote si basa sul numero di query al secondo (QPS) per ogni API. Le sezioni seguenti descrivono le quote per le API utilizzate con ogni funzionalità di Agent Assist.

Tipi di progetto

Le tabelle delle quote seguenti elencano due tipi di progetti: consumer e risorsa. Per le definizioni di questi due tipi di progetto, consulta la documentazione sull'utilizzo di più progetti.

Trascrizione vocale

Questa funzionalità utilizza l'integrazione di telefonia o gRPC, ognuna delle quali ha quote API diverse.

Integrazione della telefonia

Consulta le quote di Dialogflow per le API utilizzate con l'integrazione della telefonia.

Integrazione gRPC

Nome del limite di quota	Valore predefinito	Regione	Risorsa di addebito/Progetto consumer	Descrizione
`AnalyzeContentOperationsPerMinutePerProject`	300 richieste/min	Globale	Progetto consumer	Richieste AnalyzeContent/StreamingAnalyzeContent. La quota è condivisa tra Dialogflow e Agent Assist.
`ConcurrentBidiStreamingSessionsPerProjectPerRegion`	50 richieste simultanee	Regionale (il traffico globale viene conteggiato nella regione `us-central1`)	Progetto consumer (progetto di risorse per l'integrazione SipRec di telefonia)	Sessioni di streaming bidirezionale simultanee per regione.

Trascrizione con i modelli Chirp

Nome quota	Valore predefinito	Regione	Progetto consumer o risorsa di addebito	Descrizione
`SttV2StreamingRequestsPerMinutePerResourceTypePerRegion`	20 richieste al minuto	Regionale (il traffico globale viene conteggiato nella regione `us-central1`).	Progetto consumer (progetto di risorse per l'integrazione SipRec di telefonia)	Numero di nuove richieste `StreamingRecognize` inviate a STT V2 per tipo di risorsa.

Analisi del sentiment

Nome del limite di quota	Valore predefinito	Regione	Risorsa di addebito/Progetto consumer	Descrizione
`AnalyzeSentimentOperationsPerVersion`	300 richieste/min	Globale	Progetto consumer	Richieste di analisi del sentiment tramite AnalyzeContent o StreamingAnalyzeContent.
`AnalyzeSentimentOperationsPerVersionPerRegion`	300 richieste/min	Regionale	Progetto consumer	Richieste di analisi del sentiment tramite AnalyzeContent o StreamingAnalyzeContent.
`AnalyzeSentimentOperationsPerMinutePerProject`	300 richieste/min	Globale	Progetto consumer	Richieste di analisi del sentiment tramite AnalyzeContent o StreamingAnalyzeContent.
`AnalyzeSentimentOperationsPerMinutePerProjectPerRegion`	300 richieste/min	Regionale	Progetto consumer	Richieste di analisi del sentiment tramite AnalyzeContent o StreamingAnalyzeContent.

Crea il tuo assist

Questa funzionalità utilizza i seguenti modelli di AI:

text-bison@001 (limite predefinito 0)
text-bison@002
text-bison-32k@002
gemini-1.0-pro
gemini-1.5-pro
gemini-1.5-pro-001
gemini-1.5-flash-001
gemini-1.5-flash-002
gemini-2.0-flash-001

Nome del limite di quota	Valore predefinito	Regione	Risorsa di addebito/Progetto consumer	Descrizione
`GeneratorSuggestionOperationsPerMinutePerModelType`	10 richieste/min	Globale	Progetto consumer	Operazioni di suggerimento del generatore per tipo di modello.
`GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion`	10 richieste/min	Regionale	Progetto consumer	Operazioni di suggerimento del generatore per tipo di modello e regione.

Risposta rapida

Nome del limite di quota	Valore predefinito	Regione	Risorsa di addebito/Progetto consumer	Descrizione
`SmartReplyBaselineModelOperationsPerMinutePerProject`	120 richieste/min	Globale	Progetto consumer	Ricevi richieste di modelli di base di risposta rapida tramite `AnalyzeContent` o `SuggestSmartReplies`.
`SmartReplyBaselineV2ModelOperationsPerMinutePerProject`	60 richieste/min	Globale	Progetto consumer	Ricevi richieste del modello di base V2 di Risposta rapida tramite `AnalyzeContent` o `SuggestSmartReplies`.
`SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion`	60 richieste/min	Regionale	Progetto consumer	Ricevi richieste del modello di base V2 di Risposta rapida tramite `AnalyzeContent` o `SuggestSmartReplies`.

Risposta rapida generativa

Nome del limite di quota	Valore predefinito	Regione	Risorsa di addebito/Progetto consumer	Descrizione
`SmartReplyBaselineModelOperationsPerMinutePerProject`	120 richieste/min	Globale	Progetto consumer	Ricevi richieste di modelli di base di risposta rapida tramite `AnalyzeContent` o `SuggestSmartReplies`.
`SmartReplyBaselineV2ModelOperationsPerMinutePerProject`	60 richieste/min	Globale	Progetto consumer	Ricevi richieste del modello di base V2 di Risposta rapida tramite `AnalyzeContent` o `SuggestSmartReplies`.
`SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion`	60 richieste/min	Regionale	Progetto consumer	Ricevi richieste del modello di base V2 di Risposta rapida tramite `AnalyzeContent` o `SuggestSmartReplies`.

Riassunto

Il riassunto generato con l'AI utilizza i seguenti modelli:

summarization-1.0
summarization-2.0
summarization-2.1
summarization-3.0
summarization-3.1
summarization-4.0
summarization-5.0

La tabella seguente mostra il tipo di quota e il modello utilizzato per ogni versione del riepilogo.

Versione del riassunto	Tipo di quota	Modello di backend
Generatore 5.0	Basato sul generatore	Pretrained Gemini-2.5-flash
Generatore 4.0	Basato sul generatore	Gemini-2.0-flash-001 preaddestrato
Generatore 3.1	Basato sul generatore	gemini-1.5-flash-001 ottimizzato per Lora
Generator 3.0	Basato sul generatore	gemini-1.0-pro-002 ottimizzato con Lora
Generatore 2.1	Basato sul generatore	Lora-tuned text-bison-32k@002
Generatore 2.0	Basato sul generatore	Lora-tuned text-bison-32k@002
Generator 1.0	Basato sul generatore	text-bison@001 ottimizzato per Lora
Baseline v2	Modello di riferimento v2	text-bison
Baseline v1	Non basato sul generatore	Modello LongT5
Personalizzato 2.0	Non basato sul generatore	Modello LongT5

I tipi di quota nella tabella precedente sono riportati nel seguente elenco di quote per le API utilizzate con il riepilogo.

Tipo di quota	Nome limite di quota	Valore predefinito	Regione	Risorsa di addebito/Progetto consumer	Descrizione
Basato sul generatore	GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion	10 richieste/min	Regionale	Progetto consumer	Operazioni di suggerimento del generatore per tipo di modello e regione
Basato sul generatore	GeneratorSuggestionOperationsPerMinutePerModelType	10 richieste/min	Globale	Progetto consumer	Operazioni di suggerimento del generatore per tipo di modello
Basato sul generatore	SuggestConversationSummaryOperationsPerMinutePerProject	60 richieste/min	Globale	Progetto risorsa	Suggerisci operazioni di riepilogo della conversazione
Non basato sul generatore	SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion	0-2 richieste/min	Regionale	Progetto risorsa	Suggerisci operazioni di riepilogo delle conversazioni in ogni regione
Modello di riferimento v2	SuggestSummaryV2BaselineOperationsPerMinutePerProject	120 richieste/min	Globale	Progetto risorsa	Richieste di polling di base per il suggerimento di riepilogo della conversazione V2
Modello di riferimento v2	SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion	60 richieste/min	Regionale	Progetto risorsa	Richieste di polling di base per il suggerimento di riepilogo delle conversazioni V2 in ogni regione

Valutazione automatica del riepilogo

Nome del limite di quota	Valore predefinito	Regione	Risorsa di addebito/Progetto consumer	Descrizione
`ConcurrentSummarizationEvaluationsPerProject`	1 richiesta per progetto	Progetto consumer	Richieste di autovalutazione

Se hai bisogno di quote simultanee aggiuntive, invia una richiesta tramite la console Google Cloud . Questa funzionalità può supportare fino a quattro quote simultanee per progetto.

Assistenza knowledge base generativa

Nome del limite di quota	Valore predefinito	Regione	Risorsa di addebito/Progetto consumer	Descrizione
`SearchKnowledgeRequestsPerMinutePerProject`	60 richieste/min	Globale	Progetto consumer	Richieste SearchKnowledge.
`SearchKnowledgeRequestsPerMinutePerProjectPerRegion`	30 richieste/min	Regionale	Progetto consumer	Richieste SearchKnowledge per regione.

Assistenza proattiva basata sull'AI generativa V1

Nome del limite di quota	Valore predefinito	Regione	Risorsa di addebito/Progetto consumer	Descrizione
`SuggestKnowledgeAssistOperationsPerMinutePerProject`	60 richieste/min	Globale	Progetto risorsa	Richieste di KnowledgeAssist tramite `AnalyzeContent` o `SuggestKnowledgeAssist`.
`SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion`	30 richieste/min	Regionale	Progetto risorsa	Richieste di KnowledgeAssist tramite `AnalyzeContent` o `SuggestKnowledgeAssist` in ogni regione.

Assistenza proattiva con l'IA generativa V2

Nome del limite di quota	Valore predefinito	Regione	Risorsa di addebito/Progetto consumer	Descrizione
`KnowledgeAssistOpsPerMinutePerProjectPerVersion`	30 richieste/min	Globale	Progetto risorsa	Richieste KnowledgeAssist per una versione specifica del modello quando la richiesta è indirizzata all'endpoint della posizione globale.
`KnowledgeAssistOpsPerMinutePerProjectPerVersionPerRegion`	30 richieste/min	Regionale	Progetto risorsa	Richieste KnowledgeAssist indirizzate a una singola Google Cloud regione specifica, ad esempio `us-central1` o `europe-west1`.
`KnowledgeAssistOpsPerMinutePerProjectPerVersionPerMultiRegion`	30 richieste/min	MultiRegional	Progetto risorsa	Richieste KnowledgeAssist indirizzate a endpoint multiregionali, come Stati Uniti o UE.

Coach AI (LLM)

Questa funzionalità utilizza il modello di AI agent-coaching-2.5.

Nome del limite di quota	Valore predefinito	Regione	Progetto consumer o risorsa di addebito	Descrizione
`GeneratorSuggestionOperationsPerMinutePerModelType`	60 richieste al minuto	Globale	Progetto consumer	Operazioni di suggerimento del generatore per tipo di modello.
`GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion`	60 richieste al minuto	Regionale	Progetto consumer	Operazioni di suggerimento del generatore per tipo di modello e regione.

Altre quote API

Nome del limite di quota	Valore predefinito	Regione	Risorsa di addebito/Progetto consumer	Descrizione
`ConversationOperationsPerMinutePerProject`	300 richieste/min	Globale	Progetto consumer	Altre richieste di conversazione, ad eccezione di AnalyzeContent e StreamingAnalyzeContent, ad esempio CreateConversation, CompleteConversation. La quota è condivisa tra Dialogflow e Agent Assist.
`MessagePollingOperationsPerMinutePerProject`	1200 richieste al minuto	Globale	Progetto consumer	Richieste ListMessages. La quota è condivisa tra Dialogflow e Agent Assist.
`AnswerRecordOperationsPerMinutePerProject`	300 richieste al minuto	Globale	Progetto consumer	Richieste AnswerRecord.

Passaggi successivi

Per ulteriori informazioni su come richiedere un aumento della quota, consulta la pagina delle quote.
Dopo aver inviato la richiesta, Google potrebbe contattarti per ulteriori informazioni e comunicarti quando la richiesta viene approvata o rifiutata.

Quote Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.