Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Kontingente

Eine genaue Kontingentschätzung basiert auf der Anzahl Ihrer Anfragen pro Sekunde (Queries per Second, QPS) an jede API. In den folgenden Abschnitten werden die Kontingente für APIs beschrieben, die mit den einzelnen Agent Assist-Funktionen verwendet werden.

Projekttypen

In den folgenden Kontingenttabellen werden zwei Arten von Projekten aufgeführt: Verbraucher- und Ressourcenprojekte. Definitionen dieser beiden Projekttypen finden Sie in der Dokumentation zur Verwendung mehrerer Projekte.

Sprachtranskription

Für diese Funktion wird entweder die Telefonie- oder die gRPC-Integration verwendet, die jeweils unterschiedliche API-Kontingente haben.

Telefonieintegration

Informationen zu den Kontingenten für die APIs, die für die Telefonieintegration verwendet werden, finden Sie unter Dialogflow-Kontingente.

gRPC-Integration

Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource/Verbraucherprojekt	Beschreibung
`AnalyzeContentOperationsPerMinutePerProject`	300 Anfragen/Min.	Global	Nutzerprojekt	AnalyzeContent-/StreamingAnalyzeContent-Anfragen. Das Kontingent wird zwischen Dialogflow und Agent Assist aufgeteilt.
`ConcurrentBidiStreamingSessionsPerProjectPerRegion`	50 gleichzeitige Anfragen	Regional (globaler Traffic wird in der Region `us-central1` gezählt)	Nutzerprojekt (Ressourcenprojekt für die SipRec-Integration für Telefonie)	Gleichzeitige bidirektionale Streaming-Sitzungen pro Region.

Transkription mit Chirp-Modellen

Kontingentname	Standardwert	Region	Abrechnungsressource oder Nutzerprojekt	Beschreibung
`SttV2StreamingRequestsPerMinutePerResourceTypePerRegion`	20 Anfragen pro Minute	Regional (Globaler Traffic wird in der Region `us-central1` gezählt.)	Nutzerprojekt (Ressourcenprojekt für die SipRec-Integration für Telefonie)	Anzahl der neuen `StreamingRecognize`-Anfragen, die pro Ressourcentyp an STT V2 gesendet wurden.

Sentimentanalyse

Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource/Verbraucherprojekt	Beschreibung
`AnalyzeSentimentOperationsPerVersion`	300 Anfragen/Min.	Global	Nutzerprojekt	Anfragen zur Sentimentanalyse über „AnalyzeContent“ oder „StreamingAnalyzeContent“
`AnalyzeSentimentOperationsPerVersionPerRegion`	300 Anfragen/Min.	Regional	Nutzerprojekt	Anfragen zur Sentimentanalyse über „AnalyzeContent“ oder „StreamingAnalyzeContent“
`AnalyzeSentimentOperationsPerMinutePerProject`	300 Anfragen/Min.	Global	Nutzerprojekt	Anfragen zur Sentimentanalyse über „AnalyzeContent“ oder „StreamingAnalyzeContent“
`AnalyzeSentimentOperationsPerMinutePerProjectPerRegion`	300 Anfragen/Min.	Regional	Nutzerprojekt	Anfragen zur Sentimentanalyse über „AnalyzeContent“ oder „StreamingAnalyzeContent“

Eigene Assistenten erstellen

Für diese Funktion werden die folgenden KI-Modelle verwendet:

text-bison@001 (Standardlimit 0)
(text-bison@002)
text-bison-32k@002
gemini-1.0-pro
gemini-1.5-pro
gemini-1.5-pro-001
gemini-1.5-flash-001
gemini-1.5-flash-002
gemini-2.0-flash-001

Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource/Verbraucherprojekt	Beschreibung
`GeneratorSuggestionOperationsPerMinutePerModelType`	10 Anfragen/Min.	Global	Nutzerprojekt	Vorgänge für Generatorvorschläge pro Modelltyp.
`GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion`	10 Anfragen/Min.	Regional	Nutzerprojekt	Vorgänge für Generatorvorschläge nach Modelltyp und Region.

Intelligente Antwort

Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource/Verbraucherprojekt	Beschreibung
`SmartReplyBaselineModelOperationsPerMinutePerProject`	120 Anfragen/Min.	Global	Nutzerprojekt	Anfragen für das Baseline-Modell für intelligente Antworten über `AnalyzeContent` oder `SuggestSmartReplies` erhalten.
`SmartReplyBaselineV2ModelOperationsPerMinutePerProject`	60 Anfragen/Min.	Global	Nutzerprojekt	Sie können Baseline-V2-Modellanfragen für intelligente Antworten über `AnalyzeContent` oder `SuggestSmartReplies` abrufen.
`SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion`	60 Anfragen/Min.	Regional	Nutzerprojekt	Sie können Baseline-V2-Modellanfragen für intelligente Antworten über `AnalyzeContent` oder `SuggestSmartReplies` abrufen.

Generative intelligente Antwort

Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource/Verbraucherprojekt	Beschreibung
`SmartReplyBaselineModelOperationsPerMinutePerProject`	120 Anfragen/Min.	Global	Nutzerprojekt	Anfragen für das Baseline-Modell für intelligente Antworten über `AnalyzeContent` oder `SuggestSmartReplies` erhalten.
`SmartReplyBaselineV2ModelOperationsPerMinutePerProject`	60 Anfragen/Min.	Global	Nutzerprojekt	Sie können Baseline-V2-Modellanfragen für intelligente Antworten über `AnalyzeContent` oder `SuggestSmartReplies` abrufen.
`SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion`	60 Anfragen/Min.	Regional	Nutzerprojekt	Sie erhalten Anfragen für das Baseline-Modell V2 für intelligente Antworten über `AnalyzeContent` oder `SuggestSmartReplies`.

Zusammenfassung

Für die KI-generierte Zusammenfassung werden die folgenden Modelle verwendet:

summarization-1.0
summarization-2.0
summarization-2.1
summarization-3.0
summarization-3.1
summarization-4.0
summarization-5.0

In der folgenden Tabelle sind der Kontingenttyp und das Modell für jede Version der Zusammenfassung aufgeführt.

Version der Zusammenfassung	Kontingenttyp	Backend-Modell
Generator 5.0	Generatorbasiert	Vortrainiertes Gemini 2.5 Flash
Generator 4.0	Generatorbasiert	Vortrainiertes Gemini-2.0-flash-001
Generator 3.1	Generatorbasiert	Lora-tuned gemini-1.5-flash-001
Generator 3.0	Generatorbasiert	Lora-tuned gemini-1.0-pro-002
Generator 2.1	Generatorbasiert	Lora-tuned text-bison-32k@002
Generator 2.0	Generatorbasiert	Lora-tuned text-bison-32k@002
Generator 1.0	Generatorbasiert	Lora-tuned text-bison@001
Baseline v2	Baseline v2-Modell	text-bison
Baseline V1	Nicht auf Generator basierend	LongT5-Modell
Benutzerdefiniert 2.0	Nicht auf Generator basierend	LongT5-Modell

Die Kontingenttypen in der vorherigen Tabelle werden in der folgenden Kontingentliste für APIs, die für die Zusammenfassung verwendet werden, berücksichtigt.

Kontingenttyp	Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource/Verbraucherprojekt	Beschreibung
Generatorbasiert	GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion	10 Anfragen/Min.	Regional	Nutzerprojekt	Vorgänge für Generatorvorschläge nach Modelltyp und Region
Generatorbasiert	GeneratorSuggestionOperationsPerMinutePerModelType	10 Anfragen/Min.	Global	Nutzerprojekt	Vorgänge für Generatorvorschläge nach Modelltyp
Generatorbasiert	SuggestConversationSummaryOperationsPerMinutePerProject	60 Anfragen/Min.	Global	Ressourcenprojekt	Vorgänge zum Zusammenfassen von Unterhaltungen vorschlagen
Nicht auf Generator basierend	SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion	0–2 Anfragen/Min.	Regional	Ressourcenprojekt	Vorgänge zum Zusammenfassen von Unterhaltungen in jeder Region vorschlagen
Baseline v2-Modell	SuggestSummaryV2BaselineOperationsPerMinutePerProject	120 Anfragen/Min.	Global	Ressourcenprojekt	Baseline-Polling-Anfragen für Vorschläge für Gesprächszusammenfassungen V2
Baseline v2-Modell	SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion	60 Anfragen/Min.	Regional	Ressourcenprojekt	Baseline-Umfrageanfragen für die Zusammenfassung von Unterhaltungen V2 in jeder Region

Automatische Bewertung der Zusammenfassung

Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource/Verbraucherprojekt	Beschreibung
`ConcurrentSummarizationEvaluationsPerProject`	1 Anfrage pro Projekt	Nutzerprojekt	Anfragen zur automatischen Überprüfung

Wenn Sie zusätzliche Kontingente für gleichzeitige Anfragen benötigen, stellen Sie über die Google Cloud Console eine Anfrage. Diese Funktion unterstützt bis zu vier Kontingente für gleichzeitige Anfragen pro Projekt.

Generative Knowledge Assist

Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource/Verbraucherprojekt	Beschreibung
`SearchKnowledgeRequestsPerMinutePerProject`	60 Anfragen/Min.	Global	Nutzerprojekt	SearchKnowledge-Anfragen.
`SearchKnowledgeRequestsPerMinutePerProjectPerRegion`	30 Anfragen/Min.	Regional	Nutzerprojekt	SearchKnowledge-Anfragen pro Region.

Proaktive Unterstützung durch generative KI – Version 1

Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource/Verbraucherprojekt	Beschreibung
`SuggestKnowledgeAssistOperationsPerMinutePerProject`	60 Anfragen/Min.	Global	Ressourcenprojekt	KnowledgeAssist-Anfragen über `AnalyzeContent` oder `SuggestKnowledgeAssist`.
`SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion`	30 Anfragen/Min.	Regional	Ressourcenprojekt	KnowledgeAssist-Anfragen über `AnalyzeContent` oder `SuggestKnowledgeAssist` in jeder Region.

Proaktive generative Wissensunterstützung V2

Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource/Verbraucherprojekt	Beschreibung
`KnowledgeAssistOpsPerMinutePerProjectPerVersion`	30 Anfragen/Min.	Global	Ressourcenprojekt	KnowledgeAssist-Anfragen für eine bestimmte Modellversion, wenn die Anfrage an den globalen Standortendpunkt gerichtet ist.
`KnowledgeAssistOpsPerMinutePerProjectPerVersionPerRegion`	30 Anfragen/Min.	Regional	Ressourcenprojekt	KnowledgeAssist-Anfragen, die an eine einzelne bestimmte Google Cloud Region gerichtet sind, z. B. `us-central1` oder `europe-west1`.
`KnowledgeAssistOpsPerMinutePerProjectPerVersionPerMultiRegion`	30 Anfragen/Min.	MultiRegional	Ressourcenprojekt	KnowledgeAssist-Anfragen, die an multiregionale Endpunkte wie die USA oder die EU gerichtet sind.

KI-Coach (LLM)

Diese Funktion verwendet das KI-Modell „agent-coaching-2.5“.

Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource oder Nutzerprojekt	Beschreibung
`GeneratorSuggestionOperationsPerMinutePerModelType`	60 Anfragen pro Minute	Global	Nutzerprojekt	Vorgänge für Generatorvorschläge pro Modelltyp.
`GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion`	60 Anfragen pro Minute	Regional	Nutzerprojekt	Vorgänge für Generatorvorschläge nach Modelltyp und Region.

Weitere API-Kontingente

Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource/Verbraucherprojekt	Beschreibung
`ConversationOperationsPerMinutePerProject`	300 Anfragen/Min.	Global	Nutzerprojekt	Andere Unterhaltungsanfragen als „AnalyzeContent“ und „StreamingAnalyzeContent“, z. B. „CreateConversation“ und „CompleteConversation“. Das Kontingent wird zwischen Dialogflow und Agent Assist aufgeteilt.
`MessagePollingOperationsPerMinutePerProject`	1.200 Anfragen pro Minute	Global	Nutzerprojekt	ListMessages-Anfragen. Das Kontingent wird zwischen Dialogflow und Agent Assist aufgeteilt.
`AnswerRecordOperationsPerMinutePerProject`	300 Anfragen / Min.	Global	Nutzerprojekt	AnswerRecord-Anfragen.

Nächste Schritte

Weitere Informationen zum Anfordern einer Kontingenterhöhung finden Sie auf der Kontingentseite.
Wenn Sie Ihren Antrag eingereicht haben, bittet Google Sie möglicherweise um weitere Informationen und teilt Ihnen mit, ob Ihr Antrag genehmigt oder abgelehnt wurde.

Kontingente Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.