Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

配額

準確預估配額時，會根據每個 API 的每秒查詢次數 (QPS) 計算。以下各節將說明搭配各項 Agent Assist 功能使用的 API 配額。

專案類型

下列配額表列出兩種專案：消費者和資源。如要瞭解這兩種專案類型的定義，請參閱使用多個專案的文件。

語音轉錄

這項功能會使用電話或 gRPC 整合，兩者各有不同的 API 配額。

電話整合

如要瞭解與電話整合服務搭配使用的 API 配額，請參閱 Dialogflow 配額。

整合 gRPC

配額限制名稱	預設值	區域	收費資源/消費者專案	說明
`AnalyzeContentOperationsPerMinutePerProject`	每分鐘 300 次要求	全球	消費者專案	AnalyzeContent/StreamingAnalyzeContent 要求。Dialogflow 和 Agent Assist 共用配額。
`ConcurrentBidiStreamingSessionsPerProjectPerRegion`	50 項並行要求	區域 (全球流量計入 `us-central1` 區域)	消費者專案 (電話 SipRec 整合的資源專案)	每個區域的並行雙向串流工作階段。

使用 Chirp 模型轉錄

配額名稱	預設值	區域	收費資源或消費者專案	說明
`SttV2StreamingRequestsPerMinutePerResourceTypePerRegion`	每分鐘 20 個要求	區域 (全域流量會計入 `us-central1` 區域)。	消費者專案 (電話 SipRec 整合的資源專案)	傳送至 STT V2 的新 `StreamingRecognize` 要求數量 (依資源類型劃分)。

情緒分析

配額限制名稱	預設值	區域	收費資源/消費者專案	說明
`AnalyzeSentimentOperationsPerVersion`	每分鐘 300 次要求	全球	消費者專案	透過 AnalyzeContent 或 StreamingAnalyzeContent 提出的情緒分析要求。
`AnalyzeSentimentOperationsPerVersionPerRegion`	每分鐘 300 次要求	區域	消費者專案	透過 AnalyzeContent 或 StreamingAnalyzeContent 提出的情緒分析要求。
`AnalyzeSentimentOperationsPerMinutePerProject`	每分鐘 300 次要求	全球	消費者專案	透過 AnalyzeContent 或 StreamingAnalyzeContent 提出的情緒分析要求。
`AnalyzeSentimentOperationsPerMinutePerProjectPerRegion`	每分鐘 300 次要求	區域	消費者專案	透過 AnalyzeContent 或 StreamingAnalyzeContent 提出的情緒分析要求。

打造專屬輔助功能

這項功能使用下列 AI 模型：

text-bison@001 (預設限制為 0)
text-bison@002
text-bison-32k@002
gemini-1.0-pro
gemini-1.5-pro
gemini-1.5-pro-001
gemini-1.5-flash-001
gemini-1.5-flash-002
gemini-2.0-flash-001

配額限制名稱	預設值	區域	收費資源/消費者專案	說明
`GeneratorSuggestionOperationsPerMinutePerModelType`	每分鐘 10 個要求	全球	消費者專案	各模型類型的生成器建議作業。
`GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion`	每分鐘 10 個要求	區域	消費者專案	各模型類型和區域的產生器建議作業。

智慧回覆

配額限制名稱	預設值	區域	收費資源/消費者專案	說明
`SmartReplyBaselineModelOperationsPerMinutePerProject`	每分鐘 120 個要求	全球	消費者專案	透過 `AnalyzeContent` 或 `SuggestSmartReplies` 取得智慧回覆基準模型要求。
`SmartReplyBaselineV2ModelOperationsPerMinutePerProject`	每分鐘 60 次要求	全球	消費者專案	透過 `AnalyzeContent` 或 `SuggestSmartReplies` 取得智慧回覆基準 V2 模型要求。
`SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion`	每分鐘 60 次要求	區域	消費者專案	透過 `AnalyzeContent` 或 `SuggestSmartReplies` 取得智慧回覆基準 V2 模型要求。

生成式智慧回覆

配額限制名稱	預設值	區域	收費資源/消費者專案	說明
`SmartReplyBaselineModelOperationsPerMinutePerProject`	每分鐘 120 個要求	全球	消費者專案	透過 `AnalyzeContent` 或 `SuggestSmartReplies` 取得智慧回覆基準模型要求。
`SmartReplyBaselineV2ModelOperationsPerMinutePerProject`	每分鐘 60 次要求	全球	消費者專案	透過 `AnalyzeContent` 或 `SuggestSmartReplies` 取得智慧回覆基準 V2 模型要求。
`SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion`	每分鐘 60 次要求	區域	消費者專案	透過 `AnalyzeContent` 或 `SuggestSmartReplies` 取得智慧回覆基準 V2 模型要求。

摘要

AI 生成摘要功能使用下列模型：

summarization-1.0
summarization-2.0
summarization-2.1
summarization-3.0
summarization-3.1
summarization-4.0
summarization-5.0

下表列出各個摘要版本使用的配額類型和模型。

摘要版本	配額類型	後端模型
Generator 5.0	根據生成器	預先訓練的 Gemini-2.5-flash
Generator 4.0	根據生成器	預先訓練的 Gemini-2.0-flash-001
Generator 3.1	根據生成器	經 Lora 微調的 gemini-1.5-flash-001
Generator 3.0	發電機	Lora 微調的 gemini-1.0-pro-002
Generator 2.1	發電機	Lora 微調的 text-bison-32k@002
生成器 2.0	根據生成器	Lora 微調的 text-bison-32k@002
Generator 1.0	根據生成器	經過 Lora 微調的 text-bison@001
基準 v2	基準模型第 2 版	text-bison
Baseline v1	非生成器	LongT5 模型
自訂 2.0	非生成器	LongT5 模型

下表列出用於摘要的 API 配額，反映上表中的配額類型。

配額類型	配額限制名稱	預設值	區域	收費資源/消費者專案	說明
根據生成器	GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion	每分鐘 10 次要求	區域	消費者專案	各模型類型和區域的產生器建議作業
根據生成器	GeneratorSuggestionOperationsPerMinutePerModelType	每分鐘 10 次要求	全球	消費者專案	各模型類型的生成器建議作業
發電機	SuggestConversationSummaryOperationsPerMinutePerProject	每分鐘 60 個要求	全球	資源專案	建議對話摘要作業
非生成器	SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion	每分鐘 0 到 2 次要求	區域	資源專案	在每個區域建議對話摘要作業
基準模型第 2 版	SuggestSummaryV2BaselineOperationsPerMinutePerProject	每分鐘 120 次要求	全球	資源專案	Conversation Summary Suggestion V2 Baseline polling requests
基準模型第 2 版	SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion	每分鐘 60 個要求	區域	資源專案	各區域的對話摘要建議 V2 基準輪詢要求

摘要自動評估

配額限制名稱	預設值	區域	收費資源/消費者專案	說明
`ConcurrentSummarizationEvaluationsPerProject`	每項專案 1 項要求	消費者專案	自動評估要求

如需額外的並行配額，請透過 Google Cloud 控制台提出要求。這項功能每個專案最多可支援四個並行配額。

生成式知識輔助

配額限制名稱	預設值	區域	收費資源/消費者專案	說明
`SearchKnowledgeRequestsPerMinutePerProject`	每分鐘 60 次要求	全球	消費者專案	SearchKnowledge 要求。
`SearchKnowledgeRequestsPerMinutePerProjectPerRegion`	每分鐘 30 次要求	區域	消費者專案	每個區域的 SearchKnowledge 要求。

主動式生成知識輔助 V1

配額限制名稱	預設值	區域	收費資源/消費者專案	說明
`SuggestKnowledgeAssistOperationsPerMinutePerProject`	每分鐘 60 次要求	全球	資源專案	透過 `AnalyzeContent` 或 `SuggestKnowledgeAssist` 提出的 KnowledgeAssist 要求。
`SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion`	每分鐘 30 次要求	區域	資源專案	透過各區域的 `AnalyzeContent` 或 `SuggestKnowledgeAssist` 提出 KnowledgeAssist 要求。

主動生成知識輔助 V2

配額限制名稱	預設值	區域	收費資源/消費者專案	說明
`KnowledgeAssistOpsPerMinutePerProjectPerVersion`	每分鐘 30 次要求	全球	資源專案	如果要求是傳送至全域位置端點，則 KnowledgeAssist 會要求特定模型版本。
`KnowledgeAssistOpsPerMinutePerProjectPerVersionPerRegion`	每分鐘 30 次要求	區域	資源專案	KnowledgeAssist 要求會導向單一特定 Google Cloud 區域，例如 `us-central1` 或 `europe-west1`。
`KnowledgeAssistOpsPerMinutePerProjectPerVersionPerMultiRegion`	每分鐘 30 次要求	MultiRegional	資源專案	KnowledgeAssist 要求會導向多區域端點，例如美國或歐盟。

AI 教練 (LLM)

這項功能採用 agent-coaching-2.5 AI 模型。

配額限制名稱	預設值	區域	收費資源或消費者專案	說明
`GeneratorSuggestionOperationsPerMinutePerModelType`	每分鐘 60 個要求	全球	消費者專案	各模型類型的生成器建議作業。
`GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion`	每分鐘 60 個要求	區域	消費者專案	各模型類型和區域的產生器建議作業。

其他 API 配額

配額限制名稱	預設值	區域	收費資源/消費者專案	說明
`ConversationOperationsPerMinutePerProject`	每分鐘 300 次要求	全球	消費者專案	除了 AnalyzeContent 和 StreamingAnalyzeContent 以外的其他對話要求，例如 CreateConversation、CompleteConversation。Dialogflow 和 Agent Assist 共用配額。
`MessagePollingOperationsPerMinutePerProject`	每分鐘 1,200 個要求	全球	消費者專案	ListMessages 請求。Dialogflow 和 Agent Assist 共用配額。
`AnswerRecordOperationsPerMinutePerProject`	每分鐘 300 個要求	全球	消費者專案	AnswerRecord 要求。

後續步驟

如要進一步瞭解如何申請增加配額，請參閱配額頁面。
提交申請後，Google 可能會與您聯絡，以便進一步瞭解相關資訊，並通知您申請是否獲得核准。

配額 透過集合功能整理內容 你可以依據偏好儲存及分類內容。