準確預估配額時,會根據每個 API 的每秒查詢次數 (QPS) 計算。以下各節將說明搭配各項 Agent Assist 功能使用的 API 配額。
專案類型
下列配額表列出兩種專案:消費者和資源。如要瞭解這兩種專案類型的定義,請參閱使用多個專案的文件。
語音轉錄
這項功能會使用電話或 gRPC 整合,兩者各有不同的 API 配額。
電話整合
如要瞭解與電話整合服務搭配使用的 API 配額,請參閱 Dialogflow 配額。
整合 gRPC
| 配額限制名稱 | 預設值 | 區域 | 收費資源/消費者專案 | 說明 |
|---|---|---|---|---|
AnalyzeContentOperationsPerMinutePerProject |
每分鐘 300 次要求 | 全球 | 消費者專案 | AnalyzeContent/StreamingAnalyzeContent 要求。Dialogflow 和 Agent Assist 共用配額。 |
ConcurrentBidiStreamingSessionsPerProjectPerRegion |
50 項並行要求 | 區域 (全球流量計入 us-central1 區域) |
消費者專案 (電話 SipRec 整合的資源專案) | 每個區域的並行雙向串流工作階段。 |
使用 Chirp 模型轉錄
| 配額名稱 | 預設值 | 區域 | 收費資源或消費者專案 | 說明 |
|---|---|---|---|---|
SttV2StreamingRequestsPerMinutePerResourceTypePerRegion |
每分鐘 20 個要求 | 區域 (全域流量會計入 us-central1 區域)。 |
消費者專案 (電話 SipRec 整合的資源專案) | 傳送至 STT V2 的新 StreamingRecognize 要求數量 (依資源類型劃分)。 |
情緒分析
| 配額限制名稱 | 預設值 | 區域 | 收費資源/消費者專案 | 說明 |
|---|---|---|---|---|
AnalyzeSentimentOperationsPerVersion |
每分鐘 300 次要求 | 全球 | 消費者專案 | 透過 AnalyzeContent 或 StreamingAnalyzeContent 提出的情緒分析要求。 |
AnalyzeSentimentOperationsPerVersionPerRegion |
每分鐘 300 次要求 | 區域 | 消費者專案 | 透過 AnalyzeContent 或 StreamingAnalyzeContent 提出的情緒分析要求。 |
AnalyzeSentimentOperationsPerMinutePerProject |
每分鐘 300 次要求 | 全球 | 消費者專案 | 透過 AnalyzeContent 或 StreamingAnalyzeContent 提出的情緒分析要求。 |
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion |
每分鐘 300 次要求 | 區域 | 消費者專案 | 透過 AnalyzeContent 或 StreamingAnalyzeContent 提出的情緒分析要求。 |
打造專屬輔助功能
這項功能使用下列 AI 模型:
- text-bison@001 (預設限制為 0)
- text-bison@002
- text-bison-32k@002
- gemini-1.0-pro
- gemini-1.5-pro
- gemini-1.5-pro-001
- gemini-1.5-flash-001
- gemini-1.5-flash-002
- gemini-2.0-flash-001
| 配額限制名稱 | 預設值 | 區域 | 收費資源/消費者專案 | 說明 |
|---|---|---|---|---|
GeneratorSuggestionOperationsPerMinutePerModelType |
每分鐘 10 個要求 | 全球 | 消費者專案 | 各模型類型的生成器建議作業。 |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
每分鐘 10 個要求 | 區域 | 消費者專案 | 各模型類型和區域的產生器建議作業。 |
智慧回覆
| 配額限制名稱 | 預設值 | 區域 | 收費資源/消費者專案 | 說明 |
|---|---|---|---|---|
SmartReplyBaselineModelOperationsPerMinutePerProject |
每分鐘 120 個要求 | 全球 | 消費者專案 | 透過 AnalyzeContent 或 SuggestSmartReplies 取得智慧回覆基準模型要求。 |
SmartReplyBaselineV2ModelOperationsPerMinutePerProject |
每分鐘 60 次要求 | 全球 | 消費者專案 | 透過 AnalyzeContent 或 SuggestSmartReplies 取得智慧回覆基準 V2 模型要求。 |
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion |
每分鐘 60 次要求 | 區域 | 消費者專案 | 透過 AnalyzeContent 或 SuggestSmartReplies 取得智慧回覆基準 V2 模型要求。 |
生成式智慧回覆
| 配額限制名稱 | 預設值 | 區域 | 收費資源/消費者專案 | 說明 |
|---|---|---|---|---|
SmartReplyBaselineModelOperationsPerMinutePerProject |
每分鐘 120 個要求 | 全球 | 消費者專案 | 透過 AnalyzeContent 或 SuggestSmartReplies 取得智慧回覆基準模型要求。 |
SmartReplyBaselineV2ModelOperationsPerMinutePerProject |
每分鐘 60 次要求 | 全球 | 消費者專案 | 透過 AnalyzeContent 或 SuggestSmartReplies 取得智慧回覆基準 V2 模型要求。 |
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion |
每分鐘 60 次要求 | 區域 | 消費者專案 | 透過 AnalyzeContent 或 SuggestSmartReplies 取得智慧回覆基準 V2 模型要求。 |
摘要
AI 生成摘要功能使用下列模型:
- summarization-1.0
- summarization-2.0
- summarization-2.1
- summarization-3.0
- summarization-3.1
- summarization-4.0
- summarization-5.0
下表列出各個摘要版本使用的配額類型和模型。
摘要版本 |
配額類型 |
後端模型 |
|---|---|---|
Generator 5.0 |
根據生成器 |
預先訓練的 Gemini-2.5-flash |
Generator 4.0 |
根據生成器 |
預先訓練的 Gemini-2.0-flash-001 |
Generator 3.1 |
根據生成器 |
經 Lora 微調的 gemini-1.5-flash-001 |
Generator 3.0 |
發電機 |
Lora 微調的 gemini-1.0-pro-002 |
Generator 2.1 |
發電機 |
Lora 微調的 text-bison-32k@002 |
生成器 2.0 |
根據生成器 |
Lora 微調的 text-bison-32k@002 |
Generator 1.0 |
根據生成器 |
經過 Lora 微調的 text-bison@001 |
基準 v2 |
基準模型第 2 版 |
text-bison |
Baseline v1 |
非生成器 |
LongT5 模型 |
自訂 2.0 |
非生成器 |
LongT5 模型 |
下表列出用於摘要的 API 配額,反映上表中的配額類型。
配額類型 |
配額限制名稱 |
預設值 |
區域 |
收費資源/消費者專案 |
說明 |
|---|---|---|---|---|---|
根據生成器 |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
每分鐘 10 次要求 |
區域 |
消費者專案 |
各模型類型和區域的產生器建議作業 |
根據生成器 |
GeneratorSuggestionOperationsPerMinutePerModelType |
每分鐘 10 次要求 |
全球 |
消費者專案 |
各模型類型的生成器建議作業 |
發電機 |
SuggestConversationSummaryOperationsPerMinutePerProject |
每分鐘 60 個要求 |
全球 |
資源專案 |
建議對話摘要作業 |
非生成器 |
SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion |
每分鐘 0 到 2 次要求 |
區域 |
資源專案 |
在每個區域建議對話摘要作業 |
基準模型第 2 版 |
SuggestSummaryV2BaselineOperationsPerMinutePerProject |
每分鐘 120 次要求 |
全球 |
資源專案 |
Conversation Summary Suggestion V2 Baseline polling requests |
基準模型第 2 版 |
SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion |
每分鐘 60 個要求 |
區域 |
資源專案 |
各區域的對話摘要建議 V2 基準輪詢要求 |
摘要自動評估
| 配額限制名稱 | 預設值 | 區域 | 收費資源/消費者專案 | 說明 |
|---|---|---|---|---|
ConcurrentSummarizationEvaluationsPerProject |
每項專案 1 項要求 | 消費者專案 | 自動評估要求 |
如需額外的並行配額,請透過 Google Cloud 控制台提出要求。這項功能每個專案最多可支援四個並行配額。
生成式知識輔助
| 配額限制名稱 | 預設值 | 區域 | 收費資源/消費者專案 | 說明 |
|---|---|---|---|---|
SearchKnowledgeRequestsPerMinutePerProject |
每分鐘 60 次要求 | 全球 | 消費者專案 | SearchKnowledge 要求。 |
SearchKnowledgeRequestsPerMinutePerProjectPerRegion |
每分鐘 30 次要求 | 區域 | 消費者專案 | 每個區域的 SearchKnowledge 要求。 |
主動式生成知識輔助 V1
| 配額限制名稱 | 預設值 | 區域 | 收費資源/消費者專案 | 說明 |
|---|---|---|---|---|
SuggestKnowledgeAssistOperationsPerMinutePerProject |
每分鐘 60 次要求 | 全球 | 資源專案 | 透過 AnalyzeContent 或 SuggestKnowledgeAssist 提出的 KnowledgeAssist 要求。 |
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion |
每分鐘 30 次要求 | 區域 | 資源專案 | 透過各區域的 AnalyzeContent 或 SuggestKnowledgeAssist 提出 KnowledgeAssist 要求。 |
主動生成知識輔助 V2
| 配額限制名稱 | 預設值 | 區域 | 收費資源/消費者專案 | 說明 |
|---|---|---|---|---|
KnowledgeAssistOpsPerMinutePerProjectPerVersion |
每分鐘 30 次要求 | 全球 | 資源專案 | 如果要求是傳送至全域位置端點,則 KnowledgeAssist 會要求特定模型版本。 |
KnowledgeAssistOpsPerMinutePerProjectPerVersionPerRegion |
每分鐘 30 次要求 | 區域 | 資源專案 | KnowledgeAssist 要求會導向單一特定 Google Cloud 區域,例如 us-central1 或 europe-west1。 |
KnowledgeAssistOpsPerMinutePerProjectPerVersionPerMultiRegion |
每分鐘 30 次要求 | MultiRegional | 資源專案 | KnowledgeAssist 要求會導向多區域端點,例如美國或歐盟。 |
AI 教練 (LLM)
這項功能採用 agent-coaching-2.5 AI 模型。
| 配額限制名稱 | 預設值 | 區域 | 收費資源或消費者專案 | 說明 |
|---|---|---|---|---|
GeneratorSuggestionOperationsPerMinutePerModelType |
每分鐘 60 個要求 | 全球 | 消費者專案 | 各模型類型的生成器建議作業。 |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
每分鐘 60 個要求 | 區域 | 消費者專案 | 各模型類型和區域的產生器建議作業。 |
其他 API 配額
| 配額限制名稱 | 預設值 | 區域 | 收費資源/消費者專案 | 說明 |
|---|---|---|---|---|
ConversationOperationsPerMinutePerProject |
每分鐘 300 次要求 | 全球 | 消費者專案 | 除了 AnalyzeContent 和 StreamingAnalyzeContent 以外的其他對話要求,例如 CreateConversation、CompleteConversation。Dialogflow 和 Agent Assist 共用配額。 |
MessagePollingOperationsPerMinutePerProject |
每分鐘 1,200 個要求 | 全球 | 消費者專案 | ListMessages 請求。Dialogflow 和 Agent Assist 共用配額。 |
AnswerRecordOperationsPerMinutePerProject |
每分鐘 300 個要求 | 全球 | 消費者專案 | AnswerRecord 要求。 |
後續步驟
- 如要進一步瞭解如何申請增加配額,請參閱配額頁面。
- 提交申請後,Google 可能會與您聯絡,以便進一步瞭解相關資訊,並通知您申請是否獲得核准。