配額

準確預估配額時,會根據每個 API 的每秒查詢次數 (QPS) 計算。以下各節將說明搭配各項 Agent Assist 功能使用的 API 配額。

專案類型

下列配額表列出兩種專案:消費者和資源。如要瞭解這兩種專案類型的定義,請參閱使用多個專案的文件。

語音轉錄

這項功能會使用電話或 gRPC 整合,兩者各有不同的 API 配額。

電話整合

如要瞭解與電話整合服務搭配使用的 API 配額,請參閱 Dialogflow 配額

整合 gRPC

配額限制名稱 預設值 區域 收費資源/消費者專案 說明
AnalyzeContentOperationsPerMinutePerProject 每分鐘 300 次要求 全球 消費者專案 AnalyzeContent/StreamingAnalyzeContent 要求。Dialogflow 和 Agent Assist 共用配額。
ConcurrentBidiStreamingSessionsPerProjectPerRegion 50 項並行要求 區域 (全球流量計入 us-central1 區域) 消費者專案 (電話 SipRec 整合的資源專案) 每個區域的並行雙向串流工作階段。

使用 Chirp 模型轉錄

配額名稱 預設值 區域 收費資源或消費者專案 說明
SttV2StreamingRequestsPerMinutePerResourceTypePerRegion 每分鐘 20 個要求 區域 (全域流量會計入 us-central1 區域)。 消費者專案 (電話 SipRec 整合的資源專案) 傳送至 STT V2 的新 StreamingRecognize 要求數量 (依資源類型劃分)。

情緒分析

配額限制名稱 預設值 區域 收費資源/消費者專案 說明
AnalyzeSentimentOperationsPerVersion 每分鐘 300 次要求 全球 消費者專案 透過 AnalyzeContent 或 StreamingAnalyzeContent 提出的情緒分析要求。
AnalyzeSentimentOperationsPerVersionPerRegion 每分鐘 300 次要求 區域 消費者專案 透過 AnalyzeContent 或 StreamingAnalyzeContent 提出的情緒分析要求。
AnalyzeSentimentOperationsPerMinutePerProject 每分鐘 300 次要求 全球 消費者專案 透過 AnalyzeContent 或 StreamingAnalyzeContent 提出的情緒分析要求。
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion 每分鐘 300 次要求 區域 消費者專案 透過 AnalyzeContent 或 StreamingAnalyzeContent 提出的情緒分析要求。

打造專屬輔助功能

這項功能使用下列 AI 模型:

  • text-bison@001 (預設限制為 0)
  • text-bison@002
  • text-bison-32k@002
  • gemini-1.0-pro
  • gemini-1.5-pro
  • gemini-1.5-pro-001
  • gemini-1.5-flash-001
  • gemini-1.5-flash-002
  • gemini-2.0-flash-001
配額限制名稱 預設值 區域 收費資源/消費者專案 說明
GeneratorSuggestionOperationsPerMinutePerModelType 每分鐘 10 個要求 全球 消費者專案 各模型類型的生成器建議作業。
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 每分鐘 10 個要求 區域 消費者專案 各模型類型和區域的產生器建議作業。

智慧回覆

配額限制名稱 預設值 區域 收費資源/消費者專案 說明
SmartReplyBaselineModelOperationsPerMinutePerProject 每分鐘 120 個要求 全球 消費者專案 透過 AnalyzeContentSuggestSmartReplies 取得智慧回覆基準模型要求。
SmartReplyBaselineV2ModelOperationsPerMinutePerProject 每分鐘 60 次要求 全球 消費者專案 透過 AnalyzeContentSuggestSmartReplies 取得智慧回覆基準 V2 模型要求。
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion 每分鐘 60 次要求 區域 消費者專案 透過 AnalyzeContentSuggestSmartReplies 取得智慧回覆基準 V2 模型要求。

生成式智慧回覆

配額限制名稱 預設值 區域 收費資源/消費者專案 說明
SmartReplyBaselineModelOperationsPerMinutePerProject 每分鐘 120 個要求 全球 消費者專案 透過 AnalyzeContentSuggestSmartReplies 取得智慧回覆基準模型要求。
SmartReplyBaselineV2ModelOperationsPerMinutePerProject 每分鐘 60 次要求 全球 消費者專案 透過 AnalyzeContentSuggestSmartReplies 取得智慧回覆基準 V2 模型要求。
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion 每分鐘 60 次要求 區域 消費者專案 透過 AnalyzeContentSuggestSmartReplies 取得智慧回覆基準 V2 模型要求。

摘要

AI 生成摘要功能使用下列模型:

  • summarization-1.0
  • summarization-2.0
  • summarization-2.1
  • summarization-3.0
  • summarization-3.1
  • summarization-4.0
  • summarization-5.0

下表列出各個摘要版本使用的配額類型和模型。


摘要版本

配額類型

後端模型

Generator 5.0

根據生成器

預先訓練的 Gemini-2.5-flash

Generator 4.0

根據生成器

預先訓練的 Gemini-2.0-flash-001

Generator 3.1

根據生成器

經 Lora 微調的 gemini-1.5-flash-001

Generator 3.0

發電機

Lora 微調的 gemini-1.0-pro-002

Generator 2.1

發電機

Lora 微調的 text-bison-32k@002

生成器 2.0

根據生成器

Lora 微調的 text-bison-32k@002

Generator 1.0

根據生成器

經過 Lora 微調的 text-bison@001

基準 v2

基準模型第 2 版

text-bison

Baseline v1

非生成器

LongT5 模型

自訂 2.0

非生成器

LongT5 模型

下表列出用於摘要的 API 配額,反映上表中的配額類型。


配額類型

配額限制名稱

預設值

區域

收費資源/消費者專案

說明

根據生成器

GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion

每分鐘 10 次要求

區域

消費者專案

各模型類型和區域的產生器建議作業

根據生成器

GeneratorSuggestionOperationsPerMinutePerModelType

每分鐘 10 次要求

全球

消費者專案

各模型類型的生成器建議作業

發電機

SuggestConversationSummaryOperationsPerMinutePerProject

每分鐘 60 個要求

全球

資源專案

建議對話摘要作業

非生成器

SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion

每分鐘 0 到 2 次要求

區域

資源專案

在每個區域建議對話摘要作業

基準模型第 2 版

SuggestSummaryV2BaselineOperationsPerMinutePerProject

每分鐘 120 次要求

全球

資源專案

Conversation Summary Suggestion V2 Baseline polling requests

基準模型第 2 版

SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion

每分鐘 60 個要求

區域

資源專案

各區域的對話摘要建議 V2 基準輪詢要求

摘要自動評估

配額限制名稱 預設值 區域 收費資源/消費者專案 說明
ConcurrentSummarizationEvaluationsPerProject 每項專案 1 項要求 消費者專案 自動評估要求

如需額外的並行配額,請透過 Google Cloud 控制台提出要求。這項功能每個專案最多可支援四個並行配額。

生成式知識輔助

配額限制名稱 預設值 區域 收費資源/消費者專案 說明
SearchKnowledgeRequestsPerMinutePerProject 每分鐘 60 次要求 全球 消費者專案 SearchKnowledge 要求。
SearchKnowledgeRequestsPerMinutePerProjectPerRegion 每分鐘 30 次要求 區域 消費者專案 每個區域的 SearchKnowledge 要求。

主動式生成知識輔助 V1

配額限制名稱 預設值 區域 收費資源/消費者專案 說明
SuggestKnowledgeAssistOperationsPerMinutePerProject 每分鐘 60 次要求 全球 資源專案 透過 AnalyzeContentSuggestKnowledgeAssist 提出的 KnowledgeAssist 要求。
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion 每分鐘 30 次要求 區域 資源專案 透過各區域的 AnalyzeContentSuggestKnowledgeAssist 提出 KnowledgeAssist 要求。

主動生成知識輔助 V2

配額限制名稱 預設值 區域 收費資源/消費者專案 說明
KnowledgeAssistOpsPerMinutePerProjectPerVersion 每分鐘 30 次要求 全球 資源專案 如果要求是傳送至全域位置端點,則 KnowledgeAssist 會要求特定模型版本。
KnowledgeAssistOpsPerMinutePerProjectPerVersionPerRegion 每分鐘 30 次要求 區域 資源專案 KnowledgeAssist 要求會導向單一特定 Google Cloud 區域,例如 us-central1europe-west1
KnowledgeAssistOpsPerMinutePerProjectPerVersionPerMultiRegion 每分鐘 30 次要求 MultiRegional 資源專案 KnowledgeAssist 要求會導向多區域端點,例如美國或歐盟。

AI 教練 (LLM)

這項功能採用 agent-coaching-2.5 AI 模型。

配額限制名稱 預設值 區域 收費資源或消費者專案 說明
GeneratorSuggestionOperationsPerMinutePerModelType 每分鐘 60 個要求 全球 消費者專案 各模型類型的生成器建議作業。
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 每分鐘 60 個要求 區域 消費者專案 各模型類型和區域的產生器建議作業。

其他 API 配額

配額限制名稱 預設值 區域 收費資源/消費者專案 說明
ConversationOperationsPerMinutePerProject 每分鐘 300 次要求 全球 消費者專案 除了 AnalyzeContent 和 StreamingAnalyzeContent 以外的其他對話要求,例如 CreateConversation、CompleteConversation。Dialogflow 和 Agent Assist 共用配額。
MessagePollingOperationsPerMinutePerProject 每分鐘 1,200 個要求 全球 消費者專案 ListMessages 請求。Dialogflow 和 Agent Assist 共用配額。
AnswerRecordOperationsPerMinutePerProject 每分鐘 300 個要求 全球 消費者專案 AnswerRecord 要求。

後續步驟

  • 如要進一步瞭解如何申請增加配額,請參閱配額頁面
  • 提交申請後,Google 可能會與您聯絡,以便進一步瞭解相關資訊,並通知您申請是否獲得核准。