割り当て

割り当てを正確に見積もるには、各 API への秒間クエリ数(QPS)を把握する必要があります。以降のセクションでは、各 Agent Assist 機能で使用される API の割り当てについて説明します。

プロジェクトの種類

次の割り当て表には、コンシューマ プロジェクトとリソース プロジェクトの 2 種類のプロジェクトが記載されています。これらの 2 種類のプロジェクトの 定義については、複数のプロジェクトを使用するをご覧ください。

音声文字変換

この機能では、テレフォニー統合または gRPC 統合を使用します。それぞれ API 割り当てが異なります。

テレフォニー統合

テレフォニー統合で使用される API については、Dialogflow の割り当てをご覧ください。

gRPC 統合

割り当て上限名 デフォルト値 リージョン 課金対象リソース/コンシューマ プロジェクト 説明
AnalyzeContentOperationsPerMinutePerProject 300 リクエスト/分 グローバル コンシューマ プロジェクト AnalyzeContent/StreamingAnalyzeContent リクエスト。割り当ては Dialogflow と Agent Assist で共有されます。
ConcurrentBidiStreamingSessionsPerProjectPerRegion 同時リクエスト 50 件 リージョン(グローバル トラフィックは us-central1 リージョンでカウントされます) コンシューマ プロジェクト(テレフォニー SipRec 統合のリソース プロジェクト) リージョンごとの同時双方向ストリーミング セッション。

Chirp モデルを使用した文字起こし

割り当て名 デフォルト値 リージョン 課金対象リソースまたはコンシューマ プロジェクト 説明
SttV2StreamingRequestsPerMinutePerResourceTypePerRegion 1 分あたり 20 件のリクエスト リージョン(グローバル トラフィックは us-central1 リージョンでカウントされます) コンシューマ プロジェクト(テレフォニー SipRec 統合のリソース プロジェクト) リソースタイプごとに STT V2 に送信される新しい StreamingRecognize リクエストの数。

感情分析

割り当て上限名 デフォルト値 リージョン 課金対象リソース/コンシューマ プロジェクト 説明
AnalyzeSentimentOperationsPerVersion 300 リクエスト/分 グローバル コンシューマ プロジェクト AnalyzeContent または StreamingAnalyzeContent を介した感情分析リクエスト。
AnalyzeSentimentOperationsPerVersionPerRegion 300 リクエスト/分 リージョン コンシューマ プロジェクト AnalyzeContent または StreamingAnalyzeContent を介した感情分析リクエスト。
AnalyzeSentimentOperationsPerMinutePerProject 300 リクエスト/分 グローバル コンシューマ プロジェクト AnalyzeContent または StreamingAnalyzeContent を介した感情分析リクエスト。
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion 300 リクエスト/分 リージョン コンシューマ プロジェクト AnalyzeContent または StreamingAnalyzeContent を介した感情分析リクエスト。

独自のアシストを構築する

この機能では、次の AI モデルを使用します。

  • text-bison@001(デフォルトの上限は 0)
  • text-bison@002
  • text-bison-32k@002
  • gemini-1.0-pro
  • gemini-1.5-pro
  • gemini-1.5-pro-001
  • gemini-1.5-flash-001
  • gemini-1.5-flash-002
  • gemini-2.0-flash-001
割り当て上限名 デフォルト値 リージョン 課金対象リソース/コンシューマ プロジェクト 説明
GeneratorSuggestionOperationsPerMinutePerModelType 10 リクエスト/分 グローバル コンシューマ プロジェクト モデルタイプごとの生成ツール候補オペレーション。
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 10 リクエスト/分 リージョン コンシューマ プロジェクト モデルタイプとリージョンごとの生成ツール候補オペレーション。

スマート リプライ

割り当て上限名 デフォルト値 リージョン 課金対象リソース/コンシューマ プロジェクト 説明
SmartReplyBaselineModelOperationsPerMinutePerProject 120 リクエスト/分 グローバル コンシューマ プロジェクト AnalyzeContent または SuggestSmartReplies を介したスマート リプライ ベースライン モデルのリクエストを取得します。
SmartReplyBaselineV2ModelOperationsPerMinutePerProject 60 リクエスト/分 グローバル コンシューマ プロジェクト AnalyzeContent または SuggestSmartReplies を介したスマート リプライ ベースライン V2 モデルのリクエストを取得します。
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion 60 リクエスト/分 リージョン コンシューマ プロジェクト AnalyzeContent または SuggestSmartReplies を介したスマート リプライ ベースライン V2 モデルのリクエストを取得します。

生成スマート リプライ

割り当て上限名 デフォルト値 リージョン 課金対象リソース/コンシューマ プロジェクト 説明
SmartReplyBaselineModelOperationsPerMinutePerProject 120 リクエスト/分 グローバル コンシューマ プロジェクト AnalyzeContent または SuggestSmartReplies を介したスマート リプライ ベースライン モデルのリクエストを取得します。
SmartReplyBaselineV2ModelOperationsPerMinutePerProject 60 リクエスト/分 グローバル コンシューマ プロジェクト AnalyzeContent または SuggestSmartReplies を介したスマート リプライ ベースライン V2 モデルのリクエストを取得します。
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion 60 リクエスト/分 リージョン コンシューマ プロジェクト AnalyzeContent または SuggestSmartReplies を介したスマート リプライ ベースライン V2 モデルのリクエストを取得します。

要約

AI によって生成された要約では、次のモデルが使用されます。

  • summarization-1.0
  • summarization-2.0
  • summarization-2.1
  • summarization-3.0
  • summarization-3.1
  • summarization-4.0
  • summarization-5.0

次の表に、要約の各バージョンで使用される割り当てタイプとモデルを示します。


要約バージョン

割り当てタイプ

バックエンド モデル

Generator 5.0

Generator ベース

事前トレーニング済み Gemini-2.5-flash

Generator 4.0

Generator ベース

事前トレーニング済み Gemini-2.0-flash-001

Generator 3.1

Generator ベース

Lora チューニング済み gemini-1.5-flash-001

Generator 3.0

Generator ベース

Lora チューニング済み gemini-1.0-pro-002

Generator 2.1

Generator ベース

Lora チューニング済み text-bison-32k@002

Generator 2.0

Generator ベース

Lora チューニング済み text-bison-32k@002

Generator 1.0

Generator ベース

Lora チューニング済み text-bison@001

ベースライン v2

ベースライン v2 モデル

text-bison

ベースライン v1

Generator ベース以外

LongT5 モデル

カスタム 2.0

Generator ベース以外

LongT5 モデル

上の表の割り当てタイプは、要約で使用される API の次の割り当てリストに反映されます。


割り当てタイプ

割り当て上限名

デフォルト値

リージョン

課金対象リソース/コンシューマ プロジェクト

説明

Generator ベース

GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion

10 リクエスト/分

リージョン

コンシューマ プロジェクト

モデルタイプとリージョンごとの生成ツール候補オペレーション

Generator ベース

GeneratorSuggestionOperationsPerMinutePerModelType

10 リクエスト/分

グローバル

コンシューマ プロジェクト

モデルタイプごとの生成ツール候補オペレーション

Generator ベース

SuggestConversationSummaryOperationsPerMinutePerProject

60 リクエスト/分

グローバル

リソース プロジェクト

会話の概要の提案オペレーション

Generator ベース以外

SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion

0 ~ 2 リクエスト/分

リージョン

リソース プロジェクト

各リージョンでの会話の概要の提案オペレーション

ベースライン v2 モデル

SuggestSummaryV2BaselineOperationsPerMinutePerProject

120 リクエスト/分

グローバル

リソース プロジェクト

会話の概要の提案 V2 ベースラインのポーリング リクエスト

ベースライン v2 モデル

SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion

60 リクエスト/分

リージョン

リソース プロジェクト

各リージョンでの会話の概要の提案 V2 ベースラインのポーリング リクエスト

要約の自動評価

割り当て上限名 デフォルト値 リージョン 課金対象リソース/コンシューマ プロジェクト 説明
ConcurrentSummarizationEvaluationsPerProject プロジェクトごとに 1 件のリクエスト コンシューマ プロジェクト 自動評価リクエスト

同時割り当てを追加する必要がある場合は、 Google Cloud コンソールからリクエストを送信してください。この機能では、プロジェクトごとに最大 4 つの同時割り当てをサポートできます。

生成ナレッジ アシスト

割り当て上限名 デフォルト値 リージョン 課金対象リソース/コンシューマ プロジェクト 説明
SearchKnowledgeRequestsPerMinutePerProject 60 リクエスト/分 グローバル コンシューマ プロジェクト SearchKnowledge リクエスト。
SearchKnowledgeRequestsPerMinutePerProjectPerRegion 30 リクエスト/分 リージョン コンシューマ プロジェクト 各リージョンの SearchKnowledge リクエスト。

プロアクティブ生成ナレッジ アシスト V1

割り当て上限名 デフォルト値 リージョン 課金対象リソース/コンシューマ プロジェクト 説明
SuggestKnowledgeAssistOperationsPerMinutePerProject 60 リクエスト/分 グローバル リソース プロジェクト AnalyzeContent または SuggestKnowledgeAssist を介した KnowledgeAssist リクエスト。
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion 30 リクエスト/分 リージョン リソース プロジェクト 各リージョンの AnalyzeContent または SuggestKnowledgeAssist を介した KnowledgeAssist リクエスト。

プロアクティブ生成ナレッジ アシスト V2

割り当て上限名 デフォルト値 リージョン 課金対象リソース/コンシューマ プロジェクト 説明
KnowledgeAssistOpsPerMinutePerProjectPerVersion 30 リクエスト/分 グローバル リソース プロジェクト リクエストがグローバル ロケーション エンドポイントに送信された場合の特定のモデル バージョンの KnowledgeAssist リクエスト。
KnowledgeAssistOpsPerMinutePerProjectPerVersionPerRegion 30 リクエスト/分 リージョン リソース プロジェクト us-central1europe-west1 など、単一の特定の Google Cloud リージョンに送信される KnowledgeAssist リクエスト。
KnowledgeAssistOpsPerMinutePerProjectPerVersionPerMultiRegion 30 リクエスト/分 MultiRegional リソース プロジェクト 米国や EU などのマルチリージョン エンドポイントに送信される KnowledgeAssist リクエスト。

AI コーチ(LLM)

この機能では、agent-coaching-2.5 AI モデルを使用します。

割り当て上限名 デフォルト値 リージョン 課金対象リソースまたはコンシューマ プロジェクト 説明
GeneratorSuggestionOperationsPerMinutePerModelType 1 分あたり 60 件のリクエスト グローバル コンシューマ プロジェクト モデルタイプごとの生成ツール候補オペレーション。
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 1 分あたり 60 件のリクエスト リージョン コンシューマ プロジェクト モデルタイプとリージョンごとの生成ツール候補オペレーション。

その他の API 割り当て

割り当て上限名 デフォルト値 リージョン 課金対象リソース/コンシューマ プロジェクト 説明
ConversationOperationsPerMinutePerProject 300 リクエスト/分 グローバル コンシューマ プロジェクト AnalyzeContent と StreamingAnalyzeContent 以外の会話リクエスト(CreateConversation、CompleteConversation など)。割り当ては Dialogflow と Agent Assist で共有されます。
MessagePollingOperationsPerMinutePerProject 1,200 リクエスト / 分 グローバル コンシューマ プロジェクト ListMessages リクエスト。割り当ては Dialogflow と Agent Assist で共有されます。
AnswerRecordOperationsPerMinutePerProject 300 リクエスト / 分 グローバル コンシューマ プロジェクト AnswerRecord リクエスト。

次のステップ

  • 割り当ての増加をリクエストする方法について詳しくは、割り当てのページをご覧ください。
  • リクエスト送信後に、Google から詳細について確認させていただく場合があります。リクエストの承認または却下の結果については、追ってお知らせいたします。