정확한 할당량 추정은 각 API에 대한 초당 쿼리 수 (QPS)를 기반으로 합니다. 다음 섹션에서는 각 Agent Assist 기능과 함께 사용되는 API의 할당량을 간략히 설명합니다.
프로젝트 유형
다음 할당량 표에는 소비자 프로젝트와 리소스 프로젝트라는 두 가지 유형의 프로젝트가 나열되어 있습니다. 이러한 두 프로젝트 유형의 정의는 여러 프로젝트 사용에 관한 문서를 참고하세요.
음성 텍스트 변환
이 기능은 전화 통신 또는 gRPC 통합을 사용하며, 각 통합에는 서로 다른 API 할당량이 있습니다.
전화 통신 통합
전화 통신 통합에 사용되는 API의 경우 Dialogflow 할당량을 참고하세요.
gRPC 통합
| 할당량 한도 이름 | 기본값 | 리전 | 요금 청구 리소스/소비자 프로젝트 | 설명 |
|---|---|---|---|---|
AnalyzeContentOperationsPerMinutePerProject |
분당 요청 300개 | 전역 | 소비자 프로젝트 | AnalyzeContent/StreamingAnalyzeContent 요청 할당량은 Dialogflow와 Agent Assist 간에 공유됩니다. |
ConcurrentBidiStreamingSessionsPerProjectPerRegion |
동시 요청 50개 | 리전 (전역 트래픽은 us-central1 리전에서 집계됨) |
소비자 프로젝트 (전화 통신 SipRec 통합의 리소스 프로젝트) | 리전별 동시 양방향 스트리밍 세션 수입니다. |
Chirp 모델을 사용한 스크립트 작성
| 할당량 이름 | 기본값 | 리전 | 리소스 또는 소비자 프로젝트에 요금 청구 | 설명 |
|---|---|---|---|---|
SttV2StreamingRequestsPerMinutePerResourceTypePerRegion |
요청 20개/분 | 리전 (전역 트래픽은 us-central1 리전에서 집계됨) |
소비자 프로젝트 (전화 통신 SipRec 통합의 리소스 프로젝트) | 리소스 유형별로 STT V2에 전송된 새 StreamingRecognize 요청 수입니다. |
감정 분석
| 할당량 한도 이름 | 기본값 | 리전 | 요금 청구 리소스/소비자 프로젝트 | 설명 |
|---|---|---|---|---|
AnalyzeSentimentOperationsPerVersion |
분당 요청 300개 | 전역 | 소비자 프로젝트 | AnalyzeContent 또는 StreamingAnalyzeContent를 통한 감정 분석 요청 |
AnalyzeSentimentOperationsPerVersionPerRegion |
분당 요청 300개 | 리전 | 소비자 프로젝트 | AnalyzeContent 또는 StreamingAnalyzeContent를 통한 감정 분석 요청 |
AnalyzeSentimentOperationsPerMinutePerProject |
분당 요청 300개 | 전역 | 소비자 프로젝트 | AnalyzeContent 또는 StreamingAnalyzeContent를 통한 감정 분석 요청 |
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion |
분당 요청 300개 | 리전 | 소비자 프로젝트 | AnalyzeContent 또는 StreamingAnalyzeContent를 통한 감정 분석 요청 |
나만의 어시스트 만들기
이 기능은 다음 AI 모델을 사용합니다.
- text-bison@001 (기본 한도 0)
- text-bison@002
- text-bison-32k@002
- gemini-1.0-pro
- gemini-1.5-pro
- gemini-1.5-pro-001
- gemini-1.5-flash-001
- gemini-1.5-flash-002
- gemini-2.0-flash-001
| 할당량 한도 이름 | 기본값 | 리전 | 요금 청구 리소스/소비자 프로젝트 | 설명 |
|---|---|---|---|---|
GeneratorSuggestionOperationsPerMinutePerModelType |
요청 10개/분 | 전역 | 소비자 프로젝트 | 모델 유형별 생성기 제안 작업입니다. |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
요청 10개/분 | 리전 | 소비자 프로젝트 | 모델 유형 및 리전별 생성기 제안 작업 |
스마트 답장
| 할당량 한도 이름 | 기본값 | 리전 | 요금 청구 리소스/소비자 프로젝트 | 설명 |
|---|---|---|---|---|
SmartReplyBaselineModelOperationsPerMinutePerProject |
요청 120회/분 | 전역 | 소비자 프로젝트 | AnalyzeContent 또는 SuggestSmartReplies를 통해 스마트 답장 기준 모델 요청을 가져옵니다. |
SmartReplyBaselineV2ModelOperationsPerMinutePerProject |
요청 60개/분 | 전역 | 소비자 프로젝트 | AnalyzeContent 또는 SuggestSmartReplies을 통해 스마트 답장 기준 V2 모델 요청을 가져옵니다. |
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion |
요청 60개/분 | 리전 | 소비자 프로젝트 | AnalyzeContent 또는 SuggestSmartReplies을 통해 스마트 답장 기준 V2 모델 요청을 가져옵니다. |
생성형 스마트 답장
| 할당량 한도 이름 | 기본값 | 리전 | 요금 청구 리소스/소비자 프로젝트 | 설명 |
|---|---|---|---|---|
SmartReplyBaselineModelOperationsPerMinutePerProject |
요청 120회/분 | 전역 | 소비자 프로젝트 | AnalyzeContent 또는 SuggestSmartReplies를 통해 스마트 답장 기준 모델 요청을 가져옵니다. |
SmartReplyBaselineV2ModelOperationsPerMinutePerProject |
요청 60개/분 | 전역 | 소비자 프로젝트 | AnalyzeContent 또는 SuggestSmartReplies을 통해 스마트 답장 기준 V2 모델 요청을 가져옵니다. |
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion |
요청 60개/분 | 리전 | 소비자 프로젝트 | AnalyzeContent 또는 SuggestSmartReplies을 통해 스마트 답장 기준 V2 모델 요청을 가져옵니다. |
요약
AI 생성 요약은 다음 모델을 사용합니다.
- summarization-1.0
- summarization-2.0
- summarization-2.1
- summarization-3.0
- summarization-3.1
- summarization-4.0
- summarization-5.0
다음 표에는 각 버전의 요약에 사용되는 할당량 유형과 모델이 나와 있습니다.
요약 버전 |
할당량 유형 |
백엔드 모델 |
|---|---|---|
Generator 5.0 |
생성기 기반 |
사전 학습된 Gemini-2.5-flash |
Generator 4.0 |
생성기 기반 |
사전 학습된 Gemini-2.0-flash-001 |
Generator 3.1 |
생성기 기반 |
LoRA로 조정된 gemini-1.5-flash-001 |
Generator 3.0 |
생성기 기반 |
LoRA로 조정된 gemini-1.0-pro-002 |
Generator 2.1 |
생성기 기반 |
Lora로 조정된 text-bison-32k@002 |
Generator 2.0 |
생성기 기반 |
Lora로 조정된 text-bison-32k@002 |
Generator 1.0 |
생성기 기반 |
Lora로 조정된 text-bison@001 |
기준 v2 |
기준 v2 모델 |
text-bison |
기준 v1 |
생성기 기반이 아님 |
LongT5 모델 |
맞춤 2.0 |
생성기 기반이 아님 |
LongT5 모델 |
이전 표의 할당량 유형은 요약에 사용되는 API의 다음 할당량 목록에 반영됩니다.
할당량 유형 |
할당량 한도 이름 |
기본값 |
리전 |
리소스/소비자 프로젝트 요금 청구 |
설명 |
|---|---|---|---|---|---|
생성기 기반 |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
분당 요청 10개 |
지역 |
소비자 프로젝트 |
모델 유형 및 리전별 생성기 제안 작업 |
생성기 기반 |
GeneratorSuggestionOperationsPerMinutePerModelType |
분당 요청 10개 |
전체 |
소비자 프로젝트 |
모델 유형별 생성기 제안 작업 |
생성기 기반 |
SuggestConversationSummaryOperationsPerMinutePerProject |
요청 60개/분 |
전체 |
리소스 프로젝트 |
대화 요약 작업 제안 |
생성기 기반이 아님 |
SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion |
0~2회/분 |
지역 |
리소스 프로젝트 |
각 리전에서 대화 요약 작업 제안 |
기준 v2 모델 |
SuggestSummaryV2BaselineOperationsPerMinutePerProject |
분당 요청 120개 |
전체 |
리소스 프로젝트 |
대화 요약 제안 V2 기준 폴링 요청 |
기준 v2 모델 |
SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion |
요청 60개/분 |
지역 |
리소스 프로젝트 |
각 리전의 대화 요약 제안 V2 Baseline 폴링 요청 |
요약 자동 평가
| 할당량 한도 이름 | 기본값 | 리전 | 요금 청구 리소스/소비자 프로젝트 | 설명 |
|---|---|---|---|---|
ConcurrentSummarizationEvaluationsPerProject |
프로젝트당 1개 요청 | 소비자 프로젝트 | 자동 평가 요청 |
동시 할당량이 추가로 필요한 경우 Google Cloud 콘솔을 통해 요청을 제출하세요. 이 기능은 프로젝트당 최대 4개의 동시 할당량을 지원할 수 있습니다.
생성형 지식 지원
| 할당량 한도 이름 | 기본값 | 리전 | 요금 청구 리소스/소비자 프로젝트 | 설명 |
|---|---|---|---|---|
SearchKnowledgeRequestsPerMinutePerProject |
요청 60개/분 | 전역 | 소비자 프로젝트 | SearchKnowledge 요청 |
SearchKnowledgeRequestsPerMinutePerProjectPerRegion |
요청 30회/분 | 리전 | 소비자 프로젝트 | 각 리전의 SearchKnowledge 요청입니다. |
선제적 생성형 지식 지원 V1
| 할당량 한도 이름 | 기본값 | 리전 | 요금 청구 리소스/소비자 프로젝트 | 설명 |
|---|---|---|---|---|
SuggestKnowledgeAssistOperationsPerMinutePerProject |
요청 60개/분 | 전역 | 리소스 프로젝트 | AnalyzeContent 또는 SuggestKnowledgeAssist을 통한 KnowledgeAssist 요청 |
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion |
요청 30회/분 | 리전 | 리소스 프로젝트 | 각 리전의 AnalyzeContent 또는 SuggestKnowledgeAssist을 통한 KnowledgeAssist 요청 |
선제적 생성형 지식 지원 V2
| 할당량 한도 이름 | 기본값 | 리전 | 요금 청구 리소스/소비자 프로젝트 | 설명 |
|---|---|---|---|---|
KnowledgeAssistOpsPerMinutePerProjectPerVersion |
요청 30회/분 | 전역 | 리소스 프로젝트 | 요청이 전역 위치 엔드포인트로 전송될 때 특정 모델 버전에 대한 KnowledgeAssist 요청 |
KnowledgeAssistOpsPerMinutePerProjectPerVersionPerRegion |
요청 30회/분 | 리전 | 리소스 프로젝트 | us-central1 또는 europe-west1와 같은 단일 특정 Google Cloud 리전으로 전송되는 KnowledgeAssist 요청 |
KnowledgeAssistOpsPerMinutePerProjectPerVersionPerMultiRegion |
요청 30회/분 | MultiRegional | 리소스 프로젝트 | 미국 또는 EU와 같은 멀티 리전 엔드포인트로 전송되는 KnowledgeAssist 요청 |
AI 코치 (LLM)
이 기능은 agent-coaching-2.5 AI 모델을 사용합니다.
| 할당량 한도 이름 | 기본값 | 리전 | 리소스 또는 소비자 프로젝트에 요금 청구 | 설명 |
|---|---|---|---|---|
GeneratorSuggestionOperationsPerMinutePerModelType |
요청 60개/분 | 전역 | 소비자 프로젝트 | 모델 유형별 생성기 제안 작업입니다. |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
요청 60개/분 | 리전 | 소비자 프로젝트 | 모델 유형 및 리전별 생성기 제안 작업 |
기타 API 할당량
| 할당량 한도 이름 | 기본값 | 리전 | 요금 청구 리소스/소비자 프로젝트 | 설명 |
|---|---|---|---|---|
ConversationOperationsPerMinutePerProject |
분당 요청 300개 | 전역 | 소비자 프로젝트 | AnalyzeContent 및 StreamingAnalyzeContent를 제외한 기타 대화 요청(예: CreateConversation, CompleteConversation) 할당량은 Dialogflow와 Agent Assist 간에 공유됩니다. |
MessagePollingOperationsPerMinutePerProject |
1,200개 요청 / 분 | 전역 | 소비자 프로젝트 | ListMessages 요청입니다. 할당량은 Dialogflow와 Agent Assist 간에 공유됩니다. |
AnswerRecordOperationsPerMinutePerProject |
300 요청 / 분 | 전역 | 소비자 프로젝트 | AnswerRecord 요청입니다. |
다음 단계
- 할당량 상향 조정 요청에 대한 자세한 내용은 할당량 페이지를 참고하세요.
- 요청이 제출된 후 Google에서 추가 정보를 위해 연락할 수도 있고, 요청의 승인 또는 거부 여부를 알릴 수도 있습니다.