Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

할당량

정확한 할당량 추정은 각 API에 대한 초당 쿼리 수 (QPS)를 기반으로 합니다. 다음 섹션에서는 각 Agent Assist 기능과 함께 사용되는 API의 할당량을 간략히 설명합니다.

프로젝트 유형

다음 할당량 표에는 소비자 프로젝트와 리소스 프로젝트라는 두 가지 유형의 프로젝트가 나열되어 있습니다. 이러한 두 프로젝트 유형의 정의는 여러 프로젝트 사용에 관한 문서를 참고하세요.

음성 텍스트 변환

이 기능은 전화 통신 또는 gRPC 통합을 사용하며, 각 통합에는 서로 다른 API 할당량이 있습니다.

전화 통신 통합

전화 통신 통합에 사용되는 API의 경우 Dialogflow 할당량을 참고하세요.

gRPC 통합

할당량 한도 이름	기본값	리전	요금 청구 리소스/소비자 프로젝트	설명
`AnalyzeContentOperationsPerMinutePerProject`	분당 요청 300개	전역	소비자 프로젝트	AnalyzeContent/StreamingAnalyzeContent 요청 할당량은 Dialogflow와 Agent Assist 간에 공유됩니다.
`ConcurrentBidiStreamingSessionsPerProjectPerRegion`	동시 요청 50개	리전 (전역 트래픽은 `us-central1` 리전에서 집계됨)	소비자 프로젝트 (전화 통신 SipRec 통합의 리소스 프로젝트)	리전별 동시 양방향 스트리밍 세션 수입니다.

Chirp 모델을 사용한 스크립트 작성

할당량 이름	기본값	리전	리소스 또는 소비자 프로젝트에 요금 청구	설명
`SttV2StreamingRequestsPerMinutePerResourceTypePerRegion`	요청 20개/분	리전 (전역 트래픽은 `us-central1` 리전에서 집계됨)	소비자 프로젝트 (전화 통신 SipRec 통합의 리소스 프로젝트)	리소스 유형별로 STT V2에 전송된 새 `StreamingRecognize` 요청 수입니다.

감정 분석

할당량 한도 이름	기본값	리전	요금 청구 리소스/소비자 프로젝트	설명
`AnalyzeSentimentOperationsPerVersion`	분당 요청 300개	전역	소비자 프로젝트	AnalyzeContent 또는 StreamingAnalyzeContent를 통한 감정 분석 요청
`AnalyzeSentimentOperationsPerVersionPerRegion`	분당 요청 300개	리전	소비자 프로젝트	AnalyzeContent 또는 StreamingAnalyzeContent를 통한 감정 분석 요청
`AnalyzeSentimentOperationsPerMinutePerProject`	분당 요청 300개	전역	소비자 프로젝트	AnalyzeContent 또는 StreamingAnalyzeContent를 통한 감정 분석 요청
`AnalyzeSentimentOperationsPerMinutePerProjectPerRegion`	분당 요청 300개	리전	소비자 프로젝트	AnalyzeContent 또는 StreamingAnalyzeContent를 통한 감정 분석 요청

나만의 어시스트 만들기

이 기능은 다음 AI 모델을 사용합니다.

text-bison@001 (기본 한도 0)
text-bison@002
text-bison-32k@002
gemini-1.0-pro
gemini-1.5-pro
gemini-1.5-pro-001
gemini-1.5-flash-001
gemini-1.5-flash-002
gemini-2.0-flash-001

할당량 한도 이름	기본값	리전	요금 청구 리소스/소비자 프로젝트	설명
`GeneratorSuggestionOperationsPerMinutePerModelType`	요청 10개/분	전역	소비자 프로젝트	모델 유형별 생성기 제안 작업입니다.
`GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion`	요청 10개/분	리전	소비자 프로젝트	모델 유형 및 리전별 생성기 제안 작업

스마트 답장

할당량 한도 이름	기본값	리전	요금 청구 리소스/소비자 프로젝트	설명
`SmartReplyBaselineModelOperationsPerMinutePerProject`	요청 120회/분	전역	소비자 프로젝트	`AnalyzeContent` 또는 `SuggestSmartReplies`를 통해 스마트 답장 기준 모델 요청을 가져옵니다.
`SmartReplyBaselineV2ModelOperationsPerMinutePerProject`	요청 60개/분	전역	소비자 프로젝트	`AnalyzeContent` 또는 `SuggestSmartReplies`을 통해 스마트 답장 기준 V2 모델 요청을 가져옵니다.
`SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion`	요청 60개/분	리전	소비자 프로젝트	`AnalyzeContent` 또는 `SuggestSmartReplies`을 통해 스마트 답장 기준 V2 모델 요청을 가져옵니다.

생성형 스마트 답장

할당량 한도 이름	기본값	리전	요금 청구 리소스/소비자 프로젝트	설명
`SmartReplyBaselineModelOperationsPerMinutePerProject`	요청 120회/분	전역	소비자 프로젝트	`AnalyzeContent` 또는 `SuggestSmartReplies`를 통해 스마트 답장 기준 모델 요청을 가져옵니다.
`SmartReplyBaselineV2ModelOperationsPerMinutePerProject`	요청 60개/분	전역	소비자 프로젝트	`AnalyzeContent` 또는 `SuggestSmartReplies`을 통해 스마트 답장 기준 V2 모델 요청을 가져옵니다.
`SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion`	요청 60개/분	리전	소비자 프로젝트	`AnalyzeContent` 또는 `SuggestSmartReplies`을 통해 스마트 답장 기준 V2 모델 요청을 가져옵니다.

요약

AI 생성 요약은 다음 모델을 사용합니다.

summarization-1.0
summarization-2.0
summarization-2.1
summarization-3.0
summarization-3.1
summarization-4.0
summarization-5.0

다음 표에는 각 버전의 요약에 사용되는 할당량 유형과 모델이 나와 있습니다.

요약 버전	할당량 유형	백엔드 모델
Generator 5.0	생성기 기반	사전 학습된 Gemini-2.5-flash
Generator 4.0	생성기 기반	사전 학습된 Gemini-2.0-flash-001
Generator 3.1	생성기 기반	LoRA로 조정된 gemini-1.5-flash-001
Generator 3.0	생성기 기반	LoRA로 조정된 gemini-1.0-pro-002
Generator 2.1	생성기 기반	Lora로 조정된 text-bison-32k@002
Generator 2.0	생성기 기반	Lora로 조정된 text-bison-32k@002
Generator 1.0	생성기 기반	Lora로 조정된 text-bison@001
기준 v2	기준 v2 모델	text-bison
기준 v1	생성기 기반이 아님	LongT5 모델
맞춤 2.0	생성기 기반이 아님	LongT5 모델

이전 표의 할당량 유형은 요약에 사용되는 API의 다음 할당량 목록에 반영됩니다.

할당량 유형	할당량 한도 이름	기본값	리전	리소스/소비자 프로젝트 요금 청구	설명
생성기 기반	GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion	분당 요청 10개	지역	소비자 프로젝트	모델 유형 및 리전별 생성기 제안 작업
생성기 기반	GeneratorSuggestionOperationsPerMinutePerModelType	분당 요청 10개	전체	소비자 프로젝트	모델 유형별 생성기 제안 작업
생성기 기반	SuggestConversationSummaryOperationsPerMinutePerProject	요청 60개/분	전체	리소스 프로젝트	대화 요약 작업 제안
생성기 기반이 아님	SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion	0~2회/분	지역	리소스 프로젝트	각 리전에서 대화 요약 작업 제안
기준 v2 모델	SuggestSummaryV2BaselineOperationsPerMinutePerProject	분당 요청 120개	전체	리소스 프로젝트	대화 요약 제안 V2 기준 폴링 요청
기준 v2 모델	SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion	요청 60개/분	지역	리소스 프로젝트	각 리전의 대화 요약 제안 V2 Baseline 폴링 요청

요약 자동 평가

할당량 한도 이름	기본값	리전	요금 청구 리소스/소비자 프로젝트	설명
`ConcurrentSummarizationEvaluationsPerProject`	프로젝트당 1개 요청	소비자 프로젝트	자동 평가 요청

동시 할당량이 추가로 필요한 경우 Google Cloud 콘솔을 통해 요청을 제출하세요. 이 기능은 프로젝트당 최대 4개의 동시 할당량을 지원할 수 있습니다.

생성형 지식 지원

할당량 한도 이름	기본값	리전	요금 청구 리소스/소비자 프로젝트	설명
`SearchKnowledgeRequestsPerMinutePerProject`	요청 60개/분	전역	소비자 프로젝트	SearchKnowledge 요청
`SearchKnowledgeRequestsPerMinutePerProjectPerRegion`	요청 30회/분	리전	소비자 프로젝트	각 리전의 SearchKnowledge 요청입니다.

선제적 생성형 지식 지원 V1

할당량 한도 이름	기본값	리전	요금 청구 리소스/소비자 프로젝트	설명
`SuggestKnowledgeAssistOperationsPerMinutePerProject`	요청 60개/분	전역	리소스 프로젝트	`AnalyzeContent` 또는 `SuggestKnowledgeAssist`을 통한 KnowledgeAssist 요청
`SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion`	요청 30회/분	리전	리소스 프로젝트	각 리전의 `AnalyzeContent` 또는 `SuggestKnowledgeAssist`을 통한 KnowledgeAssist 요청

선제적 생성형 지식 지원 V2

할당량 한도 이름	기본값	리전	요금 청구 리소스/소비자 프로젝트	설명
`KnowledgeAssistOpsPerMinutePerProjectPerVersion`	요청 30회/분	전역	리소스 프로젝트	요청이 전역 위치 엔드포인트로 전송될 때 특정 모델 버전에 대한 KnowledgeAssist 요청
`KnowledgeAssistOpsPerMinutePerProjectPerVersionPerRegion`	요청 30회/분	리전	리소스 프로젝트	`us-central1` 또는 `europe-west1`와 같은 단일 특정 Google Cloud 리전으로 전송되는 KnowledgeAssist 요청
`KnowledgeAssistOpsPerMinutePerProjectPerVersionPerMultiRegion`	요청 30회/분	MultiRegional	리소스 프로젝트	미국 또는 EU와 같은 멀티 리전 엔드포인트로 전송되는 KnowledgeAssist 요청

AI 코치 (LLM)

이 기능은 agent-coaching-2.5 AI 모델을 사용합니다.

할당량 한도 이름	기본값	리전	리소스 또는 소비자 프로젝트에 요금 청구	설명
`GeneratorSuggestionOperationsPerMinutePerModelType`	요청 60개/분	전역	소비자 프로젝트	모델 유형별 생성기 제안 작업입니다.
`GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion`	요청 60개/분	리전	소비자 프로젝트	모델 유형 및 리전별 생성기 제안 작업

기타 API 할당량

할당량 한도 이름	기본값	리전	요금 청구 리소스/소비자 프로젝트	설명
`ConversationOperationsPerMinutePerProject`	분당 요청 300개	전역	소비자 프로젝트	AnalyzeContent 및 StreamingAnalyzeContent를 제외한 기타 대화 요청(예: CreateConversation, CompleteConversation) 할당량은 Dialogflow와 Agent Assist 간에 공유됩니다.
`MessagePollingOperationsPerMinutePerProject`	1,200개 요청 / 분	전역	소비자 프로젝트	ListMessages 요청입니다. 할당량은 Dialogflow와 Agent Assist 간에 공유됩니다.
`AnswerRecordOperationsPerMinutePerProject`	300 요청 / 분	전역	소비자 프로젝트	AnswerRecord 요청입니다.

다음 단계

할당량 상향 조정 요청에 대한 자세한 내용은 할당량 페이지를 참고하세요.
요청이 제출된 후 Google에서 추가 정보를 위해 연락할 수도 있고, 요청의 승인 또는 거부 여부를 알릴 수도 있습니다.

할당량 컬렉션을 사용해 정리하기 내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.