Kuota

Estimasi kuota yang akurat didasarkan pada jumlah kueri per detik (QPS) Anda ke setiap API. Bagian berikut menguraikan kuota untuk API yang digunakan dengan setiap fitur Agent Assist.

Jenis project

Tabel kuota berikut mencantumkan dua jenis project: konsumen dan resource. Lihat dokumentasi tentang penggunaan beberapa project untuk definisi kedua jenis project ini.

Transkripsi suara

Fitur ini menggunakan integrasi telepon atau gRPC, yang masing-masing memiliki kuota API yang berbeda.

Integrasi telepon

Lihat kuota Dialogflow untuk API yang digunakan dengan integrasi telepon.

Integrasi gRPC

Nama batas kuota Nilai default Region Resource pengisian daya/Project konsumen Deskripsi
AnalyzeContentOperationsPerMinutePerProject 300 permintaan/mnt Global Project konsumen Permintaan AnalyzeContent/StreamingAnalyzeContent. Kuota dibagi antara Dialogflow dan Agent Assist.
ConcurrentBidiStreamingSessionsPerProjectPerRegion 50 permintaan serentak Regional (traffic global dihitung di region us-central1) Project konsumen (project resource untuk integrasi SipRec telepon) Sesi streaming dua arah serentak per region.

Transkripsi dengan model Chirp

Nama kuota Nilai default Region Project konsumen atau resource penagihan Deskripsi
SttV2StreamingRequestsPerMinutePerResourceTypePerRegion 20 permintaan per menit Regional (Traffic global dihitung di region us-central1.) Project konsumen (project resource untuk integrasi SipRec telepon) Jumlah permintaan StreamingRecognize baru yang dikirim ke STT V2 per jenis resource.

Analisis sentimen

Nama batas kuota Nilai default Region Resource pengisian daya/Project konsumen Deskripsi
AnalyzeSentimentOperationsPerVersion 300 permintaan/mnt Global Project konsumen Permintaan analisis sentimen melalui AnalyzeContent atau StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerVersionPerRegion 300 permintaan/mnt Regional Project konsumen Permintaan analisis sentimen melalui AnalyzeContent atau StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerMinutePerProject 300 permintaan/mnt Global Project konsumen Permintaan analisis sentimen melalui AnalyzeContent atau StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion 300 permintaan/mnt Regional Project konsumen Permintaan analisis sentimen melalui AnalyzeContent atau StreamingAnalyzeContent.

Membangun bantuan Anda sendiri

Fitur ini menggunakan model AI berikut:

  • text-bison@001 (batas default 0)
  • text-bison@002
  • text-bison-32k@002
  • gemini-1.0-pro
  • gemini-1.5-pro
  • gemini-1.5-pro-001
  • gemini-1.5-flash-001
  • gemini-1.5-flash-002
  • gemini-2.0-flash-001
Nama batas kuota Nilai default Region Resource pengisian daya/Project konsumen Deskripsi
GeneratorSuggestionOperationsPerMinutePerModelType 10 permintaan/menit Global Project konsumen Operasi saran generator per jenis model.
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 10 permintaan/menit Regional Project konsumen Operasi saran generator per jenis model dan region.

Smart reply

Nama batas kuota Nilai default Region Resource pengisian daya/Project konsumen Deskripsi
SmartReplyBaselineModelOperationsPerMinutePerProject 120 permintaan/menit Global Project konsumen Dapatkan permintaan model dasar Smart Reply melalui AnalyzeContent atau SuggestSmartReplies.
SmartReplyBaselineV2ModelOperationsPerMinutePerProject 60 permintaan/mnt Global Project konsumen Dapatkan permintaan model dasar Smart Reply V2 melalui AnalyzeContent atau SuggestSmartReplies.
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion 60 permintaan/mnt Regional Project konsumen Dapatkan permintaan model dasar Smart Reply V2 melalui AnalyzeContent atau SuggestSmartReplies.

Smart reply generatif

Nama batas kuota Nilai default Region Resource pengisian daya/Project konsumen Deskripsi
SmartReplyBaselineModelOperationsPerMinutePerProject 120 permintaan/menit Global Project konsumen Dapatkan permintaan model dasar Smart Reply melalui AnalyzeContent atau SuggestSmartReplies.
SmartReplyBaselineV2ModelOperationsPerMinutePerProject 60 permintaan/mnt Global Project konsumen Dapatkan permintaan model dasar Smart Reply V2 melalui AnalyzeContent atau SuggestSmartReplies.
SmartReplyBaselineV2ModelOperationsPerMinutePerProjectPerRegion 60 permintaan/mnt Regional Project konsumen Dapatkan permintaan model dasar Smart Reply V2 melalui AnalyzeContent atau SuggestSmartReplies.

Ringkasan

Ringkasan yang dihasilkan AI menggunakan model berikut:

  • summarization-1.0
  • summarization-2.0
  • summarization-2.1
  • summarization-3.0
  • summarization-3.1
  • summarization-4.0
  • summarization-5.0

Tabel berikut menunjukkan jenis kuota dan model yang digunakan untuk setiap versi ringkasan.


Versi ringkasan

Jenis kuota

Model backend

Generator 5.0

Berdasarkan generator

Gemini-2.5-flash yang telah dilatih sebelumnya

Generator 4.0

Berdasarkan generator

Gemini-2.0-flash-001 yang telah dilatih sebelumnya

Generator 3.1

Berdasarkan generator

gemini-1.5-flash-001 yang di-tuning Lora

Generator 3.0

Berdasarkan generator

gemini-1.0-pro-002 yang di-tuning Lora

Generator 2.1

Berdasarkan generator

text-bison-32k@002 yang di-tuning Lora

Generator 2.0

Berdasarkan generator

text-bison-32k@002 yang di-tuning Lora

Generator 1.0

Berdasarkan generator

text-bison@001 yang di-tuning Lora

Baseline v2

Model dasar v2

text-bison

Dasar pengukuran v1

Tidak berbasis Generator

Model LongT5

Kustom 2.0

Tidak berbasis Generator

Model LongT5

Jenis kuota dalam tabel sebelumnya tercermin dalam daftar kuota berikut untuk API yang digunakan dengan ringkasan.


Jenis kuota

Nama batas kuota

Nilai default

Region

Mengisi daya perangkat/Project konsumen

Deskripsi

Berdasarkan generator

GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion

10 permintaan/menit

Regional

Project konsumen

Operasi saran generator per jenis model dan wilayah

Berdasarkan generator

GeneratorSuggestionOperationsPerMinutePerModelType

10 permintaan/menit

Global

Project konsumen

Operasi saran generator per jenis model

Berdasarkan generator

SuggestConversationSummaryOperationsPerMinutePerProject

60 permintaan/menit

Global

Project resource

Menyarankan operasi ringkasan percakapan

Tidak berbasis Generator

SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion

0-2 permintaan/mnt

Regional

Project resource

Menyarankan operasi ringkasan percakapan di setiap region

Model dasar v2

SuggestSummaryV2BaselineOperationsPerMinutePerProject

120 permintaan/menit

Global

Project resource

Permintaan polling dasar Saran Ringkasan Percakapan V2

Model dasar v2

SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion

60 permintaan/menit

Regional

Project resource

Permintaan polling dasar Saran Ringkasan Percakapan V2 di setiap region

Evaluasi otomatis perangkuman

Nama batas kuota Nilai default Region Resource pengisian daya/Project konsumen Deskripsi
ConcurrentSummarizationEvaluationsPerProject 1 permintaan per project Project konsumen Permintaan evaluasi otomatis

Jika Anda memerlukan kuota serentak tambahan, ajukan permintaan melalui konsol Google Cloud . Fitur ini dapat mendukung hingga empat kuota serentak per project.

Bantuan pengetahuan generatif

Nama batas kuota Nilai default Region Resource pengisian daya/Project konsumen Deskripsi
SearchKnowledgeRequestsPerMinutePerProject 60 permintaan/mnt Global Project konsumen Permintaan SearchKnowledge.
SearchKnowledgeRequestsPerMinutePerProjectPerRegion 30 permintaan/menit Regional Project konsumen SearchKnowledge meminta setiap wilayah.

Bantuan pengetahuan generatif proaktif V1

Nama batas kuota Nilai default Region Resource pengisian daya/Project konsumen Deskripsi
SuggestKnowledgeAssistOperationsPerMinutePerProject 60 permintaan/mnt Global Project resource Permintaan KnowledgeAssist melalui AnalyzeContent atau SuggestKnowledgeAssist.
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion 30 permintaan/menit Regional Project resource Permintaan KnowledgeAssist melalui AnalyzeContent atau SuggestKnowledgeAssist di setiap region.

Bantuan pengetahuan generatif proaktif V2

Nama batas kuota Nilai default Region Resource pengisian daya/Project konsumen Deskripsi
KnowledgeAssistOpsPerMinutePerProjectPerVersion 30 permintaan/menit Global Project resource Permintaan KnowledgeAssist untuk versi model tertentu saat permintaan diarahkan ke endpoint lokasi global.
KnowledgeAssistOpsPerMinutePerProjectPerVersionPerRegion 30 permintaan/menit Regional Project resource Permintaan KnowledgeAssist yang diarahkan ke satu Google Cloud wilayah tertentu, seperti us-central1 atau europe-west1.
KnowledgeAssistOpsPerMinutePerProjectPerVersionPerMultiRegion 30 permintaan/menit MultiRegional Project resource Permintaan KnowledgeAssist yang diarahkan ke endpoint multi-region, seperti Amerika Serikat atau Uni Eropa.

Pelatih AI (LLM)

Fitur ini menggunakan model AI agent-coaching-2.5.

Nama batas kuota Nilai default Region Project konsumen atau resource penagihan Deskripsi
GeneratorSuggestionOperationsPerMinutePerModelType 60 permintaan per menit Global Project konsumen Operasi saran generator per jenis model.
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 60 permintaan per menit Regional Project konsumen Operasi saran generator per jenis model dan region.

Kuota API lainnya

Nama batas kuota Nilai default Region Resource pengisian daya/Project konsumen Deskripsi
ConversationOperationsPerMinutePerProject 300 permintaan/mnt Global Project konsumen Permintaan percakapan lainnya, kecuali AnalyzeContent dan StreamingAnalyzeContent, misalnya CreateConversation, CompleteConversation. Kuota dibagi antara Dialogflow dan Agent Assist.
MessagePollingOperationsPerMinutePerProject 1.200 permintaan / menit Global Project konsumen Permintaan ListMessages. Kuota dibagi antara Dialogflow dan Agent Assist.
AnswerRecordOperationsPerMinutePerProject 300 permintaan / menit Global Project konsumen Permintaan AnswerRecord.

Langkah berikutnya

  • Untuk mengetahui informasi selengkapnya tentang cara meminta penambahan kuota, lihat halaman kuota.
  • Setelah mengirimkan permintaan, Google mungkin akan menghubungi Anda untuk meminta informasi tambahan dan menginformasikan kapan permintaan Anda disetujui atau ditolak.