Langsung ke konten utama
OpenAI

Pemrosesan Prioritas untuk Pelanggan API.

Pemrosesan Prioritas menawarkan kinerja yang andal dan berkecepatan tinggi dengan fleksibilitas untuk membayar sesuai pemakaian.

Dengan memilih pemrosesan Prioritas, Anda dapat membuka akses:

  • Latensi rendah yang dapat diprediksi: Pemrosesan Prioritas membuat token lebih cepat dan dengan kecepatan yang lebih konsisten dibandingkan dengan layanan pemrosesan Standar, bahkan selama permintaan puncak.
  • Fleksibilitas yang mudah digunakan: Seperti pemrosesan Standar, pemrosesan Prioritas dapat diakses secara fleksibel dengan model bayar sesuai penggunaan, tanpa memerlukan penyediaan sebelumnya.
Harga per 1JT token masukanHarga per 1JT token masukan (dengan cache)Harga per 1JT token keluaranSLA Waktu aktif3SLA Latensi3
GPT-5.5
mengecualikan konteks panjang1
US$12,50US$1,250US$75,0099,9%99% > 50 token per detik2
GPT-5.4 mini
mengecualikan konteks panjang1
US$1,50US$0,150US$9,0099,9%99% > 100 token per detik2
GPT-5.4
mengecualikan konteks panjang1
US$5,00US$0,500US$30,0099,9%99% > 50 token per detik2
GPT-5.2
mengecualikan konteks panjang1
US$3,50US$0,350US$28,0099,9%99% > 50 token per detik2
GPT-5.1
mengecualikan konteks panjang1
US$2,50US$0,250US$20,0099,9%99% > 50 token per detik2
GPT-5
mengecualikan konteks panjang1
US$2,50US$0,250US$20,0099,9%99% > 50 token per detik2
GPT-5 mini
mengecualikan konteks panjang1
US$0,45US$0,045US$3,6099,9%99% > 80 token per detik2
GPT-5.1 codex
mengecualikan konteks panjang1
US$2,50US$0,250US$20,0099,9%99% > 50 token per detik2
GPT-5 codex
mengecualikan konteks panjang1
US$2,50US$0,250US$20,0099,9%99% > 50 token per detik2
GPT-4.1
mengecualikan konteks panjang1
US$3,50US$0,875US$14,0099,9%99% > 80 token per detik2
GPT-4.1 mini
mengecualikan konteks panjang1
US$0,70US$0,175US$2,8099,9%99% > 90 token per detik2
GPT-4.1 nano
mengecualikan konteks panjang1
US$0,20US$0,050US$0,8099,9%99% > 100 token per detik2
GPT-4o
gpt-4o-2024-11-20
gpt-4o-2024-08-06
US$4,25US$2,125US$17,0099,9%99% > 80 token per detik2
gpt-4o-2024-05-13
US$8,75US$26,2599,9%99% > 80 token per detik2
GPT-4o mini
US$0,25US$0,125US$1,0099,9%99% > 90 token per detik2
o3
US$3,50US$0,875US$14,0099,9%99% > 80 token per detik2
o4-mini
US$2,00US$0,500US$8,0099,9%99% > 90 token per detik2
1Permintaan diestimasikan pada token prompt >128K
2Dihitung sebagai latensi permintaan p50 per 5 menit. Untuk pelanggan dengan perjanjian enterprise yang ada, dengan SLA latensi yang dihitung sebagai latensi permintaan p50 per menit, SLA sebelumnya juga masih berlaku.
3Ini hanya berlaku bagi pelanggan Enterprise

Cara kerjanya

Pelanggan dapat mengarahkan lalu lintas ke pemrosesan Prioritas berdasarkan setiap permintaan menggunakan parameter service_tier yang sudah ada, dengan opsi service_tier = “priority”.

Token yang diproses dengan pemrosesan Prioritas akan dikenakan biaya per token, dengan harga premium dibandingkan dengan tarif pemrosesan Standar. 

Selain dikonfigurasi pada tingkat permintaan, Anda juga dapat mengatur proyek ke Prioritas secara default di Pengaturan proyek → Jenjang Layanan Default: Prioritas. Anda masih dapat menimpa (override) per permintaan.

Keterbatasan

  • Batas laju pemrosesan prioritas dibagikan dengan tingkat layanan lainnya. 
  • Dalam kasus yang jarang terjadi, peningkatan cepat pada Token per Menit pemrosesan Prioritas Anda dapat menyebabkan tercapainya batas laju kenaikan (ramp rate limits). Jika Anda melebihi batas laju kenaikan, maka lalu lintas tambahan mungkin akan dialihkan ke pemrosesan Standar.

Harga

Model

Batas laju

Keandalan

Kebijakan