Үндсэн агуулга руу алгасах
OpenAI

API хэрэглэгчдэд зориулсан Priority Processing

Priority processing нь төлсөн хэмжээгээрээ төлөх уян хатан нөхцөлтэйгээр найдвартай, өндөр хурдны гүйцэтгэл санал болгодог.

Priority processing-ийг сонгосноор та дараах боломжуудыг нээж чадна:

  • Тогтвортой бага хоцролт: Priority processing нь оргил ачааллын үед ч Standard processing үйлчилгээнээс илүү хурдан, илүү тогтвортой хурдаар токен үүсгэдэг.
  • Ашиглахад хялбар уян хатан байдал: Standard processing-ийн адил Priority processing-ийг урьдчилан нөөцлөх шаардлагагүй, уян хатан pay-as-you-go нөхцөлөөр ашиглах боломжтой.
1M оролтын токен тутмын үнэ1 сая оролтын токен тутмын үнэ (кэшлэсэн)1M гаралтын токен тутмын үнэАжиллагааны тасралтгүй байдлын SLA3Саатлын SLA3
GPT-5.5
урт контекстийг хасна1
$ 12.50$ 1.250$ 75.0099.9%99% > 50 токен секундэд2
GPT-5.4 mini
урт контекстийг хасна1
$ 1.50$ 0.150$ 9.0099.9%99% > 100 токен секундэд2
GPT-5.4
урт контекстийг хасна1
$ 5.00$ 0.500$ 30.0099.9%99% > 50 токен секундэд2
GPT-5.2
урт контекстийг хасна1
$ 3.50$ 0.350$ 28.0099.9%99% > 50 токен секундэд2
GPT-5.1
урт контекстийг хасна1
$ 2.50$ 0.250$ 20.0099.9%99% > 50 токен секундэд2
GPT-5
урт контекстийг хасна1
$ 2.50$ 0.250$ 20.0099.9%99% > 50 токен секундэд2
GPT-5 mini
урт контекстийг хасна1
$ 0.45$ 0.045$ 3.6099.9%99% > 80 токен секундэд2
GPT-5.1 codex
урт контекстийг хасна1
$ 2.50$ 0.250$ 20.0099.9%99% > 50 токен секундэд2
GPT-5 codex
урт контекстийг хасна1
$ 2.50$ 0.250$ 20.0099.9%99% > 50 токен секундэд2
GPT-4.1
урт контекстийг хасна1
$ 3.50$ 0.875$ 14.0099.9%99% > 80 токен секундэд2
GPT-4.1 mini
урт контекстийг хасна1
$ 0.70$ 0.175$ 2.8099.9%99% > 90 токен секундэд2
GPT-4.1 nano
урт контекстийг хасна1
$ 0.20$ 0.050$ 0.8099.9%99% > 100 токен секундэд2
GPT-4o
gpt-4o-2024-11-20
gpt-4o-2024-08-06
$ 4.25$ 2.125$ 17.0099.9%99% > 80 токен секундэд2
gpt-4o-2024-05-13
$ 8.75$ 26.2599.9%99% > 80 токен секундэд2
GPT-4o mini
$ 0.25$ 0.125$ 1.0099.9%99% > 90 токен секундэд2
o3
$ 3.50$ 0.875$ 14.0099.9%99% > 80 токен секундэд2
o4-mini
$ 2.00$ 0.500$ 8.0099.9%99% > 90 токен секундэд2
1128K-аас дээш өгөгдлийн токен гэж тооцоолсон хүсэлтүүд
25 минут тутамд p50 хүсэлтийн саатлаар тооцно. p50 хүсэлтийн саатлаар минут тутамд тооцдог саатлын SLA-ууд бүхий одоо байгаа байгууллагын гэрээтэй хэрэглэгчдийн хувьд өмнөх SLA-ууд мөн хүчинтэй хэвээр байна.
3Энэ нь зөвхөн аж ахуйн нэгжийн хэрэглэгчдэд хамаарна

Хэрхэн ажилладаг вэ

Хэрэглэгчид одоо байгаа service_tier параметрийг ашиглан хүсэлт тус бүрийн түвшинд Priority processing руу урсгал чиглүүлэх боломжтой бөгөөд service_tier = “priority” сонголтыг хэрэглэнэ.

Priority processing-ээр боловсруулсан токенуудыг токен тутмаар тооцон төлбөржүүлэх бөгөөд Standard processing-ийн үнэтэй харьцуулахад өндөр үнэтэй байна. 

Хүсэлтийн түвшинд тохируулахаас гадна Project settings → Default Service Tier: Priority хэсэгт төслийн анхдагч утгыг мөн Priority болгож болно. Та хүсэлт тус бүр дээр үүнийг мөн дарж өөрчилж болно.

Хязгаарлалтууд

  • Priority processing-ийн rate limit-үүд бусад service tier-үүдтэй хуваалцагдана. 
  • Ховор тохиолдолд, таны Priority processing Tokens per Minute огцом өсөх нь ramp rate limit-д хүргэж болзошгүй. Хэрэв та ramp rate limit-ийг давбал нэмэлт урсгалын заримыг Standard processing руу илгээж магадгүй.

Үнэ

Загварууд

Rate limit-үүд

Найдвартай байдал

Бодлогууд