API хэрэглэгчдэд зориулсан Priority Processing
Priority processing нь төлсөн хэмжээгээрээ төлөх уян хатан нөхцөлтэйгээр найдвартай, өндөр хурдны гүйцэтгэл санал болгодог.
Priority processing-ийг сонгосноор та дараах боломжуудыг нээж чадна:
- Тогтвортой бага хоцролт: Priority processing нь оргил ачааллын үед ч Standard processing үйлчилгээнээс илүү хурдан, илүү тогтвортой хурдаар токен үүсгэдэг.
- Ашиглахад хялбар уян хатан байдал: Standard processing-ийн адил Priority processing-ийг урьдчилан нөөцлөх шаардлагагүй, уян хатан pay-as-you-go нөхцөлөөр ашиглах боломжтой.
| 1M оролтын токен тутмын үнэ | 1 сая оролтын токен тутмын үнэ (кэшлэсэн) | 1M гаралтын токен тутмын үнэ | Ажиллагааны тасралтгүй байдлын SLA3 | Саатлын SLA3 | |
|---|---|---|---|---|---|
GPT-5.5 урт контекстийг хасна1 | $ 12.50 | $ 1.250 | $ 75.00 | 99.9% | 99% > 50 токен секундэд2 |
GPT-5.4 mini урт контекстийг хасна1 | $ 1.50 | $ 0.150 | $ 9.00 | 99.9% | 99% > 100 токен секундэд2 |
GPT-5.4 урт контекстийг хасна1 | $ 5.00 | $ 0.500 | $ 30.00 | 99.9% | 99% > 50 токен секундэд2 |
GPT-5.2 урт контекстийг хасна1 | $ 3.50 | $ 0.350 | $ 28.00 | 99.9% | 99% > 50 токен секундэд2 |
GPT-5.1 урт контекстийг хасна1 | $ 2.50 | $ 0.250 | $ 20.00 | 99.9% | 99% > 50 токен секундэд2 |
GPT-5 урт контекстийг хасна1 | $ 2.50 | $ 0.250 | $ 20.00 | 99.9% | 99% > 50 токен секундэд2 |
GPT-5 mini урт контекстийг хасна1 | $ 0.45 | $ 0.045 | $ 3.60 | 99.9% | 99% > 80 токен секундэд2 |
GPT-5.1 codex урт контекстийг хасна1 | $ 2.50 | $ 0.250 | $ 20.00 | 99.9% | 99% > 50 токен секундэд2 |
GPT-5 codex урт контекстийг хасна1 | $ 2.50 | $ 0.250 | $ 20.00 | 99.9% | 99% > 50 токен секундэд2 |
GPT-4.1 урт контекстийг хасна1 | $ 3.50 | $ 0.875 | $ 14.00 | 99.9% | 99% > 80 токен секундэд2 |
GPT-4.1 mini урт контекстийг хасна1 | $ 0.70 | $ 0.175 | $ 2.80 | 99.9% | 99% > 90 токен секундэд2 |
GPT-4.1 nano урт контекстийг хасна1 | $ 0.20 | $ 0.050 | $ 0.80 | 99.9% | 99% > 100 токен секундэд2 |
GPT-4o gpt-4o-2024-11-20 gpt-4o-2024-08-06 | $ 4.25 | $ 2.125 | $ 17.00 | 99.9% | 99% > 80 токен секундэд2 |
gpt-4o-2024-05-13 | $ 8.75 | — | $ 26.25 | 99.9% | 99% > 80 токен секундэд2 |
GPT-4o mini | $ 0.25 | $ 0.125 | $ 1.00 | 99.9% | 99% > 90 токен секундэд2 |
o3 | $ 3.50 | $ 0.875 | $ 14.00 | 99.9% | 99% > 80 токен секундэд2 |
o4-mini | $ 2.00 | $ 0.500 | $ 8.00 | 99.9% | 99% > 90 токен секундэд2 |
Хэрхэн ажилладаг вэ
Хэрэглэгчид одоо байгаа service_tier параметрийг ашиглан хүсэлт тус бүрийн түвшинд Priority processing руу урсгал чиглүүлэх боломжтой бөгөөд service_tier = “priority” сонголтыг хэрэглэнэ.
Priority processing-ээр боловсруулсан токенуудыг токен тутмаар тооцон төлбөржүүлэх бөгөөд Standard processing-ийн үнэтэй харьцуулахад өндөр үнэтэй байна.
Хүсэлтийн түвшинд тохируулахаас гадна Project settings → Default Service Tier: Priority хэсэгт төслийн анхдагч утгыг мөн Priority болгож болно. Та хүсэлт тус бүр дээр үүнийг мөн дарж өөрчилж болно.
Хязгаарлалтууд
- Priority processing-ийн rate limit-үүд бусад service tier-үүдтэй хуваалцагдана.
- Ховор тохиолдолд, таны Priority processing Tokens per Minute огцом өсөх нь ramp rate limit-д хүргэж болзошгүй. Хэрэв та ramp rate limit-ийг давбал нэмэлт урсгалын заримыг Standard processing руу илгээж магадгүй.