API कस्टमर्स के लिए प्रायोरिटी प्रोसेसिंग
प्रायोरिटी प्रोसेसिंग, पे-एज़-यू-गो की सुविधा के साथ भरोसेमंद, हाई-स्पीड वाली परफ़ॉर्मेंस देता है.
प्रायोरिटी प्रोसेसिंग चुनकर, तुम अनलॉक कर सकते हो:
- पूर्वानुमेय कम विलंबता: प्रायोरिटी प्रोसेसिंग टोकन्स को तेज़ी से और स्टैंडर्ड प्रोसेसिंग सर्विस की तुलना में अधिक लगातार स्पीड पर जनरेट करता है, यहाँ तक कि पीक डिमांड के दौरान भी.
- आसान-से-इस्तेमाल लचीलेपन: स्टैंडर्ड प्रोसेसिंग की तरह, प्रायोरिटी प्रोसेसिंग को एडवांस प्रोविजनिंग की आवश्यकता के बजाय फ्लेक्सिबल, पे-एज़-यू-गो बेसिस पर एक्सेस किया जा सकता है.
| प्रति 1M इनपुट टोकन की क़ीमत | प्रति 1M इनपुट टोकन की क़ीमत (कैश्ड) | प्रति 1M आउटपुट टोकन्स की क़ीमत | अपटाइम SLA3 | लेटेंसी SLA3 | |
|---|---|---|---|---|---|
GPT-5.5 लंबे कॉन्टेक्स्ट1 को बाहर कर देता है | $12.50 | $1.250 | $75.00 | 99.9% | 99% > 50 टोकन प्रति सेकंड2 |
GPT-5.4 mini लंबे कॉन्टेक्स्ट1 को बाहर कर देता है | $1.50 | $0.150 | $9.00 | 99.9% | 99% > 100 टोकन प्रति सेकंड2 |
GPT-5.4 लंबे कॉन्टेक्स्ट1 को बाहर कर देता है | $5.00 | $0.500 | $30.00 | 99.9% | 99% > 50 टोकन प्रति सेकंड2 |
GPT-5.2 लंबे कॉन्टेक्स्ट1 को बाहर कर देता है | $3.50 | $0.350 | $28.00 | 99.9% | 99% > 50 टोकन प्रति सेकंड2 |
GPT-5.1 लंबे कॉन्टेक्स्ट1 को बाहर कर देता है | $2.50 | $0.250 | $20.00 | 99.9% | 99% > 50 टोकन प्रति सेकंड2 |
GPT-5 लंबे कॉन्टेक्स्ट1 को बाहर कर देता है | $2.50 | $0.250 | $20.00 | 99.9% | 99% > 50 टोकन प्रति सेकंड2 |
GPT-5 mini लंबे कॉन्टेक्स्ट1 को बाहर कर देता है | $0.45 | $0.045 | $3.60 | 99.9% | 99% > 80 टोकन प्रति सेकंड2 |
GPT-5.1 codex लंबे कॉन्टेक्स्ट1 को बाहर कर देता है | $2.50 | $0.250 | $20.00 | 99.9% | 99% > 50 टोकन प्रति सेकंड2 |
GPT-5 codex लंबे कॉन्टेक्स्ट1 को बाहर कर देता है | $2.50 | $0.250 | $20.00 | 99.9% | 99% > 50 टोकन प्रति सेकंड2 |
GPT-4.1 लंबे कॉन्टेक्स्ट1 को बाहर कर देता है | $3.50 | $0.875 | $14.00 | 99.9% | 99% > 80 टोकन प्रति सेकंड2 |
GPT-4.1 mini लंबे कॉन्टेक्स्ट1 को बाहर कर देता है | $0.70 | $0.175 | $2.80 | 99.9% | 99% > 90 टोकन प्रति सेकंड2 |
GPT-4.1 nano लंबे कॉन्टेक्स्ट1 को बाहर कर देता है | $0.20 | $0.050 | $0.80 | 99.9% | 99% > 100 टोकन प्रति सेकंड2 |
GPT-4o gpt-4o-2024-11-20 gpt-4o-2024-08-06 | $4.25 | $2.125 | $17.00 | 99.9% | 99% > 80 टोकन प्रति सेकंड2 |
gpt-4o-2024-05-13 | $8.75 | — | $26.25 | 99.9% | 99% > 80 टोकन प्रति सेकंड2 |
GPT-4o mini | $0.25 | $0.125 | $1.00 | 99.9% | 99% > 90 टोकन प्रति सेकंड2 |
o3 | $3.50 | $0.875 | $14.00 | 99.9% | 99% > 80 टोकन प्रति सेकंड2 |
o4-mini | $2.00 | $0.500 | $8.00 | 99.9% | 99% > 90 टोकन प्रति सेकंड2 |
ये कैसे काम करता है
ग्राहक मौजूदा service_tier पैरामीटर का उपयोग करके, service_tier = “priority”विकल्प के साथ, प्रति अनुरोध के आधार पर ट्रैफ़िक को प्राथमिकता प्रोसेसिंग के लिए निर्देशित कर सकते हैं.
प्रायोरिटी प्रोसेसिंग द्वारा सर्व किए गए टोकन्स को प्रति-टोकन आधार पर बिल किया जाएगा, जो स्टैंडर्ड प्रोसेसिंग रेट्स की तुलना में प्रीमियम मूल्य पर है.
अनुरोध स्तर पर कॉन्फ़िगर किए जाने के अलावा, आप प्रोजेक्ट सेटिंग्स → डिफ़ॉल्ट सेवा स्तर: प्रायोरिटी में प्रोजेक्ट को भी डिफ़ॉल्ट कर सकते हैं. तुम अब भी हर अनुरोध पर ओवरराइड कर सकते हो.
सीमाऍं
- प्राथमिकता प्रोसेसिंग की दर सीमाएँ अन्य सेवा स्तरों के साथ साझा की जाती हैं.
- कुछ दुर्लभ मामलों में, आपकी प्रायोरिटी प्रोसेसिंग टोकन प्रति मिनट में तेजी से वृद्धि के कारण रैंप रेट सीमाएं पार हो सकती हैं. यदि आप रैंप रेट सीमा को पार कर जाते हैं, तो अतिरिक्त ट्रैफ़िक को स्टैंडर्ड प्रोसेसिंग में भेजा जा सकता है.