Priority Processing API მომხმარებლებისთვის
Priority processing გთავაზობთ საიმედო, მაღალსიჩქარიან მუშაობას pay-as-you-go მოქნილობით.
Priority processing-ის არჩევით მიიღებთ:
- სტაბილურად დაბალი შეყოვნება: Priority processing token-ებს ქმნის უფრო სწრაფად და უფრო თანმიმდევრული სიჩქარით, ვიდრე Standard processing სერვისი, პიკური დატვირთვის დროსაც კი.
- მარტივად გამოსაყენებელი მოქნილობა: Standard processing-ის მსგავსად, Priority processing-ზე წვდომა შესაძლებელია მოქნილი, pay-as-you-go მოდელით წინასწარი რესურსების გამოყოფის მოთხოვნის გარეშე.
| ფასი 1M შემავალი ტოკენისთვის | ფასი 1M შეყვანის ტოკენზე (cached) | ფასი 1M გამომავალი ტოკენებისთვის | SLA-ს უწყვეტი მუშაობის გარანტია3 | დაყოვნების SLA3 | |
|---|---|---|---|---|---|
GPT-5.5 გამორიცხავს ხანგრძლივ კონტექსტს1 | 12,50 US$ | 1,250 US$ | 75,00 US$ | 99,9% | 99% > 50 ტოკენი წამში2 |
GPT-5.4 mini გამორიცხავს ხანგრძლივ კონტექსტს1 | 1,50 US$ | 0,150 US$ | 9,00 US$ | 99,9% | 99% > 100 ტოკენი წამში2 |
GPT-5.4 გამორიცხავს ხანგრძლივ კონტექსტს1 | 5,00 US$ | 0,500 US$ | 30,00 US$ | 99,9% | 99% > 50 ტოკენი წამში2 |
GPT-5.2 გამორიცხავს ხანგრძლივ კონტექსტს1 | 3,50 US$ | 0,350 US$ | 28,00 US$ | 99,9% | 99% > 50 ტოკენი წამში2 |
GPT-5.1 გამორიცხავს ხანგრძლივ კონტექსტს1 | 2,50 US$ | 0,250 US$ | 20,00 US$ | 99,9% | 99% > 50 ტოკენი წამში2 |
GPT-5 გამორიცხავს ხანგრძლივ კონტექსტს1 | 2,50 US$ | 0,250 US$ | 20,00 US$ | 99,9% | 99% > 50 ტოკენი წამში2 |
GPT-5 mini გამორიცხავს ხანგრძლივ კონტექსტს1 | 0,45 US$ | 0,045 US$ | 3,60 US$ | 99,9% | 99% > 80 ტოკენი წამში2 |
GPT-5.1 codex გამორიცხავს ხანგრძლივ კონტექსტს1 | 2,50 US$ | 0,250 US$ | 20,00 US$ | 99,9% | 99% > 50 ტოკენი წამში2 |
GPT-5 codex გამორიცხავს ხანგრძლივ კონტექსტს1 | 2,50 US$ | 0,250 US$ | 20,00 US$ | 99,9% | 99% > 50 ტოკენი წამში2 |
GPT-4.1 გამორიცხავს ხანგრძლივ კონტექსტს1 | 3,50 US$ | 0,875 US$ | 14,00 US$ | 99,9% | 99% > 80 ტოკენი წამში2 |
GPT-4.1 mini გამორიცხავს ხანგრძლივ კონტექსტს1 | 0,70 US$ | 0,175 US$ | 2,80 US$ | 99,9% | 99% > 90 ტოკენი წამში2 |
GPT-4.1 nano გამორიცხავს ხანგრძლივ კონტექსტს1 | 0,20 US$ | 0,050 US$ | 0,80 US$ | 99,9% | 99% > 100 ტოკენი წამში2 |
GPT-4o gpt-4o-2024-11-20 gpt-4o-2024-08-06 | 4,25 US$ | 2,125 US$ | 17,00 US$ | 99,9% | 99% > 80 ტოკენი წამში2 |
gpt-4o-2024-05-13 | 8,75 US$ | — | 26,25 US$ | 99,9% | 99% > 80 ტოკენი წამში2 |
GPT-4o mini | 0,25 US$ | 0,125 US$ | 1,00 US$ | 99,9% | 99% > 90 ტოკენი წამში2 |
o3 | 3,50 US$ | 0,875 US$ | 14,00 US$ | 99,9% | 99% > 80 ტოკენი წამში2 |
o4-mini | 2,00 US$ | 0,500 US$ | 8,00 US$ | 99,9% | 99% > 90 ტოკენი წამში2 |
როგორ მუშაობს
მომხმარებლებს შეუძლიათ ტრაფიკი მიმართონ Priority processing-ზე თითოეული მოთხოვნის საფუძველზე არსებული service_tier პარამეტრის გამოყენებით, ოფციით service_tier = “priority”.
Priority processing-ით დამუშავებული token-ები დაიბილინგება თითო token-ზე, Standard processing-ის ტარიფებთან შედარებით უფრო მაღალი ფასით.
მოთხოვნის დონეზე კონფიგურაციის გარდა, ასევე შეგიძლიათ პროექტისთვის ნაგულისხმევად დააყენოთ Priority: Project settings → Default Service Tier: Priority. თითო მოთხოვნაზე გადაფარვა მაინც შესაძლებელი იქნება.
შეზღუდვები
- Priority processing-ის rate limit-ები გაზიარებულია სხვა service tier-ებთან.
- იშვიათ შემთხვევებში, თქვენი Priority processing Tokens per Minute-ის სწრაფმა ზრდამ შეიძლება ramp rate limit-ებს მიაღწიოს. თუ ramp rate limit-ს გადააჭარბებთ, დამატებითი ტრაფიკის ნაწილი შესაძლოა სანაცვლოდ Standard processing-ზე გაიგზავნოს.