გადადით მთავარ შინაარსზე
OpenAI

Priority Processing API მომხმარებლებისთვის

Priority processing გთავაზობთ საიმედო, მაღალსიჩქარიან მუშაობას pay-as-you-go მოქნილობით.

Priority processing-ის არჩევით მიიღებთ:

  • სტაბილურად დაბალი შეყოვნება: Priority processing token-ებს ქმნის უფრო სწრაფად და უფრო თანმიმდევრული სიჩქარით, ვიდრე Standard processing სერვისი, პიკური დატვირთვის დროსაც კი.
  • მარტივად გამოსაყენებელი მოქნილობა: Standard processing-ის მსგავსად, Priority processing-ზე წვდომა შესაძლებელია მოქნილი, pay-as-you-go მოდელით წინასწარი რესურსების გამოყოფის მოთხოვნის გარეშე.
ფასი 1M შემავალი ტოკენისთვისფასი 1M შეყვანის ტოკენზე (cached)ფასი 1M გამომავალი ტოკენებისთვისSLA-ს უწყვეტი მუშაობის გარანტია3დაყოვნების SLA3
GPT-5.5
გამორიცხავს ხანგრძლივ კონტექსტს1
12,50 US$1,250 US$75,00 US$99,9%99% > 50 ტოკენი წამში2
GPT-5.4 mini
გამორიცხავს ხანგრძლივ კონტექსტს1
1,50 US$0,150 US$9,00 US$99,9%99% > 100 ტოკენი წამში2
GPT-5.4
გამორიცხავს ხანგრძლივ კონტექსტს1
5,00 US$0,500 US$30,00 US$99,9%99% > 50 ტოკენი წამში2
GPT-5.2
გამორიცხავს ხანგრძლივ კონტექსტს1
3,50 US$0,350 US$28,00 US$99,9%99% > 50 ტოკენი წამში2
GPT-5.1
გამორიცხავს ხანგრძლივ კონტექსტს1
2,50 US$0,250 US$20,00 US$99,9%99% > 50 ტოკენი წამში2
GPT-5
გამორიცხავს ხანგრძლივ კონტექსტს1
2,50 US$0,250 US$20,00 US$99,9%99% > 50 ტოკენი წამში2
GPT-5 mini
გამორიცხავს ხანგრძლივ კონტექსტს1
0,45 US$0,045 US$3,60 US$99,9%99% > 80 ტოკენი წამში2
GPT-5.1 codex
გამორიცხავს ხანგრძლივ კონტექსტს1
2,50 US$0,250 US$20,00 US$99,9%99% > 50 ტოკენი წამში2
GPT-5 codex
გამორიცხავს ხანგრძლივ კონტექსტს1
2,50 US$0,250 US$20,00 US$99,9%99% > 50 ტოკენი წამში2
GPT-4.1
გამორიცხავს ხანგრძლივ კონტექსტს1
3,50 US$0,875 US$14,00 US$99,9%99% > 80 ტოკენი წამში2
GPT-4.1 mini
გამორიცხავს ხანგრძლივ კონტექსტს1
0,70 US$0,175 US$2,80 US$99,9%99% > 90 ტოკენი წამში2
GPT-4.1 nano
გამორიცხავს ხანგრძლივ კონტექსტს1
0,20 US$0,050 US$0,80 US$99,9%99% > 100 ტოკენი წამში2
GPT-4o
gpt-4o-2024-11-20
gpt-4o-2024-08-06
4,25 US$2,125 US$17,00 US$99,9%99% > 80 ტოკენი წამში2
gpt-4o-2024-05-13
8,75 US$26,25 US$99,9%99% > 80 ტოკენი წამში2
GPT-4o mini
0,25 US$0,125 US$1,00 US$99,9%99% > 90 ტოკენი წამში2
o3
3,50 US$0,875 US$14,00 US$99,9%99% > 80 ტოკენი წამში2
o4-mini
2,00 US$0,500 US$8,00 US$99,9%99% > 90 ტოკენი წამში2
1მოთხოვნები, რომლებიც ფასდება როგორც >128K ტოკენი
2გამოითვლება p50 მოთხოვნის დაყოვნების მიხედვით ყოველ 5 წუთზე. იმ მომხმარებლებისთვის, რომლებსაც აქვთ მოქმედი კორპორაციული ხელშეკრულებები და რომელთა დაყოვნების SLA-ები გამოითვლება როგორც p50 მოთხოვნის დაყოვნება წუთობრივ ჭრილში, წინა SLA-ები კვლავ ძალაში რჩება.
3ეს ვრცელდება მხოლოდ კორპორაციულ მომხმარებლებზე

როგორ მუშაობს

მომხმარებლებს შეუძლიათ ტრაფიკი მიმართონ Priority processing-ზე თითოეული მოთხოვნის საფუძველზე არსებული service_tier პარამეტრის გამოყენებით, ოფციით service_tier = “priority”.

Priority processing-ით დამუშავებული token-ები დაიბილინგება თითო token-ზე, Standard processing-ის ტარიფებთან შედარებით უფრო მაღალი ფასით. 

მოთხოვნის დონეზე კონფიგურაციის გარდა, ასევე შეგიძლიათ პროექტისთვის ნაგულისხმევად დააყენოთ Priority: Project settings → Default Service Tier: Priority. თითო მოთხოვნაზე გადაფარვა მაინც შესაძლებელი იქნება.

შეზღუდვები

  • Priority processing-ის rate limit-ები გაზიარებულია სხვა service tier-ებთან. 
  • იშვიათ შემთხვევებში, თქვენი Priority processing Tokens per Minute-ის სწრაფმა ზრდამ შეიძლება ramp rate limit-ებს მიაღწიოს. თუ ramp rate limit-ს გადააჭარბებთ, დამატებითი ტრაფიკის ნაწილი შესაძლოა სანაცვლოდ Standard processing-ზე გაიგზავნოს.

ფასები

მოდელები

rate limit-ები

საიმედოობა

პოლიტიკები