Siirry pääsisältöön
OpenAI

API-asiakkaiden prioriteettikäsittely

Prioriteettikäsittely tarjoaa luotettavan, nopean suorituskyvyn ja joustavuutta maksaa käytön mukaan.

Prioriteettikäsittely avaa seuraavat ominaisuudet:

  • Ennustettavasti vähäinen viive: Prioriteettikäsittely luo tokenit nopeammin ja tasaisemmalla nopeudella kuin vakiokäsittelypalvelu, jopa huippukysynnän aikana.
  • Helppokäyttöinen joustavuus: Kuten vakiokäsittelyä, myös prioriteettikäsittelyä voidaan käyttää joustavasti ja maksuperusteisesti sen sijaan, että se edellyttäisi etukäteisvalmistelua.
Hinta per 1M syötetunnistettaHinta per 1M syötetunnistetta (välimuistissa olevaa)Hinta per 1M tuotostunnistettaKäytettävyysajan palvelutasosopimus (SLA)3Viiveen palvelutasosopimus (SLA)3
GPT-5.5
ei sisällä pitkää kontekstia1
12,50 $1,250 $75,00 $99,9 %99 % > 50 tunnistetta sekunnissa2
GPT-5.4 mini
ei sisällä pitkää kontekstia1
1,50 $0,150 $9,00 $99,9 %99 % > 100 tunnistetta sekunnissa2
GPT-5.4
ei sisällä pitkää kontekstia1
5,00 $0,500 $30,00 $99,9 %99 % > 50 tunnistetta sekunnissa2
GPT-5.2
ei sisällä pitkää kontekstia1
3,50 $0,350 $28,00 $99,9 %99 % > 50 tunnistetta sekunnissa2
GPT-5.1
ei sisällä pitkää kontekstia1
2,50 $0,250 $20,00 $99,9 %99 % > 50 tunnistetta sekunnissa2
GPT-5
ei sisällä pitkää kontekstia1
2,50 $0,250 $20,00 $99,9 %99 % > 50 tunnistetta sekunnissa2
GPT-5 mini
ei sisällä pitkää kontekstia1
0,45 $0,045 $3,60 $99,9 %99 % > 80 tunnistetta sekunnissa2
GPT-5.1 codex
ei sisällä pitkää kontekstia1
2,50 $0,250 $20,00 $99,9 %99 % > 50 tunnistetta sekunnissa2
GPT-5 codex
ei sisällä pitkää kontekstia1
2,50 $0,250 $20,00 $99,9 %99 % > 50 tunnistetta sekunnissa2
GPT-4.1
ei sisällä pitkää kontekstia1
3,50 $0,875 $14,00 $99,9 %99 % > 80 tunnistetta sekunnissa2
GPT-4.1 mini
ei sisällä pitkää kontekstia1
0,70 $0,175 $2,80 $99,9 %99 % > 90 tunnistetta sekunnissa2
GPT-4.1 nano
ei sisällä pitkää kontekstia1
0,20 $0,050 $0,80 $99,9 %99 % > 100 tunnistetta sekunnissa2
GPT-4o
gpt-4o-2024-11-20
gpt-4o-2024-08-06
4,25 $2,125 $17,00 $99,9 %99 % > 80 tunnistetta sekunnissa2
gpt-4o-2024-05-13
8,75 $26,25 $99,9 %99 % > 80 tunnistetta sekunnissa2
GPT-4o mini
0,25 $0,125 $1,00 $99,9 %99 % > 90 tunnistetta sekunnissa2
o3
3,50 $0,875 $14,00 $99,9 %99 % > 80 tunnistetta sekunnissa2
o4-mini
2,00 $0,500 $8,00 $99,9 %99 % > 90 tunnistetta sekunnissa2
1Pyyntöjä arviolta yli 128k kehotemerkkiä
2Lasketaan p50-pyynnön viiveenä 5 minuutin välein. Asiakkailla, joilla on voimassa oleva yrityssopimus, jossa viiveen SLA lasketaan p50-pyynnön viiveenä minuutin välein, aiemmat SLA-määritykset ovat yhä voimassa.
3Sovellettavissa vain Enterprise-asiakkaille

Miten se toimii

Asiakkaat voivat ohjata liikennettä prioriteettikäsittelyyn pyyntökohtaisesti käyttämällä olemassa olevaa service_tier-parametria, jossa on vaihtoehtona service_tier = "priority".

Prioriteettikäsittelyn kautta toimitetut tokenit laskutetaan tokenkohtaisesti, ja niiden hinta on korkeampi kuin vakiokäsittelyn. 

Sen lisäksi, että voit määrittää sen pyyntökohtaisesti, voit myös asettaa projektin oletusasetukseksi Prioriteetin valikossa Projektin asetukset → Oletuspalvelutaso: Prioriteetti. Voit edelleen ohittaa pyyntökohtaisesti.

Rajoitukset

  • Prioriteettikäsittelyn nopeusrajat jaetaan muiden palvelutasojen kanssa. 
  • Jos prioriteettikäsittelyn tokenien määrä minuutissa kasvaa nopeasti, se voi harvinaisissa tilanteissa ylittää nousunopeuden rajoitukset. Jos ylität nousunopeuden rajan, ylimääräinen liikenne voidaan lähettää vakiokäsittelyyn.

Hinnoittelu

Mallit

Käyttörajoitukset

Luotettavuus

Käytännöt