API-asiakkaiden prioriteettikäsittely
Prioriteettikäsittely tarjoaa luotettavan, nopean suorituskyvyn ja joustavuutta maksaa käytön mukaan.
Prioriteettikäsittely avaa seuraavat ominaisuudet:
- Ennustettavasti vähäinen viive: Prioriteettikäsittely luo tokenit nopeammin ja tasaisemmalla nopeudella kuin vakiokäsittelypalvelu, jopa huippukysynnän aikana.
- Helppokäyttöinen joustavuus: Kuten vakiokäsittelyä, myös prioriteettikäsittelyä voidaan käyttää joustavasti ja maksuperusteisesti sen sijaan, että se edellyttäisi etukäteisvalmistelua.
| Hinta per 1M syötetunnistetta | Hinta per 1M syötetunnistetta (välimuistissa olevaa) | Hinta per 1M tuotostunnistetta | Käytettävyysajan palvelutasosopimus (SLA)3 | Viiveen palvelutasosopimus (SLA)3 | |
|---|---|---|---|---|---|
GPT-5.5 ei sisällä pitkää kontekstia1 | 12,50 $ | 1,250 $ | 75,00 $ | 99,9 % | 99 % > 50 tunnistetta sekunnissa2 |
GPT-5.4 mini ei sisällä pitkää kontekstia1 | 1,50 $ | 0,150 $ | 9,00 $ | 99,9 % | 99 % > 100 tunnistetta sekunnissa2 |
GPT-5.4 ei sisällä pitkää kontekstia1 | 5,00 $ | 0,500 $ | 30,00 $ | 99,9 % | 99 % > 50 tunnistetta sekunnissa2 |
GPT-5.2 ei sisällä pitkää kontekstia1 | 3,50 $ | 0,350 $ | 28,00 $ | 99,9 % | 99 % > 50 tunnistetta sekunnissa2 |
GPT-5.1 ei sisällä pitkää kontekstia1 | 2,50 $ | 0,250 $ | 20,00 $ | 99,9 % | 99 % > 50 tunnistetta sekunnissa2 |
GPT-5 ei sisällä pitkää kontekstia1 | 2,50 $ | 0,250 $ | 20,00 $ | 99,9 % | 99 % > 50 tunnistetta sekunnissa2 |
GPT-5 mini ei sisällä pitkää kontekstia1 | 0,45 $ | 0,045 $ | 3,60 $ | 99,9 % | 99 % > 80 tunnistetta sekunnissa2 |
GPT-5.1 codex ei sisällä pitkää kontekstia1 | 2,50 $ | 0,250 $ | 20,00 $ | 99,9 % | 99 % > 50 tunnistetta sekunnissa2 |
GPT-5 codex ei sisällä pitkää kontekstia1 | 2,50 $ | 0,250 $ | 20,00 $ | 99,9 % | 99 % > 50 tunnistetta sekunnissa2 |
GPT-4.1 ei sisällä pitkää kontekstia1 | 3,50 $ | 0,875 $ | 14,00 $ | 99,9 % | 99 % > 80 tunnistetta sekunnissa2 |
GPT-4.1 mini ei sisällä pitkää kontekstia1 | 0,70 $ | 0,175 $ | 2,80 $ | 99,9 % | 99 % > 90 tunnistetta sekunnissa2 |
GPT-4.1 nano ei sisällä pitkää kontekstia1 | 0,20 $ | 0,050 $ | 0,80 $ | 99,9 % | 99 % > 100 tunnistetta sekunnissa2 |
GPT-4o gpt-4o-2024-11-20 gpt-4o-2024-08-06 | 4,25 $ | 2,125 $ | 17,00 $ | 99,9 % | 99 % > 80 tunnistetta sekunnissa2 |
gpt-4o-2024-05-13 | 8,75 $ | — | 26,25 $ | 99,9 % | 99 % > 80 tunnistetta sekunnissa2 |
GPT-4o mini | 0,25 $ | 0,125 $ | 1,00 $ | 99,9 % | 99 % > 90 tunnistetta sekunnissa2 |
o3 | 3,50 $ | 0,875 $ | 14,00 $ | 99,9 % | 99 % > 80 tunnistetta sekunnissa2 |
o4-mini | 2,00 $ | 0,500 $ | 8,00 $ | 99,9 % | 99 % > 90 tunnistetta sekunnissa2 |
Miten se toimii
Asiakkaat voivat ohjata liikennettä prioriteettikäsittelyyn pyyntökohtaisesti käyttämällä olemassa olevaa service_tier-parametria, jossa on vaihtoehtona service_tier = "priority".
Prioriteettikäsittelyn kautta toimitetut tokenit laskutetaan tokenkohtaisesti, ja niiden hinta on korkeampi kuin vakiokäsittelyn.
Sen lisäksi, että voit määrittää sen pyyntökohtaisesti, voit myös asettaa projektin oletusasetukseksi Prioriteetin valikossa Projektin asetukset → Oletuspalvelutaso: Prioriteetti. Voit edelleen ohittaa pyyntökohtaisesti.
Rajoitukset
- Prioriteettikäsittelyn nopeusrajat jaetaan muiden palvelutasojen kanssa.
- Jos prioriteettikäsittelyn tokenien määrä minuutissa kasvaa nopeasti, se voi harvinaisissa tilanteissa ylittää nousunopeuden rajoitukset. Jos ylität nousunopeuden rajan, ylimääräinen liikenne voidaan lähettää vakiokäsittelyyn.