Overslaan naar hoofdinhoud
OpenAI

Prioriteitsverwerking voor API-klanten

Prioriteitsverwerking biedt betrouwbare, snelle prestaties met de flexibiliteit om te betalen wanneer je het nodig hebt.

Door te kiezen voor prioriteitsverwerking, kun je het volgende ontgrendelen:

  • Voorspelbaar lage latentie: Prioriteitsverwerking genereert tokens sneller en met een consistentere snelheid dan de standaardverwerkingsservice, zelfs tijdens piekuren.
  • Gebruiksvriendelijke flexibiliteit: Net als bij standaardverwerking kan prioriteitsverwerking op een flexibele, pay-as-you-go-basis worden benaderd zonder dat het vooraf moet worden ingesteld.
Prijs per miljoen invoertokensPrijs per miljoen invoertokens (uit de cache)Prijs per miljoen uitvoertokensBeschikbaarheid SLA3Latentie SLA3
GPT-5.5
sluit lange context uit1
US$ 12,50US$ 1,250US$ 75,0099,9%In 99% van de gevallen meer dan 50 tokens per seconde2
GPT-5.4 mini
sluit lange context uit1
US$ 1,50US$ 0,150US$ 9,0099,9%In 99% van de gevallen meer dan 100 tokens per seconde2
GPT-5.4
sluit lange context uit1
US$ 5,00US$ 0,500US$ 30,0099,9%In 99% van de gevallen meer dan 50 tokens per seconde2
GPT-5.2
sluit lange context uit1
US$ 3,50US$ 0,350US$ 28,0099,9%In 99% van de gevallen meer dan 50 tokens per seconde2
GPT-5.1
sluit lange context uit1
US$ 2,50US$ 0,250US$ 20,0099,9%In 99% van de gevallen meer dan 50 tokens per seconde2
GPT-5
sluit lange context uit1
US$ 2,50US$ 0,250US$ 20,0099,9%In 99% van de gevallen meer dan 50 tokens per seconde2
GPT-5 mini
sluit lange context uit1
US$ 0,45US$ 0,045US$ 3,6099,9%In 99% van de gevallen meer dan 80 tokens per seconde2
GPT-5.1 codex
sluit lange context uit1
US$ 2,50US$ 0,250US$ 20,0099,9%In 99% van de gevallen meer dan 50 tokens per seconde2
GPT-5 codex
sluit lange context uit1
US$ 2,50US$ 0,250US$ 20,0099,9%In 99% van de gevallen meer dan 50 tokens per seconde2
GPT-4.1
sluit lange context uit1
US$ 3,50US$ 0,875US$ 14,0099,9%In 99% van de gevallen meer dan 80 tokens per seconde2
GPT-4.1 mini
sluit lange context uit1
US$ 0,70US$ 0,175US$ 2,8099,9%In 99% van de gevallen meer dan 90 tokens per seconde2
GPT-4.1 nano
sluit lange context uit1
US$ 0,20US$ 0,050US$ 0,8099,9%In 99% van de gevallen meer dan 100 tokens per seconde2
GPT-4o
gpt-4o-2024-11-20
gpt-4o-2024-08-06
US$ 4,25US$ 2,125US$ 17,0099,9%In 99% van de gevallen meer dan 80 tokens per seconde2
gpt-4o-2024-05-13
US$ 8,75US$ 26,2599,9%In 99% van de gevallen meer dan 80 tokens per seconde2
GPT-4o mini
US$ 0,25US$ 0,125US$ 1,0099,9%In 99% van de gevallen meer dan 90 tokens per seconde2
o3
US$ 3,50US$ 0,875US$ 14,0099,9%In 99% van de gevallen meer dan 80 tokens per seconde2
o4-mini
US$ 2,00US$ 0,500US$ 8,0099,9%In 99% van de gevallen meer dan 90 tokens per seconde2
1Verzoeken waarbij het geschatte aantal prompttokens meer dan 128.000 is
2Wordt berekend als p50-latentie (responstijd) in blokken van vijf minuten. Ben je al klant met een bestaand Enterprise-contract waarin de SLA voor de p50-latentie per minuut wordt berekend? Dan blijft die SLA ook gewoon gelden.
3Dit is alleen van toepassing op Enterprise-klanten

Hoe het werkt

Klanten kunnen per verzoek verkeer naar prioriteitsverwerking leiden met behulp van de bestaande parameter service_tier, met de optie service_tier = "priority".

Tokens die door prioriteitsverwerking worden afgehandeld, worden per token gefactureerd en zijn relatief hoger geprijsd dan de standaard verwerkingstarieven. 

Naast dat je het op verzoekniveau kunt instellen, kun je ook een project standaard instellen op prioriteitsverwerking in de projectinstellingen → Standaard serviceniveau: Prioriteit. Je kunt nog steeds per verzoek overschrijven.

Beperkingen

  • Prioriteitsverwerkingslimieten worden gedeeld met andere serviceniveaus. 
  • In zeldzame gevallen kunnen snelle stijgingen van het aantal tokens per minuut met prioriteitsverwerking ertoe leiden dat je de gefaseerde volumelimieten bereikt. Als je de gefaseerde volumelimieten overschrijdt, kan extra verkeer in plaats daarvan naar standaardverwerking worden gestuurd.

Prijzen

Modellen

Volumelimieten

Betrouwbaarheid

Beleidsregels