Skaleringsnivå for API-kunder
Dette tilbudet er tilgjengelig for Enterprise-kunder. kontakt salgsteamet vårt for å finne ut mer. Hvis du vil ha tilgang til de samme fordelene med førsteklasses ventetid og pålitelighet på en fleksibel betal-etter-bruk-basis, kan du se Prioritert behandling.
Skaleringsnivå lar deg kjøpe et angitt antall API-inndata- og utdata-token per minutt (kalt «tokenenheter») på forhånd for tilgang til ett bestemt modell-snapshot. Hver token kjøpes for minimum 30 dager. Ytterligere modell kan legges til basert på kundeinteresse.
Ved å velge Skaleringsnivå kan du låse opp:
- Forutsigbar forsinkelse: Skaleringsnivået er utformet for å generere tokens raskere og med mer konsistent hastighet enn betaling-etter-bruk-tjenesten (PAYG), selv under høy etterspørsel.
- Ubegrenset skalering: Alle kvotekjøp med Skaleringsnivå blir automatisk lagt til bruksgrensene dine, så du kan trygt skalere videre.
- Høyere pålitelighet: Skaleringsnivå-trafikk tilbyr en SLA for 99,9 % oppetid og prioritert databehandling.
| Inndata-pakke | Utdata-pakke | Tjenesteavtale – oppetid | Tjenesteavtale – forsinkelse | |
|---|---|---|---|---|
| GPT-5.5 | 50 000 TPM 750,00 USD per enhet/dag | Ikke aktuelt3 | 99,9 % | 99 % > 100 tokener per sekund2 |
| GPT-5.4 mini | 50 000 TPM 100,00 USD per enhet/dag | Ikke aktuelt3 | 99,9 % | 99 % > 100 tokener per sekund2 |
GPT-5.4 uten lang kontekst4 | 50 000 TPM 300,00 USD per enhet/dag | Ikke aktuelt3 | 99,9 % | 99 % > 50 tokener per sekund2 |
| GPT-5.2 | 25 000 TPM 105,00 USD per enhet/dag | 2 500 TPM 84,00 USD per enhet/dag | 99,9 % | 99 % > 50 tokener per sekund2 |
| GPT-5.1 | 25 000 TPM 75,00 USD per enhet/dag | 2 500 TPM 60,00 USD per enhet/dag | 99,9 % | 99 % > 50 tokener per sekund2 |
| GPT-5 | 25 000 TPM 75,00 USD per enhet/dag | 2 500 TPM 60,00 USD per enhet/dag | 99,9 % | 99 % > 50 tokener per sekund2 |
| GPT-5 mini | 500 000 TPM 275,00 USD per enhet/dag | 50 000 TPM 220,00 USD per enhet/dag | 99,9 % | 99 % > 80 tokener per sekund2 |
GPT-4.1 uten long-context 1 | 30 000 TPM 110,00 USD per enhet/dag | 2 500 TPM 36,00 USD per enhet/dag | 99,9 % | 99 % > 80 tokener per sekund2 |
GPT-4.1 mini uten long-context 1 | 500 000 TPM 450,00 USD per enhet/dag | 50 000 TPM 175,00 USD per enhet/dag | 99,9 % | 99 % > 90 tokener per sekund2 |
GPT-4.1 nano uten long-context 1 | 500 000 TPM 110,00 USD per enhet/dag | 50 000 TPM 40,00 USD per enhet/dag | 99,9 % | 99 % > 100 tokener per sekund2 |
| GPT-4.1 fine tuning | 30 000 TPM 165,00 USD per enhet/dag | 2 500 TPM 36,00 USD per enhet/dag | 99,9 % | 99 % > 80 tokener per sekund2 |
| GPT-4.1 mini fine tuning | 500 000 TPM 900,00 USD per enhet/dag | 50 000 TPM 175,00 USD per enhet/dag | 99,9 % | 99 % > 90 tokener per sekund2 |
| o3 | 25 000 TPM 75,00 USD per enhet/dag | 5 000 TPM 60,00 USD per enhet/dag | 99,9 % | 99 % > 80 tokener per sekund2 |
| o4-mini | 30 000 TPM 50,00 USD per enhet/dag | 5 000 TPM 32,50 USD per enhet/dag | 99,9 % | 99 % > 90 tokener per sekund2 |
| GPT-4o | 30 000 TPM 124,59 USD per enhet/dag | 2 500 TPM 39,34 USD per enhet/dag | 99,9 % | 99 % > 80 tokener per sekund2 |
| GPT-4o mini | 500 000 TPM 114,75 USD per enhet/dag | 50 000 TPM 49,18 USD per enhet/dag | 99,9 % | 99 % > 90 tokener per sekund2 |
| GPT-4o mini fine tuning | 500 000 TPM 229,50 USD per enhet/dag | 50 000 TPM 98,36 USD per enhet/dag | 99,9 % | 99 % > 90 tokener per sekund2 |
| o1 | 5 000 TPM 163,93 USD per enhet/dag | 1 000 TPM 131,15 USD per enhet/dag | 99,9 % | 99 % > 80 tokener per sekund2 |
| o3-mini | 30 000 TPM 78,69 USD per enhet/dag | 5 000 TPM 52,46 USD per enhet/dag | 99,9 % | 99 % > 90 tokener per sekund2 |
Slik fungerer det
Med Skaleringsnivå kan du kjøpe tokenenheter for inndata og utdata. For eksempel koster hver inndataenhet 110 USD per dag med GPT‑4.1 og gir deg rett til 30 000 input token per minutt. Hver utdataenhet koster $36 per dag og gir deg rett til 2 500 tokens per minutt. Hver token kjøpes for minimum 30 dager.
Du finner mer informasjon om hvordan Skaleringsnivå samhandler med meldingsbufring, i Spørsmål og svar-delen nedenfor.
Med GPT‑5.4 kjøper du kombinerte inndata- og utdata-token per minutt. Dette gir deg større fleksibilitet og eliminerer behovet for å forutsi forholdet mellom inndata- og utdatatokens. Når du bruker Skaleringsnivå, regner vi token mot de kombinerte tokenene dine på følgende måte:
- Inndatatokener telles som 1
- Bufrede tokens følger bufring per modell som beskrevet nedenfor i FAQ-delen
- Antall utdatatokener beregnet ut fra PayG-prisforholdet mellom utdatatokener og inndatatokener for modellen. For eksempel regnes én utdata-token som 6 med GPT‑5.4.


