Hopp til hovedinnhold
OpenAI

Skaleringsnivå for API-kunder

Dette tilbudet er tilgjengelig for Enterprise-kunder. kontakt salgsteamet vårt⁠ for å finne ut mer. Hvis du vil ha tilgang til de samme fordelene med førsteklasses ventetid og pålitelighet på en fleksibel betal-etter-bruk-basis, kan du se Prioritert behandling.

Skaleringsnivå lar deg kjøpe et angitt antall API-inndata- og utdata-token per minutt (kalt «tokenenheter») på forhånd for tilgang til ett bestemt modell-snapshot. Hver token kjøpes for minimum 30 dager. Ytterligere modell kan legges til basert på kundeinteresse.

Ved å velge Skaleringsnivå kan du låse opp:

  • Forutsigbar forsinkelse: Skaleringsnivået er utformet for å generere tokens raskere og med mer konsistent hastighet enn betaling-etter-bruk-tjenesten (PAYG), selv under høy etterspørsel.
  • Ubegrenset skalering: Alle kvotekjøp med Skaleringsnivå blir automatisk lagt til bruksgrensene dine, så du kan trygt skalere videre. 
  • Høyere pålitelighet: Skaleringsnivå-trafikk tilbyr en SLA for 99,9 % oppetid og prioritert databehandling.
Inndata-pakkeUtdata-pakkeTjenesteavtale – oppetidTjenesteavtale – forsinkelse
GPT-5.550 000 TPM
750,00 USD per enhet/dag
Ikke aktuelt399,9 %99 % > 100 tokener per sekund2
GPT-5.4 mini50 000 TPM
100,00 USD per enhet/dag
Ikke aktuelt399,9 %99 % > 100 tokener per sekund2
GPT-5.4
uten lang kontekst4
50 000 TPM
300,00 USD per enhet/dag
Ikke aktuelt399,9 %99 % > 50 tokener per sekund2
GPT-5.225 000 TPM
105,00 USD per enhet/dag
2 500 TPM
84,00 USD per enhet/dag
99,9 %99 % > 50 tokener per sekund2
GPT-5.125 000 TPM
75,00 USD per enhet/dag
2 500 TPM
60,00 USD per enhet/dag
99,9 %99 % > 50 tokener per sekund2
GPT-525 000 TPM
75,00 USD per enhet/dag
2 500 TPM
60,00 USD per enhet/dag
99,9 %99 % > 50 tokener per sekund2
GPT-5 mini500 000 TPM
275,00 USD per enhet/dag
50 000 TPM
220,00 USD per enhet/dag
99,9 %99 % > 80 tokener per sekund2
GPT-4.1
uten long-context 1
30 000 TPM
110,00 USD per enhet/dag
2 500 TPM
36,00 USD per enhet/dag
99,9 %99 % > 80 tokener per sekund2
GPT-4.1 mini
uten long-context 1
500 000 TPM
450,00 USD per enhet/dag
50 000 TPM
175,00 USD per enhet/dag
99,9 %99 % > 90 tokener per sekund2
GPT-4.1 nano
uten long-context 1
500 000 TPM
110,00 USD per enhet/dag
50 000 TPM
40,00 USD per enhet/dag
99,9 %99 % > 100 tokener per sekund2
GPT-4.1 fine tuning30 000 TPM
165,00 USD per enhet/dag
2 500 TPM
36,00 USD per enhet/dag
99,9 %99 % > 80 tokener per sekund2
GPT-4.1 mini fine tuning500 000 TPM
900,00 USD per enhet/dag
50 000 TPM
175,00 USD per enhet/dag
99,9 %99 % > 90 tokener per sekund2
o325 000 TPM
75,00 USD per enhet/dag
5 000 TPM
60,00 USD per enhet/dag
99,9 %99 % > 80 tokener per sekund2
o4-mini30 000 TPM
50,00 USD per enhet/dag
5 000 TPM
32,50 USD per enhet/dag
99,9 %99 % > 90 tokener per sekund2
GPT-4o30 000 TPM
124,59 USD per enhet/dag
2 500 TPM
39,34 USD per enhet/dag
99,9 %99 % > 80 tokener per sekund2
GPT-4o mini500 000 TPM
114,75 USD per enhet/dag
50 000 TPM
49,18 USD per enhet/dag
99,9 %99 % > 90 tokener per sekund2
GPT-4o mini fine tuning500 000 TPM
229,50 USD per enhet/dag
50 000 TPM
98,36 USD per enhet/dag
99,9 %99 % > 90 tokener per sekund2
o15 000 TPM
163,93 USD per enhet/dag
1 000 TPM
131,15 USD per enhet/dag
99,9 %99 % > 80 tokener per sekund2
o3-mini30 000 TPM
78,69 USD per enhet/dag
5 000 TPM
52,46 USD per enhet/dag
99,9 %99 % > 90 tokener per sekund2
1Forespørsler estimert ved >128 000 meldingstokener
2Beregnet som p50-meldingsforsinkelse på en per 5 minutter-basis. For kunder med eksisterende bedriftsavtaler som har tjenesteavtaler om forsinkelse beregnet som p50-meldingsforsinkelse på en per minutt-basis, gjelder også de tidligere tjenesteavtalene.
3Med GPT-5.4, Skalanivå kjøpes som en pakke med kombinerte inndata- og utdatatokener per minutt. Bruk av inndatatokener, bufrede inndatatokener og utdatatokener telles mot denne kombinerte pakken med ulike satser. Se avsnittet Slik fungerer det nedenfor.
4Lang kontekst er > 272 000

Slik fungerer det

Med Skaleringsnivå kan du kjøpe tokenenheter for inndata og utdata. For eksempel koster hver inndataenhet 110 USD per dag med GPT‑4.1 og gir deg rett til 30 000 input token per minutt. Hver utdataenhet koster $36 per dag og gir deg rett til 2 500 tokens per minutt. Hver token kjøpes for minimum 30 dager.

Du finner mer informasjon om hvordan Skaleringsnivå samhandler med meldingsbufring, i Spørsmål og svar-delen nedenfor.

Med GPT‑5.4 kjøper du kombinerte inndata- og utdata-token per minutt. Dette gir deg større fleksibilitet og eliminerer behovet for å forutsi forholdet mellom inndata- og utdatatokens. Når du bruker Skaleringsnivå, regner vi token mot de kombinerte tokenene dine på følgende måte:

  • Inndatatokener telles som 1
  • Bufrede tokens følger bufring per modell som beskrevet nedenfor i FAQ-delen
  • Antall utdatatokener beregnet ut fra PayG-prisforholdet mellom utdatatokener og inndatatokener for modellen. For eksempel regnes én utdata-token som 6 med GPT‑5.4.
Tokener per minuttTPMBetal for brukte tokener19 tok/sek99,5 %Pay-as-you-goGj.snittlig forsinkelseOppetidNivåInndataUtdataFørBetales på forhånd månedlig19 tok/sek25 tok/sek99,5 %99,9 %Pay-as-you-goSkalaGj.snittlig forsinkelseOppetidNivåInndata3 enheterUtdata2 enheterEtter

Priser

Token og bruksgrenser

Modeller

Pålitelighet

Retningslinjer