Gå direkt till huvudinnehåll
OpenAI

Scale Tier för API-kunder

Det här erbjudandet är tillgängligt för Enterprise-kunder. Kontakta vårt försäljningsteam⁠ för mer information. Om du vill få tillgång till samma premiumfördelar vad gäller latens och tillförlitlighet med flexibel pay-as-you-go-betalning, se Prioritetsbearbetning.

Med Scale Tier kan du på förhand köpa ett visst antal API-indata- och utdatatoken per minut (så kallade tokenenheter) för att få åtkomst till en särskild ögonblicksbild av en modell. Varje tokenenhet köps för minst 30 dagar. Fler modeller kan läggas till om kunden önskar det.

Genom att välja Scale Tier får du tillgång till:

  • Förutsägbar latens: Scale Tier är utformat för att generera tokens snabbare och i en jämnare takt än Pay-as-you-go-tjänsten (PAYG), även när efterfrågan är hög.
  • Obegränsad skalning: Alla kvoter som köps med Scale Tier läggs automatiskt till i dina kvotgränser, så att du tryggt kan skala vidare.
  • Högre tillförlitlighet: Scale Tier-trafik erbjuder SLA på 99,9 % drifttid och prioriterad beräkningskapacitet.
IndatapaketUtdatapaketDrifttid SLALatens SLA
GPT-5.550 000 TPM
750,00 US$ per enhet/dag
Ej tillämpligt399,9 %99 % > 100 tokens per sekund2
GPT-5.4 mini50 000 TPM
100,00 US$ per enhet/dag
Ej tillämpligt399,9 %99 % > 100 tokens per sekund2
GPT-5.4
exkluderar lång kontext4
50 000 TPM
300,00 US$ per enhet/dag
Ej tillämpligt399,9 %99 % > 50 tokens per sekund2
GPT-5.225 000 TPM
105,00 US$ per enhet/dag
2 500 TPM
84,00 US$ per enhet/dag
99,9 %99 % > 50 tokens per sekund2
GPT-5.125 000 TPM
75,00 US$ per enhet/dag
2 500 TPM
60,00 US$ per enhet/dag
99,9 %99 % > 50 tokens per sekund2
GPT-525 000 TPM
75,00 US$ per enhet/dag
2 500 TPM
60,00 US$ per enhet/dag
99,9 %99 % > 50 tokens per sekund2
GPT-5 mini500 000 TPM
275,00 US$ per enhet/dag
50 000 TPM
220,00 US$ per enhet/dag
99,9 %99 % > 80 tokens per sekund2
GPT-4.1
exkluderar lång kontext1
30 000 TPM
110,00 US$ per enhet/dag
2 500 TPM
36,00 US$ per enhet/dag
99,9 %99 % > 80 tokens per sekund2
GPT-4.1 mini
exkluderar lång kontext1
500 000 TPM
450,00 US$ per enhet/dag
50 000 TPM
175,00 US$ per enhet/dag
99,9 %99 % > 90 tokens per sekund2
GPT-4.1 nano
exkluderar lång kontext1
500 000 TPM
110,00 US$ per enhet/dag
50 000 TPM
40,00 US$ per enhet/dag
99,9 %99 % > 100 tokens per sekund2
GPT-4.1 fine tuning30 000 TPM
165,00 US$ per enhet/dag
2 500 TPM
36,00 US$ per enhet/dag
99,9 %99 % > 80 tokens per sekund2
GPT-4.1 mini fine tuning500 000 TPM
900,00 US$ per enhet/dag
50 000 TPM
175,00 US$ per enhet/dag
99,9 %99 % > 90 tokens per sekund2
o325 000 TPM
75,00 US$ per enhet/dag
5 000 TPM
60,00 US$ per enhet/dag
99,9 %99 % > 80 tokens per sekund2
o4-mini30 000 TPM
50,00 US$ per enhet/dag
5 000 TPM
32,50 US$ per enhet/dag
99,9 %99 % > 90 tokens per sekund2
GPT-4o30 000 TPM
124,59 US$ per enhet/dag
2 500 TPM
39,34 US$ per enhet/dag
99,9 %99 % > 80 tokens per sekund2
GPT-4o mini500 000 TPM
114,75 US$ per enhet/dag
50 000 TPM
49,18 US$ per enhet/dag
99,9 %99 % > 90 tokens per sekund2
GPT-4o mini fine tuning500 000 TPM
229,50 US$ per enhet/dag
50 000 TPM
98,36 US$ per enhet/dag
99,9 %99 % > 90 tokens per sekund2
o15 000 TPM
163,93 US$ per enhet/dag
1 000 TPM
131,15 US$ per enhet/dag
99,9 %99 % > 80 tokens per sekund2
o3-mini30 000 TPM
78,69 US$ per enhet/dag
5 000 TPM
52,46 US$ per enhet/dag
99,9 %99 % > 90 tokens per sekund2
1Förfrågningar uppskattade till >128 000 prompttokens
2Beräknat som medianlatens (p50) för förfrågningar under varje 5-minutersperiod. För kunder med befintliga företagsavtal som har latens-SLA:er beräknade som medianlatens (p50) för förfrågningar per minut, gäller de tidigare SLA:erna fortfarande.
3Med GPT-5.4 köps skalningsnivån som ett paket med kombinerade in- och utdatatokens per minut. Användning av indatatokens, cachade indatatokens och utdatatokens räknas mot detta kombinerade paket som finns i olika gränser. Se avsnittet "Så här fungerar det" nedan.
4Lång kontext är >272 000

Så här fungerar det

Med Scale Tier kan du köpa indata- och utdatatokenenheter. För GPT‑4.1 kostar till exempel varje indataenhet 110 $/dag och ger dig rätt till 30 000 indatatoken/min. Varje utdataenhet kostar 36$/dag och ger dig rätt till 2500 utdatatoken/min. Varje tokenenhet köps för minst 30 dagar.

Mer information om hur Scale Tier interagerar med Prompt Caching finns i avsnittet Vanliga frågor nedan.

Med GPT‑5.4 köper du kombinerade indata- och utdatatokens/min. Detta ger dig större flexibilitet och eliminerar behovet av att förutsäga din tokenkvot för indata och utdata. När du använder skalningsnivå räknar vi tokens mot dina kombinerade tokens enligt följande:

  • Indatatoken räknas som 1
  • Cachade indatatokens följer cachelagring per modell enligt nedan i avsnittet Vanliga frågor
  • Antal utdatatokens baserat på PAYG-prisförhållandet mellan utdata- och indatatokens för modellen. Till exempel räknas en token som 6 med GPT‑5.4.
Token per minutTPMBetala för använda token19 tok/s99,5 %Pay-as-you-goGenomsnittlig latensDrifttidTierIndataUtdataFöreBetalas i förskott månadsvis19 tok/s25 tok/s99,5 %99,9 %Pay-as-you-goSkalaGenomsnittlig latensDrifttidTierIndata3 enheterUtdata2 enheterEfter

Priser

Tokenenheter och kvotgränser

Modeller

Tillförlitlighet

Policyer