Scale Tier för API-kunder
Det här erbjudandet är tillgängligt för Enterprise-kunder. Kontakta vårt försäljningsteam för mer information. Om du vill få tillgång till samma premiumfördelar vad gäller latens och tillförlitlighet med flexibel pay-as-you-go-betalning, se Prioritetsbearbetning.
Med Scale Tier kan du på förhand köpa ett visst antal API-indata- och utdatatoken per minut (så kallade tokenenheter) för att få åtkomst till en särskild ögonblicksbild av en modell. Varje tokenenhet köps för minst 30 dagar. Fler modeller kan läggas till om kunden önskar det.
Genom att välja Scale Tier får du tillgång till:
- Förutsägbar latens: Scale Tier är utformat för att generera tokens snabbare och i en jämnare takt än Pay-as-you-go-tjänsten (PAYG), även när efterfrågan är hög.
- Obegränsad skalning: Alla kvoter som köps med Scale Tier läggs automatiskt till i dina kvotgränser, så att du tryggt kan skala vidare.
- Högre tillförlitlighet: Scale Tier-trafik erbjuder SLA på 99,9 % drifttid och prioriterad beräkningskapacitet.
| Indatapaket | Utdatapaket | Drifttid SLA | Latens SLA | |
|---|---|---|---|---|
| GPT-5.5 | 50 000 TPM 750,00 US$ per enhet/dag | Ej tillämpligt3 | 99,9 % | 99 % > 100 tokens per sekund2 |
| GPT-5.4 mini | 50 000 TPM 100,00 US$ per enhet/dag | Ej tillämpligt3 | 99,9 % | 99 % > 100 tokens per sekund2 |
GPT-5.4 exkluderar lång kontext4 | 50 000 TPM 300,00 US$ per enhet/dag | Ej tillämpligt3 | 99,9 % | 99 % > 50 tokens per sekund2 |
| GPT-5.2 | 25 000 TPM 105,00 US$ per enhet/dag | 2 500 TPM 84,00 US$ per enhet/dag | 99,9 % | 99 % > 50 tokens per sekund2 |
| GPT-5.1 | 25 000 TPM 75,00 US$ per enhet/dag | 2 500 TPM 60,00 US$ per enhet/dag | 99,9 % | 99 % > 50 tokens per sekund2 |
| GPT-5 | 25 000 TPM 75,00 US$ per enhet/dag | 2 500 TPM 60,00 US$ per enhet/dag | 99,9 % | 99 % > 50 tokens per sekund2 |
| GPT-5 mini | 500 000 TPM 275,00 US$ per enhet/dag | 50 000 TPM 220,00 US$ per enhet/dag | 99,9 % | 99 % > 80 tokens per sekund2 |
GPT-4.1 exkluderar lång kontext1 | 30 000 TPM 110,00 US$ per enhet/dag | 2 500 TPM 36,00 US$ per enhet/dag | 99,9 % | 99 % > 80 tokens per sekund2 |
GPT-4.1 mini exkluderar lång kontext1 | 500 000 TPM 450,00 US$ per enhet/dag | 50 000 TPM 175,00 US$ per enhet/dag | 99,9 % | 99 % > 90 tokens per sekund2 |
GPT-4.1 nano exkluderar lång kontext1 | 500 000 TPM 110,00 US$ per enhet/dag | 50 000 TPM 40,00 US$ per enhet/dag | 99,9 % | 99 % > 100 tokens per sekund2 |
| GPT-4.1 fine tuning | 30 000 TPM 165,00 US$ per enhet/dag | 2 500 TPM 36,00 US$ per enhet/dag | 99,9 % | 99 % > 80 tokens per sekund2 |
| GPT-4.1 mini fine tuning | 500 000 TPM 900,00 US$ per enhet/dag | 50 000 TPM 175,00 US$ per enhet/dag | 99,9 % | 99 % > 90 tokens per sekund2 |
| o3 | 25 000 TPM 75,00 US$ per enhet/dag | 5 000 TPM 60,00 US$ per enhet/dag | 99,9 % | 99 % > 80 tokens per sekund2 |
| o4-mini | 30 000 TPM 50,00 US$ per enhet/dag | 5 000 TPM 32,50 US$ per enhet/dag | 99,9 % | 99 % > 90 tokens per sekund2 |
| GPT-4o | 30 000 TPM 124,59 US$ per enhet/dag | 2 500 TPM 39,34 US$ per enhet/dag | 99,9 % | 99 % > 80 tokens per sekund2 |
| GPT-4o mini | 500 000 TPM 114,75 US$ per enhet/dag | 50 000 TPM 49,18 US$ per enhet/dag | 99,9 % | 99 % > 90 tokens per sekund2 |
| GPT-4o mini fine tuning | 500 000 TPM 229,50 US$ per enhet/dag | 50 000 TPM 98,36 US$ per enhet/dag | 99,9 % | 99 % > 90 tokens per sekund2 |
| o1 | 5 000 TPM 163,93 US$ per enhet/dag | 1 000 TPM 131,15 US$ per enhet/dag | 99,9 % | 99 % > 80 tokens per sekund2 |
| o3-mini | 30 000 TPM 78,69 US$ per enhet/dag | 5 000 TPM 52,46 US$ per enhet/dag | 99,9 % | 99 % > 90 tokens per sekund2 |
Så här fungerar det
Med Scale Tier kan du köpa indata- och utdatatokenenheter. För GPT‑4.1 kostar till exempel varje indataenhet 110 $/dag och ger dig rätt till 30 000 indatatoken/min. Varje utdataenhet kostar 36$/dag och ger dig rätt till 2500 utdatatoken/min. Varje tokenenhet köps för minst 30 dagar.
Mer information om hur Scale Tier interagerar med Prompt Caching finns i avsnittet Vanliga frågor nedan.
Med GPT‑5.4 köper du kombinerade indata- och utdatatokens/min. Detta ger dig större flexibilitet och eliminerar behovet av att förutsäga din tokenkvot för indata och utdata. När du använder skalningsnivå räknar vi tokens mot dina kombinerade tokens enligt följande:
- Indatatoken räknas som 1
- Cachade indatatokens följer cachelagring per modell enligt nedan i avsnittet Vanliga frågor
- Antal utdatatokens baserat på PAYG-prisförhållandet mellan utdata- och indatatokens för modellen. Till exempel räknas en token som 6 med GPT‑5.4.


