Scale Tier für API-Kund:innen
Dieses Angebot ist für Unternehmenskund:innen verfügbar. Bitte wende dich an unser Vertriebsteam, um mehr zu erfahren. Informationen dazu, wie du dieselben Premium-Vorteile bei Latenz und Zuverlässigkeit auf flexibler „Pay-as-you-go“-Basis nutzen kannst, findest du unter Vorrangige Bearbeitung.
Mit Scale Tier kannst du im Voraus eine festgelegte Anzahl von API-Eingabe- und Ausgabe-Token pro Minute (sogenannte „Token-Einheiten“) erwerben, um auf einen bestimmten Modell-Schnappschuss zuzugreifen. Jede Token-Einheit wird für mindestens 30 Tage erworben. Je nach Kundeninteresse werden möglicherweise weitere Modelle hinzugefügt.
Durch Auswahl von Scale Tier erhältst du Zugriff auf Folgendes:
- Vorhersehbare Latenz: Scale Tier ist darauf ausgelegt, Token schneller und mit einer konstanteren Geschwindigkeit zu generieren als der Pay-as-you-go-Dienst (PAYG), selbst bei hoher Nachfrage.
- Unbegrenzte Skalierung: Alle Kontingentkäufe mit Scale Tier werden automatisch zu deinen Ratenlimits hinzugefügt, sodass du mühelos weiter skalieren kannst.
- Höhere Zuverlässigkeit: Scale-Tier-Traffic bietet ein SLA mit 99,9 % Betriebszeit und priorisierter Rechenleistung.
| Eingabepaket | Output-Paket | Uptime SLA | Latenz-SLA (Service Level Agreement) | |
|---|---|---|---|---|
| GPT-5.5 | 50.000 TPM 750,00 $ pro Einheit/Tag | n. v.3 | 99,9 % | 99 % > 100 Tokens pro Sekunde2 |
| GPT-5.4 mini | 50.000 TPM 100,00 $ pro Einheit/Tag | n. v.3 | 99,9 % | 99 % > 100 Tokens pro Sekunde2 |
GPT-5.4 schließt langen Kontext aus4 | 50.000 TPM 300,00 $ pro Einheit/Tag | n. v.3 | 99,9 % | 99 % > 50 Tokens pro Sekunde2 |
| GPT-5.2 | 25.000 TPM 105,00 $ pro Einheit/Tag | 2.500 TPM 84,00 $ pro Einheit/Tag | 99,9 % | 99 % > 50 Tokens pro Sekunde2 |
| GPT-5.1 | 25.000 TPM 75,00 $ pro Einheit/Tag | 2.500 TPM 60,00 $ pro Einheit/Tag | 99,9 % | 99 % > 50 Tokens pro Sekunde2 |
| GPT-5 | 25.000 TPM 75,00 $ pro Einheit/Tag | 2.500 TPM 60,00 $ pro Einheit/Tag | 99,9 % | 99 % > 50 Tokens pro Sekunde2 |
| GPT-5 mini | 500.000 TPM 275,00 $ pro Einheit/Tag | 50.000 TPM 220,00 $ pro Einheit/Tag | 99,9 % | 99 % > 80 Tokens pro Sekunde2 |
GPT-4.1 schließt Langzeit-Kontext aus1 | 30.000 TPM 110,00 $ pro Einheit/Tag | 2.500 TPM 36,00 $ pro Einheit/Tag | 99,9 % | 99 % > 80 Tokens pro Sekunde2 |
GPT-4.1 mini schließt Langzeit-Kontext aus1 | 500.000 TPM 450,00 $ pro Einheit/Tag | 50.000 TPM 175,00 $ pro Einheit/Tag | 99,9 % | 99 % > 90 Tokens pro Sekunde2 |
GPT-4.1 nano schließt Langzeit-Kontext aus1 | 500.000 TPM 110,00 $ pro Einheit/Tag | 50.000 TPM 40,00 $ pro Einheit/Tag | 99,9 % | 99 % > 100 Tokens pro Sekunde2 |
| GPT-4.1 fine tuning | 30.000 TPM 165,00 $ pro Einheit/Tag | 2.500 TPM 36,00 $ pro Einheit/Tag | 99,9 % | 99 % > 80 Tokens pro Sekunde2 |
| GPT-4.1 mini fine tuning | 500.000 TPM 900,00 $ pro Einheit/Tag | 50.000 TPM 175,00 $ pro Einheit/Tag | 99,9 % | 99 % > 90 Tokens pro Sekunde2 |
| o3 | 25.000 TPM 75,00 $ pro Einheit/Tag | 5.000 TPM 60,00 $ pro Einheit/Tag | 99,9 % | 99 % > 80 Tokens pro Sekunde2 |
| o4-mini | 30.000 TPM 50,00 $ pro Einheit/Tag | 5.000 TPM 32,50 $ pro Einheit/Tag | 99,9 % | 99 % > 90 Tokens pro Sekunde2 |
| GPT-4o | 30.000 TPM 124,59 $ pro Einheit/Tag | 2.500 TPM 39,34 $ pro Einheit/Tag | 99,9 % | 99 % > 80 Tokens pro Sekunde2 |
| GPT-4o mini | 500.000 TPM 114,75 $ pro Einheit/Tag | 50.000 TPM 49,18 $ pro Einheit/Tag | 99,9 % | 99 % > 90 Tokens pro Sekunde2 |
| GPT-4o mini fine tuning | 500.000 TPM 229,50 $ pro Einheit/Tag | 50.000 TPM 98,36 $ pro Einheit/Tag | 99,9 % | 99 % > 90 Tokens pro Sekunde2 |
| o1 | 5.000 TPM 163,93 $ pro Einheit/Tag | 1.000 TPM 131,15 $ pro Einheit/Tag | 99,9 % | 99 % > 80 Tokens pro Sekunde2 |
| o3-mini | 30.000 TPM 78,69 $ pro Einheit/Tag | 5.000 TPM 52,46 $ pro Einheit/Tag | 99,9 % | 99 % > 90 Tokens pro Sekunde2 |
So funktioniert es
Mit Scale Tier kannst du Ein- und Ausgabe-Token erwerben. Beispielsweise kostet mit GPT‑4.1 jede Eingabeeinheit 110 $/Tag und berechtigt zu 30.000 Eingabe-Token/Minute. Jede Ausgabeeinheit kostet 36 $/Tag und berechtigt zu 2.500 Ausgabe-Token/Minute. Jede Token-Einheit wird für mindestens 30 Tage erworben.
Weitere Informationen zur Interaktion von Scale Tier mit Prompt Caching findest du im nachstehenden FAQ-Abschnitt.
Mit GPT‑5.4 kaufst du kombinierte Eingabe- und Ausgabe-Token pro Minute. Dies bietet dir mehr Flexibilität und macht es überflüssig, das Verhältnis von Eingabe- zu Ausgabe-Token vorherzusagen. Bei der Nutzung von Scale Tier rechnen wir Token wie folgt auf deine kombinierten Token an:
- Eingabe-Token zählen als 1
- Zwischengespeicherte Eingabe-Token richten sich nach der Modellzwischenspeicherung wie unten im FAQ-Abschnitt beschrieben
- Anzahl der Ausgabe-Token basierend auf dem PayG-Preisverhältnis von Ausgabe- zu Eingabe-Token für das Modell. Zum Beispiel zählt bei GPT‑5.4 ein Ausgabe-Token als 6.


