Zum Hauptinhalt springen
OpenAI

Scale Tier für API-Kund:innen

Dieses Angebot ist für Unternehmenskund:innen verfügbar. Bitte wende dich an unser Vertriebsteam⁠, um mehr zu erfahren. Informationen dazu, wie du dieselben Premium-Vorteile bei Latenz und Zuverlässigkeit auf flexibler „Pay-as-you-go“-Basis nutzen kannst, findest du unter Vorrangige Bearbeitung.

Mit Scale Tier kannst du im Voraus eine festgelegte Anzahl von API-Eingabe- und Ausgabe-Token pro Minute (sogenannte „Token-Einheiten“) erwerben, um auf einen bestimmten Modell-Schnappschuss zuzugreifen. Jede Token-Einheit wird für mindestens 30 Tage erworben. Je nach Kundeninteresse werden möglicherweise weitere Modelle hinzugefügt.

Durch Auswahl von Scale Tier erhältst du Zugriff auf Folgendes:

  • Vorhersehbare Latenz: Scale Tier ist darauf ausgelegt, Token schneller und mit einer konstanteren Geschwindigkeit zu generieren als der Pay-as-you-go-Dienst (PAYG), selbst bei hoher Nachfrage.
  • Unbegrenzte Skalierung: Alle Kontingentkäufe mit Scale Tier werden automatisch zu deinen Ratenlimits hinzugefügt, sodass du mühelos weiter skalieren kannst. 
  • Höhere Zuverlässigkeit: Scale-Tier-Traffic bietet ein SLA mit 99,9 % Betriebszeit und priorisierter Rechenleistung.
EingabepaketOutput-PaketUptime SLALatenz-SLA (Service Level Agreement)
GPT-5.550.000 TPM
750,00 $ pro Einheit/Tag
n. v.399,9 %99 % > 100 Tokens pro Sekunde2
GPT-5.4 mini50.000 TPM
100,00 $ pro Einheit/Tag
n. v.399,9 %99 % > 100 Tokens pro Sekunde2
GPT-5.4
schließt langen Kontext aus4
50.000 TPM
300,00 $ pro Einheit/Tag
n. v.399,9 %99 % > 50 Tokens pro Sekunde2
GPT-5.225.000 TPM
105,00 $ pro Einheit/Tag
2.500 TPM
84,00 $ pro Einheit/Tag
99,9 %99 % > 50 Tokens pro Sekunde2
GPT-5.125.000 TPM
75,00 $ pro Einheit/Tag
2.500 TPM
60,00 $ pro Einheit/Tag
99,9 %99 % > 50 Tokens pro Sekunde2
GPT-525.000 TPM
75,00 $ pro Einheit/Tag
2.500 TPM
60,00 $ pro Einheit/Tag
99,9 %99 % > 50 Tokens pro Sekunde2
GPT-5 mini500.000 TPM
275,00 $ pro Einheit/Tag
50.000 TPM
220,00 $ pro Einheit/Tag
99,9 %99 % > 80 Tokens pro Sekunde2
GPT-4.1
schließt Langzeit-Kontext aus1
30.000 TPM
110,00 $ pro Einheit/Tag
2.500 TPM
36,00 $ pro Einheit/Tag
99,9 %99 % > 80 Tokens pro Sekunde2
GPT-4.1 mini
schließt Langzeit-Kontext aus1
500.000 TPM
450,00 $ pro Einheit/Tag
50.000 TPM
175,00 $ pro Einheit/Tag
99,9 %99 % > 90 Tokens pro Sekunde2
GPT-4.1 nano
schließt Langzeit-Kontext aus1
500.000 TPM
110,00 $ pro Einheit/Tag
50.000 TPM
40,00 $ pro Einheit/Tag
99,9 %99 % > 100 Tokens pro Sekunde2
GPT-4.1 fine tuning30.000 TPM
165,00 $ pro Einheit/Tag
2.500 TPM
36,00 $ pro Einheit/Tag
99,9 %99 % > 80 Tokens pro Sekunde2
GPT-4.1 mini fine tuning500.000 TPM
900,00 $ pro Einheit/Tag
50.000 TPM
175,00 $ pro Einheit/Tag
99,9 %99 % > 90 Tokens pro Sekunde2
o325.000 TPM
75,00 $ pro Einheit/Tag
5.000 TPM
60,00 $ pro Einheit/Tag
99,9 %99 % > 80 Tokens pro Sekunde2
o4-mini30.000 TPM
50,00 $ pro Einheit/Tag
5.000 TPM
32,50 $ pro Einheit/Tag
99,9 %99 % > 90 Tokens pro Sekunde2
GPT-4o30.000 TPM
124,59 $ pro Einheit/Tag
2.500 TPM
39,34 $ pro Einheit/Tag
99,9 %99 % > 80 Tokens pro Sekunde2
GPT-4o mini500.000 TPM
114,75 $ pro Einheit/Tag
50.000 TPM
49,18 $ pro Einheit/Tag
99,9 %99 % > 90 Tokens pro Sekunde2
GPT-4o mini fine tuning500.000 TPM
229,50 $ pro Einheit/Tag
50.000 TPM
98,36 $ pro Einheit/Tag
99,9 %99 % > 90 Tokens pro Sekunde2
o15.000 TPM
163,93 $ pro Einheit/Tag
1.000 TPM
131,15 $ pro Einheit/Tag
99,9 %99 % > 80 Tokens pro Sekunde2
o3-mini30.000 TPM
78,69 $ pro Einheit/Tag
5.000 TPM
52,46 $ pro Einheit/Tag
99,9 %99 % > 90 Tokens pro Sekunde2
1Anfragen mit geschätztem Umfang von über 128.000 Prompt-Tokens
2Berechnet als p50-Anfragelatenz auf 5-Minuten-Basis. Für Kunden mit bestehenden Unternehmensverträgen, deren Latenz-SLAs als p50-Anfragelatenz auf Minutenbasis berechnet werden, gelten die bisherigen SLAs auch weiterhin.
3Bei GPT-5.4 wird Scale Tier als Bundle aus kombinierten Eingabe- und Ausgabe-Tokens pro Minute erworben. Die Nutzung von Eingabe-Tokens, zwischengespeicherten Eingabe-Tokens und Ausgabe-Tokens wird zu unterschiedlichen Sätzen auf dieses kombinierte Bundle angerechnet. Beachte hierzu den Abschnitt „Funktionsweise“ unten.
4Langer Kontext ist >272K

So funktioniert es

Mit Scale Tier kannst du Ein- und Ausgabe-Token erwerben. Beispielsweise kostet mit GPT‑4.1 jede Eingabeeinheit 110 $/Tag und berechtigt zu 30.000 Eingabe-Token/Minute. Jede Ausgabeeinheit kostet 36 $/Tag und berechtigt zu 2.500 Ausgabe-Token/Minute. Jede Token-Einheit wird für mindestens 30 Tage erworben.

Weitere Informationen zur Interaktion von Scale Tier mit Prompt Caching findest du im nachstehenden FAQ-Abschnitt.

Mit GPT‑5.4 kaufst du kombinierte Eingabe- und Ausgabe-Token pro Minute. Dies bietet dir mehr Flexibilität und macht es überflüssig, das Verhältnis von Eingabe- zu Ausgabe-Token vorherzusagen. Bei der Nutzung von Scale Tier rechnen wir Token wie folgt auf deine kombinierten Token an:

  • Eingabe-Token zählen als 1
  • Zwischengespeicherte Eingabe-Token richten sich nach der Modellzwischenspeicherung wie unten im FAQ-Abschnitt beschrieben
  • Anzahl der Ausgabe-Token basierend auf dem PayG-Preisverhältnis von Ausgabe- zu Eingabe-Token für das Modell. Zum Beispiel zählt bei GPT‑5.4 ein Ausgabe-Token als 6.
Token pro MinuteTPMBezahlen für verwendete Token19 Token pro Sekunde99,5 %Bezahlen nach VerbrauchDurchschnittliche LatenzBetriebszeitTarifstufeEingabeOutputVorMonatlich im Voraus bezahlt19 Token pro Sekunde25 Token pro Sekunde99,5 %99,9 %Bezahlen nach VerbrauchSkalierungDurchschnittliche LatenzBetriebszeitTarifstufeEingabe3 EinheitenOutput2 EinheitenNach

Preisgestaltung

Token-Einheiten und Ratenlimits

Modelle

Zuverlässigkeit

Richtlinien