API 利用者向けスケールティア
本サービスは Enterprise のお客様向けに提供されています。詳細は、営業チームまでお問い合わせください。 柔軟な従量課金で同様の低レイテンシと高い信頼性を備えたサービスをご利用いただくには、優先処理をご覧ください。
スケールティアでは、特定のモデルスナップショットへのアクセスのために、1分あたりの API 入力トークンおよび出力トークンの所定量(「トークン単位」)を前払いで購入できます。各トークン単位は、最低30日間から購入できます。お客様のニーズに応じて、対応モデルが追加される場合があります。
スケールティアの主な特長:
- 予測可能なレイテンシ:スケールティアは、需要のピーク時でも、従量課金(PAYG)より高速かつ安定した速度でトークンを生成できるよう設計されています。
- スケールの上限なし:スケールティアで購入したクォータはレート制限に自動的に加算されるため、追加の制約を気にせずスケールできます。
- 高い信頼性:スケールティアのトラフィックでは、99.9% の稼働率 SLA と優先的なコンピュートリソースが提供されます。
| 入力バンドル | 出力バンドル | 稼働率の SLA | レイテンシ SLA | |
|---|---|---|---|---|
| GPT-5.5 | 50,000 TPM $750.00 /1日あたりのユニット | 適用外3 | 99.9% | 99% > 100 トークン/秒2 |
| GPT-5.4 mini | 50,000 TPM $100.00 /1日あたりのユニット | 適用外3 | 99.9% | 99% > 100 トークン/秒2 |
GPT-5.4 long-context を除く4 | 50,000 TPM $300.00 /1日あたりのユニット | 適用外3 | 99.9% | 99% > 50 トークン/秒2 |
| GPT-5.2 | 25,000 TPM $105.00 /1日あたりのユニット | 2,500 TPM $84.00 /1日あたりのユニット | 99.9% | 99% > 50 トークン/秒2 |
| GPT-5.1 | 25,000 TPM $75.00 /1日あたりのユニット | 2,500 TPM $60.00 /1日あたりのユニット | 99.9% | 99% > 50 トークン/秒2 |
| GPT-5 | 25,000 TPM $75.00 /1日あたりのユニット | 2,500 TPM $60.00 /1日あたりのユニット | 99.9% | 99% > 50 トークン/秒2 |
| GPT-5 mini | 500,000 TPM $275.00 /1日あたりのユニット | 50,000 TPM $220.00 /1日あたりのユニット | 99.9% | 99% > 80 トークン/秒2 |
GPT-4.1 long-context を除く1 | 30,000 TPM 1日あたり1ユニットにつき $110.00 | 2,500 TPM 1日あたり1ユニットにつき $36.00 | 99.9% | 99% > 80 トークン/秒2 |
GPT-4.1 mini long-context を除く1 | 500,000 TPM 1日あたり1ユニットにつき $450.00 | 50,000 TPM 1日あたり1ユニットにつき $175.00 | 99.9% | 99% > 90 トークン/秒2 |
GPT-4.1 nano long-context を除く1 | 500,000 TPM 1日あたり1ユニットにつき $110.00 | 50,000 TPM 1日あたり1ユニットにつき $40.00 | 99.9% | 99% > 100 トークン/秒2 |
| GPT-4.1 fine tuning | 30,000 TPM 1日あたり1ユニットにつき $165.00 | 2,500 TPM 1日あたり1ユニットにつき $36.00 | 99.9% | 99% > 80 トークン/秒2 |
| GPT-4.1 mini fine tuning | 500,000 TPM 1日あたり1ユニットにつき $900.00 | 50,000 TPM 1日あたり1ユニットにつき $175.00 | 99.9% | 99% > 90 トークン/秒2 |
| o3 | 25,000 TPM $75.00 /1日あたりのユニット | 5,000 TPM $60.00 /1日あたりのユニット | 99.9% | 99% > 80 トークン/秒2 |
| o4-mini | 30,000 TPM $50.00 /1日あたりのユニット | 5,000 TPM $32.50 /1日あたりのユニット | 99.9% | 99% > 90 トークン/秒2 |
| GPT-4o | 30,000 TPM 1日あたり1ユニットにつき $124.59 | 2,500 TPM 1日あたり1ユニットにつき $39.34 | 99.9% | 99% > 80 トークン/秒2 |
| GPT-4o mini | 500,000 TPM 1日あたり1ユニットにつき $114.75 | 50,000 TPM 1日あたり1ユニットにつき $49.18 | 99.9% | 99% > 90 トークン/秒2 |
| GPT-4o mini fine tuning | 500,000 TPM 1日あたり1ユニットにつき $229.50 | 50,000 TPM 1日あたり1ユニットにつき $98.36 | 99.9% | 99% > 90 トークン/秒2 |
| o1 | 5,000 TPM $163.93 /1日あたりのユニット | 1,000 TPM $131.15 /1日あたりのユニット | 99.9% | 99% > 80 トークン/秒2 |
| o3-mini | 30,000 TPM $78.69 /1日あたりのユニット | 5,000 TPM $52.46 /1日あたりのユニット | 99.9% | 99% > 90 トークン/秒2 |
仕組み
スケールティアでは、入力トークンおよび出力トークンのトークン単位を購入できます。たとえば GPT‑4.1 では、入力トークン単位は1日あたり$110で、1分あたり3万入力トークンを利用できます。出力トークン単位は1日あたり$36で、1分あたり2,500出力トークンを利用できます。各トークン単位は、最低30日間から購入できます。
スケールティアと Prompt Caching の連携についての詳細は、以下の FAQ セクションをご参照ください。
GPT‑5.4 では、1分あたりの入力トークンと出力トークンの合計量を購入します。これにより柔軟性が向上し、入力トークンと出力トークンの比率を事前に見積もる必要がなくなります。スケールティアの利用時は、トークンは以下のように合計トークン数に対してカウントされます。
- 入力トークンは1としてカウントされます。
- キャッシュされた入力トークンは、以下の FAQ に記載のモデルごとのキャッシュルールに従います。
- 出力トークンは、モデルごとの出力トークンと入力トークンの PayG の価格比率に基づいてカウントされます。たとえば GPT‑5.4 では、出力トークン1つは6としてカウントされます。


