メインコンテンツにスキップ
OpenAI

API 利用者向けスケールティア

本サービスは Enterprise のお客様向けに提供されています。詳細は、営業チームまでお問い合わせください。 柔軟な従量課金で同様の低レイテンシと高い信頼性を備えたサービスをご利用いただくには、優先処理をご覧ください。

スケールティアでは、特定のモデルスナップショットへのアクセスのために、1分あたりの API 入力トークンおよび出力トークンの所定量(「トークン単位」)を前払いで購入できます。各トークン単位は、最低30日間から購入できます。お客様のニーズに応じて、対応モデルが追加される場合があります。

スケールティアの主な特長:

  • 予測可能なレイテンシ:スケールティアは、需要のピーク時でも、従量課金(PAYG)より高速かつ安定した速度でトークンを生成できるよう設計されています。
  • スケールの上限なし:スケールティアで購入したクォータはレート制限に自動的に加算されるため、追加の制約を気にせずスケールできます。 
  • 高い信頼性:スケールティアのトラフィックでは、99.9% の稼働率 SLA と優先的なコンピュートリソースが提供されます。
入力バンドル出力バンドル稼働率の SLAレイテンシ SLA
GPT-5.550,000 TPM
$750.00 /1日あたりのユニット
適用外399.9%99% > 100 トークン/秒2
GPT-5.4 mini50,000 TPM
$100.00 /1日あたりのユニット
適用外399.9%99% > 100 トークン/秒2
GPT-5.4
long-context を除く4
50,000 TPM
$300.00 /1日あたりのユニット
適用外399.9%99% > 50 トークン/秒2
GPT-5.225,000 TPM
$105.00 /1日あたりのユニット
2,500 TPM
$84.00 /1日あたりのユニット
99.9%99% > 50 トークン/秒2
GPT-5.125,000 TPM
$75.00 /1日あたりのユニット
2,500 TPM
$60.00 /1日あたりのユニット
99.9%99% > 50 トークン/秒2
GPT-525,000 TPM
$75.00 /1日あたりのユニット
2,500 TPM
$60.00 /1日あたりのユニット
99.9%99% > 50 トークン/秒2
GPT-5 mini500,000 TPM
$275.00 /1日あたりのユニット
50,000 TPM
$220.00 /1日あたりのユニット
99.9%99% > 80 トークン/秒2
GPT-4.1
long-context を除く1
30,000 TPM
1日あたり1ユニットにつき $110.00
2,500 TPM
1日あたり1ユニットにつき $36.00
99.9%99% > 80 トークン/秒2
GPT-4.1 mini
long-context を除く1
500,000 TPM
1日あたり1ユニットにつき $450.00
50,000 TPM
1日あたり1ユニットにつき $175.00
99.9%99% > 90 トークン/秒2
GPT-4.1 nano
long-context を除く1
500,000 TPM
1日あたり1ユニットにつき $110.00
50,000 TPM
1日あたり1ユニットにつき $40.00
99.9%99% > 100 トークン/秒2
GPT-4.1 fine tuning30,000 TPM
1日あたり1ユニットにつき $165.00
2,500 TPM
1日あたり1ユニットにつき $36.00
99.9%99% > 80 トークン/秒2
GPT-4.1 mini fine tuning500,000 TPM
1日あたり1ユニットにつき $900.00
50,000 TPM
1日あたり1ユニットにつき $175.00
99.9%99% > 90 トークン/秒2
o325,000 TPM
$75.00 /1日あたりのユニット
5,000 TPM
$60.00 /1日あたりのユニット
99.9%99% > 80 トークン/秒2
o4-mini30,000 TPM
$50.00 /1日あたりのユニット
5,000 TPM
$32.50 /1日あたりのユニット
99.9%99% > 90 トークン/秒2
GPT-4o30,000 TPM
1日あたり1ユニットにつき $124.59
2,500 TPM
1日あたり1ユニットにつき $39.34
99.9%99% > 80 トークン/秒2
GPT-4o mini500,000 TPM
1日あたり1ユニットにつき $114.75
50,000 TPM
1日あたり1ユニットにつき $49.18
99.9%99% > 90 トークン/秒2
GPT-4o mini fine tuning500,000 TPM
1日あたり1ユニットにつき $229.50
50,000 TPM
1日あたり1ユニットにつき $98.36
99.9%99% > 90 トークン/秒2
o15,000 TPM
$163.93 /1日あたりのユニット
1,000 TPM
$131.15 /1日あたりのユニット
99.9%99% > 80 トークン/秒2
o3-mini30,000 TPM
$78.69 /1日あたりのユニット
5,000 TPM
$52.46 /1日あたりのユニット
99.9%99% > 90 トークン/秒2
1128,000以上のプロンプト トークンでの推定リクエスト
2p50リクエストのレイテンシ(5分あたり)として計算p50リクエストのレイテンシ(1分あたり)として計算されるレイテンシ SLA を含む既存のエンタープライズ契約を締結しているお客様については、従来の SLA も引き続き適用されます。
3GPT-5.4 では、スケールティアは1分あたりの入力トークンと出力トークンの合計数としてバンドルで購入する形式となります。入力トークン、キャッシュされた入力トークン、出力トークンの使用量は、それぞれ異なる比率でこの合計バンドルにカウントされます。詳細は以下の「仕組み」セクションをご覧ください。
4272K超が長文コンテキスト

仕組み

スケールティアでは、入力トークンおよび出力トークンのトークン単位を購入できます。たとえば GPT‑4.1 では、入力トークン単位は1日あたり$110で、1分あたり3万入力トークンを利用できます。出力トークン単位は1日あたり$36で、1分あたり2,500出力トークンを利用できます。各トークン単位は、最低30日間から購入できます。

スケールティアと Prompt Caching の連携についての詳細は、以下の FAQ セクションをご参照ください。

GPT‑5.4 では、1分あたりの入力トークンと出力トークンの合計量を購入します。これにより柔軟性が向上し、入力トークンと出力トークンの比率を事前に見積もる必要がなくなります。スケールティアの利用時は、トークンは以下のように合計トークン数に対してカウントされます。

  • 入力トークンは1としてカウントされます。
  • キャッシュされた入力トークンは、以下の FAQ に記載のモデルごとのキャッシュルールに従います。
  • 出力トークンは、モデルごとの出力トークンと入力トークンの PayG の価格比率に基づいてカウントされます。たとえば GPT‑5.4 では、出力トークン1つは6としてカウントされます。
1分あたりのトークン数TPM使用トークン単位の支払い19トークン/秒99.5%従量課金制平均レイテンシアップタイムティア入力出力Before毎月前払い19トークン/秒25トークン/秒99.5%99.9%従量課金制スケール平均レイテンシアップタイムティア入力3ユニット出力2ユニットAfter

料金

トークン単位とレート制限

モデル

信頼性

ポリシー