跳到主要內容
OpenAI

API 客戶規模層級

此功能適用於 Enterprise 客戶。請聯絡我們的銷售團隊⁠了解詳情。如要以靈活的按用量付費方式享用相同的進階延遲和可靠性,請參閱優先處理

規模層級讓你可以預先購買固定數目的每分鐘 API 輸入及輸出 Token(稱為「Token 單位」),以存取一個指定的模型快照。每個 Token 單位的最低購買時數為 30 天。我們可能會因應客戶興趣加入其他模型。

選擇規模層級,即可盡享:

  • 可預期的低延遲:規模層級可加快 Token 生成速度,即使在需求高峰期,生成速度仍比按用量付費服務更快和更穩定。
  • 無上限擴展規模:任何透過規模層級購買的配額均會自動加到你的速率限制,因此你可以放心繼續擴展規模。
  • 更高可靠性:規模層級流量提供 99.9% 的在線率 SLA 和優先運算。
輸入套件輸出套件在線率 SLA延遲 SLA
GPT-5.550,000 TPM
US$750.00 每單位/天
N/A399.9%每秒 99% > 100 個詞元2
GPT-5.4 mini50,000 TPM
US$100.00 每單位/天
N/A399.9%每秒 99% > 100 個詞元2
GPT-5.4
長上下文除外4
50,000 TPM
US$300.00 每單位/天
N/A399.9%每秒 99% > 50 個詞元2
GPT-5.225,000 TPM
US$105.00 每單位/天
2,500 TPM
US$84.00 每單位/天
99.9%每秒 99% > 50 個詞元2
GPT-5.125,000 TPM
US$75.00 每單位/天
2,500 TPM
US$60.00 每單位/天
99.9%每秒 99% > 50 個詞元2
GPT-525,000 TPM
US$75.00 每單位/天
2,500 TPM
US$60.00 每單位/天
99.9%每秒 99% > 50 個詞元2
GPT-5 mini500,000 TPM
US$275.00 每單位/天
50,000 TPM
US$220.00 每單位/天
99.9%每秒 99% > 80 個詞元2
GPT-4.1
長上下文除外1
30,000 TPM
US$110.00 每單位/天
2,500 TPM
US$36.00 每單位/天
99.9%每秒 99% > 80 個詞元2
GPT-4.1 mini
長上下文除外1
500,000 TPM
US$450.00 每單位/天
50,000 TPM
US$175.00 每單位/天
99.9%每秒 99% > 90 個詞元2
GPT-4.1 nano
長上下文除外1
500,000 TPM
US$110.00 每單位/天
50,000 TPM
US$40.00 每單位/天
99.9%每秒 99% > 100 個詞元2
GPT-4.1 fine tuning30,000 TPM
US$165.00 每單位/天
2,500 TPM
US$36.00 每單位/天
99.9%每秒 99% > 80 個詞元2
GPT-4.1 mini fine tuning500,000 TPM
US$900.00 每單位/天
50,000 TPM
US$175.00 每單位/天
99.9%每秒 99% > 90 個詞元2
o325,000 TPM
US$75.00 每單位/天
5,000 TPM
US$60.00 每單位/天
99.9%每秒 99% > 80 個詞元2
o4-mini30,000 TPM
US$50.00 每單位/天
5,000 TPM
US$32.50 每單位/天
99.9%每秒 99% > 90 個詞元2
GPT-4o30,000 TPM
US$124.59 每單位/天
2,500 TPM
US$39.34 每單位/天
99.9%每秒 99% > 80 個詞元2
GPT-4o mini500,000 TPM
US$114.75 每單位/天
50,000 TPM
US$49.18 每單位/天
99.9%每秒 99% > 90 個詞元2
GPT-4o mini fine tuning500,000 TPM
US$229.50 每單位/天
50,000 TPM
US$98.36 每單位/天
99.9%每秒 99% > 90 個詞元2
o15,000 TPM
US$163.93 每單位/天
1,000 TPM
US$131.15 每單位/天
99.9%每秒 99% > 80 個詞元2
o3-mini30,000 TPM
US$78.69 每單位/天
5,000 TPM
US$52.46 每單位/天
99.9%每秒 99% > 90 個詞元2
1要求估計 > 128K 提示詞元
2按每 5 分鐘 p50 要求延遲計算。如客戶現有企業協議的延遲 SLA 按每分鐘 p50 要求延遲計算,之前的 SLA 亦仍然適用。
3使用 GPT-5.4 時,規模層級以每分鐘輸入與輸出詞元合併套餐形式購買。輸入詞元、快取輸入詞元及輸出詞元的使用量,會按不同比率抵扣此合併套餐額度。請參閱下方的「運作方式」部分。
4長上下文 >272K

運作方式

你可以透過規模層級購買輸入和輸出 Token 單位。例如,使用 GPT‑4.1 時,每個輸入單位的收費為每天 $110,每分鐘可使用 30,000 個輸入 Token。每個輸出單位的收費為每天 $36,每分鐘可使用 2,500 個輸出 Token。每個 Token 單位的最低購買時數為 30 天。

你可在下方的「常見問題」部分,查看更多有關規模層級如何影響提示詞快取的資訊。

使用 GPT‑5.4 時,你購買的是每分鐘輸入與輸出 Token 合併限額。這讓你有更大的靈活性,並且無需再預測輸入和輸出 Token 比例。當你使用規模層級時,我們會按以下方式將 Token 計入你的合併 Token 限額:

  • 輸入 Token 計作 1
  • 快取輸入 Token 按下方常見問題部分所列的各模型快取方式計算
  • 輸出 Token 會根據該模型輸出 Token 相對輸入 Token 的按用量收費價格比率計算。例如,使用 GPT‑5.4 時,一個輸出 Token 會計作 6。
每分鐘 Token 數TPM按使用的 Token 支付19 tok/s99.5%按需付費平均延遲在線率層級輸入輸出之前預付月費19 tok/s25 tok/s99.5%99.9%按需付費規模平均延遲在線率層級輸入3 個單位輸出2 個單位之後

收費模式

Token 單位及速率限制

模型

可靠性

政策