API 客戶規模層級
此功能適用於 Enterprise 客戶。請聯絡我們的銷售團隊了解詳情。如要以靈活的按用量付費方式享用相同的進階延遲和可靠性,請參閱優先處理。
規模層級讓你可以預先購買固定數目的每分鐘 API 輸入及輸出 Token(稱為「Token 單位」),以存取一個指定的模型快照。每個 Token 單位的最低購買時數為 30 天。我們可能會因應客戶興趣加入其他模型。
選擇規模層級,即可盡享:
- 可預期的低延遲:規模層級可加快 Token 生成速度,即使在需求高峰期,生成速度仍比按用量付費服務更快和更穩定。
- 無上限擴展規模:任何透過規模層級購買的配額均會自動加到你的速率限制,因此你可以放心繼續擴展規模。
- 更高可靠性:規模層級流量提供 99.9% 的在線率 SLA 和優先運算。
| 輸入套件 | 輸出套件 | 在線率 SLA | 延遲 SLA | |
|---|---|---|---|---|
| GPT-5.5 | 50,000 TPM US$750.00 每單位/天 | N/A3 | 99.9% | 每秒 99% > 100 個詞元2 |
| GPT-5.4 mini | 50,000 TPM US$100.00 每單位/天 | N/A3 | 99.9% | 每秒 99% > 100 個詞元2 |
GPT-5.4 長上下文除外4 | 50,000 TPM US$300.00 每單位/天 | N/A3 | 99.9% | 每秒 99% > 50 個詞元2 |
| GPT-5.2 | 25,000 TPM US$105.00 每單位/天 | 2,500 TPM US$84.00 每單位/天 | 99.9% | 每秒 99% > 50 個詞元2 |
| GPT-5.1 | 25,000 TPM US$75.00 每單位/天 | 2,500 TPM US$60.00 每單位/天 | 99.9% | 每秒 99% > 50 個詞元2 |
| GPT-5 | 25,000 TPM US$75.00 每單位/天 | 2,500 TPM US$60.00 每單位/天 | 99.9% | 每秒 99% > 50 個詞元2 |
| GPT-5 mini | 500,000 TPM US$275.00 每單位/天 | 50,000 TPM US$220.00 每單位/天 | 99.9% | 每秒 99% > 80 個詞元2 |
GPT-4.1 長上下文除外1 | 30,000 TPM US$110.00 每單位/天 | 2,500 TPM US$36.00 每單位/天 | 99.9% | 每秒 99% > 80 個詞元2 |
GPT-4.1 mini 長上下文除外1 | 500,000 TPM US$450.00 每單位/天 | 50,000 TPM US$175.00 每單位/天 | 99.9% | 每秒 99% > 90 個詞元2 |
GPT-4.1 nano 長上下文除外1 | 500,000 TPM US$110.00 每單位/天 | 50,000 TPM US$40.00 每單位/天 | 99.9% | 每秒 99% > 100 個詞元2 |
| GPT-4.1 fine tuning | 30,000 TPM US$165.00 每單位/天 | 2,500 TPM US$36.00 每單位/天 | 99.9% | 每秒 99% > 80 個詞元2 |
| GPT-4.1 mini fine tuning | 500,000 TPM US$900.00 每單位/天 | 50,000 TPM US$175.00 每單位/天 | 99.9% | 每秒 99% > 90 個詞元2 |
| o3 | 25,000 TPM US$75.00 每單位/天 | 5,000 TPM US$60.00 每單位/天 | 99.9% | 每秒 99% > 80 個詞元2 |
| o4-mini | 30,000 TPM US$50.00 每單位/天 | 5,000 TPM US$32.50 每單位/天 | 99.9% | 每秒 99% > 90 個詞元2 |
| GPT-4o | 30,000 TPM US$124.59 每單位/天 | 2,500 TPM US$39.34 每單位/天 | 99.9% | 每秒 99% > 80 個詞元2 |
| GPT-4o mini | 500,000 TPM US$114.75 每單位/天 | 50,000 TPM US$49.18 每單位/天 | 99.9% | 每秒 99% > 90 個詞元2 |
| GPT-4o mini fine tuning | 500,000 TPM US$229.50 每單位/天 | 50,000 TPM US$98.36 每單位/天 | 99.9% | 每秒 99% > 90 個詞元2 |
| o1 | 5,000 TPM US$163.93 每單位/天 | 1,000 TPM US$131.15 每單位/天 | 99.9% | 每秒 99% > 80 個詞元2 |
| o3-mini | 30,000 TPM US$78.69 每單位/天 | 5,000 TPM US$52.46 每單位/天 | 99.9% | 每秒 99% > 90 個詞元2 |
運作方式
你可以透過規模層級購買輸入和輸出 Token 單位。例如,使用 GPT‑4.1 時,每個輸入單位的收費為每天 $110,每分鐘可使用 30,000 個輸入 Token。每個輸出單位的收費為每天 $36,每分鐘可使用 2,500 個輸出 Token。每個 Token 單位的最低購買時數為 30 天。
你可在下方的「常見問題」部分,查看更多有關規模層級如何影響提示詞快取的資訊。
使用 GPT‑5.4 時,你購買的是每分鐘輸入與輸出 Token 合併限額。這讓你有更大的靈活性,並且無需再預測輸入和輸出 Token 比例。當你使用規模層級時,我們會按以下方式將 Token 計入你的合併 Token 限額:
- 輸入 Token 計作 1
- 快取輸入 Token 按下方常見問題部分所列的各模型快取方式計算
- 輸出 Token 會根據該模型輸出 Token 相對輸入 Token 的按用量收費價格比率計算。例如,使用 GPT‑5.4 時,一個輸出 Token 會計作 6。


