API 客戶專享優先處理服務

優先處理功能高速可靠，並提供按需付費選項，靈活又方便。

選用優先處理功能可以解鎖：

可預期的低延遲：優先處理可加快 Token 生成速度，即使在需求高峰期，生成速度仍比標準處理服務更加穩定。
方便靈活：與標準處理程序一樣，優先處理程序可以按需付費使用，毋須預先部署，彈性方便。

	每百萬個輸入詞元價格	每百萬個輸入詞元價格（快取）	每百萬個輸出詞元價格	在線率 SLA³	延遲 SLA³
GPT-5.5 長上下文除外¹	US$12.50	US$1.250	US$75.00	99.9%	99% > 每秒 50 個詞元²
GPT-5.4 mini 長上下文除外¹	US$1.50	US$0.150	US$9.00	99.9%	99% > 每秒 100 個詞元²
GPT-5.4 長上下文除外¹	US$5.00	US$0.500	US$30.00	99.9%	99% > 每秒 50 個詞元²
GPT-5.2 長上下文除外¹	US$3.50	US$0.350	US$28.00	99.9%	99% > 每秒 50 個詞元²
GPT-5.1 長上下文除外¹	US$2.50	US$0.250	US$20.00	99.9%	99% > 每秒 50 個詞元²
GPT-5 長上下文除外¹	US$2.50	US$0.250	US$20.00	99.9%	99% > 每秒 50 個詞元²
GPT-5 mini 長上下文除外¹	US$0.45	US$0.045	US$3.60	99.9%	99% > 每秒 80 個詞元²
GPT-5.1 codex 長上下文除外¹	US$2.50	US$0.250	US$20.00	99.9%	99% > 每秒 50 個詞元²
GPT-5 codex 長上下文除外¹	US$2.50	US$0.250	US$20.00	99.9%	99% > 每秒 50 個詞元²
GPT-4.1 長上下文除外¹	US$3.50	US$0.875	US$14.00	99.9%	99% > 每秒 80 個詞元²
GPT-4.1 mini 長上下文除外¹	US$0.70	US$0.175	US$2.80	99.9%	99% > 每秒 90 個詞元²
GPT-4.1 nano 長上下文除外¹	US$0.20	US$0.050	US$0.80	99.9%	99% > 每秒 100 個詞元²
GPT-4o gpt-4o-2024-11-20 gpt-4o-2024-08-06	US$4.25	US$2.125	US$17.00	99.9%	99% > 每秒 80 個詞元²
gpt-4o-2024-05-13	US$8.75	—	US$26.25	99.9%	99% > 每秒 80 個詞元²
GPT-4o mini	US$0.25	US$0.125	US$1.00	99.9%	99% > 每秒 90 個詞元²
o3	US$3.50	US$0.875	US$14.00	99.9%	99% > 每秒 80 個詞元²
o4-mini	US$2.00	US$0.500	US$8.00	99.9%	99% > 每秒 90 個詞元²

長上下文除外¹

1要求估計 > 128K 提示詞元

2按每 5 分鐘 p50 要求延遲計算。如客戶現有企業協議的延遲 SLA 按每分鐘 p50 要求延遲計算，之前的 SLA 亦仍然適用。

3只適用於 Enterprise 顧客

每次提出要求前，客戶可透過 service_tier = “priority” 選項設定既有的 service_tier 參數，藉此將流量導向優先處理程序。

透過優先處理提供的 Token 將按數目收費，價格略高於標準處理費。

除了可以在請求層級進行設定外，你亦可以在「項目設定」→「預設服務層級：優先級」中，將項目設為優先級。你仍然可以按個別請求覆寫設定。

優先處理程序的速率限制與其他服務層級一併計算。
在少數情況下，如每分鐘優先處理的詞元數目急速上升，可能會觸發增長速率限制。假如增長速率超出限制，其後的額外流量或會改送至標準處理程序。

規模層級與優先處理服務不會互相影響。

發送至優先處理程序的要求將另行計算收費，且不會扣除你購買的規模層級 TPM 配額。

不可，傳送至規模層級的超額流量不會自動轉送至優先處理。

否，所有處理模式的費用都會計入你的企業版年費訂閱支出。

是的！對於特定模型，快取輸入與標準處理服務一樣，享有同等的 50%、75% 或 90% 折扣。

如要查看經優先處理程序處理的 Token，請前往「用量資訊主頁」，選取「對話完成次數」或「回覆」，然後選取「按服務層級分類」。

如要查看優先處理服務成本，請前往「用量資訊主頁」，然後選取「按明細項目分類」。

目前不適用。我們將來會評估是否為最新模型以外的其他產品提供優先處理服務。

優先處理程序支援的多模態功能與標準處理服務相同。特別是，圖像可以作為Priority處理的輸入，並以同樣快速的延遲進行處理。

是。我們計劃為新的 GPT 模型提供優先處理。我們不保證每個模型都會被支援。

優先處理服務的使用速率限制與標準 API 流量相同。

優先處理服務設有增長速率限制，藉此確保所有客戶可享一致的優秀表現，同時提供彈性的按需收費選項。如果 (a) 優先處理程序的表現下降，以及 (b) 客戶的流量增長速度過快，則部分優先處理要求可能會降級為標準處理要求。

目前，優先處理程序的增長速率限制為正在處理至少 1M TPM，且 15 分鐘內流量增加幅度大於 50% 每分鐘 Token 數。

經標準服務處理的要求將按照標準價格收費，且不符合優先處理服務層級目標的資格。

經標準服務層級處理的要求將在回覆中包含 service_tier=”Defualt”。

避免觸發增長速率限制的最佳實務

改用不同模型後，請逐漸增加流量。舉例而言，如果你的應用程式正從先前的快照轉移至新的快照，請使用功能標記，安排流量於數小時內逐漸轉移，而非一次過轉移所有流量。
避免經優先處理程序執行大型資料處理或非同步工作；這些工作可導致流量快速增長，且往往不需要優先處理所提供的效能。
如果你經常觸發增長速率限制，不妨考慮購買規模層級容量作為主要或備用方案。

是。你的所有流量均會納入相同的增長速率限制計算之中。

如 Enterprise 客戶有任何疑問或疑慮，請與你的客戶經理聯絡。

優先處理 SLA 與規模層級 SLA 相同；如果我們在指定時間內未能達到企業版客戶協議所列的 SLA，客戶將獲發服務積分作為補償。

規模層級與優先處理服務不會互相影響。

發送至優先處理程序的要求將另行計算收費，且不會扣除你購買的規模層級 TPM 配額。

不可，傳送至規模層級的超額流量不會自動轉送至優先處理。

否，所有處理模式的費用都會計入你的企業版年費訂閱支出。

是的！對於特定模型，快取輸入與標準處理服務一樣，享有同等的 50%、75% 或 90% 折扣。

如要查看經優先處理程序處理的 Token，請前往「用量資訊主頁」，選取「對話完成次數」或「回覆」，然後選取「按服務層級分類」。

如要查看優先處理服務成本，請前往「用量資訊主頁」，然後選取「按明細項目分類」。

目前不適用。我們將來會評估是否為最新模型以外的其他產品提供優先處理服務。

優先處理程序支援的多模態功能與標準處理服務相同。特別是，圖像可以作為Priority處理的輸入，並以同樣快速的延遲進行處理。

是。我們計劃為新的 GPT 模型提供優先處理。我們不保證每個模型都會被支援。

優先處理服務的使用速率限制與標準 API 流量相同。

目前，優先處理程序的增長速率限制為正在處理至少 1M TPM，且 15 分鐘內流量增加幅度大於 50% 每分鐘 Token 數。

經標準服務處理的要求將按照標準價格收費，且不符合優先處理服務層級目標的資格。

經標準服務層級處理的要求將在回覆中包含 service_tier=”Defualt”。

避免觸發增長速率限制的最佳實務

改用不同模型後，請逐漸增加流量。舉例而言，如果你的應用程式正從先前的快照轉移至新的快照，請使用功能標記，安排流量於數小時內逐漸轉移，而非一次過轉移所有流量。
避免經優先處理程序執行大型資料處理或非同步工作；這些工作可導致流量快速增長，且往往不需要優先處理所提供的效能。
如果你經常觸發增長速率限制，不妨考慮購買規模層級容量作為主要或備用方案。

是。你的所有流量均會納入相同的增長速率限制計算之中。

如 Enterprise 客戶有任何疑問或疑慮，請與你的客戶經理聯絡。

優先處理 SLA 與規模層級 SLA 相同；如果我們在指定時間內未能達到企業版客戶協議所列的 SLA，客戶將獲發服務積分作為補償。

API 客戶專享優先處理服務

運作方式

限制

收費

（對於 Enterprise 客戶）優先處理服務會如何影響規模層級？

（對於 Enterprise 客戶）超出規模層級的流量可否自動傳送至優先處理程序？

（對於 Enterprise 客戶）我的年費訂閱是否只限使用特定處理模式？

我是否仍會就快取的輸入 Token 獲得折扣？

如何查看優先處理服務用量及開支？

模型

優先處理程序是否適用於長上下文、微調模型、内嵌等功能？

其他模態如何與優先處理程序配合使用？

優先處理服務是否支援未來的模型？

速率限制

優先處理服務的速率限制如何？

優先處理服務的增長速率限制如何？

增長速率限制是否由我的所有項目及組織共用？

可靠性

（對於 Enterprise 客戶）如果優先處理服務的延遲情況超出預期，該怎麼辦？

政策

優先處理程序是否與資料駐留服務相容？

優先處理程序是否與零資料保留 (ZDR) 及業務合作協議 (BAA) 相容？