Bỏ qua nội dung chính
OpenAI

Scale Tier cho khách hàng API

Ưu đãi này dành cho khách hàng doanh nghiệp. Vui lòng liên hệ đội ngũ bán hàng của chúng tôi⁠ để tìm hiểu thêm. Để tiếp cận các lợi ích cao cấp tương tự về độ trễ và độ tin cậy theo mô hình linh hoạt, thanh toán theo mức sử dụng, hãy xem Gói xử lý ưu tiên.

Cấp năng lực xử lý cho phép bạn mua trước một số lượng token đầu vào và đầu ra API nhất định mỗi phút (được gọi là “đơn vị token”) để truy cập vào một ảnh chụp nhanh mô hình cụ thể. Mỗi đơn vị token được mua trong thời gian tối thiểu 30 ngày. Có thể thêm các mô hình khác tùy theo sở thích của khách hàng.

Khi lựa chọn Scale Tier, bạn có thể được hưởng những lợi ích sau:

  • Độ trễ có thể dự đoán được: Scale Tier được thiết kế để tạo mã thông báo nhanh hơn và với tốc độ nhất quán hơn so với dịch vụ trả theo thời gian sử dụng (PAYG), ngay cả khi nhu cầu cao điểm.
  • Mở rộng không giới hạn: Mọi lượt mua hạn mức với Cấp năng lực xử lý sẽ tự động được cộng vào giới hạn tốc độ của bạn, giúp bạn tự tin mở rộng hơn nữa. 
  • Độ tin cậy cao hơn: Lưu lượng Cấp năng lực xử lý cung cấp SLA thời gian hoạt động 99,9% và khả năng tính toán ưu tiên.
Gói đầu vàoGói đầu raSLA thời gian hoạt độngSLA độ trễ
GPT-5.550.000 TPM
750,00 US$ mỗi đơn vị/ngày
Không áp dụng399,9%99% > 100 token mỗi giây2
GPT-5.4 mini50.000 TPM
100,00 US$ mỗi đơn vị/ngày
Không áp dụng399,9%99% > 100 token mỗi giây2
GPT-5.4
không bao gồm ngữ cảnh dài4
50.000 TPM
300,00 US$ mỗi đơn vị/ngày
Không áp dụng399,9%99% > 50 token mỗi giây2
GPT-5.225.000 TPM
105,00 US$ mỗi đơn vị/ngày
2.500 TPM
84,00 US$ mỗi đơn vị/ngày
99,9%99% > 50 token mỗi giây2
GPT-5.125.000 TPM
75,00 US$ mỗi đơn vị/ngày
2.500 TPM
60,00 US$ mỗi đơn vị/ngày
99,9%99% > 50 token mỗi giây2
GPT-525.000 TPM
75,00 US$ mỗi đơn vị/ngày
2.500 TPM
60,00 US$ mỗi đơn vị/ngày
99,9%99% > 50 token mỗi giây2
GPT-5 mini500.000 TPM
275,00 US$ mỗi đơn vị/ngày
50.000 TPM
220,00 US$ mỗi đơn vị/ngày
99,9%99% > 80 token mỗi giây2
GPT-4.1
không bao gồm ngữ cảnh dài1
30.000 TPM
110,00 US$ mỗi đơn vị/ngày
2.500 TPM
36,00 US$ mỗi đơn vị/ngày
99,9%99% > 80 token mỗi giây2
GPT-4.1 mini
không bao gồm ngữ cảnh dài1
500.000 TPM
450,00 US$ mỗi đơn vị/ngày
50.000 TPM
175,00 US$ mỗi đơn vị/ngày
99,9%99% > 90 token mỗi giây2
GPT-4.1 nano
không bao gồm ngữ cảnh dài1
500.000 TPM
110,00 US$ mỗi đơn vị/ngày
50.000 TPM
40,00 US$ mỗi đơn vị/ngày
99,9%99% > 100 token mỗi giây2
GPT-4.1 fine tuning30.000 TPM
165,00 US$ mỗi đơn vị/ngày
2.500 TPM
36,00 US$ mỗi đơn vị/ngày
99,9%99% > 80 token mỗi giây2
GPT-4.1 mini fine tuning500.000 TPM
900,00 US$ mỗi đơn vị/ngày
50.000 TPM
175,00 US$ mỗi đơn vị/ngày
99,9%99% > 90 token mỗi giây2
o325.000 TPM
75,00 US$ mỗi đơn vị/ngày
5.000 TPM
60,00 US$ mỗi đơn vị/ngày
99,9%99% > 80 token mỗi giây2
o4-mini30.000 TPM
50,00 US$ mỗi đơn vị/ngày
5.000 TPM
32,50 US$ mỗi đơn vị/ngày
99,9%99% > 90 token mỗi giây2
GPT-4o30.000 TPM
124,59 US$ mỗi đơn vị/ngày
2.500 TPM
39,34 US$ mỗi đơn vị/ngày
99,9%99% > 80 token mỗi giây2
GPT-4o mini500.000 TPM
114,75 US$ mỗi đơn vị/ngày
50.000 TPM
49,18 US$ mỗi đơn vị/ngày
99,9%99% > 90 token mỗi giây2
GPT-4o mini fine tuning500.000 TPM
229,50 US$ mỗi đơn vị/ngày
50.000 TPM
98,36 US$ mỗi đơn vị/ngày
99,9%99% > 90 token mỗi giây2
o15.000 TPM
163,93 US$ mỗi đơn vị/ngày
1.000 TPM
131,15 US$ mỗi đơn vị/ngày
99,9%99% > 80 token mỗi giây2
o3-mini30.000 TPM
78,69 US$ mỗi đơn vị/ngày
5.000 TPM
52,46 US$ mỗi đơn vị/ngày
99,9%99% > 90 token mỗi giây2
1Các yêu cầu ước tính ở mức >128.000 token lời nhắc
2Được tính dựa trên độ trễ yêu cầu p50 trên cơ sở mỗi 5 phút. Đối với những khách hàng có thỏa thuận doanh nghiệp sẵn mà các SLA độ trễ được tính toán dựa trên độ trễ yêu cầu p50 trên cơ sở mỗi phút, các SLA trước đó vẫn được áp dụng.
3Với GPT-5.4, Gói Scale Tier được mua dưới dạng một gói gồm các token đầu vào và đầu ra kết hợp mỗi phút. Việc sử dụng token đầu vào, token đầu vào lưu bộ nhớ tạm và token đầu ra sẽ được tính vào gói kết hợp này theo các mức khác nhau. Xem phần Cách thức hoạt động bên dưới.
4Ngữ cảnh dài >272K

Cách thức hoạt động

Với Scale Tier, bạn có thể mua các đơn vị token đầu vào và đầu ra. Ví dụ, với GPT‑4.1, mỗi đơn vị đầu vào có giá 110 đô la/ngày và cho phép bạn sử dụng 30.000 token đầu vào/phút. Mỗi đơn vị đầu ra có giá $36/ngày và cho phép bạn sử dụng 2,5 nghìn token đầu ra/phút. Mỗi đơn vị token được mua trong thời gian tối thiểu 30 ngày.

Bạn có thể tìm hiểu thêm thông tin về cách Scale Tier tương tác với cơ chế Lưu lời nhắc vào bộ nhớ tạm trong phần Câu hỏi thường gặp bên dưới.

Với GPT‑5.4, bạn mua token đầu vào và đầu ra kết hợp mỗi phút. Điều này mang lại cho bạn sự linh hoạt hơn và loại bỏ nhu cầu phải dự đoán tỷ lệ token đầu vào và đầu ra. Khi bạn sử dụng Cấp năng lực xử lý, chúng tôi tính token vào Token kết hợp của bạn như sau:

  • Token đầu vào được tính là 1
  • Các token đầu vào đã lưu vào bộ nhớ tạm tuân theo cơ chế lưu vào bộ nhớ tạm theo từng mô hình như bên dưới trong phần Câu hỏi thường gặp
  • Số lượng token đầu ra được tính dựa trên tỷ lệ giá PayG giữa token đầu ra và token đầu vào của mô hình. Ví dụ, với GPT‑5.4, một token đầu ra được tính là 6.
Token mỗi phútTPMThanh toán các token đã sử dụng19 token/s99,5%Dùng đến đâu trả đến đóĐộ trễ trung bìnhThời gian hoạt độngBậcĐầu vàoĐầu raTrướcThanh toán trước hàng tháng19 token/s25 token/s99,5%99,9%Dùng đến đâu trả đến đóQuy môĐộ trễ trung bìnhThời gian hoạt độngBậcĐầu vào3 đơn vịĐầu ra2 đơn vịSau

Mức giá

Đơn vị token và giới hạn sử dụng

Mô hình

Độ tin cậy

Chính sách