Scale Tier cho khách hàng API
Ưu đãi này dành cho khách hàng doanh nghiệp. Vui lòng liên hệ đội ngũ bán hàng của chúng tôi để tìm hiểu thêm. Để tiếp cận các lợi ích cao cấp tương tự về độ trễ và độ tin cậy theo mô hình linh hoạt, thanh toán theo mức sử dụng, hãy xem Gói xử lý ưu tiên.
Cấp năng lực xử lý cho phép bạn mua trước một số lượng token đầu vào và đầu ra API nhất định mỗi phút (được gọi là “đơn vị token”) để truy cập vào một ảnh chụp nhanh mô hình cụ thể. Mỗi đơn vị token được mua trong thời gian tối thiểu 30 ngày. Có thể thêm các mô hình khác tùy theo sở thích của khách hàng.
Khi lựa chọn Scale Tier, bạn có thể được hưởng những lợi ích sau:
- Độ trễ có thể dự đoán được: Scale Tier được thiết kế để tạo mã thông báo nhanh hơn và với tốc độ nhất quán hơn so với dịch vụ trả theo thời gian sử dụng (PAYG), ngay cả khi nhu cầu cao điểm.
- Mở rộng không giới hạn: Mọi lượt mua hạn mức với Cấp năng lực xử lý sẽ tự động được cộng vào giới hạn tốc độ của bạn, giúp bạn tự tin mở rộng hơn nữa.
- Độ tin cậy cao hơn: Lưu lượng Cấp năng lực xử lý cung cấp SLA thời gian hoạt động 99,9% và khả năng tính toán ưu tiên.
| Gói đầu vào | Gói đầu ra | SLA thời gian hoạt động | SLA độ trễ | |
|---|---|---|---|---|
| GPT-5.5 | 50.000 TPM 750,00 US$ mỗi đơn vị/ngày | Không áp dụng3 | 99,9% | 99% > 100 token mỗi giây2 |
| GPT-5.4 mini | 50.000 TPM 100,00 US$ mỗi đơn vị/ngày | Không áp dụng3 | 99,9% | 99% > 100 token mỗi giây2 |
GPT-5.4 không bao gồm ngữ cảnh dài4 | 50.000 TPM 300,00 US$ mỗi đơn vị/ngày | Không áp dụng3 | 99,9% | 99% > 50 token mỗi giây2 |
| GPT-5.2 | 25.000 TPM 105,00 US$ mỗi đơn vị/ngày | 2.500 TPM 84,00 US$ mỗi đơn vị/ngày | 99,9% | 99% > 50 token mỗi giây2 |
| GPT-5.1 | 25.000 TPM 75,00 US$ mỗi đơn vị/ngày | 2.500 TPM 60,00 US$ mỗi đơn vị/ngày | 99,9% | 99% > 50 token mỗi giây2 |
| GPT-5 | 25.000 TPM 75,00 US$ mỗi đơn vị/ngày | 2.500 TPM 60,00 US$ mỗi đơn vị/ngày | 99,9% | 99% > 50 token mỗi giây2 |
| GPT-5 mini | 500.000 TPM 275,00 US$ mỗi đơn vị/ngày | 50.000 TPM 220,00 US$ mỗi đơn vị/ngày | 99,9% | 99% > 80 token mỗi giây2 |
GPT-4.1 không bao gồm ngữ cảnh dài1 | 30.000 TPM 110,00 US$ mỗi đơn vị/ngày | 2.500 TPM 36,00 US$ mỗi đơn vị/ngày | 99,9% | 99% > 80 token mỗi giây2 |
GPT-4.1 mini không bao gồm ngữ cảnh dài1 | 500.000 TPM 450,00 US$ mỗi đơn vị/ngày | 50.000 TPM 175,00 US$ mỗi đơn vị/ngày | 99,9% | 99% > 90 token mỗi giây2 |
GPT-4.1 nano không bao gồm ngữ cảnh dài1 | 500.000 TPM 110,00 US$ mỗi đơn vị/ngày | 50.000 TPM 40,00 US$ mỗi đơn vị/ngày | 99,9% | 99% > 100 token mỗi giây2 |
| GPT-4.1 fine tuning | 30.000 TPM 165,00 US$ mỗi đơn vị/ngày | 2.500 TPM 36,00 US$ mỗi đơn vị/ngày | 99,9% | 99% > 80 token mỗi giây2 |
| GPT-4.1 mini fine tuning | 500.000 TPM 900,00 US$ mỗi đơn vị/ngày | 50.000 TPM 175,00 US$ mỗi đơn vị/ngày | 99,9% | 99% > 90 token mỗi giây2 |
| o3 | 25.000 TPM 75,00 US$ mỗi đơn vị/ngày | 5.000 TPM 60,00 US$ mỗi đơn vị/ngày | 99,9% | 99% > 80 token mỗi giây2 |
| o4-mini | 30.000 TPM 50,00 US$ mỗi đơn vị/ngày | 5.000 TPM 32,50 US$ mỗi đơn vị/ngày | 99,9% | 99% > 90 token mỗi giây2 |
| GPT-4o | 30.000 TPM 124,59 US$ mỗi đơn vị/ngày | 2.500 TPM 39,34 US$ mỗi đơn vị/ngày | 99,9% | 99% > 80 token mỗi giây2 |
| GPT-4o mini | 500.000 TPM 114,75 US$ mỗi đơn vị/ngày | 50.000 TPM 49,18 US$ mỗi đơn vị/ngày | 99,9% | 99% > 90 token mỗi giây2 |
| GPT-4o mini fine tuning | 500.000 TPM 229,50 US$ mỗi đơn vị/ngày | 50.000 TPM 98,36 US$ mỗi đơn vị/ngày | 99,9% | 99% > 90 token mỗi giây2 |
| o1 | 5.000 TPM 163,93 US$ mỗi đơn vị/ngày | 1.000 TPM 131,15 US$ mỗi đơn vị/ngày | 99,9% | 99% > 80 token mỗi giây2 |
| o3-mini | 30.000 TPM 78,69 US$ mỗi đơn vị/ngày | 5.000 TPM 52,46 US$ mỗi đơn vị/ngày | 99,9% | 99% > 90 token mỗi giây2 |
Cách thức hoạt động
Với Scale Tier, bạn có thể mua các đơn vị token đầu vào và đầu ra. Ví dụ, với GPT‑4.1, mỗi đơn vị đầu vào có giá 110 đô la/ngày và cho phép bạn sử dụng 30.000 token đầu vào/phút. Mỗi đơn vị đầu ra có giá $36/ngày và cho phép bạn sử dụng 2,5 nghìn token đầu ra/phút. Mỗi đơn vị token được mua trong thời gian tối thiểu 30 ngày.
Bạn có thể tìm hiểu thêm thông tin về cách Scale Tier tương tác với cơ chế Lưu lời nhắc vào bộ nhớ tạm trong phần Câu hỏi thường gặp bên dưới.
Với GPT‑5.4, bạn mua token đầu vào và đầu ra kết hợp mỗi phút. Điều này mang lại cho bạn sự linh hoạt hơn và loại bỏ nhu cầu phải dự đoán tỷ lệ token đầu vào và đầu ra. Khi bạn sử dụng Cấp năng lực xử lý, chúng tôi tính token vào Token kết hợp của bạn như sau:
- Token đầu vào được tính là 1
- Các token đầu vào đã lưu vào bộ nhớ tạm tuân theo cơ chế lưu vào bộ nhớ tạm theo từng mô hình như bên dưới trong phần Câu hỏi thường gặp
- Số lượng token đầu ra được tính dựa trên tỷ lệ giá PayG giữa token đầu ra và token đầu vào của mô hình. Ví dụ, với GPT‑5.4, một token đầu ra được tính là 6.


