API 고객용 스케일 등급
이 서비스는 엔터프라이즈 고객에게 제공됩니다. 자세히 알아보려면 영업팀에 문의하세요. 동일한 프리미엄 지연 시간 및 안정성 혜택을 사용한 만큼 결제하는 유연하게 결제하려면 우선 처리를 참조하세요.
스케일 등급을 사용하면 특정 모델 스냅샷에서 사용할 API 입력 및 출력 토큰을 분당 일정량('토큰 유닛') 기준으로 미리 구매할 수 있습니다. 각 토큰 유닛은 최소 30일 단위로 구매해야 합니다. 고객 수요에 따라 추가 모델이 제공될 수 있습니다.
스케일 등급을 선택하면 다음과 같은 이점을 누릴 수 있습니다.
- 예측 가능한 지연 시간: 스케일 등급은 피크 시간대에도 종량제 서비스보다 더 빠르고 안정적인 속도로 토큰을 생성하도록 설계되었습니다.
- 제한 없는 확장성: 스케일 등급으로 구매한 모든 할당량은 사용 한도에 자동으로 추가되기 때문에 더 큰 규모로 안정적으로 확장할 수 있습니다.
- 더 높은 안정성: 스케일 등급 트래픽은 99.9% 가동 시간 SLA와 우선 처리되는 컴퓨팅 리소스를 제공합니다.
| 입력 번들 | 출력 번들 | 가동 시간 SLA | 레이턴시 SLA | |
|---|---|---|---|---|
| GPT-5.5 | 50,000 TPM 단위당 1일 US$750.00 | 해당 없음3 | 99.9% | 99% > 100 개의 토큰/초2 |
| GPT-5.4 mini | 50,000 TPM 단위당 1일 US$100.00 | 해당 없음3 | 99.9% | 99% > 100 개의 토큰/초2 |
GPT-5.4 긴 컨텍스트 제외4 | 50,000 TPM 단위당 1일 US$300.00 | 해당 없음3 | 99.9% | 99% > 50 개의 토큰/초2 |
| GPT-5.2 | 25,000 TPM 단위당 1일 US$105.00 | 2,500 TPM 단위당 1일 US$84.00 | 99.9% | 99% > 50 개의 토큰/초2 |
| GPT-5.1 | 25,000 TPM 단위당 1일 US$75.00 | 2,500 TPM 단위당 1일 US$60.00 | 99.9% | 99% > 50 개의 토큰/초2 |
| GPT-5 | 25,000 TPM 단위당 1일 US$75.00 | 2,500 TPM 단위당 1일 US$60.00 | 99.9% | 99% > 50 개의 토큰/초2 |
| GPT-5 mini | 500,000 TPM 단위당 1일 US$275.00 | 50,000 TPM 단위당 1일 US$220.00 | 99.9% | 99% > 80 개의 토큰/초2 |
GPT-4.1 Long-Context 제외1 | 30,000 TPM 단위당 1일 US$110.00 | 2,500 TPM 단위당 1일 US$36.00 | 99.9% | 99% > 80 개의 토큰/초2 |
GPT-4.1 mini Long-Context 제외1 | 500,000 TPM 단위당 1일 US$450.00 | 50,000 TPM 단위당 1일 US$175.00 | 99.9% | 99% > 90 개의 토큰/초2 |
GPT-4.1 nano Long-Context 제외1 | 500,000 TPM 단위당 1일 US$110.00 | 50,000 TPM 단위당 1일 US$40.00 | 99.9% | 99% > 100 개의 토큰/초2 |
| GPT-4.1 fine tuning | 30,000 TPM 단위당 1일 US$165.00 | 2,500 TPM 단위당 1일 US$36.00 | 99.9% | 99% > 80 개의 토큰/초2 |
| GPT-4.1 mini fine tuning | 500,000 TPM 단위당 1일 US$900.00 | 50,000 TPM 단위당 1일 US$175.00 | 99.9% | 99% > 90 개의 토큰/초2 |
| o3 | 25,000 TPM 단위당 1일 US$75.00 | 5,000 TPM 단위당 1일 US$60.00 | 99.9% | 99% > 80 개의 토큰/초2 |
| o4-mini | 30,000 TPM 단위당 1일 US$50.00 | 5,000 TPM 단위당 1일 US$32.50 | 99.9% | 99% > 90 개의 토큰/초2 |
| GPT-4o | 30,000 TPM 단위당 1일 US$124.59 | 2,500 TPM 단위당 1일 US$39.34 | 99.9% | 99% > 80 개의 토큰/초2 |
| GPT-4o mini | 500,000 TPM 단위당 1일 US$114.75 | 50,000 TPM 단위당 1일 US$49.18 | 99.9% | 99% > 90 개의 토큰/초2 |
| GPT-4o mini fine tuning | 500,000 TPM 단위당 1일 US$229.50 | 50,000 TPM 단위당 1일 US$98.36 | 99.9% | 99% > 90 개의 토큰/초2 |
| o1 | 5,000 TPM 단위당 1일 US$163.93 | 1,000 TPM 단위당 1일 US$131.15 | 99.9% | 99% > 80 개의 토큰/초2 |
| o3-mini | 30,000 TPM 단위당 1일 US$78.69 | 5,000 TPM 단위당 1일 US$52.46 | 99.9% | 99% > 90 개의 토큰/초2 |
작동 방식
스케일 등급으로 입력 토큰 유닛과 출력 토큰 유닛을 각각 구매할 수 있습니다. 예를 들어 GPT‑4.1의 경우 입력 유닛 가격은 하루 110달러이며 분당 30,000개의 입력 토큰을 사용할 수 있습니다. 출력 유닛은 하루 36달러이며 분당 2,500개의 출력 토큰을 사용할 수 있습니다. 각 토큰 유닛은 최소 30일 단위로 구매해야 합니다.
스케일 등급과 프롬프트 캐싱이 함께 적용되는 방식은 아래 FAQ를 통해 자세히 확인할 수 있습니다.
GPT‑5.4에서는 입력 토큰과 출력 토큰을 따로 구매하는 대신, 분당 통합 입력·출력 토큰을 구매합니다. 이를 통해 입력 토큰과 출력 토큰의 비율을 미리 예측할 필요 없이 더 유연하게 사용할 수 있습니다. 스케일 등급을 사용할 때는 통합 토큰 한도에서 다음과 같은 기준으로 토큰이 차감됩니다.
- 입력 토큰 1개는 통합 토큰 1로 계산됩니다.
- 캐시된 입력 토큰은 아래 FAQ에 안내된 모델별 캐싱 기준에 따라 계산됩니다.
- 출력 토큰은 해당 모델의 종량제 기준에서 출력 토큰과 입력 토큰의 가격 비율에 따라 계산됩니다. 예를 들어 GPT‑5.4에서는 출력 토큰 1개가 통합 토큰 6개로 계산됩니다.


