메인 콘텐츠로 건너뛰기
OpenAI

API 고객용 스케일 등급

이 서비스는 엔터프라이즈 고객에게 제공됩니다. 자세히 알아보려면 영업팀에 문의하세요. 동일한 프리미엄 지연 시간 및 안정성 혜택을 사용한 만큼 결제하는 유연하게 결제하려면 우선 처리를 참조하세요.

스케일 등급을 사용하면 특정 모델 스냅샷에서 사용할 API 입력 및 출력 토큰을 분당 일정량('토큰 유닛') 기준으로 미리 구매할 수 있습니다. 각 토큰 유닛은 최소 30일 단위로 구매해야 합니다. 고객 수요에 따라 추가 모델이 제공될 수 있습니다.

스케일 등급을 선택하면 다음과 같은 이점을 누릴 수 있습니다.

  • 예측 가능한 지연 시간: 스케일 등급은 피크 시간대에도 종량제 서비스보다 더 빠르고 안정적인 속도로 토큰을 생성하도록 설계되었습니다.
  • 제한 없는 확장성: 스케일 등급으로 구매한 모든 할당량은 사용 한도에 자동으로 추가되기 때문에 더 큰 규모로 안정적으로 확장할 수 있습니다. 
  • 더 높은 안정성: 스케일 등급 트래픽은 99.9% 가동 시간 SLA와 우선 처리되는 컴퓨팅 리소스를 제공합니다.
입력 번들출력 번들가동 시간 SLA레이턴시 SLA
GPT-5.550,000 TPM
단위당 1일 US$750.00
해당 없음399.9%99% > 100 개의 토큰/초2
GPT-5.4 mini50,000 TPM
단위당 1일 US$100.00
해당 없음399.9%99% > 100 개의 토큰/초2
GPT-5.4
긴 컨텍스트 제외4
50,000 TPM
단위당 1일 US$300.00
해당 없음399.9%99% > 50 개의 토큰/초2
GPT-5.225,000 TPM
단위당 1일 US$105.00
2,500 TPM
단위당 1일 US$84.00
99.9%99% > 50 개의 토큰/초2
GPT-5.125,000 TPM
단위당 1일 US$75.00
2,500 TPM
단위당 1일 US$60.00
99.9%99% > 50 개의 토큰/초2
GPT-525,000 TPM
단위당 1일 US$75.00
2,500 TPM
단위당 1일 US$60.00
99.9%99% > 50 개의 토큰/초2
GPT-5 mini500,000 TPM
단위당 1일 US$275.00
50,000 TPM
단위당 1일 US$220.00
99.9%99% > 80 개의 토큰/초2
GPT-4.1
Long-Context 제외1
30,000 TPM
단위당 1일 US$110.00
2,500 TPM
단위당 1일 US$36.00
99.9%99% > 80 개의 토큰/초2
GPT-4.1 mini
Long-Context 제외1
500,000 TPM
단위당 1일 US$450.00
50,000 TPM
단위당 1일 US$175.00
99.9%99% > 90 개의 토큰/초2
GPT-4.1 nano
Long-Context 제외1
500,000 TPM
단위당 1일 US$110.00
50,000 TPM
단위당 1일 US$40.00
99.9%99% > 100 개의 토큰/초2
GPT-4.1 fine tuning30,000 TPM
단위당 1일 US$165.00
2,500 TPM
단위당 1일 US$36.00
99.9%99% > 80 개의 토큰/초2
GPT-4.1 mini fine tuning500,000 TPM
단위당 1일 US$900.00
50,000 TPM
단위당 1일 US$175.00
99.9%99% > 90 개의 토큰/초2
o325,000 TPM
단위당 1일 US$75.00
5,000 TPM
단위당 1일 US$60.00
99.9%99% > 80 개의 토큰/초2
o4-mini30,000 TPM
단위당 1일 US$50.00
5,000 TPM
단위당 1일 US$32.50
99.9%99% > 90 개의 토큰/초2
GPT-4o30,000 TPM
단위당 1일 US$124.59
2,500 TPM
단위당 1일 US$39.34
99.9%99% > 80 개의 토큰/초2
GPT-4o mini500,000 TPM
단위당 1일 US$114.75
50,000 TPM
단위당 1일 US$49.18
99.9%99% > 90 개의 토큰/초2
GPT-4o mini fine tuning500,000 TPM
단위당 1일 US$229.50
50,000 TPM
단위당 1일 US$98.36
99.9%99% > 90 개의 토큰/초2
o15,000 TPM
단위당 1일 US$163.93
1,000 TPM
단위당 1일 US$131.15
99.9%99% > 80 개의 토큰/초2
o3-mini30,000 TPM
단위당 1일 US$78.69
5,000 TPM
단위당 1일 US$52.46
99.9%99% > 90 개의 토큰/초2
1프롬프트 토큰 12만 8,000개 초과 시 예상 요청 수
25분마다 p50 요청 레이턴시로 계산됩니다. 기존 엔터프라이즈 계약에 1분마다 p50 요청 레이턴시로 계산되는 레이턴시 SLA가 포함된 고객은 기존의 SLA 역시 계속 적용됩니다.
3GPT-5.4에서 Scale 티어는 분당 입력 토큰과 출력 토큰을 결합한 번들 형태로 구매됩니다. 입력 토큰, 캐시된 입력 토큰, 출력 토큰의 사용량은 서로 다른 비율로 이 결합 번들에서 차감됩니다. 자세한 내용은 아래의 작동 방식 섹션을 참고하세요.
4긴 컨텍스트: 272,000자 초과

작동 방식

스케일 등급으로 입력 토큰 유닛과 출력 토큰 유닛을 각각 구매할 수 있습니다. 예를 들어 GPT‑4.1의 경우 입력 유닛 가격은 하루 110달러이며 분당 30,000개의 입력 토큰을 사용할 수 있습니다. 출력 유닛은 하루 36달러이며 분당 2,500개의 출력 토큰을 사용할 수 있습니다. 각 토큰 유닛은 최소 30일 단위로 구매해야 합니다.

스케일 등급과 프롬프트 캐싱이 함께 적용되는 방식은 아래 FAQ를 통해 자세히 확인할 수 있습니다.

GPT‑5.4에서는 입력 토큰과 출력 토큰을 따로 구매하는 대신, 분당 통합 입력·출력 토큰을 구매합니다. 이를 통해 입력 토큰과 출력 토큰의 비율을 미리 예측할 필요 없이 더 유연하게 사용할 수 있습니다. 스케일 등급을 사용할 때는 통합 토큰 한도에서 다음과 같은 기준으로 토큰이 차감됩니다.

  • 입력 토큰 1개는 통합 토큰 1로 계산됩니다.
  • 캐시된 입력 토큰은 아래 FAQ에 안내된 모델별 캐싱 기준에 따라 계산됩니다.
  • 출력 토큰은 해당 모델의 종량제 기준에서 출력 토큰과 입력 토큰의 가격 비율에 따라 계산됩니다. 예를 들어 GPT‑5.4에서는 출력 토큰 1개가 통합 토큰 6개로 계산됩니다.
분당 토큰 수TPM사용한 토큰만큼 지불19tok/s99.5%선불 요금평균 레이턴시가동 시간단계입력출력매월 선불 결제19tok/s25tok/s99.5%99.9%선불 요금규모평균 레이턴시가동 시간단계입력3유닛출력2유닛

가격

토큰 유닛 및 요청 한도

모델

신뢰성

정책