Pasar al contenido principal
OpenAI

Nivel de capacidad para clientes de la API

Esta oferta está disponible para clientes Enterprise. Comunícate con nuestro equipo de ventas⁠ para obtener más información. Para acceder a las mismas ventajas prémium de latencia y fiabilidad con una modalidad flexible de pago por uso, consulta procesamiento prioritario.

El nivel de capacidad te permite comprar por adelantado un número determinado de tokens de entrada y salida de API por minuto (conocidos como “unidades de token”) para acceder a una instantánea específica de un modelo. Cada token se compra por un mínimo de 30 días. Se pueden añadir modelos adicionales en función del interés de los clientes.

Al elegir nivel de capacidad, podrás desbloquear:

  • Latencia predecible: el nivel de capacidad se ha diseñado para generar tokens más rápido y a una velocidad más constante que el servicio de pago por uso (PAYG), incluso durante los picos de demanda.
  • Escala sin límite: cualquier compra de cuota con nivel de capacidad se añade automáticamente a tus límites de velocidad, para que puedas seguir escalando con confianza. 
  • Mayor fiabilidad: el tráfico del nivel de capacidad ofrece un acuerdo de nivel de servicio del 99.9 % de tiempo de actividad y capacidad de procesamiento prioritaria.
Paquete de entradaPaquete de salidaTiempo en funcionamiento garantizadoLatencia garantizada
GPT-5.550,000 TPM
USD 750.00 por unidad/día
N/A399.9%99% > 100 tokens por segundo 2
GPT-5.4 mini50,000 TPM
USD 100.00 por unidad/día
N/A399.9%99% > 100 tokens por segundo 2
GPT-5.4
excluye el contexto largo4
50,000 TPM
USD 300.00 por unidad/día
N/A399.9%99% > 50 tokens por segundo 2
GPT-5.225,000 TPM
USD 105.00 por unidad/día
2,500 TPM
USD 84.00 por unidad/día
99.9%99% > 50 tokens por segundo 2
GPT-5.125,000 TPM
USD 75.00 por unidad/día
2,500 TPM
USD 60.00 por unidad/día
99.9%99% > 50 tokens por segundo 2
GPT-525,000 TPM
USD 75.00 por unidad/día
2,500 TPM
USD 60.00 por unidad/día
99.9%99% > 50 tokens por segundo 2
GPT-5 mini500,000 TPM
USD 275.00 por unidad/día
50,000 TPM
USD 220.00 por unidad/día
99.9%99% > 80 tokens por segundo 2
GPT-4.1
excluye el contexto extenso1
30 000 tokens por minuto
USD 110.00 por unidad/día
2,500 tokens por minuto
USD 36.00 por unidad/día
99.9%99% > 80 tokens por segundo 2
GPT-4.1 mini
excluye el contexto extenso1
500 000 tokens por minuto
USD 450.00 por unidad/día
50 000 tokens por minuto
USD 175.00 por unidad/día
99.9%99% > 90 tokens por segundo 2
GPT-4.1 nano
excluye el contexto extenso1
500 000 tokens por minuto
USD 110.00 por unidad/día
50 000 tokens por minuto
USD 40.00 por unidad/día
99.9%99% > 100 tokens por segundo 2
GPT-4.1 fine tuning30 000 tokens por minuto
USD 165.00 por unidad/día
2,500 tokens por minuto
USD 36.00 por unidad/día
99.9%99% > 80 tokens por segundo 2
GPT-4.1 mini fine tuning500 000 tokens por minuto
USD 900.00 por unidad/día
50 000 tokens por minuto
USD 175.00 por unidad/día
99.9%99% > 90 tokens por segundo 2
o325,000 TPM
USD 75.00 por unidad/día
5,000 TPM
USD 60.00 por unidad/día
99.9%99% > 80 tokens por segundo 2
o4-mini30,000 TPM
USD 50.00 por unidad/día
5,000 TPM
USD 32.50 por unidad/día
99.9%99% > 90 tokens por segundo 2
GPT-4o30 000 tokens por minuto
USD 124.59 por unidad/día
2,500 tokens por minuto
USD 39.34 por unidad/día
99.9%99% > 80 tokens por segundo 2
GPT-4o mini500 000 tokens por minuto
USD 114.75 por unidad/día
50 000 tokens por minuto
USD 49.18 por unidad/día
99.9%99% > 90 tokens por segundo 2
GPT-4o mini fine tuning500 000 tokens por minuto
USD 229.50 por unidad/día
50 000 tokens por minuto
USD 98.36 por unidad/día
99.9%99% > 90 tokens por segundo 2
o15,000 TPM
USD 163.93 por unidad/día
1,000 TPM
USD 131.15 por unidad/día
99.9%99% > 80 tokens por segundo 2
o3-mini30,000 TPM
USD 78.69 por unidad/día
5,000 TPM
USD 52.46 por unidad/día
99.9%99% > 90 tokens por segundo 2
1Solicitudes estimadas en >128 000 tokens de mensaje
2Calculado con la latencia de solicitud p50 en intervalos de 5 minutos. Las garantías de funcionamiento anteriores también siguen siendo aplicables a los clientes con contratos empresariales existentes que tienen acuerdos de latencia calculados según la latencia p50 de las solicitudes en intervalos por minuto.
3Con GPT-5.4, el nivel de escala se compra como un paquete de tokens de entrada y de salida combinados por minuto. El uso de tokens de entrada, tokens de entrada en caché y tokens de salida cuenta para este paquete combinado a diferentes tarifas. Consulta la sección Cómo funciona a continuación.
4El contexto largo es >272 000

Cómo funciona

Con nivel de capacidad, puedes comprar unidades de token de entrada y de salida. Por ejemplo, con GPT‑4.1 cada unidad de entrada cuesta USD 110 por día y te da derecho a 30 000 token de entrada por minuto. Cada unidad de salida cuesta USD 36 por día y te da derecho a 2500 token de salida por minuto. Cada token se compra por un mínimo de 30 días.

En la sección de preguntas frecuentes que aparece más abajo, encontrarás más información sobre cómo el nivel de capacidad interactúa con Prompt Caching.

Con GPT‑5.4 compras token de entrada y salida combinados por minuto. Esto te proporciona más flexibilidad y elimina la necesidad de predecir la proporción de token de entrada y salida. A medida que usas el nivel de capacidad, contabilizamos el token en tus tokens combinados de la siguiente manera:

  • Los token de entrada cuentan como 1
  • Los tokens de entrada en caché siguen el almacenamiento en caché por modelo, como se indica a continuación en la sección de preguntas frecuentes.
  • Cantidad de token de salida basada en la relación de precio de PayG de los tokens de salida con respecto a los tokens de entrada para el modelo. Por ejemplo, con GPT‑5.4 un token de salida equivale a 6.
Tokens por minutoTPMPago por tokens usados19 tokens por segundo99.5%Pago por usoLatencia mediaTiempo en funcionamientoNivelEntradaSalidaAntesPago mensual por adelantado19 tokens por segundo25 tokens por segundo99.5%99.9%Pago por usoEscalaLatencia mediaTiempo en funcionamientoNivelEntrada3 unidadesSalida2 unidadesDespués

Precios

Unidades de token y límites

Modelos

Confiabilidad

Políticas