Nivel de capacidad para clientes de la API
Esta oferta está disponible para clientes Enterprise. Contacta con nuestro equipo de ventas para obtener más información. Para acceder a las mismas ventajas prémium de latencia y fiabilidad con una modalidad flexible de pago por uso, consulta procesamiento prioritario.
El nivel de capacidad te permite comprar por adelantado un número determinado de tokens de entrada y salida de API por minuto (conocidos como «unidades de token») para acceder a una instantánea específica de un modelo. Cada token se compra por un mínimo de 30 días. Se pueden añadir modelos adicionales en función del interés de los clientes.
Al elegir nivel de capacidad, podrás desbloquear:
- Latencia predecible: el nivel de capacidad se ha diseñado para generar tokens más rápido y a una velocidad más constante que el servicio de pago por uso (PAYG), incluso durante los picos de demanda.
- Escalado sin límites: cualquier compra de cuota con nivel de capacidad se añade automáticamente a tus límites de velocidad, para que puedas seguir escalando con confianza.
- Mayor fiabilidad: el tráfico del nivel de capacidad ofrece un acuerdo de nivel de servicio del 99,9 % de tiempo de actividad y capacidad de procesamiento prioritaria.
| Paquete de entrada | Paquete de salida | Tiempo de actividad garantizado | Latencia garantizada | |
|---|---|---|---|---|
| GPT-5.5 | 50.000 TPM 750,00 US$ por unidad/día | No disponible3 | 99,9 % | 99 % > 100 tókenes por segundo2 |
| GPT-5.4 mini | 50.000 TPM 100,00 US$ por unidad/día | No disponible3 | 99,9 % | 99 % > 100 tókenes por segundo2 |
GPT-5.4 excluye contexto largo4 | 50.000 TPM 300,00 US$ por unidad/día | No disponible3 | 99,9 % | 99 % > 50 tókenes por segundo2 |
| GPT-5.2 | 25.000 TPM 105,00 US$ por unidad/día | 2500 TPM 84,00 US$ por unidad/día | 99,9 % | 99 % > 50 tókenes por segundo2 |
| GPT-5.1 | 25.000 TPM 75,00 US$ por unidad/día | 2500 TPM 60,00 US$ por unidad/día | 99,9 % | 99 % > 50 tókenes por segundo2 |
| GPT-5 | 25.000 TPM 75,00 US$ por unidad/día | 2500 TPM 60,00 US$ por unidad/día | 99,9 % | 99 % > 50 tókenes por segundo2 |
| GPT-5 mini | 500.000 TPM 275,00 US$ por unidad/día | 50.000 TPM 220,00 US$ por unidad/día | 99,9 % | 99 % > 80 tókenes por segundo2 |
GPT-4.1 excluye contexto largo1 | 30 000 TPM 110,00 US$ por unidad/día | 2500 TPM 36,00 US$ por unidad/día | 99,9 % | 99 % > 80 tókenes por segundo2 |
GPT-4.1 mini excluye contexto largo1 | 500 000 TPM 450,00 US$ por unidad/día | 50 000 TPM 175,00 US$ por unidad/día | 99,9 % | 99 % > 90 tókenes por segundo2 |
GPT-4.1 nano excluye contexto largo1 | 500 000 TPM 110,00 US$ por unidad/día | 50 000 TPM 40,00 US$ por unidad/día | 99,9 % | 99 % > 100 tókenes por segundo2 |
| GPT-4.1 fine tuning | 30 000 TPM 165,00 US$ por unidad/día | 2500 TPM 36,00 US$ por unidad/día | 99,9 % | 99 % > 80 tókenes por segundo2 |
| GPT-4.1 mini fine tuning | 500 000 TPM 900,00 US$ por unidad/día | 50 000 TPM 175,00 US$ por unidad/día | 99,9 % | 99 % > 90 tókenes por segundo2 |
| o3 | 25.000 TPM 75,00 US$ por unidad/día | 5000 TPM 60,00 US$ por unidad/día | 99,9 % | 99 % > 80 tókenes por segundo2 |
| o4-mini | 30.000 TPM 50,00 US$ por unidad/día | 5000 TPM 32,50 US$ por unidad/día | 99,9 % | 99 % > 90 tókenes por segundo2 |
| GPT-4o | 30 000 TPM 124,59 US$ por unidad/día | 2500 TPM 39,34 US$ por unidad/día | 99,9 % | 99 % > 80 tókenes por segundo2 |
| GPT-4o mini | 500 000 TPM 114,75 US$ por unidad/día | 50 000 TPM 49,18 US$ por unidad/día | 99,9 % | 99 % > 90 tókenes por segundo2 |
| GPT-4o mini fine tuning | 500 000 TPM 229,50 US$ por unidad/día | 50 000 TPM 98,36 US$ por unidad/día | 99,9 % | 99 % > 90 tókenes por segundo2 |
| o1 | 5000 TPM 163,93 US$ por unidad/día | 1000 TPM 131,15 US$ por unidad/día | 99,9 % | 99 % > 80 tókenes por segundo2 |
| o3-mini | 30.000 TPM 78,69 US$ por unidad/día | 5000 TPM 52,46 US$ por unidad/día | 99,9 % | 99 % > 90 tókenes por segundo2 |
Cómo funciona
Con nivel de capacidad, puedes comprar unidades de token de entrada y de salida. Por ejemplo, con GPT‑4.1 cada unidad de entrada cuesta 110 USD por día y te da derecho a 30 000 token de entrada por minuto. Cada unidad de salida cuesta 36 USD por día y te da derecho a 2500 tokens de salida por minuto. Cada token se compra por un mínimo de 30 días.
En la sección de preguntas frecuentes que aparece más abajo, encontrarás más información sobre cómo el nivel de capacidad interactúa con Prompt Caching.
Con GPT‑5.4 compras token de entrada y salida combinados por minuto. Esto te proporciona más flexibilidad y elimina la necesidad de predecir la proporción de token de entrada y salida. A medida que usas el nivel de capacidad, contabilizamos el token en tus tokens combinados de la siguiente manera:
- Los tokens de entrada cuentan como 1
- Los tokens de entrada en caché siguen el almacenamiento en caché por modelo, como se indica a continuación en la sección de preguntas frecuentes.
- Cantidad de token de salida basada en la relación de precio de PayG de los tokens de salida con respecto a los tokens de entrada para el modelo. Por ejemplo, con GPT‑5.4 un token de salida equivale a 6.


