Nivel de capacidad para clientes de la API
Esta oferta está disponible para clientes Enterprise. Comunícate con nuestro equipo de ventas para obtener más información. Para acceder a las mismas ventajas prémium de latencia y fiabilidad con una modalidad flexible de pago por uso, consulta procesamiento prioritario.
El nivel de capacidad te permite comprar por adelantado un número determinado de tokens de entrada y salida de API por minuto (conocidos como “unidades de token”) para acceder a una instantánea específica de un modelo. Cada token se compra por un mínimo de 30 días. Se pueden añadir modelos adicionales en función del interés de los clientes.
Al elegir nivel de capacidad, podrás desbloquear:
- Latencia predecible: el nivel de capacidad se ha diseñado para generar tokens más rápido y a una velocidad más constante que el servicio de pago por uso (PAYG), incluso durante los picos de demanda.
- Escala sin límite: cualquier compra de cuota con nivel de capacidad se añade automáticamente a tus límites de velocidad, para que puedas seguir escalando con confianza.
- Mayor fiabilidad: el tráfico del nivel de capacidad ofrece un acuerdo de nivel de servicio del 99.9 % de tiempo de actividad y capacidad de procesamiento prioritaria.
| Paquete de entrada | Paquete de salida | Tiempo en funcionamiento garantizado | Latencia garantizada | |
|---|---|---|---|---|
| GPT-5.5 | 50,000 TPM USD 750.00 por unidad/día | N/A3 | 99.9% | 99% > 100 tokens por segundo 2 |
| GPT-5.4 mini | 50,000 TPM USD 100.00 por unidad/día | N/A3 | 99.9% | 99% > 100 tokens por segundo 2 |
GPT-5.4 excluye el contexto largo4 | 50,000 TPM USD 300.00 por unidad/día | N/A3 | 99.9% | 99% > 50 tokens por segundo 2 |
| GPT-5.2 | 25,000 TPM USD 105.00 por unidad/día | 2,500 TPM USD 84.00 por unidad/día | 99.9% | 99% > 50 tokens por segundo 2 |
| GPT-5.1 | 25,000 TPM USD 75.00 por unidad/día | 2,500 TPM USD 60.00 por unidad/día | 99.9% | 99% > 50 tokens por segundo 2 |
| GPT-5 | 25,000 TPM USD 75.00 por unidad/día | 2,500 TPM USD 60.00 por unidad/día | 99.9% | 99% > 50 tokens por segundo 2 |
| GPT-5 mini | 500,000 TPM USD 275.00 por unidad/día | 50,000 TPM USD 220.00 por unidad/día | 99.9% | 99% > 80 tokens por segundo 2 |
GPT-4.1 excluye el contexto extenso1 | 30 000 tokens por minuto USD 110.00 por unidad/día | 2,500 tokens por minuto USD 36.00 por unidad/día | 99.9% | 99% > 80 tokens por segundo 2 |
GPT-4.1 mini excluye el contexto extenso1 | 500 000 tokens por minuto USD 450.00 por unidad/día | 50 000 tokens por minuto USD 175.00 por unidad/día | 99.9% | 99% > 90 tokens por segundo 2 |
GPT-4.1 nano excluye el contexto extenso1 | 500 000 tokens por minuto USD 110.00 por unidad/día | 50 000 tokens por minuto USD 40.00 por unidad/día | 99.9% | 99% > 100 tokens por segundo 2 |
| GPT-4.1 fine tuning | 30 000 tokens por minuto USD 165.00 por unidad/día | 2,500 tokens por minuto USD 36.00 por unidad/día | 99.9% | 99% > 80 tokens por segundo 2 |
| GPT-4.1 mini fine tuning | 500 000 tokens por minuto USD 900.00 por unidad/día | 50 000 tokens por minuto USD 175.00 por unidad/día | 99.9% | 99% > 90 tokens por segundo 2 |
| o3 | 25,000 TPM USD 75.00 por unidad/día | 5,000 TPM USD 60.00 por unidad/día | 99.9% | 99% > 80 tokens por segundo 2 |
| o4-mini | 30,000 TPM USD 50.00 por unidad/día | 5,000 TPM USD 32.50 por unidad/día | 99.9% | 99% > 90 tokens por segundo 2 |
| GPT-4o | 30 000 tokens por minuto USD 124.59 por unidad/día | 2,500 tokens por minuto USD 39.34 por unidad/día | 99.9% | 99% > 80 tokens por segundo 2 |
| GPT-4o mini | 500 000 tokens por minuto USD 114.75 por unidad/día | 50 000 tokens por minuto USD 49.18 por unidad/día | 99.9% | 99% > 90 tokens por segundo 2 |
| GPT-4o mini fine tuning | 500 000 tokens por minuto USD 229.50 por unidad/día | 50 000 tokens por minuto USD 98.36 por unidad/día | 99.9% | 99% > 90 tokens por segundo 2 |
| o1 | 5,000 TPM USD 163.93 por unidad/día | 1,000 TPM USD 131.15 por unidad/día | 99.9% | 99% > 80 tokens por segundo 2 |
| o3-mini | 30,000 TPM USD 78.69 por unidad/día | 5,000 TPM USD 52.46 por unidad/día | 99.9% | 99% > 90 tokens por segundo 2 |
Cómo funciona
Con nivel de capacidad, puedes comprar unidades de token de entrada y de salida. Por ejemplo, con GPT‑4.1 cada unidad de entrada cuesta USD 110 por día y te da derecho a 30 000 token de entrada por minuto. Cada unidad de salida cuesta USD 36 por día y te da derecho a 2500 token de salida por minuto. Cada token se compra por un mínimo de 30 días.
En la sección de preguntas frecuentes que aparece más abajo, encontrarás más información sobre cómo el nivel de capacidad interactúa con Prompt Caching.
Con GPT‑5.4 compras token de entrada y salida combinados por minuto. Esto te proporciona más flexibilidad y elimina la necesidad de predecir la proporción de token de entrada y salida. A medida que usas el nivel de capacidad, contabilizamos el token en tus tokens combinados de la siguiente manera:
- Los token de entrada cuentan como 1
- Los tokens de entrada en caché siguen el almacenamiento en caché por modelo, como se indica a continuación en la sección de preguntas frecuentes.
- Cantidad de token de salida basada en la relación de precio de PayG de los tokens de salida con respecto a los tokens de entrada para el modelo. Por ejemplo, con GPT‑5.4 un token de salida equivale a 6.


