Ir al contenido principal
OpenAI

Nivel de capacidad para clientes de la API

Esta oferta está disponible para clientes Enterprise. Contacta con nuestro equipo de ventas⁠ para obtener más información. Para acceder a las mismas ventajas prémium de latencia y fiabilidad con una modalidad flexible de pago por uso, consulta procesamiento prioritario.

El nivel de capacidad te permite comprar por adelantado un número determinado de tokens de entrada y salida de API por minuto (conocidos como «unidades de token») para acceder a una instantánea específica de un modelo. Cada token se compra por un mínimo de 30 días. Se pueden añadir modelos adicionales en función del interés de los clientes.

Al elegir nivel de capacidad, podrás desbloquear:

  • Latencia predecible: el nivel de capacidad se ha diseñado para generar tokens más rápido y a una velocidad más constante que el servicio de pago por uso (PAYG), incluso durante los picos de demanda.
  • Escalado sin límites: cualquier compra de cuota con nivel de capacidad se añade automáticamente a tus límites de velocidad, para que puedas seguir escalando con confianza. 
  • Mayor fiabilidad: el tráfico del nivel de capacidad ofrece un acuerdo de nivel de servicio del 99,9 % de tiempo de actividad y capacidad de procesamiento prioritaria.
Paquete de entradaPaquete de salidaTiempo de actividad garantizadoLatencia garantizada
GPT-5.550.000 TPM
750,00 US$ por unidad/día
No disponible399,9 %99 % > 100 tókenes por segundo2
GPT-5.4 mini50.000 TPM
100,00 US$ por unidad/día
No disponible399,9 %99 % > 100 tókenes por segundo2
GPT-5.4
excluye contexto largo4
50.000 TPM
300,00 US$ por unidad/día
No disponible399,9 %99 % > 50 tókenes por segundo2
GPT-5.225.000 TPM
105,00 US$ por unidad/día
2500 TPM
84,00 US$ por unidad/día
99,9 %99 % > 50 tókenes por segundo2
GPT-5.125.000 TPM
75,00 US$ por unidad/día
2500 TPM
60,00 US$ por unidad/día
99,9 %99 % > 50 tókenes por segundo2
GPT-525.000 TPM
75,00 US$ por unidad/día
2500 TPM
60,00 US$ por unidad/día
99,9 %99 % > 50 tókenes por segundo2
GPT-5 mini500.000 TPM
275,00 US$ por unidad/día
50.000 TPM
220,00 US$ por unidad/día
99,9 %99 % > 80 tókenes por segundo2
GPT-4.1
excluye contexto largo1
30 000 TPM
110,00 US$ por unidad/día
2500 TPM
36,00 US$ por unidad/día
99,9 %99 % > 80 tókenes por segundo2
GPT-4.1 mini
excluye contexto largo1
500 000 TPM
450,00 US$ por unidad/día
50 000 TPM
175,00 US$ por unidad/día
99,9 %99 % > 90 tókenes por segundo2
GPT-4.1 nano
excluye contexto largo1
500 000 TPM
110,00 US$ por unidad/día
50 000 TPM
40,00 US$ por unidad/día
99,9 %99 % > 100 tókenes por segundo2
GPT-4.1 fine tuning30 000 TPM
165,00 US$ por unidad/día
2500 TPM
36,00 US$ por unidad/día
99,9 %99 % > 80 tókenes por segundo2
GPT-4.1 mini fine tuning500 000 TPM
900,00 US$ por unidad/día
50 000 TPM
175,00 US$ por unidad/día
99,9 %99 % > 90 tókenes por segundo2
o325.000 TPM
75,00 US$ por unidad/día
5000 TPM
60,00 US$ por unidad/día
99,9 %99 % > 80 tókenes por segundo2
o4-mini30.000 TPM
50,00 US$ por unidad/día
5000 TPM
32,50 US$ por unidad/día
99,9 %99 % > 90 tókenes por segundo2
GPT-4o30 000 TPM
124,59 US$ por unidad/día
2500 TPM
39,34 US$ por unidad/día
99,9 %99 % > 80 tókenes por segundo2
GPT-4o mini500 000 TPM
114,75 US$ por unidad/día
50 000 TPM
49,18 US$ por unidad/día
99,9 %99 % > 90 tókenes por segundo2
GPT-4o mini fine tuning500 000 TPM
229,50 US$ por unidad/día
50 000 TPM
98,36 US$ por unidad/día
99,9 %99 % > 90 tókenes por segundo2
o15000 TPM
163,93 US$ por unidad/día
1000 TPM
131,15 US$ por unidad/día
99,9 %99 % > 80 tókenes por segundo2
o3-mini30.000 TPM
78,69 US$ por unidad/día
5000 TPM
52,46 US$ por unidad/día
99,9 %99 % > 90 tókenes por segundo2
1Solicitudes estimadas en >128 000 tókenes de indicación
2Se calcula como latencia p50 de solicitudes en intervalos de 5 minutos. Para los clientes que ya tengan acuerdos empresariales con ANS de latencia p50 de solicitudes por minuto, dichos acuerdos anteriores siguen siendo vigentes.
3Con GPT-5.4, El nivel de escala se adquiere como un paquete de tokens de entrada y salida combinados por minuto. El uso de tokens de entrada, tokens de entrada en caché y tokens de salida se contabiliza en este paquete combinado a diferentes tarifas. Consulta la sección Cómo funciona a continuación.
4El contexto largo supera los 272 000

Cómo funciona

Con nivel de capacidad, puedes comprar unidades de token de entrada y de salida. Por ejemplo, con GPT‑4.1 cada unidad de entrada cuesta 110 USD por día y te da derecho a 30 000 token de entrada por minuto. Cada unidad de salida cuesta 36 USD por día y te da derecho a 2500 tokens de salida por minuto. Cada token se compra por un mínimo de 30 días.

En la sección de preguntas frecuentes que aparece más abajo, encontrarás más información sobre cómo el nivel de capacidad interactúa con Prompt Caching.

Con GPT‑5.4 compras token de entrada y salida combinados por minuto. Esto te proporciona más flexibilidad y elimina la necesidad de predecir la proporción de token de entrada y salida. A medida que usas el nivel de capacidad, contabilizamos el token en tus tokens combinados de la siguiente manera:

  • Los tokens de entrada cuentan como 1
  • Los tokens de entrada en caché siguen el almacenamiento en caché por modelo, como se indica a continuación en la sección de preguntas frecuentes.
  • Cantidad de token de salida basada en la relación de precio de PayG de los tokens de salida con respecto a los tokens de entrada para el modelo. Por ejemplo, con GPT‑5.4 un token de salida equivale a 6.
Tókenes por minutoTPMPago por tókenes usados19 tókenes por segundo99,5 %Pago por usoLatencia mediaTiempo en líneaTierEntradaSalidaAntesPago mensual por adelantado19 tókenes por segundo25 tókenes por segundo99,5 %99,9 %Pago por usoScaleLatencia mediaTiempo en líneaTierEntrada3 unidadesSalida2 unidadesDespués

Precios

Unidades de token y límites

Modelos

Fiabilidad

Políticas