Pasar al contenido principal
OpenAI

17 de julio de 2025

Programa de recompensas para detectar errores en biología de Agent

Prueba de jailbreaks universales en busca de riesgos biológicos en ChatGPT Agent

Invitación

Como parte de los esfuerzos continuos por mejorar nuestras medidas de protección para las capacidades avanzadas de IA en biología, ya está abierta la convocatoria para participar en el programa de recompensas para detectar errores en biología. Implementamos el modelo ChatGPT Agent y trabajamos activamente para reforzar aún más sus medidas de seguridad, y las de otros modelos. Invitamos a investigadores con experiencia en equipos rojos de IA, seguridad o riesgos químicos y biológicos a que intenten encontrar un jailbreak universal capaz de superar nuestro desafío bioquímico de diez niveles.

Resumen del programa

  • Model cubierto: Solo el agente de ChatGPT-
  • Reto: Identificar un mensaje de jailbreaking universal para responder correctamente a las diez preguntas de seguridad bioquímica de un chat vacío.
  • Recompensas:
    • $25,000 al primer jailbreak universal que resuelva las diez preguntas.
    • $10.000 al primer equipo que responda a las diez preguntas con múltiples mensajes de jailbreak.
    • Se podrán conceder premios menores por victorias parciales si lo estimamos oportuno.
  • Cronograma: Las solicitudes se abren el 17 de julio de 2025, y se aceptan de forma continua. La prueba comienza el 29 de julio de 2025.
  • Acceso: Solo por solicitud y con invitación. Enviaremos invitaciones a una lista seleccionada de miembros de equipos rojos biológicos de confianza y revisaremos las nuevas solicitudes. Una vez seleccionados, los candidatos aceptados se incorporarán a la plataforma del programa de recompensas para detectar errores en biología.
  • Divulgación: Todos los mensajes, las conclusiones, los hallazgos y las comunicaciones se rigen por el acuerdo de confidencialidad (NDA).

Cómo presentar una solicitud

Envía una breve solicitud aquí(se abre en una nueva ventana) (nombre, afiliación organizacional, breve historial y un plan de 150 palabras) antes del 29 de julio de 2025. Los candidatos y colaboradores aceptados deben tener una cuenta activa de ChatGPT y firmar un acuerdo de confidencialidad.

Presenta ya tu solicitud y ayúdanos a hacer que la IA sea más segura.

Presenta tu candidatura para el Programa de recompensas por la detección de errores en biología de OpenAI

Autor

OpenAI