Recientemente, la organización sin fines de lucro Epoch AI causó controversia porque su proyecto de referencia de matemáticas de IA FrontierMath recibió financiación de OpenAI pero no lo reveló de manera oportuna. Este incidente involucra cuestiones como la transparencia de la divulgación de información, los conflictos de intereses y la objetividad de la evaluación comparativa, y ha despertado una preocupación generalizada entre los académicos y el público. Este artículo analizará en detalle los entresijos de este incidente y explorará su impacto potencial.
Recientemente, Epoch AI, una organización sin fines de lucro que desarrolla puntos de referencia matemáticos de IA, ha causado controversia por no revelar de inmediato la financiación que recibió de OpenAI. La organización anunció el 20 de diciembre que OpenAI financió un proyecto llamado FrontierMath, un punto de referencia diseñado para probar las capacidades matemáticas de la IA y que también utilizó el punto de referencia para mostrar su próximo producto insignia de IA, o3. Un contratista de Epoch AI que usa el apodo "Meemi" en el foro LessWrong dijo que muchos contribuyentes al proyecto FrontierMath desconocían la financiación de OpenAI hasta que se hizo pública. Mencionó: "Hay una falta de transparencia en la comunicación sobre esto. En mi opinión, Epoch AI debería revelar la fuente de financiación de OpenAI con antelación, y los contratistas deberían saber que su trabajo puede utilizarse para la evaluación de capacidades antes de decidir si hacerlo o no. participar en el desarrollo de puntos de referencia." En las redes sociales, algunos usuarios expresaron su preocupación de que dicho secreto podría dañar la reputación de FrontierMath como punto de referencia objetivo. Además de financiar FrontierMath, OpenAI también tiene visibilidad de muchos problemas y soluciones en el punto de referencia, que Epoch AI no reveló antes del 20 de diciembre. Carina Hong, estudiante de doctorado en matemáticas en la Universidad de Stanford, señaló en las plataformas sociales que OpenAI recibió acceso prioritario a FrontierMath debido a su cooperación con Epoch AI, lo que hizo que algunos contribuyentes se sintieran descontentos. "Seis matemáticos que han hecho contribuciones significativas al punto de referencia FrontierMath confirmaron que no sabían que OpenAI sería propietario exclusivo de este punto de referencia y que otros no podrían acceder a él. Hong dijo que después de enterarse de esto, la mayoría de los contribuyentes dijeron que si lo hicieran". Lo sabían antes. Con este acuerdo, no podrán participar en el proyecto. Tamay Besiroglu, subdirectora de Epoch AI, dijo que aunque la transparencia de la organización ha sido insuficiente, cree que la integridad de FrontierMath no se ha visto afectada. Admitió que Epoch AI había cometido errores de comunicación y no informó a los contribuyentes con antelación sobre la participación de OpenAI. Besiroglu dijo que si bien OpenAI tiene acceso a FrontierMath, existe un "acuerdo verbal" entre las dos partes de que OpenAI no utilizará el conjunto de problemas del punto de referencia para entrenar su IA. Epoch AI también mantiene una "retención separada" para garantizar una verificación independiente de los resultados de las pruebas comparativas de FrontierMath. Ellot Glazer, matemático jefe de Epoch AI, mencionó en Reddit que Epoch AI no ha verificado de forma independiente los resultados de FrontierMath o3 de OpenAI. Cree que la puntuación de OpenAI es creíble, pero no puede confirmarla hasta que se complete una revisión independiente.
El incidente de Epoch AI expuso la importancia de la transparencia y la divulgación de información en la cooperación en investigación científica. En el futuro, proyectos similares de referencia de IA necesitarán acuerdos de financiación más claros y mecanismos de comunicación más eficaces para garantizar su objetividad e imparcialidad y mantener la confianza y la reputación de la comunidad académica. Sólo así se podrá promover el sano desarrollo del campo de la IA.