Récemment, l'organisation à but non lucratif Epoch AI a suscité la controverse parce que son projet FrontierMath, référence en mathématiques de l'IA, a reçu un financement d'OpenAI, mais n'a pas réussi à le divulguer en temps opportun. Cet incident implique des questions telles que la transparence de la divulgation de l'information, les conflits d'intérêts et l'objectivité de l'analyse comparative, et a suscité une inquiétude généralisée parmi les universitaires et le public. Cet article analysera en détail les tenants et les aboutissants de cet incident et explorera son impact potentiel.
Récemment, Epoch AI, une organisation à but non lucratif qui développe des références mathématiques en matière d'IA, a suscité une controverse pour ne pas avoir divulgué rapidement le financement qu'elle a reçu d'OpenAI. L'organisation a annoncé le 20 décembre qu'OpenAI avait financé un projet appelé FrontierMath, un benchmark conçu pour tester les capacités mathématiques de l'IA. OpenAI a également utilisé ce benchmark pour présenter son prochain produit phare d'IA, o3. Un entrepreneur d'Epoch AI qui utilise le surnom « Meemi » sur le forum LessWrong a déclaré que de nombreux contributeurs au projet FrontierMath n'étaient pas au courant du financement d'OpenAI jusqu'à ce qu'il soit rendu public. Il a mentionné : « Il y a un manque de transparence dans la communication sur ce point. À mon avis, Epoch AI devrait divulguer à l'avance la source de financement d'OpenAI, et les entrepreneurs devraient également savoir que leur travail peut être utilisé pour une évaluation des capacités avant de décider. s'il faut participer au développement du benchmark. » Sur les réseaux sociaux, certains utilisateurs ont exprimé leur inquiétude quant au fait qu'un tel secret pourrait nuire à la réputation de FrontierMath en tant que benchmark objectif. En plus de financer FrontierMath, OpenAI a également une visibilité sur de nombreux problèmes et solutions dans le benchmark, qu'Epoch AI n'a pas divulgué avant le 20 décembre. Carina Hong, doctorante en mathématiques à l'Université de Stanford, a souligné sur les plateformes sociales qu'OpenAI avait reçu un accès prioritaire à FrontierMath en raison de sa coopération avec Epoch AI, ce qui a rendu certains contributeurs mécontents. "Six mathématiciens qui ont apporté des contributions significatives au benchmark FrontierMath ont confirmé qu'ils ne savaient pas qu'OpenAI monopoliserait ce benchmark et que d'autres ne pourraient pas y accéder." Hong a déclaré qu'après avoir appris cela, la plupart des contributeurs auraient déclaré que s'ils l'avaient fait. connu plus tôt. Avec cet arrangement, ils ne peuvent pas participer au projet. Tamay Besiroglu, directeur adjoint d'Epoch AI, a déclaré que même si la transparence de l'organisation a été insuffisante, il estime que l'intégrité de FrontierMath n'a pas été affectée. Il a admis qu’Epoch AI avait commis des erreurs de communication et n’avait pas informé à l’avance les contributeurs de la participation d’OpenAI. Besiroglu a déclaré que même si OpenAI a accès à FrontierMath, il existe un « accord verbal » entre les deux parties selon lequel OpenAI n'utilisera pas l'ensemble de problèmes du benchmark pour entraîner son IA. Epoch AI maintient également un « holdout séparé » pour garantir une vérification indépendante des résultats du benchmark FrontierMath. Ellot Glazer, mathématicien en chef d'Epoch AI, a mentionné sur Reddit qu'Epoch AI n'avait pas vérifié de manière indépendante les résultats FrontierMath o3 d'OpenAI. Il estime que le score d'OpenAI est crédible mais ne peut le confirmer tant qu'un examen indépendant n'est pas terminé.
L’incident d’Epoch AI a révélé l’importance de la transparence et de la divulgation d’informations dans la coopération en matière de recherche scientifique. À l’avenir, des projets de référence similaires en matière d’IA nécessiteront des accords de financement plus clairs et des mécanismes de communication plus efficaces pour garantir leur objectivité et leur impartialité et maintenir la confiance et la réputation de la communauté universitaire. Ce n'est qu'ainsi que le développement sain du domaine de l'IA pourra être favorisé.