L'équipe de recherche Meta lance une nouvelle méthode pour laisser les modèles d'IA « réfléchir » avant de répondre !
Meta, l'Université de Californie à Berkeley et l'Université de New York ont collaboré pour développer la technologie « Thinking Preference Optimization » (TPO), visant à améliorer les performances des grands modèles de langage (LLM). Interprétat
2024-12-03