Dans le monde universitaire, la prolifération de faux papiers est devenue un problème sérieux, entravant sérieusement le progrès de la recherche scientifique et la diffusion des connaissances. Pour relever ce défi, le chercheur Ahmed Abdin Hameed de l'Université de Binghamton dans l'État de New York a développé un algorithme d'apprentissage automatique appelé xFakeSci, qui peut identifier efficacement les faux articles universitaires et fournir de nouveaux moyens techniques. Cet article explorera en profondeur les principes, les applications et les orientations de développement futures de l'algorithme xFakeSci, démontrant ainsi son énorme potentiel dans la lutte contre la fraude académique.
À l'ère actuelle d'explosion de l'information, en particulier dans le domaine de la recherche scientifique, il est difficile de se prémunir contre l'émergence de faux documents.
Récemment, Ahmed Abdeen Hamed, chercheur à l'Université de Binghamton dans l'État de New York, a développé un algorithme d'apprentissage automatique appelé xFakeSci, capable d'identifier avec une précision allant jusqu'à 94 % des articles universitaires falsifiés .
Hameed a déclaré que sa principale direction de recherche était l'informatique biomédicale et que pendant l'épidémie, de faux articles de recherche scientifique sont apparus sans cesse.
Lui et son équipe ont mené un grand nombre d'expériences, produit 50 faux articles sur trois sujets médicaux populaires : la maladie d'Alzheimer, le cancer et la dépression, et mené une analyse comparative avec de vrais articles sur le même sujet. De cette façon, il espère découvrir des différences et des modèles.
Au cours du processus de recherche, Hameed a extrait la littérature pertinente en utilisant la base de données PubMed des National Institutes of Health et a utilisé les mêmes mots-clés pour demander à ChatGPT de générer des articles. Son intuition lui disait qu'il devait y avoir une certaine tendance entre les faux papiers et les vrais papiers.
Rapport nœud/bord pour différents ensembles de données ChatGPT et articles scientifiques.
Après une analyse approfondie, l'algorithme xFakeSci se concentre principalement sur deux caractéristiques majeures : d'une part, les bigrammes de l'article, tels que « changement climatique », « essai clinique », etc., et d'autre part, l'association de ces bigrammes avec d'autres mots et notions.
Il a constaté que le nombre de combinaisons de mots doubles apparaissant dans les faux articles était nettement inférieur à celui des vrais articles, même si ces combinaisons étaient étroitement liées à d’autres contenus des faux articles.
Il a souligné que les articles générés par l’IA sont souvent conçus pour convaincre les lecteurs, tandis que l’objectif des chercheurs humains est de rendre compte de manière véridique des résultats et des méthodes expérimentaux.
À l’avenir, Hamed prévoit d’étendre l’algorithme xFakeSci à davantage de domaines, notamment l’ingénierie, les sciences et les sciences humaines, afin de vérifier si les caractéristiques des faux papiers sont cohérentes. Il a souligné qu'avec les progrès continus de la technologie de l'IA, il deviendra de plus en plus difficile d'identifier les vrais et les faux papiers. Il est donc particulièrement important de concevoir une solution globale.
Bien que l’algorithme actuel puisse détecter 94 % des faux papiers, 6 % des faux papiers peuvent encore passer entre les mailles du filet. Il a humblement déclaré que même si des progrès importants ont été réalisés, des efforts continus sont encore nécessaires pour améliorer les taux de reconnaissance et sensibiliser le public.
Entrée papier : https://www.nature.com/articles/s41598-024-66784-6
Souligner:
** Le nouvel outil xFakeSci peut identifier les faux documents de recherche scientifique avec une précision allant jusqu'à 94 %, protégeant ainsi la recherche scientifique. **
? ** Les chercheurs ont produit un grand nombre de faux articles et les ont comparés à de vrais articles et ont constaté qu'il existait des différences significatives dans les styles d'écriture entre les deux. **
** À l'avenir, le champ d'application de l'algorithme sera élargi pour répondre aux défis de plus en plus complexes des articles générés par l'IA. **
L’émergence de l’algorithme xFakeSci constitue une arme puissante pour lutter contre la fraude académique, mais elle doit encore être continuellement améliorée et perfectionnée. Les progrès technologiques et le maintien de l’intégrité académique nécessitent des efforts conjoints pour créer un écosystème académique plus sain.