No meio acadêmico, a proliferação de artigos falsos tornou-se um problema grave, dificultando seriamente o progresso da pesquisa científica e a disseminação do conhecimento. Para enfrentar esse desafio, o pesquisador Ahmed Abdin Hameed, da Universidade de Binghamton, no estado de Nova York, desenvolveu um algoritmo de aprendizado de máquina chamado xFakeSci, que pode identificar com eficácia trabalhos acadêmicos falsos e fornecer novos meios técnicos para manter a integridade acadêmica. Este artigo explorará profundamente os princípios, aplicações e direções de desenvolvimento futuro do algoritmo xFakeSci, mostrando seu enorme potencial no combate à fraude acadêmica.
Na era atual de explosão de informação, especialmente no campo da investigação científica, é difícil prevenir o aparecimento de artigos falsos.
Recentemente, Ahmed Abdeen Hamed, pesquisador da Universidade de Binghamton, no estado de Nova York, desenvolveu um algoritmo de aprendizado de máquina chamado xFakeSci, que pode identificar com precisão de até 94% artigos acadêmicos forjados .
Hameed disse que sua principal direção de pesquisa é a informática biomédica e, durante a epidemia, artigos falsos de pesquisas científicas apareceram indefinidamente.
Ele e sua equipe conduziram um grande número de experimentos, produziram 50 artigos falsos sobre três temas médicos populares: doença de Alzheimer, câncer e depressão, e conduziram análises comparativas com artigos reais sobre o mesmo tema. Desta forma, ele espera descobrir diferenças e padrões.
Durante o processo de pesquisa, Hameed extraiu literatura relevante usando o banco de dados PubMed dos Institutos Nacionais de Saúde e usou as mesmas palavras-chave para solicitar ao ChatGPT a geração de artigos. Sua intuição lhe disse que deveria haver algum padrão entre os documentos falsos e os verdadeiros.
Proporção nó-borda para diferentes conjuntos de dados ChatGPT e artigos científicos.
Após uma análise aprofundada, o algoritmo xFakeSci concentra-se principalmente em duas características principais: primeiro, os bigramas do artigo, como “mudança climática”, “ensaio clínico”, etc., e em segundo lugar, a associação desses bigramas com outras palavras e conceitos.
Ele descobriu que o número de combinações de palavras duplas que apareciam nos artigos falsos era significativamente menor do que nos artigos reais, embora essas combinações estivessem intimamente relacionadas a outros conteúdos dos artigos falsos.
Ele ressaltou que os artigos gerados por IA são frequentemente projetados para convencer os leitores, enquanto o objetivo dos pesquisadores humanos é relatar com veracidade resultados e métodos experimentais.
No futuro, Hamed planeja expandir o algoritmo xFakeSci para mais áreas, incluindo engenharia, ciências e humanidades, para verificar se as características dos documentos falsos são consistentes. Ele enfatizou que, com o avanço contínuo da tecnologia de IA, continuará a ser mais difícil identificar documentos verdadeiros e falsos. Portanto, projetar uma solução abrangente é particularmente importante.
Embora o algoritmo atual possa detectar 94% dos documentos falsos, 6% dos documentos falsos ainda podem escapar da rede. Ele humildemente disse que embora tenham sido feitos progressos importantes, ainda são necessários esforços contínuos para melhorar as taxas de reconhecimento e aumentar a sensibilização do público.
Entrada de papel: https://www.nature.com/articles/s41598-024-66784-6
Destaque:
** A nova ferramenta xFakeSci pode identificar artigos de pesquisa científica falsos com uma precisão de até 94%, protegendo a pesquisa científica. **
?** Os pesquisadores produziram um grande número de artigos falsos e os compararam com artigos reais e descobriram que havia diferenças significativas nos estilos de escrita entre os dois. **
** No futuro, o escopo de aplicação do algoritmo será ampliado para atender aos desafios cada vez mais complexos dos documentos gerados por IA. **
O surgimento do algoritmo xFakeSci fornece uma arma poderosa para combater a fraude acadêmica, mas ainda precisa ser continuamente aprimorado e aprimorado. O avanço da tecnologia e a manutenção da integridade acadêmica exigem esforços conjuntos para criar um ecossistema acadêmico mais saudável.