O ChatGPT geralmente gera palavras que podem exigir um dicionário para compreensão ou surge com palavras que parecem mágicas. Isso não é verdade apenas para ChatGPT, outros modelos de linguagem de código aberto como Mistral fazem o mesmo. Não há mal nenhum em buscar ajuda da IA para criar conteúdo, desde que seja feito de forma ética, mas em uma competição de redação científica para jovens de 14 a 16 anos, um juiz suspeitou quando viu a frase “labirintos labirínticos” em um ensaio , que parecia muito avançado para um escritor adolescente. Então, ele usou ferramentas de IA para verificar isso. Infelizmente, todas as quatro ferramentas deram o mesmo resultado, quase todo o ensaio, cerca de 90-96%, parecia ter sido escrito por IA, não por um humano. Porém, nem todos nós somos profissionais. Se virmos a frase acima, podemos tê-la ignorado devido à nossa consciência limitada.
Há necessidade de habilidades de pensamento crítico para identificar se a IA é a autora
A maneira mais fácil de detectar texto gerado por IA é verificar palavras que você normalmente não usa, mas que são comuns no ChatGPT. Considere um enorme corpus de mais de 19 bilhões de palavras em inglês de blogs, artigos, notícias e muito mais, atualizado diariamente de 2010 até agora. Procurei a palavra **“delve” **usando um algoritmo de pesquisa de string e ela apareceu 52.388 vezes . Tracei seu padrão anual e identifiquei um comportamento incomum, um crescimento de aproximadamente 200% em sua aparição na internet a partir de 2022, mesmo ano em que o ChatGPT foi lançado em 30 de novembro.
Outras palavras, como **“complexidades” **ou “inabalável” , também mostram um aumento semelhante, assim como “investigar” . Eles estão sendo usados com mais frequência ultimamente.
Esta escolha de vocabulário não é necessariamente algo que a IA utiliza exclusivamente, uma vez que os humanos também utilizam uma gama diversificada de palavras. Embora, na redação acadêmica, muitas vezes usemos frases como “explorar” ou “discutir com mais detalhes” em vez de “aprofundar” . Peço ao ChatGPT para reformular “discutir com mais detalhes…” , ****as cinco sugestões iniciais que ele fornece normalmente incluem esta frase.
Além disso, tento analisar o banco de dados arXiv, uma famosa plataforma de publicação de artigos que contém mais de 2 milhões de artigos até 2023. Tento detectar a palavra ** “aprofundar” ** nos resumos dos artigos e traçar seu padrão anual. Fiquei surpreso ao ver que esta palavra tem sido amplamente utilizada nos resumos de artigos do ano de 2023 , a mesma palavra que o ChatGPT sugeriu em suas 5 principais sugestões.
Isso indica que escritores acadêmicos podem estar usando o ChatGPT, seja para reformular ou gerar conteúdo. A presença da palavra “aprofundar” serve como uma dica ou dúvida de que o documento enviado por um aluno ou blog online, seja aquele parágrafo ou aquela parte do texto, foi reformulado ou aprimorado usando ChatGPT.
Com base em minha experiência em pesquisa e dois anos de experiência trabalhando com LLMs, reuni uma lista bastante abrangente de 100 palavras que você pode observar em um trecho de texto para ajudá-lo a descobrir se ele foi gerado ou parafraseado usando IA.
Mas verificar esse número de palavras não é uma tarefa fácil, então para fazer isso rapidamente, criei um aplicativo web que verifica rapidamente o seu texto. Basta enviar seu arquivo ou colar seu texto e ele fará o resto. Fácil!