ChatGPT a menudo genera palabras que pueden requerir un diccionario para comprenderlas, o genera palabras que suenan mágicas. Esto no sólo es cierto para ChatGPT, otros modelos de lenguaje de código abierto como Mistral hacen lo mismo. No hay nada de malo en buscar ayuda de la IA para crear contenido, siempre y cuando se haga de manera ética, pero en un concurso de redacción científica para jóvenes de 14 a 16 años, un juez sospechó cuando vio la frase "laberintos" en un ensayo. , que parecía demasiado avanzado para que escribiera un adolescente. Entonces, utilizó herramientas de inteligencia artificial para comprobarlo. Desafortunadamente, las cuatro herramientas dieron el mismo resultado: casi todo el ensayo, alrededor del 90-96%, parecía haber sido escrito por una IA, no por un humano. Sin embargo, no todos somos profesionales. Si vemos la frase anterior, es posible que nos la hayamos saltado debido a nuestra limitada conciencia.
Se necesitan habilidades de pensamiento crítico para identificar si la IA es el autor
La forma más sencilla de detectar texto generado por IA es buscando palabras que no usas habitualmente pero que son comunes en ChatGPT. Considere un corpus masivo de más de 19 mil millones de palabras en inglés de blogs, artículos, noticias y más, actualizado diariamente desde 2010 hasta ahora. Busqué la palabra **“profundizar” **usando un algoritmo de búsqueda de cadenas y apareció 52,388 veces . Tracé su patrón anual e identifiqué un comportamiento inusual, un crecimiento de ~200% en su aparición en Internet desde 2022, el mismo año en que se lanzó ChatGPT el 30 de noviembre.
Otras palabras, como **“complejos” **o “inquebrantable” , también muestran un aumento similar, al igual que “profundizar” . Últimamente se utilizan con más frecuencia.
Esta elección de vocabulario no es necesariamente algo que la IA utilice exclusivamente, ya que los humanos también utilizan una amplia gama de palabras. Aunque, en la escritura académica, solemos utilizar frases como “explorar” o “discutir con más detalle” en lugar de “profundizar” . Le pido a ChatGPT que reformule “discutir con más detalle…” , ****las cinco sugerencias iniciales que ofrece generalmente incluyen esta frase.
Además, trato de analizar la base de datos arXiv, una famosa plataforma de publicación de artículos que contiene más de 2 millones de artículos hasta 2023. Intento detectar la palabra ** "profundizar" ** en los resúmenes de los artículos y trazar su patrón anual. Me sorprendió ver que esta palabra se ha utilizado ampliamente en los resúmenes de artículos del año 2023 , la misma palabra que sugirió ChatGPT en sus 5 sugerencias principales.
Esto indica que los escritores académicos pueden estar usando ChatGPT, ya sea para reformular o generar contenido. La presencia de la palabra "profundizar" sirve como una pista o una duda de que el documento enviado por un estudiante o un blog en línea, ya sea ese párrafo o esa porción de texto, ha sido reformulado o mejorado usando ChatGPT.
Basándome en mi experiencia en investigación y dos años de experiencia trabajando con LLM, he elaborado una lista bastante completa de 100 palabras a las que puedes estar atento en un fragmento de texto para ayudarte a determinar si se generó o parafraseó usando AI.
Pero verificar tal cantidad de palabras no es un trabajo fácil, así que para lograrlo rápidamente, creé una aplicación web que verifica rápidamente tu texto. Simplemente cargue su archivo o pegue su texto y él hará el resto. ¡Fácil!