ChatGPT generiert häufig Wörter, für deren Verständnis möglicherweise ein Wörterbuch erforderlich ist, oder es werden Wörter gefunden, die einfach magisch klingen. Dies gilt nicht nur für ChatGPT, auch andere Open-Source-Sprachmodelle wie Mistral tun dasselbe. Es kann nicht schaden, bei der Erstellung von Inhalten die Unterstützung von KI in Anspruch zu nehmen, solange dies ethisch vertretbar ist. Doch bei einem Wettbewerb für wissenschaftliche Texte für 14- bis 16-Jährige wurde ein Richter misstrauisch, als er in einem Aufsatz den Ausdruck „Labyrinthische Labyrinthe“ sah , was für das Schreiben eines Teenagers zu fortgeschritten schien. Also nutzte er KI-Tools, um es zu überprüfen. Leider lieferten alle vier Tools das gleiche Ergebnis, fast der gesamte Aufsatz, etwa 90–96 %, schien von KI und nicht von Menschen geschrieben worden zu sein. Allerdings sind nicht alle von uns Profis. Wenn wir den obigen Satz sehen, haben wir ihn möglicherweise aufgrund unseres begrenzten Bewusstseins übersprungen.
Es bedarf kritischer Denkfähigkeiten, um herauszufinden, ob KI der Urheber ist
Der einfachste Weg, KI-generierten Text zu erkennen, besteht darin, nach Wörtern zu suchen, die Sie normalerweise nicht verwenden, die aber für ChatGPT üblich sind. Betrachten Sie einen riesigen Korpus von über 19 Milliarden englischen Wörtern aus Blogs, Artikeln, Nachrichten und mehr, der von 2010 bis heute täglich aktualisiert wird. Ich habe mit einem String-Suchalgorithmus nach dem Wort „delve“ gesucht und es wurde 52.388 Mal angezeigt. Ich zeichnete sein jährliches Muster auf und identifizierte ein ungewöhnliches Verhalten, ein etwa 200-prozentiges Wachstum seines Auftritts im Internet ab 2022, dem gleichen Jahr, in dem ChatGPT am 30. November veröffentlicht wurde.
Andere Wörter wie **„intricacies“ **oder „unwantering“ weisen ebenfalls einen ähnlichen Anstieg auf, genau wie „delve“ . Sie werden in letzter Zeit häufiger verwendet.
Diese Wahl des Vokabulars ist nicht unbedingt etwas, das ausschließlich von der KI verwendet wird, da auch Menschen eine vielfältige Auswahl an Wörtern verwenden. Allerdings verwenden wir beim wissenschaftlichen Schreiben häufig Ausdrücke wie „erforschen“ oder „ausführlicher diskutieren“ anstelle von „eintauchen“ . Ich bitte ChatGPT , „ausführlicher besprechen …“ umzuformulieren. ****Die ersten fünf Vorschläge enthalten normalerweise diesen Satz.
Darüber hinaus versuche ich, die arXiv-Datenbank zu analysieren, eine bekannte Plattform für Publikationsbeiträge, die bis zum Jahr 2023 mehr als 2 Millionen Aufsätze enthält. Ich versuche, das Wort „Delve“ in den Aufsatzzusammenfassungen zu erkennen und seinen jährlichen Verlauf zu zeichnen. Ich war erstaunt zu sehen, dass dieses Wort im Jahr 2023 in den Abstracts von Aufsätzen weit verbreitet war, dasselbe Wort, das ChatGPT in seinen Top-5-Vorschlägen vorgeschlagen hatte.
Dies weist darauf hin, dass akademische Autoren ChatGPT möglicherweise zum Umformulieren oder Generieren von Inhalten verwenden. Das Vorhandensein des Wortes „delve“ dient als Hinweis oder Zweifel daran, dass das von einem Studenten oder einem Online-Blog eingereichte Dokument, entweder dieser Absatz oder dieser Textabschnitt, mit ChatGPT umformuliert oder verbessert wurde.
Basierend auf meiner Forschungskompetenz und zwei Jahren Erfahrung in der Arbeit mit LLMs habe ich eine ziemlich umfassende Liste mit 100 Wörtern zusammengestellt, nach denen Sie in einem Text Ausschau halten können, um herauszufinden, ob er mit generiert oder paraphrasiert wurde KI.
Aber die Überprüfung auf eine solche Anzahl von Wörtern ist keine leichte Aufgabe. Um dies schnell zu erreichen, habe ich eine Web-App erstellt, die Ihren Text schnell überprüft. Laden Sie einfach Ihre Datei hoch oder fügen Sie Ihren Text ein, der Rest wird erledigt. Kinderleicht!