Detect AI text Easily

Detect AI text Easily

Другой исходный код

1.0.0

Скачать

Обнаружение текста AI, просто взглянув на него

ChatGPT часто генерирует слова, для понимания которых может потребоваться словарь, или слова, которые звучат просто волшебно. Это справедливо не только для ChatGPT, другие языковые модели с открытым исходным кодом, такие как Mistral, делают то же самое. Нет ничего плохого в том, чтобы обратиться за помощью к ИИ для создания контента, если это делается этично, но на конкурсе научных работ для детей 14–16 лет судья заподозрил подозрение, увидев в эссе фразу «лабиринтные лабиринты». , который показался слишком продвинутым для письма подростка. Поэтому он использовал инструменты искусственного интеллекта, чтобы проверить это. К сожалению, все четыре инструмента дали одинаковый результат, почти всё эссе, около 90–96%, похоже, было написано ИИ, а не человеком. Однако не все из нас профессионалы. Если мы видим приведенную выше фразу, возможно, мы пропустили ее из-за нашей ограниченной осведомленности.

Чтобы определить, является ли ИИ автором, необходимы навыки критического мышления.

Самый простой способ обнаружить текст, сгенерированный искусственным интеллектом, — это проверить слова, которые вы обычно не используете, но являются общими для ChatGPT. Рассмотрим огромный корпус из более чем 19 миллиардов английских слов из блогов, статей, новостей и т. д., обновляемый ежедневно с 2010 года по настоящее время. Я искал слово **«покопаться» **, используя алгоритм поиска строк, и оно появилось 52 388 раз . Я построил график его годовой динамики и выявил необычное поведение: рост его появления в Интернете примерно на 200% с 2022 года, того же года, когда 30 ноября был выпущен ChatGPT.

Другие слова, такие как **«сложность» **или «непоколебимость» , также демонстрируют аналогичное увеличение, как и «вникать» . В последнее время их используют чаще.

Этот выбор словарного запаса не обязательно является чем-то, что использует исключительно ИИ, поскольку люди также используют разнообразный набор слов. Хотя в академических текстах мы часто используем такие фразы, как «исследовать» или «обсудить более подробно» вместо «вникать» . Я прошу ChatGPT перефразировать «обсудить более подробно…» , **** первые пять предложений, которые он предлагает, обычно включают эту фразу.

Кроме того, я пытаюсь проанализировать базу данных arXiv, известную платформу издательских статей, содержащую более 2 миллионов статей до 2023 года. Я пытаюсь обнаружить слово ** «копаться» ** в рефератах статей и построить его годовую структуру. Я был поражен, увидев, что это слово широко использовалось в рефератах статей в 2023 году, то же самое слово, которое ChatGPT предложил в своих 5 лучших предложениях.

Это указывает на то, что академические писатели могут использовать ChatGPT либо для перефразирования, либо для создания контента. Наличие слова «вникать» служит намеком или сомнением в том, что документ, отправленный студентом или онлайн-блогом, либо этот абзац, либо эта часть текста, был перефразирован или улучшен с помощью ChatGPT.

Опираясь на свой исследовательский опыт и двухлетний опыт работы с магистратурой, я составил довольно полный список из 100 слов, за которыми вы можете следить в тексте, чтобы понять, был ли он создан или перефразирован с помощью ИИ.

Но проверка такого количества слов — непростая задача, поэтому, чтобы добиться этого быстро, я создал веб-приложение, которое быстро проверяет ваш текст. Просто загрузите файл или вставьте текст, и он сделает все остальное. Легко, пожалуйста!