ChatGPT часто генерирует слова, для понимания которых может потребоваться словарь, или слова, которые звучат просто волшебно. Это справедливо не только для ChatGPT, другие языковые модели с открытым исходным кодом, такие как Mistral, делают то же самое. Нет ничего плохого в том, чтобы обратиться за помощью к ИИ для создания контента, если это делается этично, но на конкурсе научных работ для детей 14–16 лет судья заподозрил подозрение, увидев в эссе фразу «лабиринтные лабиринты». , который показался слишком продвинутым для письма подростка. Поэтому он использовал инструменты искусственного интеллекта, чтобы проверить это. К сожалению, все четыре инструмента дали одинаковый результат, почти всё эссе, около 90–96%, похоже, было написано ИИ, а не человеком. Однако не все из нас профессионалы. Если мы видим приведенную выше фразу, возможно, мы пропустили ее из-за нашей ограниченной осведомленности.
Чтобы определить, является ли ИИ автором, необходимы навыки критического мышления.
Самый простой способ обнаружить текст, сгенерированный искусственным интеллектом, — это проверить слова, которые вы обычно не используете, но являются общими для ChatGPT. Рассмотрим огромный корпус из более чем 19 миллиардов английских слов из блогов, статей, новостей и т. д., обновляемый ежедневно с 2010 года по настоящее время. Я искал слово **«покопаться» **, используя алгоритм поиска строк, и оно появилось 52 388 раз . Я построил график его годовой динамики и выявил необычное поведение: рост его появления в Интернете примерно на 200% с 2022 года, того же года, когда 30 ноября был выпущен ChatGPT.
Другие слова, такие как **«сложность» **или «непоколебимость» , также демонстрируют аналогичное увеличение, как и «вникать» . В последнее время их используют чаще.
Этот выбор словарного запаса не обязательно является чем-то, что использует исключительно ИИ, поскольку люди также используют разнообразный набор слов. Хотя в академических текстах мы часто используем такие фразы, как «исследовать» или «обсудить более подробно» вместо «вникать» . Я прошу ChatGPT перефразировать «обсудить более подробно…» , **** первые пять предложений, которые он предлагает, обычно включают эту фразу.
Кроме того, я пытаюсь проанализировать базу данных arXiv, известную платформу издательских статей, содержащую более 2 миллионов статей до 2023 года. Я пытаюсь обнаружить слово ** «копаться» ** в рефератах статей и построить его годовую структуру. Я был поражен, увидев, что это слово широко использовалось в рефератах статей в 2023 году, то же самое слово, которое ChatGPT предложил в своих 5 лучших предложениях.
Это указывает на то, что академические писатели могут использовать ChatGPT либо для перефразирования, либо для создания контента. Наличие слова «вникать» служит намеком или сомнением в том, что документ, отправленный студентом или онлайн-блогом, либо этот абзац, либо эта часть текста, был перефразирован или улучшен с помощью ChatGPT.
Опираясь на свой исследовательский опыт и двухлетний опыт работы с магистратурой, я составил довольно полный список из 100 слов, за которыми вы можете следить в тексте, чтобы понять, был ли он создан или перефразирован с помощью ИИ.
Но проверка такого количества слов — непростая задача, поэтому, чтобы добиться этого быстро, я создал веб-приложение, которое быстро проверяет ваш текст. Просто загрузите файл или вставьте текст, и он сделает все остальное. Легко, пожалуйста!