ChatGPT は、理解するために辞書が必要な単語を生成したり、魔法のように聞こえる単語を生成したりすることがよくあります。これは ChatGPT にだけ当てはまるわけではなく、Mistral などの他のオープンソース言語モデルでも同様です。倫理的に行われている限り、AI にコンテンツ作成の支援を求めるのは問題ありませんが、14 ~ 16 歳を対象とした科学作文コンテストで、審査員がエッセイの中に「ラビリンシアンの迷路」というフレーズを見たときに疑念を抱きました。 、10代の若者が書くには高度すぎるように思えました。そこで彼はAIツールを使ってそれをチェックした。残念ながら、4 つのツールすべてで同じ結果が得られ、エッセイのほぼ全体 (約 90 ~ 96%) が人間ではなく AI によって書かれているようでした。ただし、私たち全員が専門家であるわけではありません。上記のフレーズを見た場合、認識力が低いために読み飛ばしてしまう可能性があります。
AI が作者であるかどうかを特定するには、批判的思考スキルが必要です
AI によって生成されたテキストを見つける最も簡単な方法は、普段は使用しないが ChatGPT では一般的な単語をチェックすることです。 2010 年から現在まで毎日更新される、ブログ、記事、ニュースなどからの 190 億語を超える英単語の膨大なコーパスを考えてみましょう。文字列検索アルゴリズムを使用して **「delve」** という単語を検索したところ、 52,388 回表示されました。私はその年間パターンをプロットし、異常な動作を特定しました。それは、ChatGPT が 11 月 30 日にリリースされたのと同じ年である 2022 年から、インターネット上での出現が最大 200 % 増加したということです。
**「intricacies」 ** や「unwavering」などの他の単語も、 「delve」と同様の増加を示します。最近はよく使われるようになりました。
人間も多様な単語を使用するため、この語彙の選択は必ずしも AI だけが使用するものではありません。ただし、学術論文では、 「詳しく調べる」の代わりに「調べる」や「より詳細に議論する」などのフレーズをよく使います。私は ChatGPT に「もっと詳しく話し合って…」と言い換えるように頼みます。****ChatGPT が提供する最初の 5 つの提案には通常、このフレーズが含まれています。
さらに、2023 年までの 200 万件以上の論文が含まれる有名な出版論文プラットフォームである arXiv データベースを分析しようとしました。論文の要約の中から単語**「delve」**を検出し、その年間パターンをプロットしようとしました。この単語が2023年の論文要約で広く使用されていることを見て驚きました。ChatGPT がその上位 5 つの提案で提案したのと同じ単語です。
これは、学術ライターがコンテンツの言い換えまたは生成に ChatGPT を使用している可能性があることを示しています。 「delve」という単語の存在は、学生またはオンライン ブログから提出された文書 (その段落またはテキストの部分) が ChatGPT を使用して言い換えまたは強化されたというヒントまたは疑いとして機能します。
研究の専門知識と LLM を扱った 2 年間の経験を活用して、テキスト内で注目できる 100 個の単語の非常に包括的なリストを作成しました。これは、テキストが生成されたものであるか、言い換えられたものであるかを判断するのに役立ちます。あい。
しかし、これほどの単語数をチェックするのは簡単な仕事ではないので、それをすぐに達成するために、テキストをすばやくチェックする Web アプリを作成しました。ファイルをアップロードするかテキストを貼り付けるだけで、残りの作業は自動的に行われます。簡単ピージー!