AI が急速に発展する時代においては、データがトレーニングの鍵となります。しかし、AI トレーニングとは相容れないように見えたオンライン コミュニティ、Baidu Tieba の精神薄弱者バーが、予想外に AI トレーニングの重要なデータ源となり、広範な議論と懸念を引き起こしました。このコミュニティは、その不条理なユーモアで有名です。AI トレーニングにおけるデータの並外れた価値は、高品質のデータに対する人々の従来の理解を覆し、人工知能の学習メカニズムについての深い考察を引き起こしました。
今日、人工知能の急速な発展に伴い、一見目立たないオンライン コミュニティである Baidu Tieba の精神薄弱者バーが、予想外に AI トレーニングの重要なデータ ソースとなり、テクノロジー サークルやオンライン コミュニティで広く注目を集めています。不条理なユーモアに満ちたこのコミュニティは、AI トレーニングに驚くべき価値を示しています。人々はこう考えます。なぜこのような知恵遅れの発言が知性の揺りかごになっているのでしょうか。
今年4月、中国科学院とウォータールー大学などが共同で発表した研究結果は衝撃的だった。質疑応答、ブレーンストーミング、分類、生成、要約を含む 8 つのテストで、Zhiba のパフォーマンスは Encyclopedia、Zhihu、Douban、Xiaohongshu などの有名なプラットフォームを上回り、中国で最も人気のある AI トレーニング データベースの 1 つになりました。この発見は、高品質データに対する人々の従来の理解を覆しました。
最近のバンド会議では、遅滞者バーの中心メンバーが初めて公の場に姿を現し、AI に挑戦しただけでなく、このユニークなコミュニティの本当の顔を明らかにしました。 Unbounded Ark の CEO、Zeng Xiaodong 氏は、精神薄弱バーをトレーニング コーパスとして選択した理由を次のように説明しました。AI を人間に近づけるためには、口語的な言葉と複数回の質疑応答コーパスが必要であり、精神薄弱バーは、バーはまさにこの需要に応えます。
Mentally Retarded Bar の中心メンバーである Hu Luobei 氏は、AI に関する興味深い経験を共有しました。 2022 年の時点で、彼は AI にいくつかのジョークを解釈させようとしましたが、AI は関連情報を検索できても、ジョークの本当の意味を理解できないことがわかりました。これは、人間のユーモアを理解する上での AI の限界を浮き彫りにしています。
しかし、これらの一見ばかばかしいジョークの背後には深い論理があります。たとえば、「山にトラがいることを知っているから、故意に山に行くな」という文は、「承知の上で」という言葉を巧みに解体し、再構成して新しい意味を作り出しています。こうした言語の罠こそが、中国語を理解して推論する AI の能力を訓練し、機械がより人間のようにコミュニケーションできるようにするのです。
知恵遅れバーの魅力は、それがジョークの中に基礎的な科学があることです。このコミュニティのメンバーのほとんどは科学の背景を持っており、彼らが作成するジョークは論理的に厳密であるだけでなく、豊かなレトリックや人生の観察も組み込まれています。このユニークな創造的な手法は、AI にとって貴重な学習教材となります。
興味深いことに、精神薄弱バーの存在は人間とAIの間の防衛線になっているようです。胡洛北氏は次のように述べています。AI はユーモアをまったく理解していないため、遅滞を笑い飛ばすことはできません。この深い言語理解とユーモアのセンスが、人間の知能と人工知能を区別する鍵となります。
AIに囲まれた時代とはいえ、メンタルバーの存在は、人間の創造性やユーモアが依然としてユニークであることを思い出させてくれます。この一見不条理に見えるコミュニティは、AI トレーニングに関する独自の視点を提供するだけでなく、人間の知恵と創造性の縮図にもなります。
遅滞バー事件は、私たちに AI の学習データのソースについて再考させるとともに、人工知能の時代でもまだ輝いている人間の知恵の輝きを目の当たりにすることにもなりました。 これは、一見役に立たないデータでも、特定の状況下では予想外に大きな価値があることを証明しています。将来的には、AI技術の発展を促進する予期せぬデータソースがさらに登場する可能性があります。