AI生成技術が日を追うごとに進歩するにつれ、AIが生成したリアルな画像や動画がインターネット上に氾濫し、人々が真贋を見分けることが困難になっています。 AI によって生成されたコンテンツを識別することが緊急の必要性となっています。最近では、「Qubit」Bステーションのビデオで、AIが生成したビデオを識別するためにAI技術をどのように利用するかについて議論し、再生回数が168万回を超え、AI識別AI技術に関する熱い議論を引き起こした。
AI によって生成された画像がますますリアルになるにつれ、多くの人がビデオを見るときに「これは本当に撮影されたものなのか? それとも AI の傑作なのか?」と考えずにはいられません。
最近、Qubit が Bilibili 上で公開した、AI ビデオを識別するために AI を使用する方法について論じた作品が激しい議論を巻き起こし、再生回数は瞬時に 168 万回を超えました。 AI が一目で AI を識別できる方法を見てみましょう。
このビデオでは、肉眼で AI ビデオを識別するためのヒントをいくつか紹介しています。たとえば、キャラクターが不自然な動きや表情をしていないか、話すときの声、口の形、感情が調和しているかなどに注意してください。しかし、膨大な動画を前にすると人間の力だけでは明らかに不十分であり、現時点ではAIが必要とされています。
AI の顔を変えるビデオを識別する場合、AI には独自の利点があります。 AI 顔変更テクノロジーは通常、合成された部分を元のビデオにフレームごとにつなぎ合わせます。人間の目では奇妙なものにしか見えないかもしれませんが、AI はこれらの接合痕跡を正確に特定します。誰もが固有の指紋を持っているのと同じように、さまざまなビデオの照明、テクスチャ、その他の情報を完全にコピーすることは困難であり、これらの微妙な違いが AI 認識の鍵となります。
AI によって完全に生成されたビデオの場合、認識方法はより複雑になります。研究チームは、モデルの特徴、動きの特徴、幾何学的な単眼の深さの特徴の 3 次元から 3 つの分類器をトレーニングしました。 Sora が生成したビデオを例にとると、人や動物の数の不安定さ、オブジェクトの移動中の色や影の異常な変化、カメラを動かしたときの遠近感やプロポーションの誤差はすべて、AI 認識の重要な手がかりになります。
さらに興味深いことに、研究者らは DIVID と呼ばれる新しい手法も発見しました。 AIビデオと実際のビデオが拡散モデルによって再生成された場合、結果は大きく異なることがわかりました。 AI が生成したビデオのピクセルはトレーニング データの平均に近づく傾向がありますが、人間が作成したビデオはさまざまな面で明確な個性を示します。この機能に基づいて開発された DIVID アルゴリズムは、Sora によって生成されたビデオを識別する際に最大 93.7% の精度を誇ります。
これらの AI 識別手法の出現により、偽情報の拡散に対する強力な武器が私たちに提供されたことは間違いありません。彼らはデジタル世界における鋭い目のようなもので、情報の海の中で真実と虚偽を区別するのに役立ちます。
AI識別技術の進歩は、誤った情報と戦うための新たな武器を私たちに提供し、将来的には情報識別技術の継続的な開発と改善を予告し、情報化時代において人々がより明確に理解できるようになります。