À mesure que la technologie de génération d’IA progresse chaque jour, des images et des vidéos générées par l’IA de plus en plus réalistes inondent Internet, ce qui rend difficile pour les gens de distinguer l’authenticité. Identifier le contenu généré par l’IA est devenu un besoin urgent. Récemment, la vidéo de la station B "Qubit" a expliqué comment utiliser la technologie d'IA pour identifier les vidéos générées par l'IA, ce qui a attiré une large attention. Le nombre de vues a dépassé 1,68 million, déclenchant une discussion animée sur la technologie d'identification de l'IA.
Alors que les images générées par l’IA deviennent de plus en plus réalistes, de nombreuses personnes ne peuvent s’empêcher d’y penser lorsqu’elles regardent des vidéos : est-ce vraiment tourné ou est-ce un chef-d’œuvre de l’IA ?
Récemment, un ouvrage publié par Qubit sur Bilibili expliquant comment utiliser l'IA pour identifier les vidéos IA a suscité des discussions animées, le nombre de vues dépassant instantanément 1,68 million. Voyons en un coup d’œil comment l’IA peut identifier l’IA.
La vidéo présente quelques conseils pour identifier les vidéos IA à l'œil nu. Par exemple, faites attention à ce que le personnage fasse des mouvements ou des expressions non naturelles et à ce que la voix, la forme de la bouche et les émotions soient coordonnées lorsqu'il parle. Cependant, face à des vidéos massives, la puissance humaine seule est évidemment insuffisante et l’IA est actuellement nécessaire.
L’IA présente des avantages uniques lorsqu’il s’agit d’identifier des vidéos qui changent de visage. La technologie de changement de visage de l’IA raccorde généralement la partie synthétisée à la vidéo originale image par image. Même si l’œil humain ne trouve que quelque chose d’étrange, l’IA peut localiser avec précision ces traces d’épissage. Tout comme chacun possède une empreinte digitale unique, il est difficile de copier parfaitement l’éclairage, la texture et d’autres informations de différentes vidéos. Ces différences subtiles sont la clé de la reconnaissance par l’IA.
Pour les vidéos entièrement générées par l’IA, la méthode de reconnaissance est plus complexe. Une équipe de recherche a formé trois classificateurs à partir des trois dimensions des caractéristiques du modèle, des caractéristiques de mouvement et des caractéristiques de profondeur géométrique monoculaire. En prenant comme exemple la vidéo générée par Sora, le nombre instable de personnes et d'animaux, les changements anormaux de couleur et d'ombre lors du mouvement de l'objet, ainsi que les erreurs de perspective et de proportion lors du déplacement de la caméra sont tous devenus des indices importants pour la reconnaissance de l'IA.
Plus intéressant encore, les chercheurs ont également découvert une nouvelle méthode appelée DIVID. Ils ont constaté que si la vidéo IA et la vidéo réelle étaient régénérées par le modèle de diffusion, les résultats seraient très différents. Les pixels vidéo générés par l'IA ont tendance à être plus proches de la moyenne des données d'entraînement, tandis que les vidéos créées par l'homme montreront une personnalité claire sous divers aspects. L'algorithme DIVID développé sur la base de cette fonctionnalité a une précision allant jusqu'à 93,7 % lors de l'identification des vidéos générées par Sora.
L’émergence de ces méthodes d’identification par l’IA nous a sans aucun doute fourni une arme puissante contre la propagation de fausses informations. Ils sont comme des yeux perçants dans le monde numérique, nous aidant à distinguer le vrai du faux dans l’océan de l’information.
Les progrès de la technologie d'identification par l'IA nous fournissent de nouvelles armes pour lutter contre les fausses informations. Ils annoncent également le développement et l'amélioration continus de la technologie d'identification de l'information à l'avenir, permettant aux gens d'avoir une compréhension plus claire à l'ère de l'information.