Da die KI-Generierungstechnologie von Tag zu Tag voranschreitet, überschwemmen immer mehr realistische KI-generierte Bilder und Videos das Internet, was es für Menschen schwierig macht, Authentizität zu erkennen. Die Identifizierung von KI-generierten Inhalten ist zu einem dringenden Bedarf geworden. Kürzlich wurde im Video der „Qubit“-B-Station die Verwendung von KI-Technologie zur Identifizierung von KI-generierten Videos erörtert, was große Aufmerksamkeit erregte. Die Anzahl der Aufrufe überstieg 1,68 Millionen und löste eine hitzige Diskussion über die KI-Identifizierungs-KI-Technologie aus.
Da von KI erzeugte Bilder immer realistischer werden, kommen viele Menschen beim Ansehen von Videos nicht umhin, darüber nachzudenken: Ist das wirklich aufgenommen oder handelt es sich um ein Meisterwerk der KI?
Kürzlich löste eine von Qubit auf Bilibili veröffentlichte Arbeit über den Einsatz von KI zur Identifizierung von KI-Videos heftige Diskussionen aus, wobei die Zahl der Aufrufe sofort 1,68 Millionen überstieg. Werfen wir einen Blick darauf, wie KI KI auf einen Blick erkennen kann.
Das Video stellt einige Tipps zur Identifizierung von KI-Videos mit bloßem Auge vor. Achten Sie beispielsweise darauf, ob die Figur unnatürliche Bewegungen oder Ausdrücke macht und ob Stimme, Mundform und Emotion beim Sprechen aufeinander abgestimmt sind. Angesichts der riesigen Menge an Videos reicht die menschliche Kraft allein jedoch offensichtlich nicht aus, und zu diesem Zeitpunkt ist KI erforderlich.
KI bietet einzigartige Vorteile, wenn es darum geht, gesichtsverändernde KI-Videos zu identifizieren. Die KI-Technologie zur Gesichtsveränderung verbindet den synthetisierten Teil normalerweise Bild für Bild mit dem Originalvideo. Obwohl das menschliche Auge möglicherweise nur etwas Seltsames findet, kann die KI diese Spleißspuren genau lokalisieren. So wie jeder einen einzigartigen Fingerabdruck hat, ist es schwierig, die Beleuchtung, Textur und andere Informationen verschiedener Videos perfekt zu kopieren. Diese subtilen Unterschiede sind der Schlüssel zur KI-Erkennung.
Bei vollständig durch KI generierten Videos ist die Erkennungsmethode komplexer. Ein Forschungsteam hat drei Klassifikatoren aus den drei Dimensionen Modellmerkmale, Bewegungsmerkmale und geometrische monokulare Tiefenmerkmale trainiert. Am Beispiel des von Sora erstellten Videos sind die instabile Anzahl von Menschen und Tieren, ungewöhnliche Farb- und Schattenveränderungen bei Objektbewegungen sowie Perspektiven- und Proportionsfehler beim Bewegen der Kamera zu wichtigen Hinweisen für die KI-Erkennung geworden.
Noch interessanter ist, dass die Forscher auch eine neue Methode namens DIVID entdeckten. Sie fanden heraus, dass die Ergebnisse sehr unterschiedlich ausfallen würden, wenn das KI-Video und das reale Video durch das Diffusionsmodell neu generiert würden. KI-generierte Videopixel liegen tendenziell näher am Durchschnitt der Trainingsdaten, während von Menschen erstellte Videos in verschiedenen Aspekten eine klare Persönlichkeit zeigen. Der auf Basis dieser Funktion entwickelte DIVID-Algorithmus weist eine Genauigkeit von bis zu 93,7 % bei der Identifizierung von von Sora generierten Videos auf.
Das Aufkommen dieser KI-Identifizierungsmethoden hat uns zweifellos eine mächtige Waffe gegen die Verbreitung falscher Informationen an die Hand gegeben. Sie sind wie scharfe Augen in der digitalen Welt und helfen uns, im Ozean der Informationen Wahrheit von Unwahrheit zu unterscheiden.
Die Weiterentwicklung der KI-Identifikationstechnologie stellt uns neue Waffen zur Bekämpfung falscher Informationen zur Verfügung. Sie kündigt auch die kontinuierliche Weiterentwicklung und Verbesserung der Informationsidentifikationstechnologie in der Zukunft an und ermöglicht den Menschen ein klareres Verständnis im Informationszeitalter.