A medida que la tecnología de generación de IA avanza cada día que pasa, imágenes y vídeos cada vez más realistas generados por IA inundan Internet, lo que dificulta que las personas distingan la autenticidad. Identificar contenido generado por IA se ha convertido en una necesidad urgente. Recientemente, el video de la estación B "Qubit" discutió cómo usar la tecnología de inteligencia artificial para identificar videos generados por inteligencia artificial, lo que atrajo una atención generalizada. El número de vistas superó los 1,68 millones, lo que provocó una acalorada discusión sobre la tecnología de identificación de inteligencia artificial.
A medida que las imágenes generadas por IA se vuelven cada vez más realistas, muchas personas no pueden evitar pensar en ello cuando miran videos: ¿Es esto realmente filmado o es una obra maestra de la IA?
Recientemente, un trabajo publicado por Qubit en Bilibili que analiza cómo usar la IA para identificar videos de IA provocó acaloradas discusiones, y el número de visitas superó instantáneamente los 1,68 millones. Echemos un vistazo a cómo la IA puede identificar la IA de un vistazo.
El vídeo presenta algunos consejos para identificar vídeos de IA a simple vista. Por ejemplo, preste atención a si el personaje hace movimientos o expresiones antinaturales y si la voz, la forma de la boca y las emociones están coordinadas al hablar. Sin embargo, frente a videos masivos, el poder humano por sí solo es obviamente insuficiente y en este momento se necesita inteligencia artificial.
La IA tiene ventajas únicas cuando se trata de identificar videos que cambian de cara. La tecnología de cambio de cara de IA generalmente une la parte sintetizada con el video original cuadro por cuadro. Aunque es posible que el ojo humano solo encuentre algo extraño, la IA puede localizar con precisión estos rastros de empalme. Así como cada persona tiene una huella digital única, es difícil copiar perfectamente la iluminación, la textura y otra información de diferentes videos. Estas diferencias sutiles son la clave para el reconocimiento de la IA.
Para vídeos generados íntegramente por IA, el método de reconocimiento es más complejo. Un equipo de investigación ha entrenado tres clasificadores a partir de las tres dimensiones de características del modelo, características de movimiento y características geométricas de profundidad monocular. Tomando como ejemplo el vídeo generado por Sora, el número inestable de personas y animales, los cambios anormales de color y sombra durante el movimiento de los objetos y los errores de perspectiva y proporción al mover la cámara se han convertido en pistas importantes para el reconocimiento de la IA.
Aún más interesante es que los investigadores también descubrieron un nuevo método llamado DIVID. Descubrieron que si el modelo de difusión regenerara el vídeo de IA y el vídeo real, los resultados serían muy diferentes. Los píxeles de vídeo generados por IA tienden a estar más cerca del promedio de los datos de entrenamiento, mientras que los vídeos creados por humanos mostrarán una personalidad clara en varios aspectos. El algoritmo DIVID desarrollado en base a esta función tiene una precisión de hasta el 93,7% al identificar videos generados por Sora.
Sin duda, la aparición de estos métodos de identificación mediante IA nos ha proporcionado un arma poderosa contra la difusión de información falsa. Son como ojos agudos en el mundo digital, que nos ayudan a distinguir la verdad de la falsedad en el océano de información.
El avance de la tecnología de identificación de IA nos proporciona nuevas armas para luchar contra la información falsa. También presagia el desarrollo y la mejora continuos de la tecnología de identificación de información en el futuro, lo que permitirá a las personas tener una comprensión más clara en la era de la información.