À medida que a tecnologia de geração de IA avança a cada dia que passa, imagens e vídeos gerados por IA cada vez mais realistas inundam a Internet, tornando difícil para as pessoas distinguirem a autenticidade. Identificar conteúdo gerado por IA tornou-se uma necessidade urgente. Recentemente, o vídeo da estação "Qubit" B discutiu como usar a tecnologia de IA para identificar vídeos gerados por IA, o que atraiu a atenção generalizada. O número de visualizações ultrapassou 1,68 milhão, desencadeando uma discussão acalorada sobre a tecnologia de identificação de IA.
À medida que as imagens geradas pela IA se tornam cada vez mais realistas, muitas pessoas não conseguem deixar de pensar nisso ao assistir aos vídeos: isso é realmente filmado ou é uma obra-prima da IA?
Recentemente, um trabalho publicado pela Qubit sobre Bilibili discutindo como usar IA para identificar vídeos de IA gerou discussões acaloradas, com o número de visualizações ultrapassando instantaneamente 1,68 milhão. Vamos dar uma olhada em como a IA pode identificar a IA rapidamente.
O vídeo apresenta algumas dicas para identificar vídeos de IA a olho nu. Por exemplo, preste atenção se o personagem faz movimentos ou expressões não naturais e se a voz, o formato da boca e a emoção são coordenados ao falar. No entanto, face a vídeos massivos, o poder humano por si só é obviamente insuficiente e a IA é necessária neste momento.
A IA tem vantagens únicas quando se trata de identificar vídeos que mudam o rosto da IA. A tecnologia de mudança de rosto de IA geralmente une a parte sintetizada ao vídeo original, quadro a quadro. Embora o olho humano possa encontrar apenas algo estranho, a IA pode localizar com precisão esses traços de emenda. Assim como cada pessoa tem uma impressão digital única, é difícil copiar perfeitamente a iluminação, a textura e outras informações de diferentes vídeos. Essas diferenças sutis são a chave para o reconhecimento da IA.
Para vídeos inteiramente gerados por IA, o método de reconhecimento é mais complexo. Uma equipe de pesquisa treinou três classificadores nas três dimensões de recursos do modelo, recursos de movimento e recursos geométricos de profundidade monocular. Tomando como exemplo o vídeo gerado por Sora, o número instável de pessoas e animais, mudanças anormais de cor e sombra durante o movimento do objeto e erros de perspectiva e proporção ao mover a câmera tornaram-se pistas importantes para o reconhecimento da IA.
Ainda mais interessante é que os pesquisadores também descobriram um novo método chamado DIVID. Eles descobriram que se o vídeo AI e o vídeo real fossem regenerados pelo modelo de difusão, os resultados seriam muito diferentes. Os pixels de vídeo gerados por IA tendem a estar mais próximos da média dos dados de treinamento, enquanto os vídeos criados por humanos mostram uma personalidade clara em vários aspectos. O algoritmo DIVID desenvolvido com base neste recurso tem precisão de até 93,7% na identificação de vídeos gerados pelo Sora.
O surgimento destes métodos de identificação por IA forneceu-nos, sem dúvida, uma arma poderosa contra a propagação de informações falsas. São como olhos aguçados no mundo digital, ajudando-nos a distinguir a verdade da falsidade no oceano de informação.
O avanço da tecnologia de identificação de IA fornece-nos novas armas para lutar contra informações falsas. Também anuncia o desenvolvimento contínuo e a melhoria da tecnologia de identificação de informação no futuro, permitindo que as pessoas tenham uma compreensão mais clara na era da informação.