A equipe de pesquisa da Disney anunciou recentemente uma tecnologia inovadora de compressão de imagem que reduz significativamente as taxas de transmissão de dados, garantindo a qualidade da imagem. Essa tecnologia reconstrói detalhes de imagem mais realistas a baixas taxas de bits, combinando inteligentemente erros de quantização e processamento de ruído e recebeu classificações mais altas nos testes de experiência do usuário do que os concorrentes. Comparado com codecs tradicionais como JPEG e AV1, embora sua complexidade tenha sido melhorada, suas vantagens na qualidade da imagem e na eficiência do processamento são mais significativas, o que é de grande importância para o campo de armazenamento e transmissão de imagem.
A Disney Research lançou recentemente uma tecnologia inovadora de compressão de imagem que pode gerar efeitos de imagem mais realistas, mantendo baixas taxas de transmissão de dados.
Embora essa nova tecnologia de codec tenha melhorado a complexidade em comparação com os codecs tradicionais, como JPEG e AV1, ela mostrou vantagens significativas na qualidade da imagem e na eficiência do processamento. A equipe de pesquisa constatou que, ao combinar o erro de quantização com o processamento de ruído no processamento da imagem, os detalhes da imagem podem ser melhor reconstruídos à taxa de bits de destino.
Comparação do método de compactação da Disney com métodos anteriores. O autor alega que a recuperação dos detalhes melhorou ao fornecer um modelo que não requer centenas de milhares de dólares em treinamento e corre mais rápido que o método de competição equivalente mais próximo.
Os pesquisadores disseram que a nova tecnologia requer apenas menos de 10% do processo completo de processamento e não requer grandes alterações na arquitetura do sistema. Nos testes reais, a qualidade da imagem reconstruída por essa tecnologia ainda é mais popular entre os usuários finais, mesmo que outros métodos de compactação usem o dobro da taxa de bits.
No entanto, essa tecnologia também tem algumas limitações. Em certos casos específicos, a imagem reconstruída pode experimentar sutil imprecisão, como uma leve curva de linhas retas ou uma leve distorção dos limites de pequenos objetos. Esses problemas decorrem principalmente das limitações das dimensões do recurso do sistema.
Nos testes práticos de aplicação, a equipe de pesquisa usou vários conjuntos de dados para avaliação, incluindo Kodak, CLIC2022 e Coco30K. Os indicadores de avaliação abrangem múltiplas dimensões, como a relação sinal / ruído (PSNR), o aprendizado do índice de similaridade percebido (LPIPS), o índice de similaridade estrutural em várias escalas (MS-SSIM) e a distância inicial de FRÉCHET (FID).
Compare ainda mais a nova abordagem da Disney (destacada em verde) com outras abordagens.
A pesquisa do usuário adota um método de seleção obrigatória e é avaliada por meio de um sistema de classificação ELO semelhante a um campeonato de xadrez. Os resultados mostram que, mesmo com os concorrentes usando o dobro da quantidade de dados, a nova tecnologia da Disney ainda recebeu classificações de usuário significativamente mais altas.
Em termos de velocidade de processamento, a nova tecnologia melhorou significativamente em comparação com seus principais concorrentes, com o tempo de processamento reduzido de 6,87 segundos para 3,49 segundos. Essa melhoria de eficiência, juntamente com o excelente efeito de compressão, faz com que essa tecnologia tenha um importante valor de aplicação nos campos de armazenamento e transmissão de imagens.
Vale ressaltar que o desenvolvimento da tecnologia de compressão de imagem é de grande importância para resolver problemas como armazenamento global de dados, transmissão de mídia e consumo de energia. Embora as melhores soluções de tecnologia nem sempre recebam o mais amplo reconhecimento de mercado, essa inovação da Disney oferece à indústria uma solução que alcança um bom equilíbrio entre eficiência e desempenho.
Em suma, a tecnologia de compressão de imagem da Disney fez avanços significativos na eficiência e na qualidade da imagem, trazendo novas possibilidades ao campo do processamento de imagens, e os desenvolvimentos futuros valem a pena esperar.