O editor de downcodes relatou: OpenAI lançou a revolucionária tecnologia de geração de imagens de IA sCM, que fez um progresso revolucionário na velocidade e eficiência de geração de imagens e pode ser considerada um marco no campo de imagens de IA. Ao simplificar as etapas de cálculo, o modelo sCM atinge o efeito mágico de gerar imagens de alta qualidade em apenas duas etapas e é 50 vezes mais rápido que o modelo de difusão tradicional. Leva apenas 0,11 segundos para gerar uma imagem na GPU A100, e os parâmetros máximos do modelo chegam a 1,5 bilhão, estabelecendo um novo recorde da indústria. Esta tecnologia não só alcançou excelentes resultados de testes nos conjuntos de dados CIFAR-10 e ImageNet, mas também mostrou um forte potencial de expansão, estabelecendo uma base sólida para o treinamento de modelos de maior escala no futuro.
Principais vantagens técnicas:
Gere imagens de alta qualidade em apenas duas etapas de cálculo
Leva apenas 0,11 segundos para gerar uma imagem no A100GPU
Comparado com o modelo de difusão tradicional, a velocidade é aumentada em 50 vezes
Os parâmetros máximos do modelo atingiram 1,5 bilhão, estabelecendo um novo recorde
Em testes reais, o sCM teve um desempenho impressionante. Ele alcançou uma pontuação FID de 2,06 no conjunto de dados CIFAR-10 e uma pontuação excelente de 1,88 ao gerar imagens de 512x512 pixels no ImageNet. Estas métricas ficam apenas cerca de 10% atrás dos melhores modelos de difusão existentes, mas representam um salto qualitativo em termos de velocidade.
A chave para a inovação tecnológica é resolver os problemas fundamentais do modelo tradicional de consistência. Os modelos anteriores usavam intervalos de tempo discretos, que não apenas exigiam parâmetros adicionais, mas também eram propensos a erros. A equipe de pesquisa da OpenAI unificou vários métodos estabelecendo uma estrutura teórica simplificada e identificou e resolveu com sucesso as principais causas da instabilidade do treinamento.
O que é ainda mais emocionante é que esta tecnologia apresenta um forte potencial de expansão. A OpenAI treinou com sucesso um modelo com 1,5 bilhão de parâmetros no conjunto de dados ImageNet, que é a primeira vez para um modelo semelhante. O estudo descobriu que à medida que o tamanho do modelo aumenta, a qualidade da imagem continua a melhorar, o que significa que o treinamento do modelo em maior escala pode ser possível no futuro.
O advento da tecnologia sCM anuncia uma nova onda de desenvolvimento no campo da geração de imagens de IA. Sua enorme melhoria na velocidade e eficiência proporcionará possibilidades para mais cenários de aplicação. Vamos esperar e ver o que o OpenAI trará no futuro. avanço!