O editor do Downcodes aprendeu que um estudo mais recente explora profundamente a capacidade potencial dos modelos de IA no processo de aprendizagem, e seus métodos de aprendizagem excedem até mesmo a compreensão anterior das pessoas. Ao analisar a dinâmica de aprendizagem do modelo de IA no “espaço conceitual”, os pesquisadores revelaram um novo mecanismo para compreensão e geração de imagens de IA. Esta pesquisa não só fornece uma nova perspectiva para a nossa compreensão da aprendizagem de IA, mas também fornece ideias valiosas para melhorar o desempenho dos modelos de IA. Vamos dar uma olhada mais de perto nesta pesquisa inovadora.
Nota sobre a fonte da imagem: a imagem é gerada pela IA e pelo provedor de serviços de autorização de imagem Midjourney
"Espaço conceitual" é um sistema de coordenadas abstrato que pode representar as características de cada conceito independente nos dados de treinamento, como forma, cor ou tamanho de um objeto. Os pesquisadores afirmam que ao descrever a dinâmica de aprendizagem neste espaço, pode-se revelar que a velocidade de aprendizagem de conceitos e a ordem de aprendizagem são afetadas por atributos de dados, que são chamados de “sinais de conceito”. Este sinal conceitual reflete a sensibilidade do processo de geração de dados às mudanças nos valores conceituais. Por exemplo, um modelo aprende as cores mais rapidamente quando a diferença entre vermelho e azul é clara no conjunto de dados.
Durante o processo de pesquisa, a equipe de pesquisa observou que a dinâmica de aprendizagem do modelo sofreria mudanças repentinas de direção, de “memória de conceito” para “generalização”. Para verificar esse fenômeno, eles treinaram um modelo com “grandes círculos vermelhos”, “grandes círculos azuis” e “pequenos círculos vermelhos” como entrada. O modelo não pode gerar combinações de “pequenos círculos azuis” que não aparecem no treinamento por meio de simples prompts de texto. No entanto, usando técnicas de “intervenção potencial” (ou seja, manipulando as ativações responsáveis pela cor e tamanho no modelo) e técnicas de “over-cueing” (ou seja, melhorando as especificações de cores através de valores RGB), os pesquisadores geraram com sucesso “pequenos círculos azuis”. " Isso mostra que embora o modelo seja capaz de compreender a combinação de “azul” e “pequeno”, ele não domina essa habilidade por meio de simples instruções de texto.
Os pesquisadores também estenderam esse método a conjuntos de dados do mundo real, como o CelebA, que contém vários atributos de imagens faciais, como gênero e sorriso. Os resultados mostraram que o modelo apresentou capacidade de ocultação ao gerar imagens de mulheres sorridentes, mas foi fraco ao usar dicas básicas. Além disso, experimentos preliminares também descobriram que, ao usar o Stable Diffusion1.4, o excesso de solicitação pode gerar imagens incomuns, como um cartão de crédito triangular.
Portanto, a equipe de pesquisa propôs uma hipótese geral sobre habilidades ocultas: os modelos generativos possuem habilidades latentes que emergem repentina e consistentemente durante o treinamento, embora o modelo possa não exibir essas habilidades quando confrontado com pistas comuns.
Esta pesquisa fornece uma nova perspectiva para compreendermos o mecanismo de aprendizagem dos modelos de IA e também fornece uma nova direção para a melhoria e aplicação de modelos de IA no futuro. O editor do Downcodes acredita que com o aprofundamento contínuo da investigação sobre os mecanismos de aprendizagem da IA, seremos capazes de aproveitar melhor o potencial da IA e promover o desenvolvimento da tecnologia de inteligência artificial. Ansioso por resultados de pesquisas mais semelhantes no futuro!