Nos últimos anos, o mecanismo de aprendizagem de modelos de inteligência artificial tem sido um tema de pesquisa importante. Este artigo apresenta um estudo recente que revela as capacidades ocultas dos modelos de IA, analisando a dinâmica de aprendizagem dos modelos de IA no "espaço conceitual" e como usar tecnologias específicas para estimular essas capacidades para melhor compreender e gerar imagens. O estudo constatou que o processo de aprendizagem do modelo não se desenvolve linearmente, mas há reviravoltas repentinas e ativação de habilidades ocultas. Esta investigação não só aprofunda a nossa compreensão do mecanismo de aprendizagem dos modelos de IA, mas também fornece novas ideias para o desenvolvimento de sistemas de IA mais poderosos.
Recentemente, um novo método de investigação revelou as capacidades potenciais dos modelos de IA no processo de aprendizagem, superando as expectativas anteriores das pessoas. Ao analisar a dinâmica de aprendizagem do modelo de IA no “espaço conceitual”, os pesquisadores descobriram como fazer com que o sistema de IA compreenda e gere melhor imagens.
Nota sobre a fonte da imagem: a imagem é gerada pela IA e pelo provedor de serviços de autorização de imagem Midjourney
"Espaço conceitual" é um sistema de coordenadas abstrato que pode representar as características de cada conceito independente nos dados de treinamento, como forma, cor ou tamanho de um objeto. Os pesquisadores afirmam que ao descrever a dinâmica de aprendizagem neste espaço, pode-se revelar que a velocidade de aprendizagem de conceitos e a ordem de aprendizagem são afetadas por atributos de dados, que são chamados de “sinais de conceito”. Este sinal conceitual reflete a sensibilidade do processo de geração de dados às mudanças nos valores conceituais. Por exemplo, um modelo aprende as cores mais rapidamente quando a diferença entre vermelho e azul é evidente no conjunto de dados.
Durante o processo de pesquisa, a equipe de pesquisa observou que a dinâmica de aprendizagem do modelo sofreria mudanças repentinas de direção, de “memória de conceito” para “generalização”. Para verificar esse fenômeno, eles treinaram um modelo com “grandes círculos vermelhos”, “grandes círculos azuis” e “pequenos círculos vermelhos” como entrada. O modelo não pode gerar a combinação “pequeno círculo azul” que não aparece no treinamento por meio de simples prompts de texto. No entanto, usando técnicas de “intervenção potencial” (ou seja, manipulando as ativações responsáveis pela cor e tamanho no modelo) e técnicas de “over-cueing” (ou seja, melhorando as especificações de cores através de valores RGB), os pesquisadores geraram com sucesso “pequenos círculos azuis”. " Isso mostra que embora o modelo seja capaz de compreender a combinação de “azul” e “pequeno”, ele não domina essa habilidade por meio de simples instruções de texto.
Os pesquisadores também estenderam esse método a conjuntos de dados do mundo real, como o CelebA, que contém vários atributos de imagens faciais, como gênero e sorriso. Os resultados mostraram que o modelo apresentou capacidade de ocultação ao gerar imagens de mulheres sorridentes, mas foi fraco ao usar dicas básicas. Além disso, experimentos preliminares também descobriram que, ao usar o Stable Diffusion1.4, o excesso de solicitação pode gerar imagens incomuns, como um cartão de crédito triangular.
Portanto, a equipe de pesquisa propôs uma hipótese geral sobre habilidades ocultas: os modelos generativos possuem habilidades latentes que emergem repentina e consistentemente durante o treinamento, embora o modelo possa não exibir essas habilidades quando confrontado com pistas comuns.
Destaque:
Os modelos de IA exibem capacidades ocultas latentes durante a aprendizagem, além do que as pistas convencionais podem suscitar.
Através de técnicas como “intervenção latente” e “solicitação excessiva”, os pesquisadores são capazes de ativar essas habilidades ocultas e gerar imagens inesperadas.
O estudo analisa a dinâmica de aprendizagem do “espaço conceitual” e mostra que a velocidade de aprendizagem de diferentes conceitos é afetada pelas características dos dados.
Esta pesquisa fornece uma nova perspectiva para compreendermos o mecanismo de aprendizagem dos modelos de IA e também fornece uma referência valiosa para o desenvolvimento e aplicação de futuros modelos de IA. O método de análise do “espaço conceitual” e as tecnologias de “intervenção potencial” e “excesso de agilidade” fornecem ferramentas eficazes para explorar as capacidades potenciais dos modelos de IA e são dignas de mais pesquisas e aplicações.