O editor de Downcodes relata: Na recém-concluída Conferência Internacional sobre Recuperação de Informação Musical (ISMIR) de 2024, um modelo MusiConGen de resultado de pesquisa atraente foi oficialmente revelado. Este modelo usa a arquitetura Transformer e introduz um mecanismo de condição de tempo para obter controle preciso de ritmo e acordes no campo da geração musical. As amostras musicais geradas cobrem uma variedade de estilos e mostram excelente precisão e consistência de estilo. Este avanço tecnológico traz novas possibilidades para os campos da criação musical e da geração musical com inteligência artificial. Vamos dar uma olhada mais de perto neste desenvolvimento emocionante.
Na Conferência Internacional sobre Recuperação de Informação Musical (ISMIR) de 2024, os pesquisadores demonstraram seu modelo MusiConGen recém-desenvolvido. Este modelo é um modelo de música gerado por texto baseado no Transformer. Ao introduzir um mecanismo de condição de tempo, melhora significativamente a capacidade de controlar o ritmo e os acordes da música.
Entrada do produto: https://top.aibase.com/tool/musicongen
O modelo MusiConGen é ajustado com base na estrutura de melodia MusicGen pré-treinada e é usado principalmente para gerar clipes musicais de vários estilos. Ao definir parâmetros de controle para acordes e ritmo, a equipe de pesquisa demonstrou as amostras musicais geradas pelo modelo, abrangendo cinco estilos diferentes: blues casual, smooth acid jazz, rock clássico, funk de alta energia e heavy metal.
Cada estilo de música tem requisitos claros de acordes e ritmos. Esses dados são derivados do banco de dados RWC-pop-100 e os acordes gerados são estimados pelo modelo de reconhecimento de acordes BTC.
Para verificar a eficácia do MusiConGen, os pesquisadores compararam-no com o modelo de linha de base e o modelo de linha de base ajustado. Com as mesmas configurações de controle de acordes e ritmos, o MusiConGen demonstrou maior precisão e consistência de estilo nas amostras musicais geradas, refletindo suas vantagens técnicas na geração musical.
Destaque:
?MusiConGen é um modelo musical gerado por texto baseado no Transformer que pode aprimorar o controle do ritmo e dos acordes através das condições de tempo.
Ao comparar com modelos tradicionais e modelos ajustados, o MusiConGen demonstrou melhorias significativas na geração musical.
? A música gerada pelo modelo abrange cinco estilos diferentes e pode simular com precisão requisitos específicos de acordes e ritmos.
O surgimento do modelo MusiConGen marca outro grande avanço da inteligência artificial no campo da geração musical, proporcionando novas ferramentas e possibilidades para a criação musical. Suas capacidades precisas de controle de ritmo e acordes, bem como o potencial para geração de música em vários estilos, trazem imaginação ilimitada para a criação musical futura. Esperamos que a MusiConGen traga mais trabalhos musicais incríveis no futuro!