El editor de Downcodes informa: En la Conferencia Internacional sobre Recuperación de Información Musical (ISMIR) de 2024 recién concluida, se dio a conocer oficialmente un resultado de investigación llamativo: el modelo MusiConGen. Este modelo utiliza la arquitectura Transformer e introduce un mecanismo de condición de tiempo para lograr un control preciso del ritmo y los acordes en el campo de la generación musical. Las muestras musicales que genera cubren una variedad de estilos y muestran una excelente precisión y consistencia de estilo. Este avance tecnológico aporta nuevas posibilidades a los campos de la creación musical y la generación musical con inteligencia artificial. Echemos un vistazo más de cerca a este emocionante desarrollo.
En la Conferencia Internacional sobre Recuperación de Información Musical (ISMIR) de 2024, los investigadores demostraron su modelo MusiConGen recientemente desarrollado. Este modelo es un modelo de música generado por texto basado en Transformer. Al introducir un mecanismo de condición de tiempo, mejora significativamente la capacidad de controlar el ritmo y los acordes de la música.
Entrada del producto: https://top.aibase.com/tool/musicongen
El modelo MusiConGen está ajustado en función del marco de melodía MusicGen previamente entrenado y se utiliza principalmente para generar clips musicales de varios estilos. Al establecer parámetros de control para acordes y ritmo, el equipo de investigación demostró las muestras de música generadas por el modelo, que cubren cinco estilos diferentes: blues casual, jazz ácido suave, rock clásico, funk de alta energía y heavy metal.
Cada estilo de música tiene requisitos claros de acordes y ritmo. Estos datos se derivan de la base de datos RWC-pop-100 y los acordes generados se estiman mediante el modelo de reconocimiento de acordes BTC.
Para verificar la eficacia de MusiConGen, los investigadores lo compararon con el modelo de referencia y el modelo de referencia ajustado. Con las mismas configuraciones de control de acordes y ritmo, MusiConGen demostró mayor precisión y consistencia de estilo en las muestras musicales generadas, lo que refleja sus ventajas técnicas en la generación de música.
Destacar:
MusiConGen es un modelo de música generado por texto basado en Transformer que puede mejorar el control del ritmo y los acordes a través de condiciones de tiempo.
Al compararlo con los modelos tradicionales y los modelos perfeccionados, MusiConGen demostró mejoras significativas en la generación de música.
? La música generada por el modelo cubre cinco estilos diferentes y puede simular con precisión requisitos específicos de acordes y ritmos.
La aparición del modelo MusiConGen marca otro gran avance de la inteligencia artificial en el campo de la generación musical, proporcionando nuevas herramientas y posibilidades para la creación musical. Sus capacidades precisas de control de ritmo y acordes, así como el potencial para la generación de música de múltiples estilos, aportan una imaginación ilimitada a la creación musical futura. ¡Esperamos que MusiConGen traiga más trabajos musicales increíbles en el futuro!