KI-Musikgenerierungsmodell MusiConGen: Verwenden Sie Transformer, um Musik zu erzeugen und Rhythmus und Akkorde genau zu steuern

Autor：Eve Cole Aktualisierungszeit：2024-12-06 09:48:02

Der Herausgeber von Downcodes berichtet: Auf der gerade zu Ende gegangenen International Conference on Music Information Retrieval (ISMIR) 2024 wurde ein auffälliges Forschungsergebnis – das MusiConGen-Modell – offiziell vorgestellt. Dieses Modell nutzt die Transformer-Architektur und führt einen Zeitbedingungsmechanismus ein, um eine präzise Steuerung von Rhythmus und Akkorden im Bereich der Musikerzeugung zu erreichen. Die von ihm generierten Musikbeispiele decken eine Vielzahl von Stilen ab und weisen eine hervorragende Genauigkeit und Stilkonsistenz auf. Dieser technologische Durchbruch eröffnet neue Möglichkeiten für die Bereiche Musikkreation und Musikgenerierung mit künstlicher Intelligenz. Schauen wir uns diese spannende Entwicklung genauer an.

Auf der International Conference on Music Information Retrieval (ISMIR) 2024 stellten Forscher ihr neu entwickeltes MusiConGen-Modell vor. Bei diesem Modell handelt es sich um ein textgeneriertes Musikmodell, das auf Transformer basiert. Durch die Einführung eines Zeitbedingungsmechanismus wird die Fähigkeit zur Steuerung von Musikrhythmus und -akkorden erheblich verbessert.

Produkteingang: https://top.aibase.com/tool/musicongen

Das MusiConGen-Modell basiert auf dem vorab trainierten MusicGen-Melodie-Framework und wird hauptsächlich zur Generierung von Musikclips verschiedener Stilrichtungen verwendet. Durch die Festlegung von Steuerparametern für Akkorde und Rhythmus demonstrierte das Forschungsteam die vom Modell generierten Musiksamples, die fünf verschiedene Stile abdecken: Casual Blues, Smooth Acid Jazz, Classic Rock, High-Energy Funk und Heavy Metal.

Jeder Musikstil hat klare Akkord- und Rhythmusanforderungen. Diese Daten werden aus der RWC-pop-100-Datenbank abgeleitet und die generierten Akkorde werden vom BTC-Akkorderkennungsmodell geschätzt.

Um die Wirksamkeit von MusiConGen zu überprüfen, verglichen die Forscher es mit dem Basismodell und dem fein abgestimmten Basismodell. Mit den gleichen Akkord- und Rhythmussteuerungseinstellungen zeigte MusiConGen eine höhere Genauigkeit und Stilkonsistenz bei den generierten Musikbeispielen, was seine technischen Vorteile bei der Musikerzeugung widerspiegelt.

Highlight:

?MusiConGen ist ein textgeneriertes Musikmodell auf Basis von Transformer, das die Kontrolle über Rhythmus und Akkorde durch Zeitbedingungen verbessern kann.

Durch den Vergleich mit traditionellen Modellen und fein abgestimmten Modellen zeigte MusiConGen erhebliche Verbesserungen bei der Musikerzeugung.

? Die vom Modell erzeugte Musik deckt fünf verschiedene Stile ab und kann spezifische Akkord- und Rhythmusanforderungen genau simulieren.

Die Entstehung des MusiConGen-Modells stellt einen weiteren großen Durchbruch der künstlichen Intelligenz im Bereich der Musikgenerierung dar und bietet neue Werkzeuge und Möglichkeiten für die Musikkreation. Seine präzisen Rhythmus- und Akkordsteuerungsfunktionen sowie das Potenzial für die Musikgenerierung in mehreren Stilrichtungen verleihen der zukünftigen Musikkreation unbegrenzte Fantasie. Wir freuen uns darauf, dass MusiConGen in Zukunft weitere großartige Musikwerke bringt!

​KI-Musikgenerierungsmodell MusiConGen: Verwenden Sie Transformer, um Musik zu erzeugen und Rhythmus und Akkorde genau zu steuern

KI-Musikgenerierungsmodell MusiConGen: Verwenden Sie Transformer, um Musik zu erzeugen und Rhythmus und Akkorde genau zu steuern