Editor Downcodes melaporkan: Pada Konferensi Internasional tentang Pengambilan Informasi Musik (ISMIR) tahun 2024 yang baru saja berakhir, sebuah hasil penelitian yang menarik, model MusiConGen, secara resmi diluncurkan. Model ini menggunakan arsitektur Transformer dan memperkenalkan mekanisme kondisi waktu untuk mencapai kontrol ritme dan akord yang tepat di bidang pembuatan musik. Sampel musik yang dihasilkannya mencakup berbagai gaya dan menunjukkan akurasi dan konsistensi gaya yang sangat baik. Terobosan teknologi ini membawa kemungkinan-kemungkinan baru dalam bidang penciptaan musik dan generasi musik dengan kecerdasan buatan. Mari kita lihat lebih dekat perkembangan menarik ini.
Pada Konferensi Internasional Pengambilan Informasi Musik (ISMIR) tahun 2024, para peneliti mendemonstrasikan model MusiConGen yang baru mereka kembangkan. Model ini adalah model musik yang dihasilkan teks berdasarkan Transformer. Dengan memperkenalkan mekanisme kondisi waktu, model ini secara signifikan meningkatkan kemampuan untuk mengontrol ritme dan akord musik.
Pintu masuk produk: https://top.aibase.com/tool/musicongen
Model MusiConGen disetel dengan baik berdasarkan kerangka melodi MusicGen yang telah dilatih sebelumnya dan terutama digunakan untuk menghasilkan klip musik dengan berbagai gaya. Dengan menetapkan parameter kontrol untuk akord dan ritme, tim peneliti mendemonstrasikan sampel musik yang dihasilkan oleh model, mencakup lima gaya berbeda: blues kasual, jazz asam halus, rock klasik, funk berenergi tinggi, dan heavy metal.
Setiap gaya musik memiliki persyaratan akord dan ritme yang jelas. Data ini berasal dari database RWC-pop-100, dan akord yang dihasilkan diperkirakan oleh model pengenalan akord BTC.
Untuk memverifikasi efektivitas MusiConGen, para peneliti membandingkannya dengan model dasar dan model dasar yang telah disesuaikan. Dengan pengaturan kontrol akord dan ritme yang sama, MusiConGen menunjukkan akurasi dan konsistensi gaya yang lebih tinggi dalam sampel musik yang dihasilkan, yang mencerminkan keunggulan teknisnya dalam pembuatan musik.
Menyorot:
? MusiConGen adalah model musik yang dihasilkan teks berdasarkan Transformer yang dapat meningkatkan kontrol ritme dan akord melalui kondisi waktu.
Dengan membandingkan model tradisional dan model yang disempurnakan, MusiConGen menunjukkan peningkatan signifikan dalam generasi musik.
? Musik yang dihasilkan oleh model mencakup lima gaya berbeda dan dapat secara akurat mensimulasikan persyaratan akord dan ritme tertentu.
Kemunculan model MusiConGen menandai terobosan besar lainnya dalam kecerdasan buatan di bidang generasi musik, yang menyediakan alat dan kemungkinan baru untuk penciptaan musik. Kemampuan kontrol ritme dan akordnya yang tepat, serta potensi generasi musik multi-gaya, menghadirkan imajinasi tak terbatas pada kreasi musik masa depan. Kami menantikan MusiConGen menghadirkan lebih banyak karya musik menakjubkan di masa depan!