ดาวน์โหลด MusicGen แพลตฟอร์มการสร้าง AI ที่เปิดตัวโดย Meta: MetaMusicGen ได้รับการประกาศว่าออนไลน์แล้ว ผู้ใช้สามารถป้อนข้อความที่เกี่ยวข้องได้ตามความต้องการของตนเองเพื่อสร้างเพลงโปรดของตน การดำเนินการนั้นง่ายมากและไม่จำเป็นต้องมีความรู้ทางวิชาชีพ ชาวเน็ตที่ชอบก็มาลองกันดู
ทีมงาน Meta AI ซึ่งแสดงความตั้งใจเชิงบวกสำหรับ generative AI ก็ไม่พลาดความก้าวหน้าทางเทคโนโลยีในการสร้างดนตรี ประกาศ MusicGen ซึ่งเป็นโมเดลภาษาการเรียนรู้เชิงลึกที่ให้บริการสร้างเพลงด้วย AI ที่สร้างโดยทีมวิจัย Audiocraft อ่านต่อไป Meta เปิดตัว AI MusicGen รุ่นเพลง: สามารถสร้างเพลงและใช้ "ข้อความ" เพื่อปรับแทร็กที่มีอยู่และรายงานเนื้อหา
นอกจากภาพวาดแบบเคลื่อนไหวที่สามารถเต้นไปกับตัวละครกราฟฟิตี้แล้ว ทีมงาน Meta AI ซึ่งแสดงความตั้งใจเชิงบวกสำหรับ generative AI ก็ไม่พลาดความก้าวหน้าทางเทคโนโลยีในการสร้างดนตรี ประกาศว่าบริการสร้างเพลงด้วย AI โมเดลภาษาการเรียนรู้เชิงลึก MusicGen ที่สร้างโดยทีมวิจัย Audiocraft ของพวกเขานั้นเป็นโอเพ่นซอร์สบน GitHub และสามารถสร้างเพลงได้อย่างสมบูรณ์ผ่านฮาร์ดแวร์ GPU ของคุณเองหรือ Google Colab (นี่คือขั้นตอนของการวิจัย Facebook) ความสามารถของ MusicGen ในการ “ปรับ” เพลงที่มีอยู่ผ่านข้อความแจ้งก็มีให้ใช้งานทางออนไลน์เช่นกัน คุณสามารถทดลองใช้ได้ที่นี่ คลิปเพลงจะถูกอัปโหลดเพื่อสร้างเนื้อหาเพลงเชิงสร้างสรรค์ความยาวประมาณ 12 วินาที
MusicGen เวอร์ชันออนไลน์นั้นใช้งานง่ายมาก ผู้เขียนอัพโหลดเพลงทำนองเกือบ 4 นาที หากสร้างด้วย MusicGen ผ่านคำพร้อมท์พื้นฐาน จะใช้เวลามากกว่า 200 วินาทีในการประมวลผล ผ่านคำพร้อมท์สาธิตที่ค่อนข้างซับซ้อน เช่น "เพลงป๊อปยุค 80 ที่ขับเคลื่อนด้วยกลองหนักและแผ่นสังเคราะห์ในพื้นหลัง" การสร้างจะเพิ่มมากขึ้น
ในส่วนของผลกระทบของการปรับตัว โดยส่วนตัวแล้วฉันคิดว่ามันค่อนข้างน่าสนใจ และฉันยังอยากรู้จริงๆ ว่าการสร้างเพลง AI จากข้อความทั้งหมดจะเป็นอย่างไร พนักงาน Meta AI ยังได้เผยแพร่เอฟเฟกต์การดัดแปลงเพลงของ MusicGen บน Twitter (ตามด้านบน)
เจ้าหน้าที่ยังกล่าวอย่างมั่นใจว่าเมื่อเปรียบเทียบกับบริการอื่นๆ ที่มีอยู่ เช่น MusicLM, Riffusion และ Musai แล้ว MusicGen สามารถสร้างผลลัพธ์ที่ดีกว่าได้ สิ่งนี้อาจเกี่ยวข้องกับข้อเท็จจริงที่ทีมวิจัยกล่าวว่า MusicGen แตกต่างจากเทคโนโลยีอื่นๆ ตรงที่ไม่จำเป็นต้องตรวจสอบประสิทธิภาพความหมายด้วยตนเอง และสามารถจัดเตรียมขั้นตอนการประมวลผลเสียงแบบถดถอยเองได้ 50 ขั้นตอนต่อวินาที แล้วอะไรคือกุญแจสำคัญในการบรรลุประสิทธิภาพการสร้างที่ดีขึ้น?