Tsinghua University เปิดตัวแพลตฟอร์มการจำลองแหล่งกำเนิดเสียงที่ก้าวหน้า Sonicsim AI การประมวลผลเสียงกำลังจะเริ่มขึ้น? - บทความ AI

ผู้เขียน：Eve Cole เวลาอัปเดต：2025-02-14 07:48:01

ทีมวิจัยของมหาวิทยาลัย Tsinghua ได้พัฒนาแพลตฟอร์มการจำลองแหล่งกำเนิดเสียงมือถือที่เรียกว่า Sonicsim โดยมีวัตถุประสงค์เพื่อแก้ปัญหาการขาดแคลนข้อมูลในสถานการณ์แหล่งกำเนิดเสียงมือถือในด้านการประมวลผลคำพูด แพลตฟอร์มนี้สร้างขึ้นบน Habitat-SIM และสามารถฟื้นฟูสภาพแวดล้อมอะคูสติกที่แท้จริงและให้ข้อมูลคุณภาพสูงสำหรับการฝึกอบรมและการประเมินผลการแยกคำพูดและแบบจำลองที่ปรับปรุงแล้ว ชุดข้อมูลที่มีอยู่ส่วนใหญ่ขึ้นอยู่กับแหล่งเสียงแบบคงที่และยากที่จะตอบสนองความต้องการที่แท้จริง แพลตฟอร์ม SonicsIM แก้ปัญหาเหล่านี้ได้อย่างมีประสิทธิภาพและสร้างชุดข้อมูลแหล่งข้อมูลเสียงมือถือหลายแบบหลายฉาก

แพลตฟอร์มนี้สามารถจำลองสภาพแวดล้อมอะคูสติกที่ซับซ้อนได้หลากหลายรวมถึงการบดเคี้ยวสิ่งกีดขวางรูปทรงของห้องและผลกระทบของวัสดุที่แตกต่างกันต่อเสียงและรองรับพารามิเตอร์ฉากที่ผู้ใช้กำหนด ชุดข้อมูล Sonicset ใช้ข้อมูลจาก Librispeech, FreeSound DataSet50K และ Free Music Archive รวมถึงฉากจริงจากชุดข้อมูล MatterPort3D และมีเสียงที่หลากหลายเสียงรบกวนรอบข้างและข้อมูลเสียงเพลง กระบวนการก่อสร้างนั้นเป็นไปโดยอัตโนมัติอย่างมากทำให้มั่นใจได้ถึงความถูกต้องและความหลากหลายของข้อมูล ผลการทดลองแสดงให้เห็นว่าแบบจำลองที่ผ่านการฝึกอบรมในชุดข้อมูล Sonicset ทำงานได้ดีขึ้นในชุดข้อมูลจริงโดยตรวจสอบประสิทธิภาพของแพลตฟอร์ม Sonicsim การเปิดตัวแพลตฟอร์ม Sonicsim และชุดข้อมูล Sonicset ได้นำความก้าวหน้าใหม่มาสู่การประมวลผลคำพูดและจะส่งเสริมการประยุกต์ใช้เทคโนโลยีการประมวลผลคำพูดในสภาพแวดล้อมที่ซับซ้อนในอนาคต . ที่อยู่กระดาษ: https://arxiv.org/pdf/2410.01481

การเกิดขึ้นของแพลตฟอร์ม Sonicsim ให้แนวคิดใหม่สำหรับการเก็บข้อมูลในด้านการประมวลผลคำพูดและยังเน้นถึงบทบาทที่สำคัญของเทคโนโลยีการจำลองในการแก้ปัญหาเชิงปฏิบัติ ในอนาคตด้วยการพัฒนาเทคโนโลยีอย่างต่อเนื่องฉันเชื่อว่าแพลตฟอร์มการจำลองที่คล้ายกันจะมีบทบาทในสาขามากขึ้นและส่งเสริมความก้าวหน้าของเทคโนโลยีปัญญาประดิษฐ์