Исследовательская группа Университета Цинхуа разработала мобильную платформу моделирования источника звука под названием SonicsIm, направленная на решение проблемы дефицита данных в сценариях мобильного источника звука в области обработки речи. Платформа построена на среде обитания-SIM и может сильно восстановить реальную акустическую среду и предоставлять высококачественные данные для обучения и оценки разделения речи и улучшенных моделей. Большинство существующих наборов данных основаны на статических источниках звука и трудно удовлетворить фактические потребности. Платформа Sonicsim эффективно решает эти проблемы и создает большой набор данных мобильного звучания с несколькими сценарио Sonicset.
Эта платформа может имитировать множество сложных акустических сред, включая окклюзию препятствий, геометрию комнаты и влияние различных материалов на звук, и поддерживает пользовательские параметры сцены. Набор данных Sonicset использует данные из Librispeech, FreeSound DataSet50K и бесплатного музыкального архива, а также реальные сцены из набора данных Matterport3D, и содержит данные о богатом голосе, окружающем шуме и музыкальном шуме. Его строительный процесс высоко автоматизирован, обеспечивая подлинность и разнообразие данных. Экспериментальные результаты показывают, что модель, обученная набору данных Sonicset, работает лучше в реальном наборе данных, проверяя эффективность платформы Sonicsim. Выпуск набора данных платформы Sonicsim и Sonicset принес новые прорывы в область обработки речи и в будущем будет способствовать применению технологии обработки речи в сложных условиях, но его подлинность все еще ограничена деталями 3D -сцены Полем Бумажный адрес: https://arxiv.org/pdf/2410.01481
Появление платформы Sonicsim предоставляет новые идеи для сбора данных в области обработки речи, а также подчеркивает важную роль технологии моделирования в решении практических проблем. В будущем, с непрерывным развитием технологий, я считаю, что аналогичные платформы моделирования будут играть роль в большем количестве областей и способствовать прогрессу технологий искусственного интеллекта.