أصدر مختبر شنغهاي للذكاء الاصطناعي، وكلية علوم البيانات بجامعة هونغ كونغ الصينية، ومعهد شينزين لأبحاث البيانات الضخمة، مجموعة أدوات مفتوحة المصدر لتوليد الصوت والموسيقى والكلام تسمى أمفيون. هذه أخبار مثيرة ستزود المطورين في المجالات المتعلقة بالصوت بأدوات وموارد قوية وتعزز التطور السريع في هذا المجال. يتضمن Amphion بنية تحتية مثل معالجة البيانات والوحدات العامة وخوارزميات التحسين، ويخطط لدمج المزيد من نماذج الكلام في المستقبل، بهدف أن يصبح أحد أفضل مجموعات أدوات الكلام مفتوحة المصدر. وهذا بلا شك مصدر قيم للباحثين والمطورين.
قام مختبر شنغهاي للذكاء الاصطناعي، وكلية علوم البيانات في الجامعة الصينية في هونغ كونغ، ومعهد أبحاث البيانات الضخمة في شنتشن، بفتح مجموعة أدوات لتوليد الصوت والموسيقى والكلام تسمى Amphion. يمكن أن تساعد Amphion المطورين في البحث عن الصوت والموسيقى والمجالات الأخرى المتعلقة بالصوت التي يتم إنشاؤها بواسطة النصوص. تتضمن مجموعة الأدوات بنية تحتية مثل معالجة البيانات، والوحدات العامة، وخوارزميات التحسين، وتخطط لإضافة المزيد من النماذج المتعلقة بالكلام في المستقبل لإنشاء واحدة من أكثر مجموعات أدوات الكلام مفتوحة المصدر فائدة.
سيعزز مصدر Amphion المفتوح تقدم تكنولوجيا توليد الصوت والموسيقى والكلام، ويوفر الراحة لمزيد من المطورين، ويعزز البحث والتطبيقات في المجالات ذات الصلة. أعتقد أن أمفيون سيتم استخدامه على نطاق أوسع في المستقبل وسيجلب لنا المزيد من المفاجآت. ونتطلع إلى تطويره وتحسينه في المستقبل.