أطلقت MiniMax، وهي شركة تابعة لشركة Shanghai Xiyu Technology Co., Ltd.، سلسلة T2A-01 التي تمت ترقيتها حديثًا من النماذج الصوتية عالميًا في 20 يناير 2025، وأطلقت منتجات Conch الصوتية. تشتمل هذه السلسلة على نموذجين، T2A-01-HD وT2A-01-Turbo، اللذين يوفران خدمات API ويمكن للمستخدمين الاختيار وفقًا لاحتياجاتهم. باعتبارها شركة عامة لتكنولوجيا الذكاء الاصطناعي، تلتزم MiniMax بالتطوير الذاتي لنماذج كبيرة عامة ذات أوضاع مختلفة. يدعم نموذج الكلام الذي تم إصداره هذه المرة 17 لغة ومئات من نغمات الصوت المعدة مسبقًا، بهدف توفير كلام طبيعي وسلس للشركات. والمستخدمين الفرديين.
في 20 يناير 2025، أعلنت شركة MiniMax، وهي شركة تابعة لشركة Shanghai Xiyu Technology Co., Ltd.، عن الإطلاق العالمي المتزامن لسلسلة T2A-01 التي تمت ترقيتها حديثًا من النماذج الصوتية وإطلاق منتجات Conch الصوتية. تشتمل سلسلة T2A-01 على طرازين، T2A-01-HD وT2A-01-Turbo، ليستخدمهما المستخدمون. وقد تم إطلاق خدمة API في وقت واحد على منصة MiniMax المفتوحة، ويمكن للشركات الاختيار بناءً على احتياجاتها من جودة الصوت والجودة سرعة الجيل.
باعتبارها شركة رائدة في مجال تكنولوجيا الذكاء الاصطناعي العام، تركز MiniMax على النماذج الكبيرة العامة المطورة ذاتيًا في أوضاع مختلفة، بما في ذلك النماذج الكبيرة لنصوص MoE ذات تريليون معلمة، ونماذج الكلام الكبيرة، ونماذج الصور الكبيرة. واستنادًا إلى هذه النماذج، أطلقت MiniMax تطبيقات محلية مثل Hoshino وConch AI، وتوفر خدمات واجهة برمجة التطبيقات (API) ذات النظام الأساسي المفتوح للمؤسسات والمطورين. سلسلة نماذج الكلام T2A-01 التي تم إصدارها هذه المرة لا تتميز فقط بخصائص جودة الصوت الواضحة والإيقاع الطبيعي والتعبير الدقيق عن المشاعر، ولكنها تدعم أيضًا 17 لغة بما في ذلك الصينية والكانتونية والإنجليزية واليابانية والكورية والعربية، والإسبانية، ومئات الأصوات المعدة مسبقًا توفر للمستخدمين من رجال الأعمال والأفراد تجربة توليد صوت طبيعية وسلسة.
إحدى الميزات البارزة في Conch Voice هي قدرتها القوية على التوليف متعدد اللغات. وبدعم من الطراز T2A-01، تتفوق Conch Voice على المنتجات المماثلة من حيث التشابه ومعدل الخطأ وتقييم السمع. في لغات متعددة مثل الصينية والكانتونية والإنجليزية واليابانية والكورية والعربية، فإن تشابه ودقة Conch Voice متقدمة بشكل كبير، وقدراتها الشاملة قابلة للمقارنة بالنموذج الرائد عالميًا ElevenLabs. بالإضافة إلى ذلك، يتمتع Conch Voice أيضًا بقدرات الفهم العاطفي ويمكنه تحديد الاختلافات العاطفية الدقيقة في الكلام وإعادة إنتاجها بذكاء، ويمكن للمستخدمين تحديد العواطف حسب الحاجة وإنشاء مخرجات كلامية تلتقط المشاعر الإنسانية العميقة بدقة.
يوفر Conch Voice أيضًا للمستخدمين اختيارًا غنيًا للنغمة ووظائف الضبط الشخصية. يمكن للمستخدمين التصفية وفقًا للغة واللهجة والجنس والعمر، واختيار جرس الصوت المناسب من أكثر من 300 جرس صوت محدد مسبقًا، وضبط جرس الصوت من خلال المؤثرات، مثل ضبط شفافية وشدة جرس الصوت، وتركيب الصدى والبث والتشويه. والموسيقى الإلكترونية والمؤثرات الخاصة الأخرى لتلبية احتياجات المشاهد المختلفة.
صوت القوقع:
https://hailuoai.com/audio
Hailuo Audio (الإصدار الخارجي):
https://hailuo.ai/audio
خدمات واجهة برمجة التطبيقات المحلية:
https://platform.minimaxi.com/document/T2A%20V2
خدمات واجهة برمجة التطبيقات الخارجية:
https://intl.minimaxi.com/document/T2A%20V2?key=66719005a427f0c8a5701643
توفر خدمة Conch Voice التي أطلقتها شركة MiniMax للمستخدمين تجربة غير مسبوقة لتوليد الصوت من خلال دعمها القوي متعدد اللغات والتعبير العاطفي الدقيق واختيار النغمات الغنية. لا بد أن تؤدي قوتها التقنية الرائدة وخدمات واجهة برمجة التطبيقات (API) المريحة إلى إطلاق موجة جديدة في مجال تركيب الكلام.