MiniMax, une filiale de Shanghai Xiyu Technology Co., Ltd., a lancé la série de modèles vocaux T2A-01 récemment mise à niveau à l'échelle mondiale le 20 janvier 2025 et a lancé les produits vocaux Conch. Cette série comprend deux modèles, T2A-01-HD et T2A-01-Turbo, qui fournissent des services API et que les utilisateurs peuvent choisir en fonction de leurs besoins. En tant qu'entreprise de technologie générale d'intelligence artificielle, MiniMax s'engage à développer elle-même de grands modèles généraux de différents modes. Le modèle vocal publié cette fois prend en charge 17 langues et des centaines de timbres prédéfinis, dans le but de fournir une parole naturelle et fluide aux entreprises. et les utilisateurs individuels.
Le 20 janvier 2025, MiniMax, une filiale de Shanghai Xiyu Technology Co., Ltd., a annoncé le lancement mondial simultané de sa nouvelle série de modèles vocaux T2A-01 récemment mis à niveau et le lancement des produits vocaux Conch. La série T2A-01 comprend deux modèles, T2A-01-HD et T2A-01-Turbo, que les utilisateurs peuvent utiliser. Le service API a été lancé simultanément sur la plateforme ouverte MiniMax. Les entreprises peuvent choisir en fonction de leurs besoins en matière de qualité audio et. vitesse de génération.
En tant que société leader dans le domaine des technologies générales d'intelligence artificielle, MiniMax se concentre sur les grands modèles généraux auto-développés dans différents modes, notamment les grands modèles de texte MoE comportant des milliards de paramètres, les grands modèles vocaux et les grands modèles d'images. Sur la base de ces modèles, MiniMax a lancé des applications natives telles que Hoshino et Conch AI et fournit des services API à plateforme ouverte pour les entreprises et les développeurs. La série de modèles vocaux T2A-01 lancée cette fois présente non seulement les caractéristiques d'une qualité sonore claire, d'un rythme naturel et d'une expression précise des émotions, mais prend également en charge 17 langues, dont le chinois, le cantonais, l'anglais, le japonais, le coréen, l'arabe, et en espagnol, et des centaines de sons prédéfinis offrent aux utilisateurs professionnels et individuels une expérience de génération de voix naturelle et fluide.
L'un des points forts de Conch Voice est sa puissante capacité de synthèse multilingue. Avec le support du modèle T2A-01, Conch Voice est en avance sur des produits similaires en termes de similarité, de taux d'erreur et d'évaluation auditive. Dans plusieurs langues telles que le chinois, le cantonais, l'anglais, le japonais, le coréen et l'arabe, la similitude et la précision de Conch Voice sont nettement en avance, et ses capacités complètes sont comparables à celles du modèle leader international ElevenLabs. En outre, Conch Voice possède également des capacités de compréhension émotionnelle et peut identifier et reproduire intelligemment les différences émotionnelles subtiles dans la parole. Les utilisateurs peuvent spécifier les émotions selon leurs besoins et générer une sortie vocale qui capture avec précision les émotions humaines profondes.
Conch Voice offre également aux utilisateurs une riche sélection de tonalités et des fonctions de réglage personnalisées. Les utilisateurs peuvent filtrer en fonction de la langue, de l'accent, du sexe et de l'âge, sélectionner les timbres appropriés parmi plus de 300 timbres prédéfinis et affiner le timbre grâce à des effecteurs, tels que le réglage de la transparence et de l'intensité du timbre et la superposition d'écho, de diffusion et de distorsion. , musique électronique et autres effets spéciaux pour répondre aux besoins de différentes scènes.
Voix de conque :
https://hailuoai.com/audio
Hailuo Audio (version étrangère) :
https://hailuo.ai/audio
Services API nationaux :
https://platform.minimaxi.com/document/T2A%20V2
Services API à l'étranger :
https://intl.minimaxi.com/document/T2A%20V2?key=66719005a427f0c8a5701643
Conch Voice lancé par MiniMax offre aux utilisateurs une expérience de génération vocale sans précédent grâce à sa puissante prise en charge multilingue, son expression émotionnelle précise et sa riche sélection de tonalités. Sa force technique de pointe et ses services API pratiques ne manqueront pas de déclencher une nouvelle vague dans le domaine de la synthèse vocale.