Vocalin est un entraîneur de prononciation conçu pour les apprenants du langage.
Vocalin est une application qui offre une formation de prononciation aux apprenants du langage. L'utilisateur sélectionne la langue qu'ils aimeraient pratiquer, soit l'anglais et l'espagnol, et se voit ensuite présenter des mots d'entraînement. L'utilisateur est en mesure d'enregistrer sa prononciation et de le soumettre pour comparaison avec la prononciation moyenne du mot. Une représentation visuelle de la prononciation de l'utilisateur est représentée graphiquement par rapport à la prononciation moyenne.
La prononciation moyenne de chaque mot est créée en alimentant des vidéos YouTube dans un algorithme de traitement audio personnalisé. Nous gratterons d'abord les livres audio de YouTube et les soumettons à l'API de texte vocale d'IBM Watson. Nous utilisons ensuite FFMPEG pour créer un fichier audio pour chaque mot dans le livre audio. Lorsqu'un mot apparaît plusieurs fois, nous en moyenne les instances de mots ensemble à l'aide d'un module Python personnalisé qui est construit au-dessus de Scipi. Nous restreinons la portée de nos données en ne traitant que les 1000 mots les plus populaires de chaque langue. Une fois qu'une prononciation moyenne a été créée pour un mot, elle est stockée à l'aide d'Amazon S3.
Front End : React.js, React Native, Redux, D3.js
Back End : Node.js, Express, MongoDB, Amazon S3
Traitement audio : Python, Scipy, IBM Watson, FFMPEG
Test : Chai, Mocha, Pytest
Outils de construction : Gulp, Browersify, WebPack
Déploiement : océan numérique
brew install youtube-dl
npm install
gulp build
node server.js
Dans le répertoire de grattement de données, vous trouverez des fichiers JS Node qui grattent les vidéos YouTube (livres audio) pour les fichiers WAV de mots.
npm install
node index.js scrape <youtube id> <language>
Il y a aussi un fichier qui exécute les scripts Python pour en moyenne les mots et les diffuse dans un dossier «moyenné» appelé moyen.sh