Vocalise es un entrenador de pronunciación hecho para los estudiantes de idiomas.
Vocalise es una aplicación que proporciona capacitación de pronunciación para los estudiantes de idiomas. El usuario selecciona el idioma que le gustaría practicar, ya sea inglés y español, y luego se le presenta palabras de práctica. El usuario puede registrar su pronunciación y enviarla para comparar con la pronunciación promedio de la palabra. Una representación visual de la pronunciación del usuario se grafica contra la pronunciación promedio.
La pronunciación promedio de cada palabra se crea alimentando videos de YouTube en un algoritmo de procesamiento de audio personalizado. Primero raspamos audiolibros de YouTube y los enviamos a la API de texto a voz de IBM Watson. Luego usamos FFMPEG para crear un archivo de audio para cada palabra en el audiolibro. Cuando una palabra aparece varias veces, promediamos la palabra instancias juntas usando un módulo de pitón personalizado que se construye sobre SciPI. Estrechamos el alcance de nuestros datos solo procesando las 1000 palabras más populares de cada idioma. Una vez que se ha creado una pronunciación promedio para una palabra, se almacena con Amazon S3.
Front End : React.js, React Native, Redux, D3.js
Back End : Node.js, Express, MongoDB, Amazon S3
Procesamiento de audio : Python, Scipy, IBM Watson, FFMPEG
Pruebas : Chai, Mocha, Pytest
Building Herramientas : Gulp, BrowerSify, Webpack
Despliegue : océano digital
brew install youtube-dl
npm install
gulp build
node server.js
En el directorio de raspado de datos encontrará archivos JS de nodo que raspan los videos de YouTube (audiolibros) para obtener archivos de palabras WAV.
npm install
node index.js scrape <youtube id> <language>
También hay un archivo que ejecuta los scripts de Python para promediar las palabras y las lleva a una carpeta 'promedio' llamada promedio.SH