O vocalizador é um instrutor de pronúncia feito para os alunos de idiomas.
O vocalizador é um aplicativo que fornece treinamento de pronúncia para os alunos de idiomas. O usuário seleciona o idioma que gostaria de praticar, inglês e espanhol, e é apresentado com palavras práticas. O usuário pode registrar sua pronúncia e enviá -la para comparação com a pronúncia média da palavra. Uma representação visual da pronúncia do usuário é representada graficamente contra a pronúncia média.
A pronúncia média de cada palavra é criada alimentando vídeos do YouTube em um algoritmo de processamento de áudio personalizado. Primeiro, raspamos os livros de áudio do YouTube e os enviamos para a API de texto em fala da IBM Watson. Em seguida, usamos o FFMPEG para criar um arquivo de áudio para cada palavra no audiolivro. Quando uma palavra aparece várias vezes, calculamos a média das instâncias do Word, usando um módulo Python personalizado que é construído sobre o SCIPI. Estaremos o escopo de nossos dados, processando apenas as 1000 palavras mais populares de cada idioma. Depois que uma pronúncia média é criada para uma palavra, ela é armazenada usando o Amazon S3.
Front -End : React.js, React Native, Redux, D3.js
Back end : Node.js, Express, MongoDB, Amazon S3
Processamento de áudio : Python, Scipy, IBM Watson, FFMPEG
Teste : chai, mocha, pytest
Ferramentas de construção : Gulp, Browersify, Webpack
Implantação : Oceano Digital
brew install youtube-dl
npm install
gulp build
node server.js
No diretório de raspagem de dados, você encontrará arquivos JS do nó que raspam vídeos do YouTube (livros de áudio) para arquivos WAV de palavras.
npm install
node index.js scrape <youtube id> <language>
Há também um arquivo que executa os scripts do Python para calcular a média das palavras e as produz em uma pasta 'média' chamada média.sh