Vocalize是为语言学习者制作的发音教练。
Vocalize是一个为语言学习者提供发音培训的应用程序。用户选择了他们想要练习的语言,要么是英语和西班牙语,然后用练习单词呈现。用户能够记录其发音并将其提交以与单词的平均发音进行比较。用户发音的可视化表示与平均发音有关。
每个单词的平均发音是通过将YouTube视频馈送到自定义音频处理算法中创建的。我们首先从YouTube刮下音频书,然后将其提交给IBM Watson的文本对语API。然后,我们使用FFMPEG为有声读物中的每个单词创建一个音频文件。当单词多次出现时,我们使用自定义的Python模块一起平均将单词实例合在一起,该模块构建在SCIPI之上。我们仅处理每种语言中的1000个最受欢迎的单词来缩小数据的范围。一旦为单词创建平均发音,它就会使用Amazon S3存储。
前端:react.js,反应本地,redux,d3.js
后端:Node.js,Express,MongoDB,Amazon S3
音频处理:Python,Scipy,IBM Watson,FFMPEG
测试:柴,摩卡,pytest
构建工具:gulp,browersify,webpack
部署:数字海洋
brew install youtube-dl
npm install
gulp build
node server.js
在数据刮擦目录中,您会找到刮擦YouTube视频(音频书)的节点JS文件,以获取单词的WAV文件。
npm install
node index.js scrape <youtube id> <language>
还有一个文件运行Python脚本以平均单词并将其输出为“平均”文件夹,称为falus.sh。