whisper node
0.3.1
Node.js ligações para o sussurro de Openai. Transcrição feita local.
npm install whisper-node
npx whisper-node download
Requisito para Windows: Instale o comando make
a partir daqui.
import whisper from 'whisper-node' ;
const transcript = await whisper ( "example/sample.wav" ) ;
console . log ( transcript ) ; // output: [ {start,end,speech} ]
[
{
"start" : "00:00:14.310" , // time stamp begin
"end" : "00:00:16.480" , // time stamp end
"speech" : "howdy" // transcription
}
]
import whisper from 'whisper-node' ;
const filePath = "example/sample.wav" ; // required
const options = {
modelName : "base.en" , // default
// modelPath: "/custom/path/to/model.bin", // use model in a custom directory (cannot use along with 'modelName')
whisperOptions : {
language : 'auto' // default (use 'auto' for auto detect)
gen_file_txt : false , // outputs .txt file
gen_file_subtitle : false , // outputs .srt file
gen_file_vtt : false , // outputs .vtt file
word_timestamps : true // timestamp for every word
// timestamp_size: 0 // cannot use along with word_timestamps:true
}
}
const transcript = await whisper ( filePath , options ) ;
Os arquivos devem ser .wav e 16Hz
Exemplo .mp3 Arquivo convertido com um comando ffmpeg: ffmpeg -i input.mp3 -ar 16000 output.wav
d.ts
File npm run dev
- executa Nodemon e TSC em '/src/test.ts'
npm run build
- executa o TSC, saídas para '/dist' e dá permissão para 'dist/download.js'