? Я работаю над полным переписыванием проекта. Прогресс в этом можно увидеть в ветке v4. Следовательно, эта ветка не будет получать никаких новых выпусков или обновлений.
whishper — это пакет с открытым исходным кодом, 100 % локальной транскрипции аудио и создания субтитров с полнофункциональным веб-интерфейсом.
Функции
Транскрибируйте любые медиафайлы в текст: аудио, видео и т. д.
? Загрузите транскрипции во многих форматах : TXT, JSON, VTT, SRT или скопируйте необработанный текст в буфер обмена.
Переведите свои транскрипции на любой язык, поддерживаемый Libretranslate.
✍️ Мощный редактор субтитров , поэтому вам не нужно выходить из пользовательского интерфейса!
Выделение транскрипции с учетом позиции СМИ.
Предупреждения CPS (символов в секунду).
Разделение сегментов.
Вставка сегмента.
Выбор языка субтитров.
? 100% локальный : транскрипция, перевод и редактирование субтитров выполняются на 100% на вашем компьютере (может работать даже в автономном режиме!).
Быстро : использует FasterWhisper в качестве серверной части Whisper: значительно ускоряйте транскрипцию на процессоре!
? Быстрая и простая настройка : используйте сценарий быстрого запуска или выполните несколько шагов!
Поддержка графического процессора : используйте графический процессор NVIDIA, чтобы ускорить транскрипцию!
? Поддержка процессора : нет графического процессора? Без проблем! whishper также может работать на процессоре.
Дорожная карта
Локальная папка в качестве медиа-входа (#15).
Полнотекстовый поиск по всем транскрипциям.
Аутентификация пользователя.
Запись звука из браузера.
Добавьте безумно быстрый шепот в качестве дополнительного бэкэнда (#53).
Поддержка ускорения графического процессора.
Поддержка графических процессоров, отличных от NVIDIA. Возможно ли это с помощью более быстрого шепота?
Можем ли мы что-нибудь сделать с бесшовной_коммуникацией?
Структура проекта
whishper — это набор частей, которые работают вместе. Три основные части:
Transcription-API: это API, который позволяет запускать Faster-Whisper. Вы можете найти его в папке transcription-api .
whishper -Backend: это серверная часть, которая координирует вызовы внешнего интерфейса, базу данных и задачи. Вы можете найти его в backend папке.
whishper -Frontend: это интерфейс (веб-интерфейс) приложения. Вы можете найти его в папке frontend .
Перевод (сторонний): это контейнер libretranslate, который используется для перевода субтитров.
MongoDB (сторонняя): это база данных, в которой хранится вся информация о ваших транскрипциях.
Nginx (сторонний): это прокси, который позволяет запускать все из одного домена.
Содействие
Вклады приветствуются! Не стесняйтесь открыть PR со своими изменениями или просмотреть проблемы, чтобы узнать, можете ли вы чем-то помочь.
Настройка разработки
Ознакомьтесь с документацией по разработке здесь.
Скриншоты
Эти скриншоты доступны на официальном сайте. Для просмотра щелкните любую из следующих ссылок: