Skribify — это мощный инструмент транскрипции и обобщения, который использует возможности OpenAI GPT-3.5 или GPT4 и WhisperAI для создания кратких резюме из видео или аудиоконтента. Благодаря поддержке локальных файлов Skribify позволяет легко извлекать ценную информацию из ваших медиафайлов.
Функции
Установка
Использование
Интерфейс командной строки
Пример: get_transcript.py
Содействие
Лицензия
Расшифруйте и обобщите видео или аудиоконтент.
Поддерживает локальные файлы.
Настраиваемые подсказки для обобщения.
Подробное ведение журнала для отладки и отслеживания прогресса.
Клонируйте этот репозиторий:
git-клон https://github.com/jfalnes/Skribify.git
Установите необходимые зависимости:
pip install -r требования.txt
2б. Установить как пакет:
pip install git+https://github.com/jfalnes/Skribify.git
Настройте ключ API OpenAI:
Если у вас нет ключа, вместо него можно использовать GPT-3.5. (Не рекомендуется)
Skribify использует GPT4. Если у вас нет ключа API GPT4, вы можете запросить доступ к бета-версии здесь.
Получите ключ API OpenAI от OpenAI.
Создайте файл .env в каталоге Skribify/ и добавьте свой ключ API следующим образом:
ТОКЕН=ваш_openai_api_key
Настройте ключ API Google:
Следуйте инструкциям, чтобы открыть https://www.google.com/device в веб-браузере.
Введите код, предоставленный сценарием (например, «DBTH-BTYV») на веб-странице и подтвердите свою учетную запись.
Вернитесь в терминал и нажмите Enter, чтобы продолжить выполнение сценария.
Установите FFMPEG:
Scribify требует FFMPEG для работы фрагментов звука. Убедитесь, что на вашем компьютере установлен FFMPEG.
Вы можете скачать FFMPEG с официального сайта здесь и следовать инструкциям по установке в зависимости от вашей операционной системы.
Подтвердите, что FFMPEG успешно установлен, выполнив команду ffmpeg
в вашем терминале/cmd. Если он установлен правильно, вы должны увидеть ответ с информацией о версии и списком конфигураций.
Видео большего размера могут не работать с GPT 3.5, и для транскрипции большего размера вам может потребоваться доступ к GPT-4. Если вы используете файлы размером более 25 МБ, они будут сегментированы на фрагменты и последовательно обработаны. Это означает, что, хотя можно работать с файлами большего размера, настоятельно рекомендуется поддерживать размер одного файла менее 25 МБ. Это связано с тем, что Whisper API, отвечающий за транскрипцию в Skribify, может более эффективно обрабатывать отдельный файл меньшего размера без потенциальных осложнений, которые могут возникнуть при фрагментированной обработке.
Skribify можно использовать из командной строки, указав необходимые аргументы:
--file
, -f
: Путь к локальному видео или аудиофайлу для расшифровки и суммирования.
--prompt
, -p
: Пользовательский запрос для суммирования или путь к файлу, содержащему запрос (по умолчанию: «Суммируйте следующий текст:»)
--transcribe
, -t
: расшифровать только видео или аудиофайл, не внося изменений.
--model
, -
: Укажите модель. По умолчанию GPT-4.
--version
, -v
: проверить версию Skribify.
--help
, -h
: показать справочное сообщение и выйти.
python Skribify.py --путь к/вашему/видео_или_аудио_файлу
Вы можете использовать аргумент --prompt
, чтобы предоставить настраиваемое приглашение для обобщения либо в виде прямой строки, либо путем указания пути к файлу, содержащему приглашение.
Вы также можете использовать Skribify в своем скрипте Python следующим образом:
from Skribify import Skribifydef handle_transcription(transcription):# Логика для обработки файла транскрипции = "<local-file'prompt = "Обобщите следующий текст: "с помощью Skribify(callback=handle_transcription, Prompt=prompt, ) как skribify:skribify.loop. run_until_complete(skribify.run())
py .Skribify.py --f '<локальный-файл> --prompt 'Обобщите следующий текст:' -m 'gpt-3.5-turbo'
Примечание . Всегда заключайте filename
в одинарные кавычки ( ''
).
The text discusses elephants and highlights their impressively long fronts as a cool feature.
Мы приветствуем вклады! Пожалуйста, не стесняйтесь отправлять запрос на получение новых функций, исправлений ошибок или улучшений.
Skribify выпускается под лицензией GNU General Public License v3.0 . См. ЛИЦЕНЗИЮ для получения дополнительной информации.