Введение
Средство суммирования стенограмм видео YouTube с GenAI — это инновационный инструмент, предназначенный для экономии времени за счет автоматического создания кратких обзоров из стенограмм видео YouTube. Это приложение использует YouTube Transcript API для получения стенограмм видео и интегрирует Gemini AI от Google для их обобщения, помогая пользователям быстро получить ключевые выводы, не просматривая видео целиком. Благодаря чистому и удобному интерфейсу, созданному с использованием Streamlit, этот проект упрощает процесс получения сводок из видеоконтента, делая его доступным для студентов, специалистов и всех, кто хочет повысить свою продуктивность.
Оглавление
Ключевые технологии и навыки
Установка
Для запуска этого проекта вам необходимо установить следующие пакеты:
pip install python - dotenv
pip install streamlit
pip install streamlit - extras
pip install youtube - transcript - api
pip install google - generativeai
pip install langcodes
pip install language_data
Использование
Чтобы использовать этот проект, выполните следующие действия:
git clone https://github.com/gopiashokan/YouTube-Video-Transcript-Summarizer-with-GenAI.git
pip install -r requirements.txt
.env
.streamlit run app.py
http://localhost:8501
Функции
Ввод ссылки на видео: пользователи могут легко предоставить ссылку на видео YouTube в приложение. Система автоматически извлекает идентификатор видео из URL-адреса и готовит запрос на расшифровку.
Определение языка расшифровки: с помощью YouTube Transcript API
приложение определяет все доступные языки расшифровки для данного видео. Это гарантирует, что пользователи смогут выбрать предпочитаемый язык для обобщения.
Преобразование языка: обнаруженные языковые коды преобразуются в удобочитаемые имена с помощью библиотеки Langcodes
, что позволяет пользователям легко идентифицировать и выбирать предпочитаемый язык транскрипции.
Выбор языка: как только пользователь выбирает предпочитаемый язык расшифровки, API YouTube Transcript получает расшифровку на этом языке. Этот шаг гарантирует, что расшифровка будет адаптирована к выбору языка пользователя, подготавливая ее для точной обработки ИИ.
Обработка расшифровки: приложение затем обрабатывает и форматирует полученную расшифровку, чтобы обеспечить ее соответствие требованиям генеративной модели ИИ. Этот шаг включает в себя очистку и организацию текста для эффективного обобщения ИИ.
Генеративная модель искусственного интеллекта. В проекте используется модель Gemini AI gemini-pro
от Google для создания сводок. Модель обрабатывает расшифровку видео вместе с тщательно продуманной подсказкой для предоставления кратких, точных и контекстно-зависимых изложений, избавляя пользователей от необходимости просматривать видео целиком.
Пользовательские подсказки: система использует интеллектуально разработанную подсказку, которая помогает ИИ составлять соответствующие сводки, гарантируя, что ключевые моменты видео будут зафиксированы и четко представлены.
Удобный интерфейс: все приложение создано с использованием Streamlit, который обеспечивает удобный и интерактивный интерфейс. Это гарантирует, что пользователи смогут легко вводить ссылки на видео, выбирать языки и просматривать сводный контент — и все это в одном месте.
Взаимодействие в режиме реального времени. Приложение обеспечивает обратную связь и результаты в режиме реального времени, позволяя пользователям практически мгновенно получать сводные видео. Это делает работу не только эффективной, но и очень гибкой к действиям пользователя.
Содействие
Вклад в этот проект приветствуется! Если у вас возникнут какие-либо проблемы или у вас есть предложения по улучшению, пожалуйста, отправьте запрос на включение.
Лицензия
Этот проект лицензируется по лицензии MIT. Пожалуйста, просмотрите файл ЛИЦЕНЗИИ для получения более подробной информации.
Контакт
? Электронная почта: [email protected].
LinkedIn: linkedin.com/in/gopiashokan
Если у вас возникнут дополнительные вопросы или запросы, не стесняйтесь обращаться к нам. Мы рады помочь вам с любыми вопросами.