Пример:
Подпись создана: черная лошадь бежит по травянистому полю.
Этот репозиторий содержит проект, в котором исследуется задача создания подписей к изображениям с помощью Vision Transformers (ViTs). Целью проекта является создание описательных подписей к изображениям путем объединения возможностей Трансформеров и компьютерного зрения. Он использует самые современные предварительно обученные модели ViT и такие методы, как механизмы внимания и языковое моделирование, для создания точных и контекстуально релевантных подписей.
Ссылка на статью: https://www.analyticsvidhya.com/blog/2023/06/vision-transformers/
Создание подписей к изображениям — сложная задача, требующая создания человеческих описаний изображений. Используя Vision Transformers, этот проект направлен на улучшение понимания изображений и создания подписей. Сочетание компьютерного зрения и Трансформеров показало многообещающие результаты в различных задачах обработки естественного языка, и в этом проекте исследуется их применение для субтитров к изображениям.
Более подробную информацию о том, как я использовал Litserve для создания сервера субтитров к изображениям, можно найти здесь: Litserve.
Набор данных, используемый для этого проекта, состоит из парных данных подписей к изображениям. Каждое изображение связано с одной или несколькими описательными подписями. Набор данных не включен в этот репозиторий, но вы можете найти популярные наборы данных для подписей к изображениям, такие как MS COCO, Flickr30k или Conceptual Captions, для экспериментов.
Вы можете найти блокнот по точной настройке вашего собственного набора данных в каталоге тонкой настройки: здесь
Чтобы использовать код из этого репозитория, выполните следующие действия:
git clone https://github.com/your-username/image-captioning-vision-transformers.git
cd image-captioning-vision-transformers
pip install -r requirements.txt
В проекте используются следующие методы и приемы:
Проект реализован на Python и использует следующие библиотеки:
Вклад в этот проект приветствуется. Чтобы внести свой вклад, выполните следующие действия:
git checkout -b feature/your-feature
git commit -m 'Add some feature'
git push origin feature/your-feature
Этот проект лицензируется по лицензии MIT.
Ссылка на блог: https://www.analyticsvidhya.com/blog/2023/06/vision-transformers/
Следите за еще интересными проектами