Об этом репозитории
Это серия из трех частей, посвященная теме «Поговорите со своим слайдом» с использованием мультимодальных базовых моделей, размещенных на Amazon Bedrock и Amazon SageMaker.
- В первой части серии реализован дизайн решения, которое сначала преобразует слайды во внедренные элементы и сохраняет их в векторном хранилище (Amazon OpenSearch Serverless). Когда пользователь запрашивает эти данные, вызывается LLaVA 1.5, и пользователю возвращается вывод.
- Во второй части серии используется другой дизайн решения. Этот подход позволит генерировать и сохранять выводы LLaVA 1.5 в векторном хранилище (Amazon OpenSearch Serverless) и использовать эти сохраненные выводы для ответа на запросы пользователей.
- В третьей части серии будут сравниваться два подхода.