Acerca de este repositorio
Esta es una serie de tres partes sobre el tema "Hable con su presentación de diapositivas" utilizando modelos de base multimodal alojados en Amazon Bedrock y Amazon SageMaker.
- La parte 1 de la serie implementa un diseño de solución que primero convierte diapositivas en incrustaciones y almacena estas incrustaciones en un almacén de vectores (Amazon OpenSearch Serverless). Cuando un usuario consulta estos datos, se invoca LLaVA 1.5 y se devuelve la inferencia al usuario.
- La parte 2 de la serie sigue un diseño de solución diferente. Este enfoque generará y almacenará inferencias de LLaVA 1.5 en un almacén de vectores (Amazon OpenSearch Serverless) y utilizará esas inferencias almacenadas para responder a las consultas de los usuarios.
- La parte 3 de la serie comparará los dos enfoques.