Rhubarb es un marco de Python liviano que facilita la creación de aplicaciones de comprensión de documentos utilizando modelos de lenguaje grande (LLM) multimodales y modelos de incrustación. Rhubarb se creó desde cero para funcionar con los modelos de lenguaje multimodal Amazon Bedrock y Anthropic Claude V3, y el modelo de incrustación multimodal Amazon Titan.
Visita la documentación de Ruibarbo.
Rhubarb puede realizar múltiples tareas de procesamiento de documentos, como
✅ Preguntas y respuestas sobre documentos
✅ Chat en streaming con documentos (Preguntas y respuestas)
✅ Resumen de documentos
Resúmenes a nivel de página
Resúmenes completos
Resúmenes de páginas específicas
Resúmenes de transmisión
✅ Extracción de datos estructurados
✅ Reconocimiento de entidad nombrada (NER)
Con 50 entidades comunes integradas
✅ Reconocimiento de PII con entidades integradas
✅ Comprensión de figuras e imágenes a partir de documentos.
Explicar cuadros, gráficas y figuras.
Realizar razonamiento de tablas (como figuras)
✅ Clasificación de documentos con muestreo vectorial utilizando modelos de incrustación multimodal
✅ Registra el uso de tokens para ayudar a realizar un seguimiento de los costos
Rhubarb viene con indicaciones del sistema integradas que facilitan su uso para una variedad de casos de uso de comprensión de documentos diferentes. Puede personalizar Rhubarb pasando las indicaciones de su propio sistema. Admite la generación de resultados basada en esquemas JSON exactos, lo que facilita la integración en aplicaciones posteriores.
Admite archivos PDF, TIFF, PNG, JPG (próximamente compatibilidad con archivos Word, Excel, PowerPoint, CSV, Webp, eml)
Realiza la conversión de documento a imagen internamente para trabajar con los modelos multimodales.
Funciona en archivos locales o archivos almacenados en S3
Admite especificar números de página para documentos de varias páginas
Admite chat basado en historial de chat para documentos
Admite modo de transmisión y no transmisión
Comience instalando Rhubarb usando pip
.
pip install pyrhubarb
Crea una sesión boto3
.
importar boto3session = boto3.Session()
archivo local
de ruibarbo importar DocAnalysisda = DocAnalysis(file_path="./path/to/doc/doc.pdf", boto3_session=sesión)resp = da.run(message="¿Cuál es el nombre del empleado?")resp
Con archivo en Amazon S3
de ruibarbo importar DocAnalysisda = DocAnalysis(file_path="s3://path/to/doc/doc.pdf", boto3_session=sesión)resp = da.run(message="¿Cuál es el nombre del empleado?")resp
Para obtener más ejemplos de uso, consulte libros de cocina.
Consulte CONTRIBUCIÓN para obtener más información.
Este proyecto está bajo la licencia Apache-2.0.