Rhubarb est un framework Python léger qui facilite la création d'applications de compréhension de documents à l'aide de modèles multimodaux de grand langage (LLM) et de modèles d'intégration. Rhubarb est créé à partir de zéro pour fonctionner avec les modèles de langage multimodal Amazon Bedrock et Anthropic Claude V3, ainsi qu'avec le modèle d'intégration multimodale Amazon Titan.
Consultez la documentation sur la rhubarbe.
La rhubarbe peut effectuer plusieurs tâches de traitement de documents telles que
✅ Documenter les questions et réponses
✅ Chat en streaming avec documents (Q&A)
✅ Résumé des documents
Résumés au niveau de la page
Résumés complets
Résumés de pages spécifiques
Résumés en streaming
✅ Extraction de données structurées
✅ Reconnaissance d'entité nommée (NER)
Avec 50 entités communes intégrées
✅ Reconnaissance PII avec entités intégrées
✅ Compréhension des figures et des images à partir de documents
Expliquer les tableaux, les graphiques et les figures
Effectuer un raisonnement sous forme de tableau (sous forme de chiffres)
✅ Classification de documents avec échantillonnage vectoriel à l'aide de modèles d'intégration multimodaux
✅ Enregistre l'utilisation des jetons pour aider à suivre les coûts
Rhubarb est livré avec des invites système intégrées qui facilitent son utilisation pour un certain nombre de cas d'utilisation différents pour la compréhension de documents. Vous pouvez personnaliser Rhubarb en transmettant vos propres invites système. Il prend en charge la génération de sortie exacte basée sur un schéma JSON, ce qui facilite son intégration dans les applications en aval.
Prend en charge les fichiers PDF, TIFF, PNG, JPG (prise en charge des fichiers Word, Excel, PowerPoint, CSV, Webp, eml à venir)
Effectue la conversion de document en image en interne pour travailler avec les modèles multimodaux
Fonctionne sur des fichiers locaux ou stockés dans S3
Prend en charge la spécification des numéros de page pour les documents de plusieurs pages
Prend en charge le chat basé sur l'historique des discussions pour les documents
Prend en charge les modes streaming et non streaming
Commencez par installer Rhubarb en utilisant pip
.
pip install pyrhubarb
Créez une session boto3
.
importer boto3session = boto3.Session()
Fichier local
depuis l'importation de rhubarbe DocAnalysisda = DocAnalysis(file_path="./path/to/doc/doc.pdf", boto3_session=session)resp = da.run(message="Quel est le nom de l'employé ?")resp
Avec fichier dans Amazon S3
depuis l'importation de rhubarbe DocAnalysisda = DocAnalysis(file_path="s3://path/to/doc/doc.pdf", boto3_session=session)resp = da.run(message="Quel est le nom de l'employé ?")resp
Pour plus d'exemples d'utilisation, consultez les livres de recettes.
Voir CONTRIBUTION pour plus d'informations.
Ce projet est sous licence Apache-2.0.