Amazon Bedrock est un service entièrement géré qui met à votre disposition des modèles de base (FM) hautes performances provenant de startups d'IA de premier plan et d'Amazon via une API unifiée. Vous pouvez choisir parmi une large gamme de modèles de fondation pour trouver le modèle le mieux adapté à votre cas d’utilisation. Amazon Bedrock offre également un large éventail de fonctionnalités pour créer des applications d'IA générative avec sécurité, confidentialité et IA responsable. Grâce à Amazon Bedrock, vous pouvez facilement expérimenter et évaluer les meilleurs modèles de base pour vos cas d'utilisation, les personnaliser en privé avec vos données à l'aide de techniques telles que le réglage fin et la génération augmentée de récupération (RAG), et créer des agents qui exécutent des tâches à l'aide de vos systèmes d'entreprise. et les sources de données.
Les grands modèles linguistiques (LLM) présentent inévitablement des hallucinations puisque l'exactitude des textes générés ne peut être garantie uniquement par les connaissances paramétriques qu'ils encapsulent. Bien que la génération augmentée de récupération (RAG) soit un complément pratique aux LLM, elle repose fortement sur la pertinence des documents récupérés, ce qui soulève des inquiétudes quant au comportement du modèle en cas d'échec de la récupération.
Des techniques RAG avancées comme Corrective RAG ont été proposées pour améliorer la robustesse de la génération. Dans CRAG, un évaluateur de récupération léger est conçu pour évaluer la qualité globale des documents récupérés pour une requête, renvoyant un degré de confiance sur la base duquel différentes actions de récupération de connaissances peuvent être déclenchées. Étant donné que la récupération à partir de corpus statiques et limités ne peut renvoyer que des documents sous-optimaux, les recherches sur le Web à grande échelle sont utilisées comme extension pour augmenter les résultats de récupération. CRAG est plug-and-play et peut être couplé de manière transparente à diverses approches basées sur RAG.
Ce référentiel contient du code qui vous guidera tout au long du processus de création d'un assistant simplifié basé sur CRAG. Nous couvrirons deux scénarios pour la phase de récupération :
py312_opensearch-py_requests_and_requests-aws4auth.zip
à l'aide de la procédure suivante et téléchargez-le dans le même compartiment Amazon S3 qu'à l'étape 3.C:/Program Files/7-Zip/
.cd
y.py312_opensearch-py_requests_and_requests-aws4auth.zip
.cd
y.py312_opensearch-py_requests_and_requests-aws4auth.zip
.Voir CONTRIBUTION pour plus d'informations.
Cette bibliothèque est sous licence MIT-0. Voir le fichier LICENCE.