Les pipelines IA de Pathway vous permettent de mettre rapidement en production des applications d'IA qui offrent une recherche d'entreprise RAG et IA de haute précision à grande échelle en utilisant les connaissances les plus récentes disponibles dans vos sources de données. Il vous fournit des modèles d'application LLM (Large Language Model) prêts à être déployés. Vous pouvez les tester sur votre propre machine et les déployer sur le cloud (GCP, AWS, Azure, Render,...) ou sur site.
Les applications se connectent et se synchronisent (tous les nouveaux ajouts, suppressions et mises à jour de données) avec les sources de données de votre système de fichiers, Google Drive, Sharepoint, S3, Kafka, PostgreSQL, les API de données en temps réel . Ils ne comportent aucune dépendance d’infrastructure qui nécessiterait une configuration distincte. Ils incluent une indexation de données intégrée permettant la recherche vectorielle, la recherche hybride et la recherche en texte intégral, le tout effectué en mémoire, avec cache.
Les modèles d'application fournis dans ce référentiel s'étendent jusqu'à des millions de pages de documents . Certains d’entre eux sont optimisés pour la simplicité, d’autres pour une précision étonnante. Choisissez celui qui vous convient le mieux. Vous pouvez l'utiliser directement ou modifier certaines étapes du pipeline. Par exemple, si vous souhaitez ajouter une nouvelle source de données ou transformer un index vectoriel en index hybride, il s'agit simplement d'un changement d'une seule ligne.
Demande (modèle) | Description |
---|---|
Question-Answering RAG App | Application RAG de base de bout en bout. Un pipeline de questions-réponses qui utilise le modèle GPT de choix pour fournir des réponses aux requêtes sur vos documents (PDF, DOCX,...) sur une source de données connectée en direct (fichiers, Google Drive, Sharepoint,...). Vous pouvez également essayer un point de terminaison REST de démonstration. |
Live Document Indexing (Vector Store / Retriever) | Un pipeline d'indexation de documents en temps réel pour RAG qui agit comme un service de magasin de vecteurs. Il effectue une indexation en direct sur vos documents (PDF, DOCX,...) à partir d'une source de données connectée (fichiers, Google Drive, Sharepoint,...). Il peut être utilisé avec n'importe quelle interface ou intégré en tant que backend de récupération pour une application Langchain ou Llamaindex. Vous pouvez également essayer un point de terminaison REST de démonstration. |
Multimodal RAG pipeline with GPT4o | RAG multimodal utilisant GPT-4o dans la phase d'analyse pour indexer des PDF et autres documents à partir d'une source de données connectée, Google Drive, Sharepoint,...). Il est parfait pour extraire des informations de documents financiers non structurés dans vos dossiers (y compris des graphiques et des tableaux), mettre à jour les résultats à mesure que les documents changent ou que de nouveaux arrivent. |
Unstructured-to-SQL pipeline + SQL question-answering | Un exemple RAG qui se connecte à des sources de données financières non structurées (PDF de rapports financiers), structure les données en SQL et les charge dans une table PostgreSQL. Il répond également aux requêtes des utilisateurs en langage naturel sur ces documents financiers en les traduisant en SQL à l'aide d'un LLM et en exécutant la requête sur la table PostgreSQL. |
Adaptive RAG App | Une application RAG utilisant Adaptive RAG, une technique développée par Pathway pour réduire le coût des jetons dans RAG jusqu'à 4x tout en maintenant la précision. |
Private RAG App with Mistral and Ollama | Une version entièrement privée (locale) du pipeline RAG demo-question-answering utilisant Pathway, Mistral et Ollama. |
Slides AI Search App | Un pipeline d'indexation pour récupérer des diapositives. Il effectue des opérations multimodales PowerPoint et PDF et maintient un index en direct de vos diapositives. |
Les applications peuvent être exécutées en tant que conteneurs Docker et exposer une API HTTP pour connecter le frontend. Pour permettre des tests et des démonstrations rapides, certains modèles d'application incluent également une interface utilisateur Streamlit facultative qui se connecte à cette API.
Les applications s'appuient sur le framework Pathway Live Data pour la synchronisation des sources de données et pour répondre aux requêtes API (Pathway est une bibliothèque Python autonome avec un moteur Rust intégré). Ils vous apportent une logique d'application simple et unifiée pour le back-end, l'intégration, la récupération et la pile technologique LLM. Il n'est pas nécessaire d'intégrer et de maintenir des modules séparés pour votre application Gen AI : Base de données vectorielle (par exemple Pinecone/Weaviate/Qdrant) + Cache (par exemple Redis) + API Framework (par exemple Fast API) . Le choix par défaut de Pathway en matière d'index vectoriel intégré est basé sur la bibliothèque usearch ultra-rapide, et les index de texte intégral hybrides utilisent la bibliothèque Tantivy. Tout fonctionne hors de la boîte.
Chacun des modèles d'application de ce dépôt contient un fichier README.md avec des instructions sur la façon de l'exécuter.
Vous pouvez également trouver d'autres modèles de code prêts à l'emploi sur le site Web Pathway.
Extrayez et organisez sans effort les données de tableaux et de graphiques à partir de PDF, de documents et bien plus encore avec RAG multimodal - en temps réel :
(Consultez Multimodal RAG pipeline with GPT4o
pour voir l'ensemble du pipeline en cours. Vous pouvez également consulter le Unstructured-to-SQL pipeline
pour un exemple minimal qui fonctionne également avec des modèles non multimodaux.)
Exploration automatisée des connaissances et alertes en temps réel :
(Consultez l'exemple Alerting when answers change on Google Drive
.)
Pour fournir des commentaires ou signaler un bug, veuillez signaler un problème sur notre outil de suivi des problèmes.
Toute personne souhaitant contribuer à ce projet, qu'il s'agisse de documentation, de fonctionnalités, de corrections de bugs, de nettoyage de code, de tests ou de révisions de code, est vivement encouragée à le faire. S'il s'agit de votre première contribution à un projet Github, voici un guide de démarrage.
Si vous souhaitez apporter une contribution qui nécessite un peu plus de travail, levez simplement la main sur le serveur Pathway Discord (#get-help) et faites-nous savoir ce que vous prévoyez !