Los AI Pipelines de Pathway le permiten poner en producción rápidamente aplicaciones de IA que ofrecen búsqueda empresarial RAG e IA de alta precisión a escala utilizando el conocimiento más actualizado disponible en sus fuentes de datos. Le proporciona plantillas de aplicaciones LLM (modelo de lenguaje grande) listas para implementar. Puede probarlos en su propia máquina e implementarlos en la nube (GCP, AWS, Azure, Render,...) o en las instalaciones.
Las aplicaciones se conectan y sincronizan (todas las nuevas incorporaciones, eliminaciones y actualizaciones de datos) con fuentes de datos en su sistema de archivos, Google Drive, Sharepoint, S3, Kafka, PostgreSQL y API de datos en tiempo real . No vienen con dependencias de infraestructura que necesitarían una configuración separada. Incluyen indexación de datos incorporada que permite la búsqueda vectorial, la búsqueda híbrida y la búsqueda de texto completo, todo ello en memoria y con caché.
Las plantillas de aplicación proporcionadas en este repositorio escalan hasta millones de páginas de documentos . Algunos de ellos están optimizados para ser simples, otros están optimizados para una precisión asombrosa. Elige el que más te convenga. Puede usarlo de inmediato o cambiar algunos pasos del proceso; por ejemplo, si desea agregar una nueva fuente de datos o cambiar un índice vectorial a un índice híbrido, es solo un cambio de una línea.
Aplicación (plantilla) | Descripción |
---|---|
Question-Answering RAG App | Aplicación RAG básica de extremo a extremo. Un canal de respuesta a preguntas que utiliza el modelo GPT elegido para proporcionar respuestas a consultas sobre sus documentos (PDF, DOCX,...) en una fuente de datos conectada en vivo (archivos, Google Drive, Sharepoint,...). También puede probar un punto final REST de demostración. |
Live Document Indexing (Vector Store / Retriever) | Un canal de indexación de documentos en tiempo real para RAG que actúa como un servicio de almacenamiento de vectores. Realiza una indexación en vivo de sus documentos (PDF, DOCX,...) desde una fuente de datos conectada (archivos, Google Drive, Sharepoint,...). Puede usarse con cualquier interfaz o integrarse como un backend de recuperación para una aplicación Langchain o Llamaindex. También puede probar un punto final REST de demostración. |
Multimodal RAG pipeline with GPT4o | RAG multimodal que utiliza GPT-4o en la etapa de análisis para indexar archivos PDF y otros documentos desde archivos de origen de datos conectados, Google Drive, Sharepoint,...). Es perfecto para extraer información de documentos financieros no estructurados en sus carpetas (incluidos gráficos y tablas), actualizando los resultados a medida que los documentos cambian o llegan nuevos. |
Unstructured-to-SQL pipeline + SQL question-answering | Un ejemplo de RAG que se conecta a fuentes de datos financieros no estructurados (PDF de informes financieros), estructura los datos en SQL y los carga en una tabla de PostgreSQL. También responde consultas de usuarios en lenguaje natural sobre estos documentos financieros traduciéndolos a SQL utilizando un LLM y ejecutando la consulta en la tabla PostgreSQL. |
Adaptive RAG App | Una aplicación RAG que utiliza Adaptive RAG, una técnica desarrollada por Pathway para reducir el costo del token en RAG hasta 4 veces manteniendo la precisión. |
Private RAG App with Mistral and Ollama | Una versión totalmente privada (local) del canal RAG demo-question-answering que utiliza Pathway, Mistral y Ollama. |
Slides AI Search App | Un canal de indexación para recuperar diapositivas. Realiza presentaciones multimodales de PowerPoint y PDF y mantiene un índice en vivo de sus diapositivas". |
Las aplicaciones se pueden ejecutar como contenedores Docker y exponer una API HTTP para conectar la interfaz. Para permitir pruebas y demostraciones rápidas, algunas plantillas de aplicaciones también incluyen una interfaz de usuario Streamlit opcional que se conecta a esta API.
Las aplicaciones se basan en el marco Pathway Live Data para la sincronización de fuentes de datos y para atender solicitudes de API (Pathway es una biblioteca Python independiente con un motor Rust integrado). Le brindan una lógica de aplicación simple y unificada para la pila tecnológica LLM de back-end, incrustación y recuperación. No es necesario integrar ni mantener módulos separados para su aplicación Gen AI: Base de datos vectorial (p. ej. Pinecone/Weaviate/Qdrant) + Caché (p. ej. Redis) + Marco API (p. ej. Fast API) . La elección predeterminada de Pathway de índice vectorial incorporado se basa en la biblioteca de búsqueda de uso ultrarrápida, y los índices híbridos de texto completo utilizan la biblioteca Tantivy. Todo funciona desde el primer momento.
Cada una de las plantillas de aplicación en este repositorio contiene un archivo README.md con instrucciones sobre cómo ejecutarlo.
También puede encontrar más plantillas de código listas para ejecutar en el sitio web de Pathway.
Extraiga y organice sin esfuerzo datos de tablas y gráficos de archivos PDF, documentos y más con RAG multimodal, en tiempo real:
(Consulte Multimodal RAG pipeline with GPT4o
para ver toda la canalización en proceso. También puede consultar la Unstructured-to-SQL pipeline
para ver un ejemplo mínimo que también funciona con modelos no multimodales).
Minería de conocimientos y alertas automatizadas en tiempo real:
(Consulte el ejemplo Alerting when answers change on Google Drive
).
Para proporcionar comentarios o informar un error, plantee un problema en nuestro rastreador de problemas.
Se recomienda encarecidamente a cualquier persona que desee contribuir a este proyecto, ya sea documentación, funciones, corrección de errores, limpieza de código, pruebas o revisiones de código, que lo haga. Si esta es su primera contribución a un proyecto Github, aquí tiene una Guía de inicio.
Si desea hacer una contribución que necesita más trabajo, simplemente levante la mano en el servidor Pathway Discord (#get-help) y háganos saber lo que está planeando.