Generación aumentada de recuperación de próxima generación (RAG)
Introducción
Este es un centro colaborativo dedicado a promover la próxima generación de tecnología de recuperación de generación aumentada (RAG). Este repositorio se centra en la exploración dinámica del panorama cambiante de RAG, con el objetivo de descubrir, desarrollar y compartir los avances de vanguardia que dan forma al futuro de la recuperación y generación de información impulsada por la IA.
Objetivos
Este repositorio se embarca en una exploración dinámica del panorama cambiante de RAG, con el objetivo de descubrir, desarrollar y compartir los avances de vanguardia que dan forma al futuro de la recuperación y generación de información impulsada por la IA.
Objetivos
Los objetivos principales de este repositorio son:
- Innovar y explorar : ampliar los límites de las tecnologías RAG actuales mediante la exploración de nuevos conceptos, metodologías y arquitecturas.
- Investigación colaborativa : fomentar una comunidad de investigadores, desarrolladores y entusiastas que trabajen juntos para avanzar en el campo de RAG.
- Intercambio de conocimientos : servir como un recurso integral para desarrollos de última generación, avances conceptuales y debates profundos sobre RAG y sus aplicaciones.
- Impacto en el mundo real : traducir los avances teóricos en soluciones prácticas que aborden los desafíos del mundo real en la recuperación de información y la generación de texto.
Temas de interés
Este repositorio se centra en una amplia gama de temas dentro del ámbito de RAG y áreas relacionadas, que incluyen, entre otros:
- Enrutamiento semántico
- Integración de conocimientos
- Procesamiento avanzado de consultas
- Categoría
- Estrategias para una clasificación de textos eficaz y eficiente utilizando modelos de lenguaje grandes
- Capacitar a un reclasificador de LLM mediante la optimización de preferencias directas
- Perdido en el medio: cómo los modelos de lenguaje utilizan contextos largos
- Rango flash
- Recuperador de contexto largo
- Seguridad:
- (todo: agregar hilo de exploración)ComPromptMized: Liberación de gusanos sin clic dirigidos a aplicaciones impulsadas por GenAI
Estructura del repositorio
- notebooks/ : Cuadernos de Jupyter que contienen investigaciones, experimentos y demostraciones. Cada cuaderno contiene instrucciones y explicaciones.
- docs/ : Documentación adicional sobre conceptos, técnicas y hallazgos.
- data/ : Conjuntos de datos de muestra utilizados para la experimentación (todo: agregar conjuntos de datos).
- scripts/ : scripts de utilidad y fragmentos de código (todo: agregar scripts).
En curso
Reserva
Hoja de ruta