Génération augmentée de récupération de nouvelle génération (RAG)
Introduction
Il s'agit d'un pôle collaboratif dédié à l'avancement de la prochaine génération de technologie de récupération augmentée (RAG). Ce référentiel se concentre sur l'exploration dynamique du paysage évolutif de RAG, dans le but de découvrir, développer et partager les avancées de pointe qui façonnent l'avenir de la récupération et de la génération d'informations basées sur l'IA.
Objectifs
Ce référentiel se lance dans une exploration dynamique du paysage évolutif de RAG, visant à découvrir, développer et partager les avancées de pointe qui façonnent l'avenir de la récupération et de la génération d'informations basées sur l'IA.
Objectifs
Les principaux objectifs de ce référentiel sont :
- Innover et explorer : repousser les limites des technologies RAG actuelles en explorant de nouveaux concepts, méthodologies et architectures.
- Recherche collaborative : favoriser une communauté de chercheurs, de développeurs et de passionnés travaillant ensemble pour faire progresser le domaine du RAG.
- Partage de connaissances : servir de ressource complète pour les développements de pointe, les avancées conceptuelles et les discussions approfondies sur RAG et ses applications.
- Impact sur le monde réel : traduire les avancées théoriques en solutions pratiques qui répondent aux défis du monde réel en matière de recherche d'informations et de génération de textes.
Sujets d'intérêt
Ce référentiel se concentre sur un large éventail de sujets dans le domaine de RAG et des domaines connexes, y compris, mais sans s'y limiter :
- Routage sémantique
- Intégration des connaissances
- Traitement avancé des requêtes
- Classement
- Stratégies pour un classement de texte efficace et efficient à l'aide de grands modèles linguistiques
- Former un re-ranker LLM à l'aide de l'optimisation des préférences directes
- Perdu au milieu : comment les modèles de langage utilisent des contextes longs
- Classement Flash
- Récupérateur de contexte long
- Sécurité:
- (à faire : ajouter un fil d'exploration) ComPromptMized : libérer des vers sans clic qui ciblent les applications basées sur GenAI
Structure du référentiel
- notebooks/ : Carnets Jupyter contenant des recherches, des expériences et des démonstrations. Chaque cahier est autonome avec des instructions et des explications.
- docs/ : documentation supplémentaire sur les concepts, les techniques et les résultats.
- data/ : exemples d'ensembles de données utilisés pour l'expérimentation (à faire : ajouter des ensembles de données).
- scripts/ : Scripts utilitaires et extraits de code (à faire : ajouter des scripts).
En cours
Arriéré
Feuille de route