danGPT
Essayez-le sur https://dangpt.vercel.app/.
Ce projet montre comment composer des services d'IA et mettre en œuvre RAG (Retrieval Augmented Generation) avec Generative AI.
Voici un aperçu de son fonctionnement :
- En dehors du cadre de ce dépôt, nous avons récupéré une énorme quantité de données. Dans ce cas, les messages de Dan.
- Nous transformons ensuite tout le texte que nous souhaitons rechercher en vecteurs (listes de nombres) à l'aide d'un modèle d'apprentissage automatique qui mappe la signification du texte à un espace numérique multidimensionnel. "Intégrer" le texte dans l'espace vectoriel à l'aide d'un "modèle d'intégration". Dans ce cas,
text-embedding-3-small
d'OpenAI. - Nous stockons ensuite ces vecteurs dans une base de données vectorielles. Notre arme de choix ici est AstraDB de DataStax.
Ensuite, lorsqu'un utilisateur soumet une requête, nous :
- Transformez la requête en vecteur en utilisant le même modèle d'intégration.
- Recherchez dans la base de données vectorielles les vecteurs les plus similaires au vecteur de requête ou les vecteurs « proches » du vecteur de requête dans l’espace dimensionnel.
- Récupérez de nombreux textes originaux à partir des vecteurs les plus similaires.
- Prenez ces textes originaux et intégrez-les comme contexte dans un modèle d'IA génératif. Dans ce cas,
gpt-3.5-turbo
d'OpenAI. Le même modèle derrière le niveau gratuit de ChatGPT. - Le modèle d’IA générative génère ensuite une réponse basée sur le contexte qui lui a été donné, se faisant passer pour Dan.
Il convient de noter qu'il ne s'agit que d'une démo de projet parallèle idiote et qu'elle est probablement erronée. C'est plus pour l'éducation qu'autre chose.