Ce projet est conçu pour montrer un pipeline de bout en bout pour construire des graphiques de connaissances à partir d'articles de presse, les analyser à travers diverses visualisations et, enfin, permettre à LLM de générer des questions basées sur les informations fournies par le graphique de connaissances.
Le projet utilise Neo4j, une base de données graphique, pour stocker le graphique de connaissances et Diffbot comme fournisseur de données. Diffbot propose diverses intégrations de données sur sa plateforme, telles que :
Enfin, le projet utilise les OpenAI LLM pour fournir une interface de chat, qui peut répondre aux questions en fonction des informations fournies par le graphe de connaissances.
Définissez les variables d'environnement dans .env
. Vous pouvez trouver le modèle dans .env.template
Démarrez les conteneurs Docker avec
docker compose up
localhost:3000
Toutes les contributions sont les bienvenues via des problèmes GitHub ou des demandes d'extraction.