schema2dwh
est alimenté par l'IA - Gemini de Google - Veuillez vous assurer de vérifier toutes les sorties de code avant de l'inscrire en production. Veuillez également noter que le traitement via ce script utilisera l'API Gemini où les données sont traitées par Google. schema2dwh
est un framework open source conçu pour simplifier et produire automatiquement un modèle de données basé sur votre base de données en utilisant son schéma d'information, tirer parti de l'IA et quelques questions sur vos entrées, il vous produira rapidement un fichier SQL DDL, prêt à créer le squelette derrière votre entrepôt de données nouvellement construit.
Veuillez voir ci-dessous un exemple de la façon dont cela fonctionne.
my_schema.csv
: output_schema.sql
: google-generativeai
)Clonez le dépôt :
git clone https://github.com/cqllum/schema2dwh.git
cd schema2dwh
Installez les packages requis :
pip install google-generativeai
Configurez votre clé API Google Generative AI : remplacez l'espace réservé your-api-key
dans le script par votre clé API Google Generative AI réelle. Générez une clé ici : https://aistudio.google.com/app/apikey
Remplacer l'exemple de fichier de schéma d'entrée (my_schema.csv) : Veuillez noter que pour que cela soit aussi précis que possible, vous devrez récupérer le schéma d'informations de votre base de données. Dans la plupart des cas, c'est aussi simple que SELECT * FROM information_schema.columns
- Sinon, consultez la documentation de votre logiciel de base de données.
Exécutez le script :
python schema2dwh.py
Suivez les invites : Le script vous demandera les informations suivantes :
Sortie : le script générera les instructions SQL DDL et les enregistrera dans output_schema.sql
. Si le schéma ne peut pas être généré, il vous sera demandé de fournir un schéma d'informations approprié.
configure_genai(api_key)
: configure le modèle Generative AI avec la clé API fournie.create_model()
: crée et configure le modèle Generative AI avec les paramètres spécifiés.start_chat_session(model)
: Démarre une session de discussion avec le modèle en utilisant des instructions prédéfinies.gather_user_input()
: rassemble les entrées nécessaires de l'utilisateur de manière interactive.format_response(db_software, db_name, industry, case_type, input_schema, additional_value)
: formate les entrées de l'utilisateur dans une réponse pour la session de discussion.save_schema_to_file(output_file, schema_output)
: enregistre la sortie du schéma générée dans le fichier spécifié.main()
: La fonction principale qui pilote le script.