schema2dwh
didukung oleh AI - Gemini Google - Pastikan untuk memeriksa semua keluaran kode sebelum mendaftarkannya ke produksi. Perlu diketahui juga bahwa pemrosesan melalui skrip ini akan memanfaatkan API Gemini tempat data diproses oleh Google. schema2dwh
adalah kerangka kerja sumber terbuka yang dirancang untuk menyederhanakan dan secara otomatis menghasilkan model data berdasarkan database Anda menggunakan skema informasinya, memanfaatkan AI, dan beberapa pertanyaan tentang masukan Anda, ini akan dengan cepat menghasilkan file SQL DDL, siap untuk membuat kerangka di belakang gudang data Anda yang baru dibangun.
Silakan lihat di bawah untuk contoh cara kerjanya.
my_schema.csv
: output_schema.sql
: google-generativeai
)Kloning repositori:
git clone https://github.com/cqllum/schema2dwh.git
cd schema2dwh
Instal paket yang diperlukan:
pip install google-generativeai
Siapkan kunci API AI Generatif Google Anda: Ganti placeholder your-api-key
di skrip dengan kunci API AI Generatif Google Anda yang sebenarnya. Hasilkan kunci di sini: https://aistudio.google.com/app/apikey
Ganti contoh file skema masukan (my_schema.csv): Harap dicatat, agar ini seakurat mungkin, Anda perlu mengambil skema informasi dari database Anda. Dalam kebanyakan kasus, ini sesederhana SELECT * FROM information_schema.columns
- Jika tidak, kunjungi dokumentasi perangkat lunak database Anda.
Jalankan skrip:
python schema2dwh.py
Ikuti petunjuknya: Skrip akan meminta Anda untuk informasi berikut:
Keluaran: Skrip akan menghasilkan pernyataan DDL SQL dan menyimpannya ke output_schema.sql
. Jika skema tidak dapat dibuat, Anda akan diminta untuk memberikan skema informasi yang tepat.
configure_genai(api_key)
: Mengonfigurasi model AI Generatif dengan kunci API yang disediakan.create_model()
: Membuat dan mengonfigurasi model AI Generatif dengan pengaturan yang ditentukan.start_chat_session(model)
: Memulai sesi obrolan dengan model menggunakan instruksi yang telah ditentukan sebelumnya.gather_user_input()
: Mengumpulkan masukan yang diperlukan dari pengguna secara interaktif.format_response(db_software, db_name, industry, case_type, input_schema, additional_value)
: Memformat input pengguna menjadi respons untuk sesi obrolan.save_schema_to_file(output_file, schema_output)
: Menyimpan output skema yang dihasilkan ke file yang ditentukan.main()
: Fungsi utama yang menggerakkan skrip.