Repositori ini berisi semua item yang diperlukan untuk membangun LLM Anda sendiri dari awal. Ikuti saja instruksinya. Terinspirasi dari generator nanoGPT dan Shakespeare Karpathy, saya membuat repositori ini untuk membangun LLM saya sendiri. Ia memiliki segalanya mulai dari pengumpulan data untuk Model hingga file arsitektur, tokenizer, dan file kereta.
Repo ini berisi:
Sebelum menyiapkan SmallLanguageModel, pastikan Anda telah menginstal prasyarat berikut:
Ikuti langkah-langkah berikut untuk melatih tokenizer Anda sendiri atau menghasilkan keluaran dari model yang dilatih:
Kloning repositori ini:
git clone https://github.com/shivendrra/SmallLanguageModel-project
cd SLM-clone
Instal Ketergantungan:
pip install requirements.txt
Kereta: Baca training.md untuk informasi lebih lanjut. Ikuti itu.
Permintaan tarik dipersilakan. Untuk perubahan besar, silakan buka terbitan terlebih dahulu untuk mendiskusikan apa yang ingin Anda ubah. Harap pastikan untuk memperbarui pengujian sebagaimana mestinya.
Lisensi MIT. Lihat Lisensi.md untuk info lebih lanjut.