microGPT adalah implementasi ringan dari model Generative Pre-trained Transformer (GPT) untuk tugas pemrosesan bahasa alami. Ini dirancang agar sederhana dan mudah digunakan, menjadikannya pilihan bagus untuk aplikasi skala kecil atau untuk belajar dan bereksperimen dengan model generatif.
300 ribu iterasi pelatihan
pip install -r requirements.txt
tokenizer/train_tokenizer.py
untuk menghasilkan file tokenizer. Model akan memberi token pada teks berdasarkan model tersebut.datasets/prepare_dataset.py
untuk menghasilkan file dataset.train.py
untuk memulai pelatihan~Ubah file yang disebutkan di atas jika Anda ingin mengubah parameternya.
Untuk mengedit parameter pembuatan model, buka inference.py
ke bagian ini:
# Parameters (Edit here):
n_tokens = 1000
temperature = 0.8
top_k = 0
top_p = 0.9
model_path = 'models/microGPT.pth'
# Edit input here
context = "The magical wonderland of"
Tertarik untuk diterapkan sebagai aplikasi web? Lihat penerapan microGPT!
Efisiensi Dari Awal: Dikembangkan dari awal, microGPT mewakili pendekatan sederhana terhadap model GPT yang terkemuka. Ini menunjukkan efisiensi yang luar biasa dengan tetap mempertahankan sedikit trade-off dalam kualitas.
Taman Bermain Pembelajaran: Dirancang bagi individu yang ingin mendalami dunia AI, arsitektur microGPT menawarkan peluang unik untuk memahami cara kerja model generatif. Ini adalah landasan untuk mengasah keterampilan Anda dan memperdalam pemahaman Anda.
Pembangkit Tenaga Listrik Skala Kecil: Selain pembelajaran dan eksperimen, microGPT adalah pilihan yang cocok untuk aplikasi skala kecil. Ini memberdayakan Anda untuk mengintegrasikan pembuatan bahasa yang didukung AI ke dalam proyek yang mengutamakan efisiensi dan kinerja.
Kemampuan Penyesuaian: kemampuan beradaptasi microGPT memberdayakan Anda untuk memodifikasi dan menyempurnakan model agar sesuai dengan tujuan spesifik Anda, menawarkan landasan untuk menciptakan solusi AI yang disesuaikan dengan kebutuhan Anda.
Perjalanan Pembelajaran: Gunakan microGPT sebagai batu loncatan untuk memahami dasar-dasar model generatif. Desain dan dokumentasinya yang mudah diakses memberikan lingkungan ideal bagi mereka yang baru mengenal AI.
Lab Eksperimen: Terlibat dalam eksperimen dengan menyesuaikan dan menguji parameter microGPT. Kesederhanaan dan keserbagunaan model memberikan lahan subur bagi inovasi.
Jika Anda ingin berkontribusi, silakan ikuti panduan berikut:
Dengan berkontribusi pada repositori ini, Anda setuju untuk mematuhi Kode Etik kami dan kontribusi Anda akan dilepaskan di bawah Lisensi yang sama dengan repositori.
Model ini terinspirasi oleh video Andrej Karpathy Let's build GPT from scratch dan Andrej Kaparthy nanoGPT dengan modifikasi untuk proyek ini.