Unduh gptq_for_langchain - unduhan kode sumber gptq_for

gptq_for_langchain

Kode sumber lainnya

1.0.0

Unduh

Model GPTQ di LangChain

Pendahuluan

Repositori ini menyediakan kerangka kerja potensial dengan contoh-contoh praktis untuk mengembangkan aplikasi yang didukung oleh Model Model Bahasa (LLM) sumber terbuka terkuantisasi bersama dengan LangChain. Secara khusus, panduan ini berfokus pada penerapan dan pemanfaatan varian GPTQ Terkuantisasi 4-bit dari berbagai LLM, seperti WizardLM dan WizardLM-Mega. Meskipun sumber daya yang didedikasikan untuk topik spesifik ini terbatas secara online, repositori ini bertujuan untuk menjembatani kesenjangan tersebut dan menawarkan panduan komprehensif.

Menjalankan LLM secara lokal menawarkan banyak keuntungan, dengan privasi menjadi faktor kuncinya. Dengan menyimpan data Anda di dalam perangkat keras Anda sendiri, Anda dapat memanfaatkan kemampuan model ini tanpa bergantung pada API eksternal, memastikan kontrol yang lebih besar atas data Anda dan memungkinkan pengembangan aplikasi yang menarik.

Prasyarat

Ubuntu 22.04 / WSL2 Ubuntu untuk Windows
GPU Nvidia dengan VRAM minimal 6GB
- VRAM 6GB cukup untuk memuat model 7B 4-bit
8 utas CPU
RAM 16 GB direkomendasikan
Driver Nvidia sudah diinstal (perintah nvidia-smi seharusnya berfungsi)
Ruang disk yang cukup untuk paket, driver, dan file model (~30GB, mungkin bervariasi tergantung sistem)
Git LFS

Catatan: Dukungan Docker akan ditambahkan.

Model yang Diuji

Model GPTQ berikut didukung untuk saat ini:

wizardLM-7B-GPTQ
WizardLM-7B-tanpa sensor-GPTQ

Bangun dan berlari

Untuk mulai menggunakan model GPTQ dengan langchain, ada beberapa langkah penting:

Siapkan Lingkungan Python
Instal versi toolkit Pytorch dan CUDA yang tepat
Siapkan quant_cuda dengan benar
Unduh model GPTQ dari HuggingFace
Setelah langkah di atas Anda dapat menjalankan demo.py dan menggunakan LLM dengan LangChain seperti yang Anda lakukan untuk model OpenAI.

Menciptakan lingkungan conda

Instal Miniconda dengan mengikuti instruksi dari situs resminya.

Untuk memeriksa apakah conda telah diatur dengan benar

$ conda --version

Inisialisasi conda di shell Anda

$ conda init

Buat lingkungan conda baru, pastikan untuk menggunakan versi Python yang ditentukan karena hanya diuji pada 3.10.9

$ conda create -n wizardlm_langchain python=3.10.9

Setelah lingkungan baru dibuat, aktifkan.

$ conda activate wizardlm_langchain

Menyiapkan lingkungan

Seluruh proses yang dibahas di atas dari 2 hingga 4 diotomatisasi menggunakan skrip bash setup.sh . Jangan ragu untuk memodifikasinya sesuai keinginan Anda.

$ bash ./setup.sh

Semua langkah idealnya berjalan tanpa kesalahan jika lingkungan diatur dengan benar.

Jika Anda menghadapi pengecualian berikut saat menjalankan demo:

 Exception: Error while deserializing header: HeaderTooLarge

Artinya model belum diunduh sepenuhnya sehingga Anda dapat mencoba mengunduh ulang menggunakan perintah git clone yang terdapat di setup.py .

Sebelum menjalankan demo, ada baiknya untuk menonaktifkan dan mengaktifkan kembali lingkungan saat Anda mengaturnya untuk pertama kali.

Jalankan demonya:

$ python demo.py

Menggunakan setup.sh secara default akan mengunduh model wizardLM-7B-GPTQ tetapi jika Anda ingin menggunakan model lain yang diuji dengan proyek ini, Anda dapat menggunakan skrip download_model.sh .

$ download_model.sh < HUGGING FACE MODEL NAME >
# Example
$ ./download_model.sh " TheBloke/WizardLM-7B-uncensored-GPTQ "

Catatan: Jika Anda tidak dapat mengunduh model lengkap dari HF, pastikan Git LFS dikonfigurasi dengan benar. Perintah git lfs install terkadang dapat menyelesaikan pekerjaan.

Penggunaan

Setelah Anda menyelesaikan proses penyiapan, Anda dapat menggunakan model GPTQ dengan LangChain dengan mengikuti langkah-langkah berikut:

Pastikan untuk menambahkan direktori root proyek wizardlm_langchain ke PYTHONPATH untuk menggunakannya secara global

Lihat contoh skrip demo.py untuk memahami cara menggunakannya.

Berkontribusi

Kontribusi pada repositori ini dipersilahkan. Jika Anda menemukan masalah atau memiliki saran untuk perbaikan, jangan ragu untuk membuka masalah atau mengirimkan permintaan penarikan.

Saat berkontribusi, harap patuhi pedoman berikut:

Cabangkan repositori dan buat cabang baru untuk kontribusi Anda.
Sertakan dokumentasi dan komentar jika diperlukan.
Tulis pesan komit yang jelas.
Uji perubahan Anda secara menyeluruh sebelum mengirimkan permintaan penarikan.

Lisensi

Repositori ini dilisensikan di bawah Lisensi Publik GNU. Lihat file LISENSI untuk informasi lebih lanjut.

Ucapan Terima Kasih

Kami ingin mengucapkan terima kasih atas kontribusi komunitas sumber terbuka dan pengembang model GPTQ asli yang digunakan dalam repositori ini. Jutaan terima kasih kepada oobabooga/text-generasi-webui, pekerjaan mereka telah sangat membantu dalam menyiapkan model GPTQ dengan langchain.

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2024-12-07
ukuran 31.61KB
Berasal dari Github

Aplikasi Terkait

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
socat 1.8.0.1_for_Windows

2024-11-10
Sistem manajemen agen real estat eimsHouse_for_access

2010-06-28
Sistem manajemen agen real estat eimsHouse_for_mssql

2009-11-24
Sistem Manajemen Informasi Perusahaan EIMS_for_mssql

2009-11-24

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
waymo open dataset

Kode sumber lainnya

December 2023 Update
SmartTube

Kode sumber lainnya

24.71 Stable
Sunamu

Kode sumber lainnya

Release 2.2.0
waymo open dataset

Kode sumber lainnya

December 2023 Update
termwind

Kategori lainnya

v2.3.0
wp functions

Kategori lainnya

1.0.0

Informasi Terkait Semua