Chatbot untuk Discord menggunakan model LLaMA Meta, terkuantisasi 4-bit. Model dengan 13 miliar parameter cocok dalam VRAM kurang dari 9 GiB.
Sebelum Anda melakukan semua ini, Anda memerlukan token bot. Jika Anda tidak memiliki token bot, ikuti panduan ini untuk membuat bot lalu tambahkan bot tersebut ke server Anda.
Saat ini hanya Linux saja, tetapi Anda mungkin dapat membuatnya berfungsi dengan OS lain.
pip install virtualenv
), dan CUDA.git clone https://github.com/AmericanPresidentJimmyCarter/yal-discord-bot/
cd yal-discord-bot
python3 -m virtualenv env
source env/bin/activate
pip install -r requirements.txt
git clone https://github.com/huggingface/transformers/
cd transformers
git checkout 20e54e49fa11172a893d046f6e7364a434cbc04f
pip install -e .
cd ..
cd bot/llama_model
python setup_cuda.py install
cd ../..
wget https://huggingface.co/Neko-Institute-of-Science/LLaMA-13B-4bit-128g/resolve/main/llama-13b-4bit-128g.safetensors
cd bot
python -m bot $YOUR_BOT_TOKEN --allow-queue -g $YOUR_GUILD --llama-model= " Neko-Institute-of-Science/LLaMA-13B-4bit-128g " --groupsize=128 --load-checkpoint= " path/to/llama/weights/llama-13b-4bit-128g.safetensors "
Pastikan $YOUR_BOT_TOKEN
dan $YOUR_GUILD
disetel ke sebagaimana mestinya, --load-checkpoint=..."
menunjuk ke lokasi bobot yang benar, dan --llama-model=...
menunjuk ke lokasi yang benar lokasi di Huggingface untuk menemukan konfigurasi bobot.
Anda dapat menggunakan model ALPACA apa pun dengan menyetel flag --alpaca
, yang memungkinkan Anda menambahkan string input serta secara otomatis memformat prompt Anda ke dalam bentuk yang diharapkan oleh ALPACA.
Bobot ALPACA 4-bit yang direkomendasikan adalah sebagai berikut:
Atau GPT4 disempurnakan (respons pengkodean lebih baik, konten lebih terbatas):
cd bot
python -m bot $YOUR_BOT_TOKEN --allow-queue -g $YOUR_GUILD --alpaca --groupsize=128 --llama-model= " elinas/alpaca-30b-lora-int4 " --load-checkpoint= " path/to/alpaca/weights/alpaca-30b-4bit-128g.safetensors "
(c) Presiden Amerika 2023 Jimmy Carter