Ein Chatbot für Discord, der das LLaMA-Modell von Meta verwendet, 4-Bit-quantisiert. Das Modell mit 13 Milliarden Parametern passt in weniger als 9 GiB VRAM.
Bevor Sie dies tun, benötigen Sie ein Bot-Token. Wenn Sie kein Bot-Token haben, befolgen Sie diese Anleitung, um einen Bot zu erstellen und den Bot dann Ihrem Server hinzuzufügen.
Derzeit ist dies nur für Linux verfügbar, aber Sie können es möglicherweise mit anderen Betriebssystemen zum Laufen bringen.
pip install virtualenv
) und CUDA installiert sind.git clone https://github.com/AmericanPresidentJimmyCarter/yal-discord-bot/
cd yal-discord-bot
python3 -m virtualenv env
source env/bin/activate
pip install -r requirements.txt
git clone https://github.com/huggingface/transformers/
cd transformers
git checkout 20e54e49fa11172a893d046f6e7364a434cbc04f
pip install -e .
cd ..
cd bot/llama_model
python setup_cuda.py install
cd ../..
wget https://huggingface.co/Neko-Institute-of-Science/LLaMA-13B-4bit-128g/resolve/main/llama-13b-4bit-128g.safetensors
cd bot
python -m bot $YOUR_BOT_TOKEN --allow-queue -g $YOUR_GUILD --llama-model= " Neko-Institute-of-Science/LLaMA-13B-4bit-128g " --groupsize=128 --load-checkpoint= " path/to/llama/weights/llama-13b-4bit-128g.safetensors "
Stellen Sie sicher, dass $YOUR_BOT_TOKEN
und $YOUR_GUILD
so eingestellt sind, wie sie sein sollten. --load-checkpoint=..."
zeigt auf die richtige Position der Gewichtungen und --llama-model=...
zeigt auf die richtige Position Speicherort in Huggingface, um die Konfiguration für die Gewichte zu finden.
Sie können jedes ALPACA-Modell verwenden, indem Sie das Flag --alpaca
setzen. Dadurch können Sie Eingabezeichenfolgen hinzufügen und Ihre Eingabeaufforderung automatisch in die von ALPACA erwartete Form formatieren.
Die empfohlenen 4-Bit-ALPACA-Gewichte sind wie folgt:
Oder GPT4 verfeinert (bessere Codierungsreaktionen, restriktiver im Inhalt):
cd bot
python -m bot $YOUR_BOT_TOKEN --allow-queue -g $YOUR_GUILD --alpaca --groupsize=128 --llama-model= " elinas/alpaca-30b-lora-int4 " --load-checkpoint= " path/to/alpaca/weights/alpaca-30b-4bit-128g.safetensors "
(c) 2023 amerikanischer PräsidentJimmyCarter