llama3 playground herunterladen - llama3 playground Quellcode herunterladen

Lama 3 Spielplatz

Eine vollständig enthaltene, sofort einsatzbereite Umgebung zur Feinabstimmung des Llama 3-Modells mit benutzerdefinierten Datensätzen und zur Ausführung von Inferenzen auf den fein abgestimmten Modellen

Anforderungen

Docker
Nvidia-GPU

Hinweis: Bisher wurde dies nur auf NVIDIA RTX 2080- und NVIDIA Tesla T4-GPUs getestet. Es wurde nicht mit den anderen GPU-Klassen oder auf CPUs getestet.

Führen Sie diesen Befehl auf Ihrem Hostcomputer aus, um zu überprüfen, welche Nvidia-GPU Sie installiert haben.

nvidia-smi

Daraufhin sollten Ihre GPU-Informationen angezeigt werden.

+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.171.04             Driver Version: 535.171.04   CUDA Version: 12.2     |
| -----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
| =========================================+======================+====================== |
|   0  NVIDIA GeForce RTX 2080        Off | 00000000:01:00.0  On |                  N/A |
| 22%   38C    P8              17W / 215W |    197MiB /  8192MiB |      0%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+

Was beinhaltet das Setup/Image?

Python 3.10
JupyterLab
Huggingface-CLI
EasyOCR (mit vorab heruntergeladenem englischen Erkennungsmodell). Dies dient zum Ausführen der Zeichenerkennung für PDF-/Bilddateien.
Llama3-Modell vorab heruntergeladen
Skripte zum Ausführen von OCR, Training und Inferenz.
Beispieldatensatz zur Feinabstimmung des Modells

Aufstellen

git clone https://github.com/amithkoujalgi/llama3-playground.git
cd llama3-playground

bash build.sh

Laufen

bash run.sh

Dadurch wird der Docker-Container mit den folgenden Diensten gestartet.

Service	Von außen erreichbarer Endpunkt	Interner Port	Beschreibung
Aufsicht	http://localhost:8884	9001	Zum Ausführen von Schulungen für benutzerdefinierte Datensätze und zum Anzeigen von Protokollen des Trainerprozesses
FastAPI-Server	http://localhost:8883/docs	8070	Für den Zugriff auf APIs des Modellservers
JupyterLab-Server	http://localhost:8888/lab	8888	Greifen Sie auf die JupyterLab-Schnittstelle zu, um den Container zu durchsuchen und den Code zu aktualisieren/experimentieren

Hinweis : Alle Prozesse (OCR, Training und Inferenz) nutzen die GPU und wenn mehr als ein Prozess jeglicher Art gleichzeitig ausgeführt würde, würden Probleme mit unzureichendem Arbeitsspeicher (OOM) auftreten. Um dies zu bewältigen, wurde das System so konzipiert, dass es zu einem bestimmten Zeitpunkt nur einen Prozess ausführt. (d. h. es kann jeweils nur eine Instanz von OCR oder Training oder Inferenz ausgeführt werden)
Sie können den Code jederzeit entsprechend Ihren Anforderungen aktualisieren.

Befehle von Jupyter ausführen

Zugmodell

Gehen Sie zum Terminal und geben Sie ein

playground --train

Modelle auflisten

Gehen Sie zum Terminal und geben Sie ein

playground -l

Dadurch werden Modelle unter /app/data/trained-models/ erstellt. Das Trainerskript erzeugt zwei Modelle:

ein Modell, das nur über die LoRA-Adapter verfügt und das Suffix lora-adapters trägt.
ein vollständiges Modell, bei dem nur die LoRA-Adapter mit dem Basismodell verschmolzen sind.

OCR ausführen:

 cd /app/llama3_playground/core

python ocr.py 
  -f " /app/sample.pdf "

Um zu verstehen, was die Optionen bedeuten, gehen Sie zu JupyterLab und führen Sie python ocr.py -h aus

Schlussfolgerung mit RAG:

 cd /app/llama3_playground/core

python infer_rag.py 
  -m " llama-3-8b-instruct-custom-1720802202 " 
  -d " /app/data/ocr-runs/123/text-result.txt " 
  -q " What is the employer name, address, telephone, TIN, tax year end, type of business, plan name, Plan Sequence Number, Trust ID, Account number, is it a new plan or existing plan as true or false, are elective deferrals and roth deferrals allowed as true or false, are loans permitted as true or false, are life insurance investments permitted and what is the ligibility Service Requirement selected? " 
  -t 256 
  -e " Alibaba-NLP/gte-base-en-v1.5 " 
  -p " There are checkboxes in the text that denote the value as selected if the text is [Yes], and unselected if the text is [No]. The checkbox option's value can either be before the selected value or after. Keep this in context while responding and be very careful and precise in picking these values. Always respond as JSON. Keep the responses precise and concise. "

Um zu verstehen, was die Optionen bedeuten, gehen Sie zu JupyterLab und führen Sie python infer_rag.py -h aus

Zusätzliche Einrichtungsanweisungen

Dies ist erforderlich, wenn auf Ihrem Hostcomputer kein NVIDIA Container Toolkit installiert ist.

Installieren Sie NVIDIA Container Toolkit, wenn Sie einen Ubuntu-Host ausführen

 # Configure the production repository
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg 
  && curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | 
    sed ' s#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g ' | 
    sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list

# Optionally, configure the repository to use experimental packages
sed -i -e ' /experimental/ s/^#//g ' /etc/apt/sources.list.d/nvidia-container-toolkit.list

# Update the packages list from the repository
sudo apt-get update

# Install the NVIDIA Container Toolkit packages
sudo apt-get install -y nvidia-container-toolkit

Informationen zu anderen Umgebungen finden Sie hier.

APIs

Schlussfolgerung

Generieren Sie eine Antwort aus dem Modell

curl --silent -X ' POST ' 
  ' http://localhost:8883/api/infer/sync/ctx-text ' 
  -H ' accept: application/json ' 
  -H ' Content-Type: application/json ' 
  -d ' {
  "model_name": "llama-3-8b-instruct-custom-1720690384",
  "context_data": "You are a magician who goes by the name Magica",
  "question_text": "Who are you?",
  "prompt_text": "Respond in a musical and Shakespearean tone",
  "max_new_tokens": 50
} ' | jq -r " .data.response "

OCR

Führen Sie OCR für die PDF-Datei aus, indem Sie die Datei hochladen

curl -X ' POST ' 
  ' http://localhost:8883/api/ocr/sync/pdf ' 
  -H ' accept: application/json ' 
  -H ' Content-Type: multipart/form-data ' 
  -F ' file=@your_file.pdf;type=application/pdf '

Status des OCR-Prozesses abrufen. Gibt `true` zurück, wenn ein OCR-Prozess ausgeführt wird, andernfalls `false` .

curl -X ' GET ' 
  ' http://localhost:8883/api/ocr/status ' 
  -H ' accept: application/json '

Referenzen:

https://huggingface.co/unsloth/llama-3-8b-bnb-4bit
https://huggingface.co/unsloth/llama-3-8b-Instruct-bnb-4bit
https://colab.research.google.com/drive/135ced7oHytdxu3N2DNe1Z0kqjyYIkDXp?usp=sharing
https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html

Expandieren

llama3 playground

Lama 3 Spielplatz

Anforderungen

Was beinhaltet das Setup/Image?

Aufstellen

Laufen

Befehle von Jupyter ausführen

Zugmodell

Modelle auflisten

Zusätzliche Einrichtungsanweisungen

Installieren Sie NVIDIA Container Toolkit, wenn Sie einen Ubuntu-Host ausführen

APIs

Schlussfolgerung

Generieren Sie eine Antwort aus dem Modell

OCR

Führen Sie OCR für die PDF-Datei aus, indem Sie die Datei hochladen

Status des OCR-Prozesses abrufen. Gibt `true` zurück, wenn ein OCR-Prozess ausgeführt wird, andernfalls `false` .

llama3

Nextbots Sandbox PlaygroundGame

Battle Ragdoll-Spielplatzspiel

Melonenspielplatz

Melon Playground neueste Version

Menschenspielplatz

chat.petals.dev

GPT Prompt Templates

GPTyped

node telegram bot api

typebot.io

python wechaty getting started

waymo open dataset

termwind

wp functions

llama3 playground

Lama 3 Spielplatz

Anforderungen

Was beinhaltet das Setup/Image?

Aufstellen

Laufen

Befehle von Jupyter ausführen

Zugmodell

Modelle auflisten

Zusätzliche Einrichtungsanweisungen

Installieren Sie NVIDIA Container Toolkit, wenn Sie einen Ubuntu-Host ausführen

APIs

Schlussfolgerung

Generieren Sie eine Antwort aus dem Modell

OCR

Führen Sie OCR für die PDF-Datei aus, indem Sie die Datei hochladen

Status des OCR-Prozesses abrufen. Gibt true zurück, wenn ein OCR-Prozess ausgeführt wird, andernfalls false .

Status des OCR-Prozesses abrufen. Gibt `true` zurück, wenn ein OCR-Prozess ausgeführt wird, andernfalls `false` .