llama classification Télécharger - llama classification Téléchargement du code source

llama classification

Code Source AI

v1.1.1

Télécharger

Classification de texte à l'aide de LLaMA

Ce référentiel fournit une base de code de base pour la classification de texte à l'aide de LLaMA.

Quel système dois-je utiliser pour le développement ?

Appareil : GPU Nvidia 1xV100
Mémoire de l'appareil : 34 G
Mémoire hôte: 252G

Si vous avez besoin d'autres informations sur le matériel, veuillez ouvrir un problème.

Comment utiliser

Configuration expérimentale

Obtenez le point de contrôle du référentiel officiel LLaMA à partir d'ici.
1-1. Je suppose que le point de contrôle serait situé dans la direction racine du projet et que le contenu serait organisé comme suit.
```
 checkpoints
├── llama
│   ├── 7B
│   │   ├── checklist.chk
│   │   ├── consolidated.00.pth
│   │   └── params.json
│   └── tokenizer.model
```

Préparez votre environnement Python. Je recommande d'utiliser anaconda pour séparer la version CUDA de votre machine locale.

conda create -y -n llama-classification python=3.8
conda activate llama-classification
conda install cudatoolkit=11.7 -y -c nvidia
conda list cudatoolkit # to check what cuda version is installed (11.7)
pip install -r requirements.txt

Méthode : Directe

Direct consiste à comparer la probabilité conditionnelle p(y|x) .

Prétraitez les données des ensembles de données Huggingface à l'aide des scripts suivants. Désormais, nous utilisons le jeu de données ag_news.

python run_preprocess_direct_ag_news.py
python run_preprocess_direct_ag_news.py --sample=False --data_path=real/inputs_direct_ag_news.json # Use it for full evaluation

Inférence pour calculer la probabilité conditionnelle à l'aide de LLaMA et de la classe de prédiction.

torchrun --nproc_per_node 1 run_evaluate_direct_llama.py 
    --data_path samples/inputs_direct_ag_news.json 
    --output_path samples/outputs_direct_ag_news.json 
    --ckpt_dir checkpoints/llama/7B 
    --tokenizer_path checkpoints/llama/tokenizer.model

Calibration consiste à améliorer la méthode directe avec la méthode d'étalonnage.

Calibrez à l’aide de la commande suivante.

torchrun --nproc_per_node 1 run_evaluate_direct_calibrate_llama.py 
    --direct_input_path samples/inputs_direct_ag_news.json 
    --direct_output_path samples/outputs_direct_ag_news.json 
    --output_path samples/outputs_direct_calibrate_ag_news.json 
    --ckpt_dir checkpoints/llama/7B 
    --tokenizer_path checkpoints/llama/tokenizer.model

Méthode : Canal

Channel consiste à comparer la probabilité conditionnelle p(x|y) .

Prétraitez les données des ensembles de données Huggingface à l'aide des scripts suivants. Désormais, nous utilisons le jeu de données ag_news.

python run_preprocess_channel_ag_news.py
python run_preprocess_channel_ag_news.py --sample=False --data_path=real/inputs_channel_ag_news.json # Use it for full evaluation

Inférence pour calculer la probabilité conditionnelle à l'aide de LLaMA et de la classe de prédiction.

torchrun --nproc_per_node 1 run_evaluate_channel_llama.py 
    --data_path samples/inputs_channel_ag_news.json 
    --output_path samples/outputs_channel_ag_news.json 
    --ckpt_dir checkpoints/llama/7B 
    --tokenizer_path checkpoints/llama/tokenizer.model

Méthode : Génération pure

Pour évaluer en mode generate , vous pouvez utiliser la version directe prétraitée.

torchrun --nproc_per_node 1 run_evaluate_generate_llama.py 
    --data_path samples/inputs_direct_ag_news.json 
    --output_path samples/outputs_generate_ag_news.json 
    --ckpt_dir checkpoints/llama/7B 
    --tokenizer_path checkpoints/llama/tokenizer.model

Expériences

Ensemble de données	num_examples	k	méthode	précision	temps d'inférence
ag_nouvelles	7600	1	direct	0,7682	00:38:40
ag_nouvelles	7600	1	direct+calibré	0,8567	00:38:40
ag_nouvelles	7600	1	canal	0,7825	00:38:37

Liste de choses à faire

Implémenter la méthode du canal
Rapport expérimental
- Direct
- Canal
- Génération
Mettre en œuvre une autre méthode d'étalonnage
Prise en charge d'autres ensembles de données à l'intérieur des ensembles de données Huggingface
Implémenter LLM.int8
Autre métrique d'évaluation pour mesurer les différentes caractéristiques du modèle de fondation (LLaMA)

Remarque finale

J'apprécie vraiment que l'équipe du projet LLaMA publie un point de contrôle et son code d'inférence efficace. Une grande partie du travail dans ce référentiel est effectuée sur la base du référentiel officiel.
Pour le lecteur, n'hésitez pas à ouvrir un ticket ou à tirer des demandes. Tu peux me donner..
- Tout problème concernant d'autres demandes de fonctionnalités
- Tout problème concernant la mise en œuvre détaillée
- Toute discussion sur l’orientation de la recherche

Citation

Ce serait bien de citer mon travail si vous utilisez ma base de code pour vos recherches.

 @software{Lee_Simple_Text_Classification_2023,
    author = {Lee, Seonghyeon},
    month = {3},
    title = {{Simple Text Classification Codebase using LLaMA}},
    url = {https://github.com/github/sh0416/llama-classification},
    version = {1.1.0},
    year = {2023}
}

Développer

Informations supplémentaires

Version v1.1.1
Type Code Source AI
Date de mise à jour 2024-12-10
taille 2.5MB
Provenant de Github

Applications connexes

node llama cpp

2024-11-11
llama models

2024-11-10
LLaMA Factory

2024-11-02
Code Lama

2023-10-30
Code Lama grand modèle

2023-08-25
Lama 2

2023-08-17

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
node telegram bot api

Code Source AI

v0.50.0
typebot.io

Code Source AI

v3.1.2
python wechaty getting started

Code Source AI

1.0.0
waymo open dataset

Autre code source

December 2023 Update
termwind

Autres catégories

v2.3.0
wp functions

Autres catégories

1.0.0

Actualités connexes Tout