Unduh llama classification - unduhan kode sumber llama classification

llama classification

Kode Sumber AI

v1.1.1

Unduh

Klasifikasi teks menggunakan LLaMA

Repositori ini menyediakan basis kode dasar untuk klasifikasi teks menggunakan LLaMA.

Sistem apa yang saya gunakan untuk pengembangan?

Perangkat: GPU Nvidia 1xV100
Memori Perangkat: 34G
Memori Tuan Rumah: 252G

Jika Anda memerlukan informasi lain tentang perangkat keras, silakan buka terbitan.

Cara menggunakan

Pengaturan eksperimental

Dapatkan pos pemeriksaan dari repositori resmi LLaMA dari sini.
1-1. Saya berasumsi bahwa pos pemeriksaan akan ditempatkan di arah akar proyek dan isinya akan diatur sebagai berikut.

 checkpoints
├── llama
│   ├── 7B
│   │   ├── checklist.chk
│   │   ├── consolidated.00.pth
│   │   └── params.json
│   └── tokenizer.model

Siapkan lingkungan python Anda. Saya sarankan menggunakan anaconda untuk memisahkan versi CUDA mesin lokal Anda.

conda create -y -n llama-classification python=3.8
conda activate llama-classification
conda install cudatoolkit=11.7 -y -c nvidia
conda list cudatoolkit # to check what cuda version is installed (11.7)
pip install -r requirements.txt

Metode: Langsung

Direct adalah membandingkan probabilitas bersyarat p(y|x) .

Proses awal data dari kumpulan data pelukan menggunakan skrip berikut. Mulai sekarang, kami menggunakan dataset ag_news.

python run_preprocess_direct_ag_news.py
python run_preprocess_direct_ag_news.py --sample=False --data_path=real/inputs_direct_ag_news.json # Use it for full evaluation

Inferensi untuk menghitung probabilitas bersyarat menggunakan LLaMA dan kelas prediksi.

torchrun --nproc_per_node 1 run_evaluate_direct_llama.py 
    --data_path samples/inputs_direct_ag_news.json 
    --output_path samples/outputs_direct_ag_news.json 
    --ckpt_dir checkpoints/llama/7B 
    --tokenizer_path checkpoints/llama/tokenizer.model

Calibration adalah menyempurnakan metode langsung dengan metode kalibrasi.

Kalibrasi menggunakan perintah berikut.

torchrun --nproc_per_node 1 run_evaluate_direct_calibrate_llama.py 
    --direct_input_path samples/inputs_direct_ag_news.json 
    --direct_output_path samples/outputs_direct_ag_news.json 
    --output_path samples/outputs_direct_calibrate_ag_news.json 
    --ckpt_dir checkpoints/llama/7B 
    --tokenizer_path checkpoints/llama/tokenizer.model

Metode: Saluran

Channel adalah membandingkan probabilitas bersyarat p(x|y) .

Proses awal data dari kumpulan data pelukan menggunakan skrip berikut. Mulai sekarang, kami menggunakan dataset ag_news.

python run_preprocess_channel_ag_news.py
python run_preprocess_channel_ag_news.py --sample=False --data_path=real/inputs_channel_ag_news.json # Use it for full evaluation

Inferensi untuk menghitung probabilitas bersyarat menggunakan LLaMA dan kelas prediksi.

torchrun --nproc_per_node 1 run_evaluate_channel_llama.py 
    --data_path samples/inputs_channel_ag_news.json 
    --output_path samples/outputs_channel_ag_news.json 
    --ckpt_dir checkpoints/llama/7B 
    --tokenizer_path checkpoints/llama/tokenizer.model

Metode: Generasi murni

Untuk mengevaluasi menggunakan mode generate , Anda dapat menggunakan versi langsung yang telah diproses sebelumnya.

torchrun --nproc_per_node 1 run_evaluate_generate_llama.py 
    --data_path samples/inputs_direct_ag_news.json 
    --output_path samples/outputs_generate_ag_news.json 
    --ckpt_dir checkpoints/llama/7B 
    --tokenizer_path checkpoints/llama/tokenizer.model

Eksperimen

Kumpulan data	nomor_contoh	k	metode	ketepatan	waktu inferensi
ag_news	7600	1	langsung	0,7682	00:38:40
ag_news	7600	1	langsung+dikalibrasi	0,8567	00:38:40
ag_news	7600	1	saluran	0,7825	00:38:37

Daftar tugas

Menerapkan metode saluran
Laporan eksperimental
- Langsung
- Saluran
- Generasi
Menerapkan metode kalibrasi lainnya
Mendukung kumpulan data lain di dalam kumpulan data pelukan
Menerapkan LLM.int8
Metrik evaluasi lainnya untuk mengukur perbedaan karakteristik model pondasi (LLaMA)

Komentar terakhir

Saya sangat menghargai tim proyek LLaMA yang menerbitkan pos pemeriksaan dan kode inferensi efisiennya. Sebagian besar pekerjaan di repositori ini dilakukan berdasarkan repositori resmi.
Bagi pembaca, jangan sungkan untuk membuka issue atau pull request. Kamu bisa memberiku..
- Masalah apa pun tentang permintaan fitur lainnya
- Masalah apa pun tentang implementasi terperinci
- Setiap diskusi tentang arah penelitian

Kutipan

Sebaiknya Anda mengutip karya saya jika Anda menggunakan basis kode saya untuk penelitian Anda.

 @software{Lee_Simple_Text_Classification_2023,
    author = {Lee, Seonghyeon},
    month = {3},
    title = {{Simple Text Classification Codebase using LLaMA}},
    url = {https://github.com/github/sh0416/llama-classification},
    version = {1.1.0},
    year = {2023}
}

Memperluas

Informasi Tambahan

Versi v1.1.1
Tipe Kode Sumber AI
Waktu Pembaruan 2024-12-10
ukuran 2.5MB
Berasal dari Github

Aplikasi Terkait

node llama cpp

2024-11-11
llama models

2024-11-10
LLaMA Factory

2024-11-02
Kode Llama

2023-10-30
Kode Llama model besar

2023-08-25
Lama 2

2023-08-17

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
node telegram bot api

Kode Sumber AI

v0.50.0
typebot.io

Kode Sumber AI

v3.1.2
python wechaty getting started

Kode Sumber AI

1.0.0
waymo open dataset

Kode sumber lainnya

December 2023 Update
termwind

Kategori lainnya

v2.3.0
wp functions

Kategori lainnya

1.0.0

Informasi Terkait Semua