Unduhan GreaseLM - Unduhan kode sumber GreaseLM

GreaseLM

Kode Sumber AI

1.0.0

Unduh

GreaseLM : Grafik PENALASAN Model Bahasa yang Disempurnakan untuk Menjawab Pertanyaan

Repo ini menyediakan kode sumber & data makalah kami GreaseLM : Graph REAsoning Enhanced Language Models for Question Answering (Sorotan ICLR 2022). Jika Anda menggunakan salah satu kode kami, data yang diproses, atau model terlatih, harap kutip:

GreaseLM, title={ GreaseLM : Graph REASoning Enhanced Language Models}, author={Zhang, Xikun and Bosselut, Antoine and Yasunaga, Michihiro and Ren, Hongyu and Liang, Percy and Manning, Christopher D and Leskovec, Jure}, booktitle={International Conference on Learning Representations}, year={2021} }">

 @inproceedings { zhang2021 GreaseLM ,
  title = { GreaseLM : Graph REASoning Enhanced Language Models } ,
  author = { Zhang, Xikun and Bosselut, Antoine and Yasunaga, Michihiro and Ren, Hongyu and Liang, Percy and Manning, Christopher D and Leskovec, Jure } ,
  booktitle = { International Conference on Learning Representations } ,
  year = { 2021 }
}

1. Ketergantungan

Piton == 3.8
PyTorch == 1.8.0
transformator == 3.4.0
obor-geometris == 1.7.0

Jalankan perintah berikut untuk membuat lingkungan conda (dengan asumsi CUDA 10.1):

GreaseLM python=3.8 conda activate GreaseLM pip install numpy==1.18.3 tqdm pip install torch==1.8.0+cu101 torchvision -f https://download.pytorch.org/whl/torch_stable.html pip install transformers==3.4.0 nltk spacy pip install wandb conda install -y -c conda-forge tensorboardx conda install -y -c conda-forge tensorboard # for torch-geometric pip install torch-scatter==2.0.7 -f https://pytorch-geometric.com/whl/torch-1.8.0+cu101.html pip install torch-cluster==1.5.9 -f https://pytorch-geometric.com/whl/torch-1.8.0+cu101.html pip install torch-sparse==0.6.9 -f https://pytorch-geometric.com/whl/torch-1.8.0+cu101.html pip install torch-spline-conv==1.2.1 -f https://pytorch-geometric.com/whl/torch-1.8.0+cu101.html pip install torch-geometric==1.7.0 -f https://pytorch-geometric.com/whl/torch-1.8.0+cu101.html">

conda create -y -n GreaseLM python=3.8
conda activate GreaseLM
pip install numpy==1.18.3 tqdm
pip install torch==1.8.0+cu101 torchvision -f https://download.pytorch.org/whl/torch_stable.html
pip install transformers==3.4.0 nltk spacy
pip install wandb
conda install -y -c conda-forge tensorboardx
conda install -y -c conda-forge tensorboard

# for torch-geometric
pip install torch-scatter==2.0.7 -f https://pytorch-geometric.com/whl/torch-1.8.0+cu101.html
pip install torch-cluster==1.5.9 -f https://pytorch-geometric.com/whl/torch-1.8.0+cu101.html
pip install torch-sparse==0.6.9 -f https://pytorch-geometric.com/whl/torch-1.8.0+cu101.html
pip install torch-spline-conv==1.2.1 -f https://pytorch-geometric.com/whl/torch-1.8.0+cu101.html
pip install torch-geometric==1.7.0 -f https://pytorch-geometric.com/whl/torch-1.8.0+cu101.html

2. Unduh datanya

Unduh dan proses sendiri datanya

Pemrosesan awal data sendiri mungkin memakan waktu lama, jadi jika Anda ingin langsung mengunduh data yang telah diproses sebelumnya, silakan lompat ke subbagian berikutnya.

Unduh data mentah ConceptNet, CommonsenseQA, OpenBookQA dengan menggunakan

 ./download_raw_data.sh

Anda dapat melakukan praproses data mentah ini dengan menjalankan

 CUDA_VISIBLE_DEVICES=0 python preprocess.py -p <num_processes>

Anda dapat menentukan GPU yang ingin Anda gunakan di awal perintah CUDA_VISIBLE_DEVICES=... . Skripnya akan:

Siapkan ConceptNet (misalnya, ekstrak relasi bahasa Inggris dari ConceptNet, gabungkan 42 tipe relasi asli menjadi 17 tipe)
Ubah kumpulan data QA menjadi file .jsonl (misalnya, disimpan di data/csqa/statement/ )
Identifikasi semua konsep yang disebutkan dalam pertanyaan dan jawaban
Ekstrak subgraf untuk setiap pasangan qa

Skrip untuk mengunduh dan memproses data MedQA-USMLE dan grafik pengetahuan biomedis berdasarkan Database Penyakit dan Bank Obat disediakan di utils_biomed/ .

Langsung mengunduh data yang telah diproses sebelumnya

Demi kenyamanan Anda, jika Anda tidak ingin melakukan praproses data sendiri, Anda dapat mengunduh semua data praproses di sini. Unduh file-file tersebut ke direktori tingkat atas repo ini dan unzip. Pindahkan folder medqa_usmle dan ddb ke dalam direktori data/ .

Struktur file yang dihasilkan

Struktur file yang dihasilkan akan terlihat seperti ini:

 .
├── README.md
├── data/
    ├── cpnet/                 (prerocessed ConceptNet)
    ├── csqa/
        ├── train_rand_split.jsonl
        ├── dev_rand_split.jsonl
        ├── test_rand_split_no_answers.jsonl
        ├── statement/             (converted statements)
        ├── grounded/              (grounded entities)
        ├── graphs/                (extracted subgraphs)
        ├── ...
    ├── obqa/
    ├── medqa_usmle/
    └── ddb/

3. Pelatihan GreaseLM

Untuk melatih GreaseLM di CommonsenseQA, jalankan

 CUDA_VISIBLE_DEVICES=0 ./run_ GreaseLM .sh csqa --data_dir data/

Anda dapat menentukan hingga 2 GPU yang ingin Anda gunakan di awal perintah CUDA_VISIBLE_DEVICES=... .

Demikian pula, untuk melatih GreaseLM di OpenbookQA, jalankan

 CUDA_VISIBLE_DEVICES=0 ./run_ GreaseLM .sh obqa --data_dir data/

Untuk melatih GreaseLM di MedQA-USMLE, jalankan

 CUDA_VISIBLE_DEVICES=0 ./run_ GreaseLM __medqa_usmle.sh

4. Pos pemeriksaan model yang telah dilatih sebelumnya

Anda dapat mengunduh model GreaseLM yang telah dilatih sebelumnya di CommonsenseQA di sini, yang mencapai akun IH-dev. dari 79.0 dan uji IH acc. dari 74.0 .

Anda juga dapat mengunduh model GreaseLM yang telah dilatih sebelumnya di OpenbookQA di sini, yang mendapatkan uji acc. dari 84.8 .

Anda juga dapat mengunduh model GreaseLM yang telah dilatih sebelumnya di MedQA-USMLE di sini, yang mendapatkan uji acc. dari 38.5 .

5. Mengevaluasi pos pemeriksaan model yang telah dilatih sebelumnya

Untuk mengevaluasi pos pemeriksaan model GreaseLM yang telah dilatih sebelumnya di CommonsenseQA, jalankan

 CUDA_VISIBLE_DEVICES=0 ./eval_ GreaseLM .sh csqa --data_dir data/ --load_model_path /path/to/checkpoint

Sekali lagi Anda dapat menentukan hingga 2 GPU yang ingin Anda gunakan di awal perintah CUDA_VISIBLE_DEVICES=... .

Demikian pula, untuk mengevaluasi pos pemeriksaan model GreaseLM yang telah dilatih sebelumnya di OpenbookQA, jalankan

 CUDA_VISIBLE_DEVICES=0 ./eval_ GreaseLM .sh obqa --data_dir data/ --load_model_path /path/to/checkpoint

Untuk mengevaluasi pos pemeriksaan model GreaseLM yang telah dilatih sebelumnya di MedQA-USMLE, jalankan

 INHERIT_BERT=1 CUDA_VISIBLE_DEVICES=0 ./eval_ GreaseLM .sh medqa_usmle --data_dir data/ --load_model_path /path/to/checkpoint

6. Gunakan kumpulan data Anda sendiri

Konversikan kumpulan data Anda menjadi {train,dev,test}.statement.jsonl dalam format .jsonl (lihat data/csqa/statement/train.statement.jsonl )
Buat direktori di data/{yourdataset}/ untuk menyimpan file .jsonl
Ubah preprocess.py dan lakukan ekstraksi subgraf untuk data Anda
Ubah utils/parser_utils.py untuk mendukung kumpulan data Anda sendiri

7. Pengakuan

Repo ini dibangun berdasarkan pekerjaan berikut:

 QA-GNN: Question Answering using Language Models and Knowledge Graphs
https://github.com/michiyasunaga/qagnn

Terima kasih banyak kepada penulis dan pengembang!

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2024-12-30
ukuran 50MB
Berasal dari Github

Aplikasi Terkait

node telegram bot api

2024-12-14
typebot.io

2024-12-14
python wechaty getting started

2024-12-14
TranscriberBot

2024-12-14
genal chat

2024-12-14
Facemoji

2024-12-14

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
node telegram bot api

Kode Sumber AI

v0.50.0
typebot.io

Kode Sumber AI

v3.1.2
python wechaty getting started

Kode Sumber AI

1.0.0
waymo open dataset

Kode sumber lainnya

December 2023 Update
termwind

Kategori lainnya

v2.3.0
wp functions

Kategori lainnya

1.0.0

Informasi Terkait Semua