ดาวน์โหลด GreaseLM - ดาวน์โหลด GreaseLM ซอร์สโค้ด

GreaseLM

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

GreaseLM : กราฟ REASoning แบบจำลองภาษาที่ได้รับการปรับปรุงสำหรับการตอบคำถาม

การซื้อคืนนี้ให้ซอร์สโค้ดและข้อมูลของเอกสาร GreaseLM : Graph REASoning Enhanced Language Models for Question Answering (สปอตไลท์ ICLR 2022) หากคุณใช้โค้ด ข้อมูลที่ประมวลผล หรือโมเดลที่ได้รับการฝึกล่วงหน้าใดๆ ของเรา โปรดอ้างอิง:

GreaseLM, title={ GreaseLM : Graph REASoning Enhanced Language Models}, author={Zhang, Xikun and Bosselut, Antoine and Yasunaga, Michihiro and Ren, Hongyu and Liang, Percy and Manning, Christopher D and Leskovec, Jure}, booktitle={International Conference on Learning Representations}, year={2021} }">

 @inproceedings { zhang2021 GreaseLM ,
  title = { GreaseLM : Graph REASoning Enhanced Language Models } ,
  author = { Zhang, Xikun and Bosselut, Antoine and Yasunaga, Michihiro and Ren, Hongyu and Liang, Percy and Manning, Christopher D and Leskovec, Jure } ,
  booktitle = { International Conference on Learning Representations } ,
  year = { 2021 }
}

<ช่วงคลาส= สถาปัตยกรรมโมเดล GreaseLM" alt="" style="max-width: 100%;">

1. การพึ่งพาอาศัยกัน

หลาม == 3.8
ไพทอร์ช == 1.8.0
หม้อแปลงไฟฟ้า == 3.4.0
คบเพลิงเรขาคณิต == 1.7.0

รันคำสั่งต่อไปนี้เพื่อสร้างสภาพแวดล้อม conda (สมมติว่า CUDA 10.1):

GreaseLM python=3.8 conda activate GreaseLM pip install numpy==1.18.3 tqdm pip install torch==1.8.0+cu101 torchvision -f https://download.pytorch.org/whl/torch_stable.html pip install transformers==3.4.0 nltk spacy pip install wandb conda install -y -c conda-forge tensorboardx conda install -y -c conda-forge tensorboard # for torch-geometric pip install torch-scatter==2.0.7 -f https://pytorch-geometric.com/whl/torch-1.8.0+cu101.html pip install torch-cluster==1.5.9 -f https://pytorch-geometric.com/whl/torch-1.8.0+cu101.html pip install torch-sparse==0.6.9 -f https://pytorch-geometric.com/whl/torch-1.8.0+cu101.html pip install torch-spline-conv==1.2.1 -f https://pytorch-geometric.com/whl/torch-1.8.0+cu101.html pip install torch-geometric==1.7.0 -f https://pytorch-geometric.com/whl/torch-1.8.0+cu101.html">

conda create -y -n GreaseLM python=3.8
conda activate GreaseLM
pip install numpy==1.18.3 tqdm
pip install torch==1.8.0+cu101 torchvision -f https://download.pytorch.org/whl/torch_stable.html
pip install transformers==3.4.0 nltk spacy
pip install wandb
conda install -y -c conda-forge tensorboardx
conda install -y -c conda-forge tensorboard

# for torch-geometric
pip install torch-scatter==2.0.7 -f https://pytorch-geometric.com/whl/torch-1.8.0+cu101.html
pip install torch-cluster==1.5.9 -f https://pytorch-geometric.com/whl/torch-1.8.0+cu101.html
pip install torch-sparse==0.6.9 -f https://pytorch-geometric.com/whl/torch-1.8.0+cu101.html
pip install torch-spline-conv==1.2.1 -f https://pytorch-geometric.com/whl/torch-1.8.0+cu101.html
pip install torch-geometric==1.7.0 -f https://pytorch-geometric.com/whl/torch-1.8.0+cu101.html

2. ดาวน์โหลดข้อมูล

ดาวน์โหลดและประมวลผลข้อมูลล่วงหน้าด้วยตนเอง

การประมวลผลข้อมูลล่วงหน้าด้วยตนเองอาจใช้เวลานาน ดังนั้นหากคุณต้องการดาวน์โหลดข้อมูลที่ประมวลผลล่วงหน้าโดยตรง โปรดข้ามไปยังส่วนย่อยถัดไป

ดาวน์โหลดข้อมูลดิบ ConceptNet, CommonsenseQA, OpenBookQA โดยใช้

 ./download_raw_data.sh

คุณสามารถประมวลผลข้อมูลดิบเหล่านี้ล่วงหน้าได้โดยการรัน

 CUDA_VISIBLE_DEVICES=0 python preprocess.py -p <num_processes>

คุณสามารถระบุ GPU ที่คุณต้องการใช้ในตอนต้นของคำสั่ง CUDA_VISIBLE_DEVICES=... สคริปต์จะ:

ตั้งค่า ConceptNet (เช่น แยกความสัมพันธ์ภาษาอังกฤษออกจาก ConceptNet รวมประเภทความสัมพันธ์ 42 ประเภทดั้งเดิมเป็น 17 ประเภท)
แปลงชุดข้อมูล QA เป็นไฟล์ .jsonl (เช่น เก็บไว้ใน data/csqa/statement/ )
ระบุแนวคิดที่กล่าวถึงทั้งหมดในคำถามและคำตอบ
แยกกราฟย่อยสำหรับคู่ qa แต่ละคู่

สคริปต์สำหรับดาวน์โหลดและประมวลผลข้อมูล MedQA-USMLE ล่วงหน้า และกราฟความรู้ชีวการแพทย์ตามฐานข้อมูลโรคและ DrugBank มีอยู่ใน utils_biomed/

ดาวน์โหลดข้อมูลที่ประมวลผลล่วงหน้าโดยตรง

เพื่อความสะดวกของคุณ หากคุณไม่ต้องการประมวลผลข้อมูลล่วงหน้าด้วยตนเอง คุณสามารถดาวน์โหลดข้อมูลที่ประมวลผลล่วงหน้าทั้งหมดได้ที่นี่ ดาวน์โหลดลงในไดเร็กทอรีระดับบนสุดของ repo นี้แล้วแตกไฟล์ ย้ายโฟลเดอร์ medqa_usmle และ ddb ไปยังไดเร็กทอรี data/

โครงสร้างไฟล์ผลลัพธ์

โครงสร้างไฟล์ผลลัพธ์ควรมีลักษณะดังนี้:

 .
├── README.md
├── data/
    ├── cpnet/                 (prerocessed ConceptNet)
    ├── csqa/
        ├── train_rand_split.jsonl
        ├── dev_rand_split.jsonl
        ├── test_rand_split_no_answers.jsonl
        ├── statement/             (converted statements)
        ├── grounded/              (grounded entities)
        ├── graphs/                (extracted subgraphs)
        ├── ...
    ├── obqa/
    ├── medqa_usmle/
    └── ddb/

3. การฝึก GreaseLM

หากต้องการฝึก GreaseLM บน CommonsenseQA ให้รัน

 CUDA_VISIBLE_DEVICES=0 ./run_ GreaseLM .sh csqa --data_dir data/

คุณสามารถระบุ GPU ได้สูงสุด 2 ตัวที่คุณต้องการใช้ในตอนต้นของคำสั่ง CUDA_VISIBLE_DEVICES=...

ในทำนองเดียวกัน หากต้องการฝึก GreaseLM บน OpenbookQA ให้เรียกใช้

 CUDA_VISIBLE_DEVICES=0 ./run_ GreaseLM .sh obqa --data_dir data/

หากต้องการฝึก GreaseLM บน MedQA-USMLE ให้เรียกใช้

 CUDA_VISIBLE_DEVICES=0 ./run_ GreaseLM __medqa_usmle.sh

4. จุดตรวจแบบจำลองที่ฝึกไว้แล้ว

คุณสามารถดาวน์โหลดโมเดล GreaseLM ที่ผ่านการฝึกอบรมแล้วบน CommonsenseQA ที่นี่ ซึ่งรองรับ IH-dev acc 79.0 และตามมาตรฐานการทดสอบ IH จาก 74.0 .

คุณยังสามารถดาวน์โหลดโมเดล GreaseLM ที่ผ่านการฝึกอบรมแล้วบน OpenbookQA ได้ที่นี่ ซึ่งผ่านการทดสอบตามมาตรฐาน จาก 84.8 .

คุณยังสามารถดาวน์โหลดโมเดล GreaseLM ที่ผ่านการฝึกอบรมแล้วบน MedQA-USMLE ได้ที่นี่ ซึ่งผ่านการทดสอบตามมาตรฐาน จาก 38.5 .

5. การประเมินจุดตรวจแบบจำลองที่ฝึกไว้แล้ว

หากต้องการประเมินจุดตรวจสอบโมเดล GreaseLM ที่ได้รับการฝึกล่วงหน้าบน CommonsenseQA ให้รัน

 CUDA_VISIBLE_DEVICES=0 ./eval_ GreaseLM .sh csqa --data_dir data/ --load_model_path /path/to/checkpoint

อีกครั้งคุณสามารถระบุ GPU ได้สูงสุด 2 ตัวที่คุณต้องการใช้ในการเริ่มต้นคำสั่ง CUDA_VISIBLE_DEVICES=...

ในทำนองเดียวกัน หากต้องการประเมินจุดตรวจสอบโมเดล GreaseLM ที่ได้รับการฝึกล่วงหน้าบน OpenbookQA ให้รัน

 CUDA_VISIBLE_DEVICES=0 ./eval_ GreaseLM .sh obqa --data_dir data/ --load_model_path /path/to/checkpoint

หากต้องการประเมินจุดตรวจสอบโมเดล GreaseLM ที่ได้รับการฝึกอบรมบน MedQA-USMLE ให้ดำเนินการ

 INHERIT_BERT=1 CUDA_VISIBLE_DEVICES=0 ./eval_ GreaseLM .sh medqa_usmle --data_dir data/ --load_model_path /path/to/checkpoint

6. ใช้ชุดข้อมูลของคุณเอง

แปลงชุดข้อมูลของคุณเป็น {train,dev,test}.statement.jsonl ในรูปแบบ .jsonl (ดู data/csqa/statement/train.statement.jsonl )
สร้างไดเรกทอรีใน data/{yourdataset}/ เพื่อจัดเก็บไฟล์ .jsonl
แก้ไข preprocess.py และทำการแยกกราฟย่อยสำหรับข้อมูลของคุณ
แก้ไข utils/parser_utils.py เพื่อรองรับชุดข้อมูลของคุณเอง

7. การรับทราบ

repo นี้สร้างขึ้นจากงานต่อไปนี้:

 QA-GNN: Question Answering using Language Models and Knowledge Graphs
https://github.com/michiyasunaga/qagnn

ขอบคุณมากสำหรับผู้เขียนและนักพัฒนา!

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2024-12-30
ขนาด 50MB
มาจาก Github

แอปที่เกี่ยวข้อง

node telegram bot api

2024-12-14
typebot.io

2024-12-14
python wechaty getting started

2024-12-14
TranscriberBot

2024-12-14
genal chat

2024-12-14
Facemoji

2024-12-14

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
node telegram bot api

โค้ดแหล่งที่มา AI

v0.50.0
typebot.io

โค้ดแหล่งที่มา AI

v3.1.2
python wechaty getting started

โค้ดแหล่งที่มา AI

1.0.0
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
termwind

หมวดหมู่อื่นๆ

v2.3.0
wp functions

หมวดหมู่อื่นๆ

1.0.0

ข้อมูลที่เกี่ยวข้อง ทั้งหมด