DGoT
1.0.0
這是我們的LREC-Coling 2024紙DGOT的實現:科學摘要生成的思想圖形。
我們強烈建議您使用Docker Images DGOT_DEMO來運行我們的程序。
# pull docker image
docker pull jaycening/dgot_demo:v1.0.0
# Clone this repository and mount it into the image container.
git clone https://github.com/JayceNing/DGoT.git
docker run --gpus all -it -d --privileged=true -v ./DGoT:/home/nxy/LLM/DGoT
# Enter the target folder.
docker exec -it dgot /bin/bash
cd /home/nxy/LLM/DGoT
該圖像是通過在LMDEPLOY版本0.2.4下部署的InterLM2預配置的。
如果您想手動配置環境,請參見Documentation Emoverion_Setup.md
PubMedcite的引文圖記錄來自引文存儲庫。在這裡,我們提供了基於官方PubMed API下載數據集的代碼。
python get_data.py --required_num 100
required_num
是要下載培訓和測試數據集所需的數據條目數量。以InternLM2為例。
cd /home/nxy/internlm2_chat_deploy
lmdeploy serve api_server ./workspace --cache-max-entry-count 0.2
cd /home/nxy/LLM/DGoT
python generate_abstract.py --begin 0 --end 1 --mode " train " --model " internlm2 " --task " default "
begin
和end
表示所使用的數據集的啟動和結束索引。mode
指示所使用的數據集是火車數據集還是測試數據集。model
表示用於推理的LLM。task
代表要執行的任務的類型。python generate_abstract.py --begin 0 --end 100 --mode " test " --model " internlm2 " --task " default " --thresh_g 0.34 --thresh_a 0.35 --thresh_i 0.34
thresh_g
, thresh_a
和thresh_i
分別表示用於生成轉換,匯總轉換和增強DGOT中的轉換的閾值。 在這裡,我們提供有關其他方面的詳細教程。
這項工作基於以下及時的框架,大語言模型和模型部署工具包。感謝開源貢獻!
本文的計算資源由BUPT的高性能計算平台支持。
如果您發現此存儲庫有價值,請給它一顆星!
在您的工作中使用這個?請使用提供的引用來引用我們:
@misc { ning2024dgot ,
title = { DGoT: Dynamic Graph of Thoughts for Scientific Abstract Generation } ,
author = { Xinyu Ning and Yutong Zhao and Yitong Liu and Hongwen Yang } ,
year = { 2024 } ,
eprint = { 2403.17491 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.CL }
}
傑伊斯·寧
主頁:https://jaycening.github.io/zh-cn/
github:https://github.com/jaycening
Zhihu:https://www.zhihu.com/people/xinyuning