NetSolP-1.0 คาดการณ์ความสามารถในการละลายและการใช้งานเพื่อทำให้โปรตีนบริสุทธิ์ที่แสดงใน E. coli วัตถุประสงค์ในการใช้งานประกอบด้วยความสามารถในการละลายและการแสดงออกของโปรตีน NetSolP-1.0 ขึ้นอยู่กับแบบจำลองภาษาโปรตีน (ESM12, ESM1b)
สามารถดูเว็บเซิร์ฟเวอร์ได้ที่https://services.healthtech.dtu.dk/service.php?NetSolP ซอฟต์แวร์เวอร์ชันสแตนด์อโลนมีให้ใช้งานจากแท็บดาวน์โหลด มันมีรหัสสำหรับเว็บเซิร์ฟเวอร์ นอกจากนี้ยังมีชุดข้อมูล โค้ดสำหรับการฝึกและการทดสอบ และโมเดลที่ได้รับการฝึกอีกด้วย
สำหรับการฝึกอบรม:
cd TrainAndTest/
python train.py
รายละเอียดและข้อกำหนดเพิ่มเติมใน README ของโฟลเดอร์ TrainAndTest
สำหรับการทำนาย: (ขั้นแรกฝึกและแปลงโมเดลเป็น ONNX หรือดาวน์โหลดโมเดลที่ได้รับการฝึกล่วงหน้าจากแท็บดาวน์โหลดของเว็บเซิร์ฟเวอร์)
cd PredictionServer/
python predict.py --FASTA_PATH ./test_fasta.fasta --OUTPUT_PATH ./test_preds.csv --MODEL_TYPE ESM12 --PREDICTION_TYPE S
รายละเอียดและข้อกำหนดเพิ่มเติมใน README ของโฟลเดอร์ PredictionServer
รหัสนี้ได้รับอนุญาตภายใต้ใบอนุญาต BSD 3-Clause
@article{10.1093/bioinformatics/btab801,
author = {Thumuluri, Vineet and Martiny, Hannah-Marie and Almagro Armenteros, Jose J and Salomon, Jesper and Nielsen, Henrik and Johansen, Alexander Rosenberg},
title = "{NetSolP: predicting protein solubility in Escherichia coli using language models}",
journal = {Bioinformatics},
volume = {38},
number = {4},
pages = {941-946},
year = {2021},
month = {11},
issn = {1367-4803},
doi = {10.1093/bioinformatics/btab801},
url = {https://doi.org/10.1093/bioinformatics/btab801},
eprint = {https://academic.oup.com/bioinformatics/article-pdf/38/4/941/49008876/btab801.pdf},
}