يتنبأ NetSolP-1.0 بقابلية الذوبان وسهولة الاستخدام لتنقية البروتينات المعبر عنها في الإشريكية القولونية. يتضمن هدف قابلية الاستخدام قابلية ذوبان البروتينات وقابليتها للتعبير. يعتمد NetSolP-1.0 على نماذج لغة البروتين (ESM12، ESM1b).
يمكن العثور على خادم الويب على https://services.healthtech.dtu.dk/service.php?NetSolP. يتوفر إصدار مستقل من البرنامج من علامة التبويب "التنزيلات". أنه يحتوي على رمز لخادم الويب. بالإضافة إلى ذلك، فهو يحتوي أيضًا على مجموعات البيانات والتعليمات البرمجية للتدريب والاختبار والنماذج المدربة
للتدريب:
cd TrainAndTest/
python train.py
مزيد من التفاصيل والمتطلبات في الملف التمهيدي الخاص بالمجلد TrainAndTest.
للتنبؤ: (قم أولاً بتدريب النماذج وتحويلها إلى ONNX أو قم بتنزيل النماذج المدربة مسبقًا من علامة التبويب تنزيلات خادم الويب)
cd PredictionServer/
python predict.py --FASTA_PATH ./test_fasta.fasta --OUTPUT_PATH ./test_preds.csv --MODEL_TYPE ESM12 --PREDICTION_TYPE S
مزيد من التفاصيل والمتطلبات في الملف التمهيدي للمجلد PredictionServer.
تم ترخيص الكود بموجب ترخيص BSD 3-Clause.
@article{10.1093/bioinformatics/btab801,
author = {Thumuluri, Vineet and Martiny, Hannah-Marie and Almagro Armenteros, Jose J and Salomon, Jesper and Nielsen, Henrik and Johansen, Alexander Rosenberg},
title = "{NetSolP: predicting protein solubility in Escherichia coli using language models}",
journal = {Bioinformatics},
volume = {38},
number = {4},
pages = {941-946},
year = {2021},
month = {11},
issn = {1367-4803},
doi = {10.1093/bioinformatics/btab801},
url = {https://doi.org/10.1093/bioinformatics/btab801},
eprint = {https://academic.oup.com/bioinformatics/article-pdf/38/4/941/49008876/btab801.pdf},
}