NetSolP 1.0
1.0.0
NetSolP-1.0 預測大腸桿菌中表現的蛋白質純化的溶解度和可用性。可用性目標包括蛋白質的溶解度和表現性。 NetSolP-1.0 是基於蛋白質語言模型(ESM12、ESM1b)。
網路伺服器可以在 https://services.healthtech.dtu.dk/service.php?NetSolP 找到。可從「下載」標籤取得該軟體的獨立版本。它包含網路伺服器的程式碼。此外,它還有資料集、訓練和測試程式碼以及訓練後的模型
對於培訓:
cd TrainAndTest/
python train.py
如需更多詳細資訊和要求,請參閱資料夾 TrainAndTest 的自述文件。
用於預測:(首先訓練模型並將其轉換為 ONNX 或從網頁伺服器「下載」標籤下載預先訓練的模型)
cd PredictionServer/
python predict.py --FASTA_PATH ./test_fasta.fasta --OUTPUT_PATH ./test_preds.csv --MODEL_TYPE ESM12 --PREDICTION_TYPE S
如需更多詳細資訊和要求,請參閱資料夾 PredictionServer 的自述文件。
該代碼根據 BSD 3-Clause 許可證獲得許可。
@article{10.1093/bioinformatics/btab801,
author = {Thumuluri, Vineet and Martiny, Hannah-Marie and Almagro Armenteros, Jose J and Salomon, Jesper and Nielsen, Henrik and Johansen, Alexander Rosenberg},
title = "{NetSolP: predicting protein solubility in Escherichia coli using language models}",
journal = {Bioinformatics},
volume = {38},
number = {4},
pages = {941-946},
year = {2021},
month = {11},
issn = {1367-4803},
doi = {10.1093/bioinformatics/btab801},
url = {https://doi.org/10.1093/bioinformatics/btab801},
eprint = {https://academic.oup.com/bioinformatics/article-pdf/38/4/941/49008876/btab801.pdf},
}