NetSolP-1.0 memprediksi kelarutan dan kegunaan untuk pemurnian protein yang diekspresikan dalam E. coli. Tujuan kegunaan mencakup kelarutan dan ekspresibilitas protein. NetSolP-1.0 didasarkan pada model bahasa protein (ESM12, ESM1b).
Server web dapat ditemukan di https://services.healthtech.dtu.dk/service.php?NetSolP. Versi perangkat lunak mandiri tersedia dari tab Unduhan. Ini berisi kode untuk server web. Selain itu, ia juga memiliki kumpulan data, kode untuk pelatihan dan pengujian, serta model yang dilatih
Untuk pelatihan:
cd TrainAndTest/
python train.py
detail dan persyaratan lebih lanjut di README folder TrainAndTest.
Untuk prediksi: (Latih terlebih dahulu dan konversikan model ke ONNX ATAU unduh model yang telah dilatih sebelumnya dari tab Unduhan server web)
cd PredictionServer/
python predict.py --FASTA_PATH ./test_fasta.fasta --OUTPUT_PATH ./test_preds.csv --MODEL_TYPE ESM12 --PREDICTION_TYPE S
detail dan persyaratan lebih lanjut di README folder PredictionServer.
Kode ini dilisensikan di bawah lisensi BSD 3-Clause.
@article{10.1093/bioinformatics/btab801,
author = {Thumuluri, Vineet and Martiny, Hannah-Marie and Almagro Armenteros, Jose J and Salomon, Jesper and Nielsen, Henrik and Johansen, Alexander Rosenberg},
title = "{NetSolP: predicting protein solubility in Escherichia coli using language models}",
journal = {Bioinformatics},
volume = {38},
number = {4},
pages = {941-946},
year = {2021},
month = {11},
issn = {1367-4803},
doi = {10.1093/bioinformatics/btab801},
url = {https://doi.org/10.1093/bioinformatics/btab801},
eprint = {https://academic.oup.com/bioinformatics/article-pdf/38/4/941/49008876/btab801.pdf},
}