NetSolP-1.0 sagt die Löslichkeit und Verwendbarkeit für die Reinigung von in E. coli exprimierten Proteinen voraus. Das Usability-Ziel umfasst die Löslichkeit und Expressierbarkeit von Proteinen. NetSolP-1.0 basiert auf Protein-Sprachmodellen (ESM12, ESM1b).
Der Webserver ist unter https://services.healthtech.dtu.dk/service.php?NetSolP zu finden. Eine eigenständige Version der Software ist auf der Registerkarte „Downloads“ verfügbar. Es enthält den Code für den Webserver. Darüber hinaus verfügt es über die Datensätze, den Code für Training und Tests sowie die trainierten Modelle
Zum Training:
cd TrainAndTest/
python train.py
Weitere Details und Anforderungen finden Sie in der README-Datei des Ordners TrainAndTest.
Zur Vorhersage: (Zuerst trainieren und konvertieren Sie die Modelle in ONNX ODER laden Sie die vorab trainierten Modelle von der Registerkarte „Downloads“ des Webservers herunter.)
cd PredictionServer/
python predict.py --FASTA_PATH ./test_fasta.fasta --OUTPUT_PATH ./test_preds.csv --MODEL_TYPE ESM12 --PREDICTION_TYPE S
Weitere Details und Anforderungen finden Sie in der README-Datei des Ordners PredictionServer.
Der Code ist unter der BSD 3-Clause-Lizenz lizenziert.
@article{10.1093/bioinformatics/btab801,
author = {Thumuluri, Vineet and Martiny, Hannah-Marie and Almagro Armenteros, Jose J and Salomon, Jesper and Nielsen, Henrik and Johansen, Alexander Rosenberg},
title = "{NetSolP: predicting protein solubility in Escherichia coli using language models}",
journal = {Bioinformatics},
volume = {38},
number = {4},
pages = {941-946},
year = {2021},
month = {11},
issn = {1367-4803},
doi = {10.1093/bioinformatics/btab801},
url = {https://doi.org/10.1093/bioinformatics/btab801},
eprint = {https://academic.oup.com/bioinformatics/article-pdf/38/4/941/49008876/btab801.pdf},
}