NetSolP-1.0 prédit la solubilité et l'utilisabilité pour la purification des protéines exprimées dans E. coli. L'objectif d'utilisabilité inclut la solubilité et l'expressibilité des protéines. NetSolP-1.0 est basé sur des modèles de langage protéique (ESM12, ESM1b).
Le serveur Web peut être trouvé à l'adresse https://services.healthtech.dtu.dk/service.php?NetSolP. Une version autonome du logiciel est disponible dans l'onglet Téléchargements. Il contient le code du serveur Web. De plus, il contient également les ensembles de données, le code pour la formation et les tests, ainsi que les modèles formés.
Pour la formation :
cd TrainAndTest/
python train.py
plus de détails et d'exigences dans le README du dossier TrainAndTest.
Pour la prédiction : (entraînez et convertissez d'abord les modèles en ONNX OU téléchargez les modèles pré-entraînés à partir de l'onglet Téléchargements du serveur Web)
cd PredictionServer/
python predict.py --FASTA_PATH ./test_fasta.fasta --OUTPUT_PATH ./test_preds.csv --MODEL_TYPE ESM12 --PREDICTION_TYPE S
plus de détails et d'exigences dans le README du dossier PredictionServer.
Le code est sous licence BSD 3-Clause.
@article{10.1093/bioinformatics/btab801,
author = {Thumuluri, Vineet and Martiny, Hannah-Marie and Almagro Armenteros, Jose J and Salomon, Jesper and Nielsen, Henrik and Johansen, Alexander Rosenberg},
title = "{NetSolP: predicting protein solubility in Escherichia coli using language models}",
journal = {Bioinformatics},
volume = {38},
number = {4},
pages = {941-946},
year = {2021},
month = {11},
issn = {1367-4803},
doi = {10.1093/bioinformatics/btab801},
url = {https://doi.org/10.1093/bioinformatics/btab801},
eprint = {https://academic.oup.com/bioinformatics/article-pdf/38/4/941/49008876/btab801.pdf},
}