NetSolP-1.0 predice la solubilidad y usabilidad para la purificación de proteínas expresadas en E. coli. El objetivo de usabilidad incluye la solubilidad y expresabilidad de las proteínas. NetSolP-1.0 se basa en modelos de lenguaje de proteínas (ESM12, ESM1b).
El servidor web se puede encontrar en https://services.healthtech.dtu.dk/service.php?NetSolP. Hay una versión independiente del software disponible en la pestaña Descargas. Contiene el código para el servidor web. Además, también cuenta con los conjuntos de datos, el código para entrenamiento y prueba, y los modelos entrenados.
Para entrenamiento:
cd TrainAndTest/
python train.py
más detalles y requisitos en el README de la carpeta TrainAndTest.
Para predicción: (primero entrene y convierta los modelos a ONNX O descargue los modelos previamente entrenados desde la pestaña Descargas del servidor web)
cd PredictionServer/
python predict.py --FASTA_PATH ./test_fasta.fasta --OUTPUT_PATH ./test_preds.csv --MODEL_TYPE ESM12 --PREDICTION_TYPE S
Más detalles y requisitos en el archivo README de la carpeta PredictionServer.
El código tiene la licencia BSD de 3 cláusulas.
@article{10.1093/bioinformatics/btab801,
author = {Thumuluri, Vineet and Martiny, Hannah-Marie and Almagro Armenteros, Jose J and Salomon, Jesper and Nielsen, Henrik and Johansen, Alexander Rosenberg},
title = "{NetSolP: predicting protein solubility in Escherichia coli using language models}",
journal = {Bioinformatics},
volume = {38},
number = {4},
pages = {941-946},
year = {2021},
month = {11},
issn = {1367-4803},
doi = {10.1093/bioinformatics/btab801},
url = {https://doi.org/10.1093/bioinformatics/btab801},
eprint = {https://academic.oup.com/bioinformatics/article-pdf/38/4/941/49008876/btab801.pdf},
}