NetSolP 1.0
1.0.0
NetSolP-1.0은 E. coli에서 발현된 단백질의 정제를 위한 용해도와 유용성을 예측합니다. 유용성 목표에는 단백질의 용해도와 발현성이 포함됩니다. NetSolP-1.0은 단백질 언어 모델(ESM12, ESM1b)을 기반으로 합니다.
웹서버는 https://services.healthtech.dtu.dk/service.php?NetSolP에서 찾을 수 있습니다. 소프트웨어의 독립 실행형 버전은 다운로드 탭에서 사용할 수 있습니다. 여기에는 웹서버용 코드가 포함되어 있습니다. 또한 데이터 세트, 훈련 및 테스트용 코드, 훈련된 모델도 있습니다.
훈련용:
cd TrainAndTest/
python train.py
TrainAndTest 폴더의 README에서 자세한 내용과 요구 사항을 확인하세요.
예측의 경우: (먼저 모델을 학습하고 ONNX로 변환하거나 웹 서버 다운로드 탭에서 사전 학습된 모델을 다운로드합니다.)
cd PredictionServer/
python predict.py --FASTA_PATH ./test_fasta.fasta --OUTPUT_PATH ./test_preds.csv --MODEL_TYPE ESM12 --PREDICTION_TYPE S
PredictionServer 폴더의 README에서 자세한 내용과 요구 사항을 확인하세요.
코드는 BSD 3-Clause 라이센스에 따라 라이센스가 부여됩니다.
@article{10.1093/bioinformatics/btab801,
author = {Thumuluri, Vineet and Martiny, Hannah-Marie and Almagro Armenteros, Jose J and Salomon, Jesper and Nielsen, Henrik and Johansen, Alexander Rosenberg},
title = "{NetSolP: predicting protein solubility in Escherichia coli using language models}",
journal = {Bioinformatics},
volume = {38},
number = {4},
pages = {941-946},
year = {2021},
month = {11},
issn = {1367-4803},
doi = {10.1093/bioinformatics/btab801},
url = {https://doi.org/10.1093/bioinformatics/btab801},
eprint = {https://academic.oup.com/bioinformatics/article-pdf/38/4/941/49008876/btab801.pdf},
}