NetSolP 1.0
1.0.0
NetSolP-1.0 は、大腸菌で発現したタンパク質の精製における溶解性と有用性を予測します。有用性の目標には、タンパク質の溶解性と発現性が含まれます。 NetSolP-1.0 はタンパク質言語モデル (ESM12、ESM1b) に基づいています。
Web サーバーは https://services.healthtech.dtu.dk/service.php?NetSolP にあります。ソフトウェアのスタンドアロン バージョンは、[ダウンロード] タブから入手できます。これには Web サーバーのコードが含まれています。さらに、データセット、トレーニングとテスト用のコード、トレーニング済みモデルも含まれています。
トレーニングの場合:
cd TrainAndTest/
python train.py
詳細と要件については、TrainAndTest フォルダーの README を参照してください。
予測の場合: (最初にモデルをトレーニングして ONNX に変換するか、Web サーバーの [ダウンロード] タブから事前トレーニングされたモデルをダウンロードします)
cd PredictionServer/
python predict.py --FASTA_PATH ./test_fasta.fasta --OUTPUT_PATH ./test_preds.csv --MODEL_TYPE ESM12 --PREDICTION_TYPE S
詳細と要件については、PredictionServer フォルダーの README を参照してください。
このコードは、BSD 3 条項ライセンスに基づいてライセンスされています。
@article{10.1093/bioinformatics/btab801,
author = {Thumuluri, Vineet and Martiny, Hannah-Marie and Almagro Armenteros, Jose J and Salomon, Jesper and Nielsen, Henrik and Johansen, Alexander Rosenberg},
title = "{NetSolP: predicting protein solubility in Escherichia coli using language models}",
journal = {Bioinformatics},
volume = {38},
number = {4},
pages = {941-946},
year = {2021},
month = {11},
issn = {1367-4803},
doi = {10.1093/bioinformatics/btab801},
url = {https://doi.org/10.1093/bioinformatics/btab801},
eprint = {https://academic.oup.com/bioinformatics/article-pdf/38/4/941/49008876/btab801.pdf},
}