alfabet
0.4.1
このライブラリには、C、H、N、および O 原子を含む有機分子のホモリティック結合解離エネルギー (BDE) を予測するための、トレーニング済みグラフ ニューラル ネットワーク モデルが含まれています。このパッケージは、bde.ml.nrel.gov での Web ベースのモデル予測へのコマンドライン インターフェイスを提供します。
基本的なインターフェイスは次のように機能します。predict predict
ターゲット分子の SMILES 文字列のリストを期待します。
>> > from alfabet import model
>> > model . predict ([ 'CC' , 'NCCO' ])
molecule bond_index bond_type fragment1 fragment2 ... bde_pred is_valid
0 CC 0 C-C [CH3] [CH3] ... 90.278282 True
1 CC 1 C-H [H] [CH2]C ... 99.346184 True
2 NCCO 0 C-N [CH2]CO [NH2] ... 89.988495 True
3 NCCO 1 C-C [CH2]O [CH2]N ... 82.122429 True
4 NCCO 2 C-O [CH2]CN [OH] ... 98.250961 True
5 NCCO 3 H-N [H] [NH]CCO ... 99.134750 True
6 NCCO 5 C-H [H] N[CH]CO ... 92.216087 True
7 NCCO 7 C-H [H] NC[CH]O ... 92.562988 True
8 NCCO 9 H-O [H] NCC[O] ... 105.120598 True
このモデルは、入力分子内のすべての非環状単結合を切断し、それらの結合解離エネルギーを計算します。一般的な予測誤差は 1 kcal/mol 未満です。このモデルは Tensorflow (2.x) に基づいており、ニューラル フィンガープリント ライブラリ (0.1.x) を多用しています。
詳細については、出版物を参照してください: St. John, PC、Guan, Y.、Kim, Y.、Kim, S.、Paton, RS (2020)。有機ホモリティック結合の解離エンタルピーを化学的精度に近い精度で、1 秒未満の計算コストで予測します。ネイチャーコミュニケーションズ、11(1)。土井:10.1038/s41467-020-16201-z
注:本文に記載されている正確なモデルについては、 alfabet
バージョン 0.0.x をインストールしてください。バージョン 0.1 よりも tensorflow 2 用に更新されました。
conda
を使用しないとrdkit
をインストールするのが難しいため、conda を使用してインストールすることをお勧めします。
$ conda create -n alfabet -c conda-forge python=3.7 rdkit
$ source activate alfabet
$ pip install alfabet
` `