alfabet
0.4.1
该库包含经过训练的图神经网络模型,用于预测具有 C、H、N 和 O 原子的有机分子的均裂键解离能 (BDE)。该软件包为 bde.ml.nrel.gov 上基于 Web 的模型预测提供了一个命令行界面。
基本界面的工作原理如下,其中predict
需要目标分子的 SMILES 字符串列表
>> > from alfabet import model
>> > model . predict ([ 'CC' , 'NCCO' ])
molecule bond_index bond_type fragment1 fragment2 ... bde_pred is_valid
0 CC 0 C-C [CH3] [CH3] ... 90.278282 True
1 CC 1 C-H [H] [CH2]C ... 99.346184 True
2 NCCO 0 C-N [CH2]CO [NH2] ... 89.988495 True
3 NCCO 1 C-C [CH2]O [CH2]N ... 82.122429 True
4 NCCO 2 C-O [CH2]CN [OH] ... 98.250961 True
5 NCCO 3 H-N [H] [NH]CCO ... 99.134750 True
6 NCCO 5 C-H [H] N[CH]CO ... 92.216087 True
7 NCCO 7 C-H [H] NC[CH]O ... 92.562988 True
8 NCCO 9 H-O [H] NCC[O] ... 105.120598 True
该模型破坏输入分子中的所有单非环状键并计算它们的键解离能。典型的预测误差小于 1 kcal/mol。该模型基于 Tensorflow (2.x),并大量使用神经指纹库 (0.1.x)。
有关更多详细信息,请参阅出版物:St. John, PC、Guan, Y.、Kim, Y.、Kim, S. 和 Paton, RS (2020)。以接近化学精度和亚秒级计算成本预测有机均裂键解离焓。自然通讯,11(1)。 doi:10.1038/s41467-020-16201-z
注意:对于文中描述的确切型号,请安装alfabet
版本 0.0.x。 >0.1 版本已针对 TensorFlow 2 进行了更新。
建议使用conda
安装,否则rdkit
可能难以安装
$ conda create -n alfabet -c conda-forge python=3.7 rdkit
$ source activate alfabet
$ pip install alfabet
` `