Эта библиотека содержит модель нейронной сети с обученным графом для прогнозирования энергий диссоциации гомолитических связей (BDE) органических молекул с атомами C, H, N и O. Этот пакет предлагает интерфейс командной строки для прогнозирования веб-модели на сайте bde.ml.nrel.gov.
Базовый интерфейс работает следующим образом: predict
ожидает список строк SMILES целевых молекул.
>> > from alfabet import model
>> > model . predict ([ 'CC' , 'NCCO' ])
molecule bond_index bond_type fragment1 fragment2 ... bde_pred is_valid
0 CC 0 C-C [CH3] [CH3] ... 90.278282 True
1 CC 1 C-H [H] [CH2]C ... 99.346184 True
2 NCCO 0 C-N [CH2]CO [NH2] ... 89.988495 True
3 NCCO 1 C-C [CH2]O [CH2]N ... 82.122429 True
4 NCCO 2 C-O [CH2]CN [OH] ... 98.250961 True
5 NCCO 3 H-N [H] [NH]CCO ... 99.134750 True
6 NCCO 5 C-H [H] N[CH]CO ... 92.216087 True
7 NCCO 7 C-H [H] NC[CH]O ... 92.562988 True
8 NCCO 9 H-O [H] NCC[O] ... 105.120598 True
Модель разрывает все одиночные нециклические связи во входных молекулах и рассчитывает энергии диссоциации их связей. Типичные ошибки прогноза составляют менее 1 ккал/моль. Модель основана на Tensorflow (2.x) и активно использует библиотеку нейронных отпечатков пальцев (0.1.x).
Дополнительную информацию см. в публикации: Сент-Джон, ПК, Гуан, Ю., Ким, Ю., Ким, С., и Патон, Р.С. (2020). Прогнозирование энтальпий диссоциации гомолитических связей органических соединений с почти химической точностью и вычислительными затратами менее секунды. Природные коммуникации, 11 (1). doi:10.1038/s41467-020-16201-z
Примечание. Для конкретной модели, описанной в тексте, установите alfabet
версии 0.0.x. Версии >0.1 обновлены для tensorflow 2.
Рекомендуется установка с помощью conda
, так как в противном случае установка rdkit
может быть затруднена.
$ conda create -n alfabet -c conda-forge python=3.7 rdkit
$ source activate alfabet
$ pip install alfabet
` `