Esta biblioteca contém o modelo de rede neural gráfica treinada para a previsão de energias de dissociação de ligações homolíticas (BDEs) de moléculas orgânicas com átomos de C, H, N e O. Este pacote oferece uma interface de linha de comando para as previsões do modelo baseado na web em bde.ml.nrel.gov.
A interface básica funciona da seguinte maneira, onde predict
espera uma lista de strings SMILES das moléculas alvo
>> > from alfabet import model
>> > model . predict ([ 'CC' , 'NCCO' ])
molecule bond_index bond_type fragment1 fragment2 ... bde_pred is_valid
0 CC 0 C-C [CH3] [CH3] ... 90.278282 True
1 CC 1 C-H [H] [CH2]C ... 99.346184 True
2 NCCO 0 C-N [CH2]CO [NH2] ... 89.988495 True
3 NCCO 1 C-C [CH2]O [CH2]N ... 82.122429 True
4 NCCO 2 C-O [CH2]CN [OH] ... 98.250961 True
5 NCCO 3 H-N [H] [NH]CCO ... 99.134750 True
6 NCCO 5 C-H [H] N[CH]CO ... 92.216087 True
7 NCCO 7 C-H [H] NC[CH]O ... 92.562988 True
8 NCCO 9 H-O [H] NCC[O] ... 105.120598 True
O modelo quebra todas as ligações simples e não cíclicas nas moléculas de entrada e calcula suas energias de dissociação de ligações. Erros de previsão típicos são inferiores a 1 kcal/mol. O modelo é baseado no Tensorflow (2.x) e faz uso intenso da biblioteca de impressão digital neural (0.1.x).
Para detalhes adicionais, consulte a publicação: St. John, PC, Guan, Y., Kim, Y., Kim, S., & Paton, RS (2020). Previsão de entalpias de dissociação de ligações homolíticas orgânicas com precisão quase química e custo computacional inferior a um segundo. Comunicações da Natureza, 11(1). doi:10.1038/s41467-020-16201-z
Nota: Para o modelo exato descrito no texto, instale alfabet
versão 0.0.x. Versões >0.1 foram atualizadas para tensorflow 2.
A instalação com conda
é recomendada, pois caso contrário rdkit
pode ser difícil de instalar
$ conda create -n alfabet -c conda-forge python=3.7 rdkit
$ source activate alfabet
$ pip install alfabet
` `