Cette bibliothèque contient le modèle de réseau neuronal graphique entraîné pour la prédiction des énergies de dissociation des liaisons homolytiques (BDE) de molécules organiques avec des atomes de C, H, N et O. Ce package offre une interface de ligne de commande pour les prédictions de modèles basées sur le Web sur bde.ml.nrel.gov.
L'interface de base fonctionne comme suit, où predict
attend une liste de chaînes SMILES des molécules cibles
>> > from alfabet import model
>> > model . predict ([ 'CC' , 'NCCO' ])
molecule bond_index bond_type fragment1 fragment2 ... bde_pred is_valid
0 CC 0 C-C [CH3] [CH3] ... 90.278282 True
1 CC 1 C-H [H] [CH2]C ... 99.346184 True
2 NCCO 0 C-N [CH2]CO [NH2] ... 89.988495 True
3 NCCO 1 C-C [CH2]O [CH2]N ... 82.122429 True
4 NCCO 2 C-O [CH2]CN [OH] ... 98.250961 True
5 NCCO 3 H-N [H] [NH]CCO ... 99.134750 True
6 NCCO 5 C-H [H] N[CH]CO ... 92.216087 True
7 NCCO 7 C-H [H] NC[CH]O ... 92.562988 True
8 NCCO 9 H-O [H] NCC[O] ... 105.120598 True
Le modèle rompt toutes les liaisons simples non cycliques dans les molécules d'entrée et calcule leurs énergies de dissociation des liaisons. Les erreurs de prédiction typiques sont inférieures à 1 kcal/mol. Le modèle est basé sur Tensorflow (2.x) et utilise largement la bibliothèque d'empreintes neuronales (0.1.x).
Pour plus de détails, voir la publication : St. John, PC, Guan, Y., Kim, Y., Kim, S. et Paton, RS (2020). Prédiction des enthalpies de dissociation des liaisons homolytiques organiques avec une précision chimique proche avec un coût de calcul inférieur à la seconde. Communications sur la nature, 11(1). est ce que je:10.1038/s41467-020-16201-z
Remarque : Pour le modèle exact décrit dans le texte, installez la version 0.0.x alfabet
. Les versions >0.1 ont été mises à jour pour tensorflow 2.
L'installation avec conda
est recommandée, car rdkit
peut autrement être difficile à installer
$ conda create -n alfabet -c conda-forge python=3.7 rdkit
$ source activate alfabet
$ pip install alfabet
` `