Esta biblioteca contiene el modelo de red neuronal de gráficos entrenado para la predicción de energías de disociación de enlaces homolíticos (BDE) de moléculas orgánicas con átomos de C, H, N y O. Este paquete ofrece una interfaz de línea de comandos para las predicciones del modelo basado en web en bde.ml.nrel.gov.
La interfaz básica funciona de la siguiente manera, donde predict
espera una lista de cadenas SMILES de las moléculas objetivo.
>> > from alfabet import model
>> > model . predict ([ 'CC' , 'NCCO' ])
molecule bond_index bond_type fragment1 fragment2 ... bde_pred is_valid
0 CC 0 C-C [CH3] [CH3] ... 90.278282 True
1 CC 1 C-H [H] [CH2]C ... 99.346184 True
2 NCCO 0 C-N [CH2]CO [NH2] ... 89.988495 True
3 NCCO 1 C-C [CH2]O [CH2]N ... 82.122429 True
4 NCCO 2 C-O [CH2]CN [OH] ... 98.250961 True
5 NCCO 3 H-N [H] [NH]CCO ... 99.134750 True
6 NCCO 5 C-H [H] N[CH]CO ... 92.216087 True
7 NCCO 7 C-H [H] NC[CH]O ... 92.562988 True
8 NCCO 9 H-O [H] NCC[O] ... 105.120598 True
El modelo rompe todos los enlaces simples no cíclicos en las moléculas de entrada y calcula sus energías de disociación de enlaces. Los errores de predicción típicos son inferiores a 1 kcal/mol. El modelo se basa en Tensorflow (2.x) y hace un uso intensivo de la biblioteca de huellas dactilares neuronales (0.1.x).
Para obtener detalles adicionales, consulte la publicación: St. John, PC, Guan, Y., Kim, Y., Kim, S. y Paton, RS (2020). Predicción de entalpías de disociación de enlaces homolíticos orgánicos con una precisión casi química y un coste computacional inferior a un segundo. Comunicaciones de la naturaleza, 11 (1). doi:10.1038/s41467-020-16201-z
Nota: Para el modelo exacto descrito en el texto, instale la versión 0.0.x alfabet
. Se han actualizado las versiones >0.1 para tensorflow 2.
Se recomienda la instalación con conda
, ya que de lo contrario rdkit
puede resultar difícil de instalar
$ conda create -n alfabet -c conda-forge python=3.7 rdkit
$ source activate alfabet
$ pip install alfabet
` `