Perpustakaan ini berisi model jaringan saraf tiruan grafik terlatih untuk prediksi energi disosiasi ikatan homolitik (BDE) molekul organik dengan atom C, H, N, dan O. Paket ini menawarkan antarmuka baris perintah ke prediksi model berbasis web di bde.ml.nrel.gov.
Antarmuka dasar bekerja sebagai berikut, di mana predict
mengharapkan daftar string SMILES dari molekul target
>> > from alfabet import model
>> > model . predict ([ 'CC' , 'NCCO' ])
molecule bond_index bond_type fragment1 fragment2 ... bde_pred is_valid
0 CC 0 C-C [CH3] [CH3] ... 90.278282 True
1 CC 1 C-H [H] [CH2]C ... 99.346184 True
2 NCCO 0 C-N [CH2]CO [NH2] ... 89.988495 True
3 NCCO 1 C-C [CH2]O [CH2]N ... 82.122429 True
4 NCCO 2 C-O [CH2]CN [OH] ... 98.250961 True
5 NCCO 3 H-N [H] [NH]CCO ... 99.134750 True
6 NCCO 5 C-H [H] N[CH]CO ... 92.216087 True
7 NCCO 7 C-H [H] NC[CH]O ... 92.562988 True
8 NCCO 9 H-O [H] NCC[O] ... 105.120598 True
Model ini memutus semua ikatan tunggal non-siklik dalam molekul masukan dan menghitung energi disosiasi ikatannya. Kesalahan prediksi umumnya kurang dari 1 kkal/mol. Model ini didasarkan pada Tensorflow (2.x), dan banyak menggunakan perpustakaan sidik jari saraf (0.1.x).
Untuk rincian lebih lanjut, lihat publikasi: St. John, PC, Guan, Y., Kim, Y., Kim, S., & Paton, RS (2020). Prediksi entalpi disosiasi ikatan homolitik organik dengan akurasi mendekati kimia dengan biaya komputasi sub-detik. Komunikasi Alam, 11(1). doi:10.1038/s41467-020-16201-z
Catatan: Untuk model persis yang dijelaskan dalam teks, instal alfabet
versi 0.0.x. Versi >0.1 telah diperbarui untuk Tensorflow 2.
Instalasi dengan conda
disarankan, karena rdkit
mungkin sulit untuk diinstal
$ conda create -n alfabet -c conda-forge python=3.7 rdkit
$ source activate alfabet
$ pip install alfabet
` `