وحدة لميزات AB initio struction Evolution (MAISE)
* الوصف القائم على الشبكة العصبية للتفاعلات بين الذروح
* التحسين التطوري
* تحليل الهيكل
1. المعلومات العامة
2. التنزيل والتثبيت
3. المدخلات
4. أمثلة
5. إعداد علامة إدخال الإعداد
تم تطوير Maise بواسطة
Alexey Kolmogorov [email protected]
صاماد هاجنازار الحاجينزار@abinghamton.edu
إرنستو ساندوفال [email protected]
يعمل الإصدار 2.9 الحالي على منصات Linux ويجمع بين 3 وحدات للنمذجة وتحسين وتحليل الهياكل الذرية.
1 تقوم وحدة الشبكة العصبية (NN) بإنشاء نماذج واختباراتها واستخدامها لوصف التفاعلات بين الدوران مع دقة مبدئي شبه AB بتكلفة حسابية منخفضة مقارنةً بحسابات نظرية الكثافة الوظيفية.
مع الهدف الأساسي المتمثل في استخدام نماذج NN لتسريع البحث عن الهيكل ، تتمثل الوظيفة الرئيسية للوحدة في الاسترخاء. لتبسيط تطبيق NN والمقارنة ، قمنا بمطابقة تنسيقات ملفات الإدخال والإخراج عن كثب مع تلك المستخدمة في برنامج VASP. تم إنشاء نماذج NN المعلمة سابقًا في الدليل "النماذج/" واختبارها على نطاق واسع للمواد البلورية و/أو النانوية. تتضمن التطبيقات العملية الأولى لـ NNS التنبؤ بسبائك MG-CA و M-SN القابلة للتوصيل [1-3] بالإضافة إلى تحديد جسيمات CU-PD-AG و AU النانوية أكثر استقرارًا [4،5].
يمكن للمستخدمين إنشاء نماذج NN الخاصة بهم مع MAISE والتي يتم تدريبها عادة على نظرية الكثافة الوظيفية (DFT) الطاقة الكلية وبيانات القوة الذرية للهياكل الصغيرة نسبيا. يتم توليد التكوينات ذات الصلة والمتنوعة بشكل منفصل مع بروتوكول "أخذ العينات التطوري" المفصل في عملنا المنشور [6]. يقدم الرمز ميزة فريدة من نوعها ، "التدريب الطبقي" ، حول كيفية بناء NNS القوية للأنظمة الكيميائية مع عدة عناصر [6]. تم تطوير نماذج NN بطريقة هرمية ، أولاً للعناصر ، ثم للثنائيات ، وما إلى ذلك ، والتي تتيح توليد المكتبات القابلة لإعادة الاستخدام للكتل الممتدة في الجدول الدوري.
2 تتيح الخوارزمية التطورية المنفذة (EA) تحديدًا فعالًا لتكوينات الحالة الأرضية في تكوين كيميائي معين. أظهرت دراساتنا أن EA مفيدة بشكل خاص في التعامل مع الهياكل الكبيرة عندما لا تتوفر مدخلات هيكلية تجريبية [7،8].
يمكن إجراء عمليات البحث عن بلورات ثلاثية الأبعاد ، والأفلام ثنائية الأبعاد ، والجسيمات النانوية 0D. يمكن إنشاء مجموعة من الهياكل إما بشكل عشوائي أو محدد مسبقًا بناءً على المعلومات السابقة. العمليات الأساسية هي "كروس" ، عندما يتم إنشاء تكوين جديد استنادًا إلى هيكلين الأم في الجيل السابق ، و "طفرة" ، عندما يتم تشويه بنية الأصل بشكل عشوائي. بالنسبة إلى الجسيمات النانوية 0D ، قدمنا خوارزمية تطورية متعددة النطاقات تتيح تحسينًا فعالًا في وقت واحد من المجموعات في نطاق حجم محدد [4].
3 تشمل وظائف التحليل مقارنة الهياكل المستندة إلى وظيفة التوزيع الشعاعي (RDF) ، وتحديد مجموعة الفضاء ومواضع WYCKOFF مع حزمة SPGLIB خارجية ، وما إلى ذلك على وجه الخصوص. التخلص من الهياكل المكررة في عمليات البحث عن EA واختيار تكوينات مختلفة في مجموعة هياكل الطاقة المنخفضة التي تم العثور عليها.
[1] https://pubs.rsc.org/en/content/articlelanding/2018/cp/c8cp05314f# !divabstract
[2] https://www.nature.com/articles/S41524-022-00825-4
[3] https://pubs.rsc.org/en/content/articleling/2023/cp/d3cp02817h/unauth
[4] https://pubs.rsc.org/en/content/articleling/2019/cp/c9cp00837c#!
[5] https://pubs.acs.org/doi/10.1021/acs.jpcc.9b08517
[6] https://journals.aps.org/prb/abstract/10.1103/physrevb.95.014114
[7] https://journals.aps.org/prl/abstract/10.1103/physrevlett.109.075501
[8] https://journals.aps.org/prb/abstract/10.1103/physrevb.98.085131
يمكن الحصول على رمز المصدر لـ Maise من سطر الأوامر عن طريق التشغيل:
git clone git://github.com/maise-guide/maise.git
أو
git clone https://github.com/maise-guide/maise.git
أو
wget -O master.zip https://github.com/maise-guide/maise/archive/master.zip unzip master.zip
1 استخدم " Make -Jobs " للتجميع الكامل. لإعادة الترسيب ، استخدم "Make Clean" لإزالة ملفات الكائنات أو "إنشاء كل شيء" لإزالة ملفات الكائنات والمكتبات الخارجية.
2 أثناء تجميع MAISE ، يقوم "Make -Jobs" بالتحقق من المكتبات الخارجية المطلوبة ، مكتبة GSL و SPGLIB V1.11.2.1 ، فبراير 2019. إذا لم يكن الأمر كذلك ، فسيتم تنزيلها تلقائيًا إلى ./EXT-DEP وتثبيتها في ./lib على معظم الأنظمة.
3 إذا لم يتم إكمال تثبيت GSL أو SPGLIB تلقائيًا ، فيرجى ترجمةها يدويًا ونسخ (i) libgsl.a و libgslcblas.a و libsymspg.a إلى ". (ii) "spglib.h" header in './lib/include' subdirectory ؛ و (iii) جميع رؤوس GSL في "./lib/include/gsl 'subdirectory.
4 يتوفر برنامج "فحص" في الدليل. يتحقق هذا البرنامج النصي تلقائيًا من أداء الكود في تحليل البيانات وتدريب الشبكة العصبية وتقييم بنية بلورية. إذا كان التجميع جيدًا ، فسيتم إخراج البرنامج النصي "التحقق" ؛ وإلا سيتم تزويد سجلات الأخطاء بمزيد من المعلومات حول هذه المشكلة.
تم اختبار الرمز على نطاق واسع على منصات Linux. سنقدر ملاحظات المستخدمين على تثبيت وأداء الحزمة على منصات مختلفة.
ملفات الإدخال الرئيسية التي تحدد المحاكاة هي "الإعداد" مع إعدادات الوظائف ، "النموذج" مع معلمات NN ، و "poscar" مع معلمات البنية الذرية في تنسيق VASP. يتطلب تحويل البيئات الذرية إلى مدخلات NN خلال مرحلة التحليل لتطوير NN ملفًا "أساسًا" يحدد وظائف التماثل Behler-Parrinello.
evos | nnet | خلية | |||||
يبحث | امتحان | تحليل | يدرب | امتحان | سيمول | امتحان | |
يثبت | + | + | + | + | + | + | |
نموذج | +* | +# | +# | ||||
أساس | + | $ | |||||
SPG | + | + | |||||
GSL | + | + | |||||
* للتدريب الطبقي يحتاج المرء إلى توفير نماذج فردية يتم إلحاق "أساس" $ "المخزنة في الدليل المحلل" إلى "النموذج" في نهاية التدريب # "نموذج" قد تم لصقه في النهاية بمجرد انتهاء التدريب |
يتم تشغيل وظائف فحص الهيكل والتلاعب عن طريق استدعاء Maise مع العلم:
maise -flag
علَم | وصف العلم |
---|---|
رجل | إخراج قائمة الأعلام المتاحة |
RDF | حساب ورسم RDF ل poscar |
CXC | حساب منتج DOT لـ POSCAR0 و POSCAR1 باستخدام RDF |
CMP | قارن RDF ، المجموعة الفضائية ، وحجم POSCAR0 و POSCAR1 |
SPG | تحويل poscar إلى str.cif ، conv ، prim |
CIF | تحويل str.cif إلى مقنع و prim |
خافت | ابحث عن ما إذا كان POSCAR دوريًا (3) أو غير فوري (0) |
المجلد | حساب حجم لكل ذرة لهياكل البلورة أو النانو |
تعفن | تدوير الجسيمات النانوية على طول eigenvectors من لحظات الجمود |
موف | حرك الذرات على طول اتجاه واحد من خلال تحول مستمر |
صندوق | أعد ضبط حجم الصندوق للجسيمات النانوية |
رشفة | اجعل Supercell محدد بواسطة Na X Nb X NC |
eig | خلية وحدة التحول في poscar على طول phonon eigenmode |
أمر | ترتيب الذرات حسب الأنواع |
خارج | استخراج لقطات من MD أو مسارات الاسترخاء في VASP |
الدليل "أمثلة/" لديه عينات من وظائف MAISE لتحليل خلايا الوحدة والتلاعب بها ، تحليل البيانات ، التدريب الشبكات العصبية ، محاكاة الهياكل مع نماذج الشبكة العصبية ، البحث التطوري عن نموذج الشبكة العصبية في حالة الأرض ، والديناميات الجزيئية تشغيل ، وحساب فونون. يحتوي Eash Example على ملف ReadMe ، وملف إعداد مع علامات ذات صلة فقط للوظيفة المحددة ، وملفات الإخراج المرجعية للمقارنة.
محدد نوع الوظيفة الرئيسي
بنية وعيرة
evos الرئيسية
عمليات EVOS
إيفوس كروس/طفرة
الديناميات الجزيئية
الأنواع ذات الصلة
أنا/س
النموذج العام
نموذج الشبكة العصبية
التدريب على الشبكة العصبية
التحليل
استرخاء الخلايا
JOBT
nmax mmax
رمز Dene KMSH Lbox NDIM NITR NNJB NPOP RANT RUNT SETR TINI
Blob Chop Invs Mate Mute Pack Plnt Resp Rube Swap Tetr
ACRS ADST ELPS LCRS LDST MCRS SCRS SDST
CPLT CPLP ICMP DELT MOVI NSTP MDTP TMAX TMIN TSTP
ASPC NSPC TSPC
بيانات COUT DEPO eval otpt wdir
ncmp nngt nnnn nnnu nsym
FMRK LREG NTRN NTST TEFS NPAR
emax fmax fmin vmax vmin mmax
ETOL MINT MITR PGPA RLXT TIME
علامة | وصف |
---|---|
JOBT | تحليل الهيكل (00) أدوات تحليل الاستخدام المحددة بواسطة الأعلام ، البحث التطوري (10) Run (11) تحليل مخرج ناعم (12) تحليل الصلب (13) ، محاكاة الخلية (20) الاسترخاء (21) ديناميات الجزيئية (22) حسابات فونون ، تحليل البيانات (30) إعداد مدخلات لتدريب NN ، NN Training (40) التدريب الكامل (41) التدريب الطبقي |
شفرة | نوع الكود المستخدمة. (0) maise-int (1) vasp-ext (2) maise-ext |
NPAR | عدد النوى للتدريب المتوازي NN أو محاكاة الخلايا |
النعناع | خوارزمية المحسّنة للتدريب على الشبكة العصبية وتحسين الخلية. (GSL Minimizer Type (0) BFGS2 (1) CG-FR (2) CG-PR (3) أحسن النسب |
ميت | الحد الأقصى لعدد خطوات التحسين ؛ إذا لم يتم الوصول إلى الدقة المطلوبة لخطوات تدريب NN أو تحسين الخلايا |
RLXT | نوع تحسين الخلية (2) قوة فقط (3) حجم الخلية الكاملة (7) (ISIF في VASP) |
etol | تحمل الخطأ للتدريب أو تقارب تحسين الخلايا |
TEFS | تدريب القيمة الهدف (0) E (1) EF (2) ES (3) EFS (4) لعبة |
الرنين المغناطيسي الوظيفي | جزء من الذرات التي سيتم تحليلها لاستخدامها في تدريبات EF أو EFS |
كوت | نوع الإخراج في ملف OutCar في تقييم الخلايا وتحسينه |
NMAX | الحد الأقصى لعدد الذرات في خلية الوحدة |
mmax | الحد الأقصى لعدد الجيران داخل نصف قطر القطع |
NSPC | عدد أنواع العناصر للبحث التطوري ، تحليل البيانات والتدريب على الشبكة العصبية. |
TSPC | العدد الذري للعناصر المحددة مع علامة NSPC |
ASPC | عدد ذرات كل عنصر للبحث التطوري |
nsym | عدد وظائف تماثل Behler-Parrinello لتحليل البيانات باستخدام ملف "الأساس" |
NCMP | طول متجه الإدخال للشبكة العصبية |
ntrn | عدد الهياكل المستخدمة في قطار الشبكة العصبية (العدد السلبي يعني النسبة المئوية) |
NTST | عدد الهياكل المستخدمة لاختبار الشبكة العصبية (العدد السلبي يعني النسبة المئوية) |
nnnn | عدد الطبقات المخفية في الشبكة العصبية (لا يشمل متجه الإدخال والخلايا العصبية المخرج) |
nnnu | عدد الخلايا العصبية في الطبقات المخفية |
nngt | نوع وظيفة التنشيط للخلايا العصبية ذات الطبقات المخفية (0) خطية (1) تانه |
emax | تحليل هذا الكسر فقط من هياكل الطاقة الأدنى. من 0 إلى 1 |
fmax | لن يحلل البيانات بقوى أكبر من هذه القيمة |
vmin | لن يتم تحليل البيانات مع حجم/ذرة أصغر من هذه القيمة |
vmax | لن يحلل البيانات مع حجم/ذرة أكبر من هذه القيمة |
نديم | أبعاد خلية الوحدة في البحث التطوري وتحسين الخلايا (3) جسيم بلور (2) (0) |
LBOX | بُعد مربع لتوليد الجزيئات في البحث التطوري في Angs (تم تجاهله للبلورات) |
NPOP | حجم السكان في البحث التطوري |
SITR | بدء التكرار في البحث التطوري (0) ابدأ من الهياكل العشوائية أو المحددة |
نيتر | عدد التكرارات في البحث التطوري (يجب أن يكون أكبر من SITR) |
تيني | نوع بدء البحث التطوري عند sitr = 0 |
وقت | أقصى وقت للاسترخاء في الخلية في البحث التطوري وتحسين الخلايا |
PGPA | الضغط في المعدل التراكمي |
واد | تخزين هياكل مميزة تم إنشاؤها في البحث التطوري في البركة/إذا كانت داخل هذه الطاقة/الذرة (EV/ATOM) من الحالة الأرضية |
kmsh | كثافة K-MESH المستخدمة في VASP-EVOS. القيم المقترحة: 0.30 لـ S/C ، 0.05 للمعادن |
البذور | يستخدم البذور لمولد الأرقام العشوائية في البحث التطوري (0) الوقت كبذور (+) قيمة البذور |
راند | بدء بذرة لتحليل مجموعة البيانات. (0) يستخدم الوقت كبذور (+) قيمة البذور (-) لا توجد توزيع عشوائي: يتم تحليل الهياكل في ترتيب الإدراج |
tmin | الحد الأدنى لدرجة الحرارة في تشغيل MD (K) |
tmax | أقصى درجة حرارة في تشغيل MD (K) |
TSTP | خطوة درجة الحرارة في تشغيل MD (K) في تشغيل TMIN إلى tmax |
دلتا | الخطوة الزمنية في تشغيل MD |
NSTP | عدد الخطوات لكل درجة حرارة في تشغيل MD |
cplt | اقتران ثابت في ترموستات الأنف هوفر لركض MD. اقترح: 25.0 |
CPLP | اقتران ثابت في Brendsen Barostat لتشغيل MD. اقترح: 100.0 |
ICMP | الانضغاط متساوي الحرارة في Brendsen Barostat لركض MD (في 1/GPA) |
موفي | عدد الخطوات التي سيتم بعدها حفظ لقطة من الهيكل خلال تشغيل MD |
MDTP | MD Run Type (10) NVE (20) NVT: Nose-Hoover (30) NPT: NOVE-HOOVER و BRENDEN (40) ISOBARIC (11،21،31،41) يعمل مع السرعات القراءة من ملف poscar |
ديبو | مسار إلى مجموعات بيانات DFT ليتم تحليلها |
بيانات | موقع البيانات المحسورة لتحليلها أو القراءة للتدريب (سيتم الكتابة فوقها أثناء التحليل) |
otpt | دليل لتخزين المعلمات النموذجية في عملية التدريب |
تقييم | دليل لبيانات اختبار النموذج |
WDIR | دليل العمل للبحث التطوري ، تشغيل MD ، إلخ. |
Tetr | جزء من الهياكل التي تم إنشاؤها عشوائيا باستخدام تشغيل Tetris. من 0 إلى 1 |
plnt | جزء من الهياكل الناتجة من البذور. من 0 إلى 1 |
علية | جزء من الهياكل الناتجة من هياكل حزمة مغلقة. من 0 إلى 1 |
النقطة | جزء من الهياكل التي تم إنشاؤها عشوائيا باستخدام شكل النقطة. من 0 إلى 1 |
رَفِيق | جزء من الهياكل التي تم إنشاؤها بواسطة كروس باستخدام نصفين من كل والد. من 0 إلى 1 |
تبديل | جزء من الهياكل التي تم إنشاؤها بواسطة كروس باستخدام Core و Shell من الآباء. من 0 إلى 1 |
روب | جزء من الهياكل الناتجة عن عملية مكعب روبيك. من 0 إلى 1 |
انعكاس | جزء من الهياكل الناتجة عن التناظر عن طريق الانعكاس. من 0 إلى 1 |
Invs | جزء من الهياكل الناتجة عن التناظر عن طريق الانعكاس. من 0 إلى 1 |
ختم | جزء من الهياكل التي تم إنشاؤها عن طريق التقطيع لصنع الجوانب. من 0 إلى 1 |
صامت | جزء من الهياكل الناتجة عن تشوهات عشوائية للهيكل. من 0 إلى 1 |
MCRS | 0.50 معدل طفرة في كروس |
SCRS | 0.00 كروس: معدل التبادل |
LCRS | 0.00 كروس: قوة طفرة للناقلات الشبكة |
ACRS | 0.10 كروس: قوة طفرة للمواقف الذرية |
SDST | 0.00 تشويه: معدل التبادل |
ldst | 0.00 تشويه: قوة طفرة للناقلات الشبكة |
ADST | 0.20 التشويه: قوة طفرة للمواقف الذرية |
Elps | 0.30 عشوائي: إهليلجية الجسيمات النانوية |