從頭算結構演變(Maise)特徵的模塊
*基於神經網絡間相互作用的描述
*進化優化
*結構分析
1。一般信息
2。下載和安裝
3。輸入
4。例子
5。設置輸入標籤描述
Maise是由
Alexey Kolmogorov [email protected]
samad hajinazar [email protected]
Ernesto Sandoval [email protected]
當前版本2.9在Linux平台上工作,並結合了3個用於建模,優化和分析原子結構的模塊。
1與密度功能理論計算相比,神經網絡(NN)模塊以低計算成本來構建,測試和使用NN模型以低計算成本來描述具有接近AB的啟動精度的原子質相互作用。
以使用NN模型加速結構搜索的主要目標,該模塊的主要功能是放鬆給定的結構。為了簡化NN應用程序和比較,我們將輸入和輸出文件格式與VASP軟件中的輸入格式密切匹配。以前在“模型/”目錄中可用的參數化NN模型已被生成並廣泛測試了晶體和/或納米結構材料。 NNS的第一個實用應用包括預測新合成的MG-CA和M-SN合金[1-3],以及鑑定更穩定的CU-PD-AG和AU納米顆粒[4,5]。
用戶可以使用Maise創建自己的NN模型,該模型通常經過密度功能理論(DFT)的總能量和原子力數據,以培訓相對較小的結構。相關和多樣化的配置的產生是通過我們發表的工作中詳細介紹的“進化抽樣”協議分別完成的[6]。該法規介紹瞭如何為具有多個元素的化學系統構建強大的NNS的獨特功能“分層訓練” [6]。 NN模型是以層次結構開發的,首先是針對元素的,然後是用於二進制的,它可以生成可重複使用的庫,用於元素週期表中的擴展塊。
2實施的進化算法(EA)可有效地識別給定化學成分的基態構型。我們的研究表明,當沒有實驗性結構輸入可用時,EA在處理大型結構方面特別有利[7,8]。
可以對3D散裝晶體,2D膜和0D納米顆粒進行搜索。可以根據先驗信息隨機或預定義的結構群體。當基於上一代的兩個父結構創建新的配置時,基本操作是“交叉”,當父結構隨機變形時,“突變”。對於0D納米顆粒,我們引入了多發性進化算法,該算法允許在指定的大小範圍內有效地同時優化簇[4]。
3分析函數包括基於徑向分佈函數(RDF),空間群和WYCKOFF位置的結構進行比較,特別是,基於RDF的結構點乘積對於基於外部的SPGLIB包裝等。消除EA搜索中的重複結構,並在發現的低能結構池中選擇不同的配置。
[1] https://pubs.rsc.org/en/content/articlelanding/2018/cp/c8cp05314f# !! divabstract
[2] https://www.nature.com/articles/s41524-022-00825-4
[3] https://pubs.rsc.org/en/content/articlelanding/2023/cp/d3cp02817h/unauth
[4] https://pubs.rsc.org/en/content/articlelanding/2019/cp/c9cp00837c# !! divabstract
[5] https://pubs.acs.org/doi/10.1021/acs.jpcc.9b08517
[6] https://journals.aps.org/prb/abstract/10.1103/physrevb.95.014114
[7] https://journals.aps.org/prl/abstract/10.1103/physrevlett.109.075501
[8] https://journals.aps.org/prb/abstract/10.1103/physrevb.98.085131
可以通過運行從命令行獲得的Maise的源代碼:
git clone git://github.com/maise-guide/maise.git
或者
git clone https://github.com/maise-guide/maise.git
或者
wget -O master.zip https://github.com/maise-guide/maise/archive/master.zip unzip master.zip
1使用“ make -jobs ”進行完整彙編。要進行重新編譯,請使用“ Make Clean”來刪除對象文件或“使All-All”刪除對象文件和外部庫。
2在Maise彙編期間,“ Make -Jobs”檢查是否存在兩個所需的外部庫,GSL庫和SPGLIB v1.11.2.1,2019年2月。如果沒有,它們將自動下載到./ ext-dep並在大多數係統上安裝在./lib中。
3如果沒有自動完成GSL或SPGLIB安裝,請手動編譯它們,然後復制(i)libgsl.a,libgslcblas.a和libsymspg.a,納入'./lib'subdirectory; (ii)'spglib.h'標題進入'./lib/include'subdirectory; (iii)所有GSL標頭進入'./lib/include/gsl'子目錄。
4 a'check'腳本在“ ./test/”目錄中可用,該目錄可以在編譯Maise可執行文件後運行以確保代碼的正確功能。該腳本會自動檢查在解析數據,訓練神經網絡並評估晶體結構時的代碼性能。如果彙編正常,則“檢查”腳本將輸出。否則,將為錯誤日誌提供有關此問題的更多信息。
該代碼已在Linux平台上進行了廣泛的測試。我們將感謝用戶對包裝在不同平台上的安裝和性能的反饋。
定義仿真的主要輸入文件是用作業設置,具有NN參數的“模型”的“設置”,以及具有VASP格式的原子結構參數的“ POSCAR”。在NN開發的解析階段,將原子環境轉換為NN輸入需要一個“基礎”文件,該文件指定Behler-Parrinello對稱函數。
evos | nnet | 細胞 | |||||
搜尋 | 考試 | 解析 | 火車 | 測試 | 模擬 | 考試 | |
設定 | + | + | + | + | + | + | |
模型 | +* | +# | +# | ||||
基礎 | + | $ | |||||
SPG | + | + | |||||
GSL | + | + | |||||
*對於分層的培訓,需要提供單個模型 在培訓結束時,在解析目錄中存儲的$'基礎'附加到“模型” #“模型”在培訓完成後結束時粘貼了“基礎” |
結構檢查和操縱功能是通過用標誌調用Maise來運行的:
maise -flag
旗幟 | 標誌說明 |
---|---|
男人 | 輸出可用標誌的列表 |
RDF | 計算和繪製POSCAR的RDF |
CXC | 使用RDF計算POSCAR0和POSCAR1的點產品 |
CMP | 比較POSCAR0和POSCAR1的RDF,空間組和數量 |
SPG | 將POSCAR轉換為str.Cif,Conv,Prim |
CIF | 將str.Cif轉換為Conv和Prim |
暗淡 | 查找POSCAR是周期性(3)還是非週期性(0) |
卷 | 計算每個原子的晶體或納米結構的體積 |
腐爛 | 沿著慣性矩的特徵向量旋轉納米顆粒 |
移動 | 通過恆定移動沿一個方向移動原子 |
盒子 | 重置納米顆粒的盒子尺寸 |
sup | 製作由Na X NB X NC指定的超級電池 |
eig | 沿著聲子本本元中的波斯卡式移動單元單元 |
ORD | 按物種訂購原子 |
出去 | 從MD提取快照或VASP中的放鬆軌跡 |
目錄“示例/”具有用於單位細胞分析和操縱,分析數據,訓練神經網絡,使用神經網絡模型模擬結構的毛症作業樣本,進化搜索基態神經網絡模型,分子動力學運行和唱機計算。 EASH示例具有一個讀數文件,一個設置文件僅具有適用於特定作業的標籤,以及參考輸出文件以進行比較。
主要作業類型選擇器
結構啟示
主要evos
EVO操作
EVO跨界/突變
分子動力學
物種相關
I/O。
一般模型
神經網絡模型
神經網絡培訓
解析
細胞放鬆
喬布特
nmax mmax
代碼dene kmsh lbox ndim nitr nnjb npop rand rant runt seed sitr tini
Blob Chop Invs Mate Mute Pack PLNT refl rube交換tetr
ACRS ADST ELPS LCRS LDST MCRS SCRS SDST
CPLT CPLP ICMP DELT MOVI NSTP MDTP TMAX TMIN TMIN TSTP
ASPC NSPC TSPC
Cout Data Depo eval otpt wdir
ncmp nngt nnnn nnnu nsym
fmrk lreg ntrn ntst tefs npar
emax fmax fmin vmax vmin mmax
etol mint mitr pgpa rlxt時間
標籤 | 描述 |
---|---|
喬布特 | 結構分析(00)使用標誌指定的分析工具,進化搜索(10)運行(11)軟出口(12)硬出口(13)分析,細胞模擬(20)鬆弛(21)分子動力學(22)聲子計算,數據解析(30)準備NN培訓的輸入,NN培訓(40)全面培訓(41)分層培訓 |
代碼 | 使用中的代碼類型。 (0)Maise-Int(1)Vasp-Ext(2)Maise-Ext |
NPAR | 平行NN訓練或細胞模擬的核心數量 |
薄荷 | 用於神經網絡訓練和細胞優化的優化器算法。 (GSL最小化型(0)BFGS2(1)CG-FR(2)CG-PR(3)CG-PR(3)最陡下降 |
mitr | 最大優化步驟數;如果未達到所需的精度以進行NN訓練或細胞優化步驟 |
rlxt | 細胞優化類型(2)僅力(3)全細胞(7)體積(VASP中的ISIF) |
etol | 訓練或細胞優化收斂的誤差耐受性 |
tefs | 培訓目標值(0)E(1)EF(2)ES(3)EFS(4)玩具 |
FMRK | 將用於EF或EFS培訓的原子的一部分 |
cout | 在單元評估和優化中輸出輸出類型 |
nmax | 單位單元中最大原子數 |
mmax | 截止半徑內的最大鄰居數 |
NSPC | 進化搜索,解析數據和神經網絡培訓的元素類型數量。 |
TSPC | NSPC標籤指定的元素的原子數 |
ASPC | 每個元素的原子數量用於進化搜索 |
nsym | 使用“基礎”文件的Behler-Parrinello對稱函數的數量 |
NCMP | 神經網絡輸入向量的長度 |
ntrn | 用於神經網絡培訓的結構數量(負數為負數百分比) |
ntst | 用於神經網絡測試的結構數量(負數為單位百分比) |
nnn | 神經網絡中隱藏層的數量(不包括輸入向量和輸出神經元) |
nnnu | 隱藏層中的神經元數 |
nngt | 隱藏層神經元的激活函數類型(0)線性(1)TANH |
emax | 僅解析最低能量結構的這一比例。從0到1 |
fmax | 不會用大於此值的力解析數據 |
Vmin | 不會用體積/原子小於此值來解析數據 |
vmax | 不會用卷/原子大於此值的數據來解析數據 |
NDIM | 在進化搜索和細胞優化中單位細胞的維度(3)晶體(2)膜(0)粒子 |
lbox | 在ANG中生成顆粒的框維(忽略了晶體) |
NPOP | 進化搜索中的人口規模 |
Sitr | 在進化搜索(0)中開始迭代從隨機或指定的結構開始 |
nitr | 進化搜索中的迭代次數(應大於SITR) |
蒂尼 | SITR = 0時啟動進化搜索的類型 |
時間 | 進化搜索和細胞優化中細胞鬆弛的最大時間 |
PGPA | GPA的壓力 |
迪恩 | 在池中的進化搜索中生成的不同結構/如果在此能量/原子(EV/ATOM)窗口內從基態開始 |
KMSH | k-mesh密度用於VASP-evos。建議的值:S/C 0.30,金屬0.05 |
種子 | 在進化搜索(0)中開始使用隨機數生成器的種子,將時間用作種子(+)種子值 |
蘭德 | 開始種子以解析數據集。 (0)將時間用作種子(+)種子價值( - )無隨機性:結構在清單順序中解析 |
Tmin | MD運行中的最低溫度(K) |
tmax | MD運行中的最高溫度(K) |
TSTP | MD運行中的溫度步驟(K)以Tmin到TMAX的運行形式 |
delt | MD運行的時間步長 |
NSTP | MD運行中每個溫度的步驟數 |
CPLT | MD運行的鼻恆溫器中的耦合常數。建議:25.0 |
CPLP | Brendsen Barostat中的耦合常數用於MD運行。建議:100.0 |
ICMP | MD運行的Brendsen Barostat中的等溫可壓縮性(以1/GPA為單位) |
Movi | 在MD運行期間將保存結構快照的步驟數 |
MDTP | MD Run類型(10)NVE(20)NVT:鼻子- 霍夫(30)NPT:Nose-Hoover and Brendsen(40)同質(11,21,31,41)運行,並從POSCAR文件中讀取,速度讀取速度 |
depo | 通往DFT數據集的路徑 |
數據 | 解析數據的位置進行解析或閱讀以進行培訓(在解析過程中將被覆蓋) |
OTPT | 在培訓過程中存儲模型參數的目錄 |
評估 | 模型測試數據目錄 |
wdir | 進化搜索的工作目錄,MD運行等。 |
Tetr | 使用Tetris操作隨機生成的結構的一部分。從0到1 |
plnt | 從種子產生的結構的一部分。從0到1 |
盒 | 由封閉式結構產生的結構的一部分。從0到1 |
斑點 | 使用斑點形狀隨機生成的結構的部分。從0到1 |
伴侶 | 分頻器使用每個父母的兩半產生的結構的部分。從0到1 |
交換 | 跨界產生的結構的一部分是使用父母的核心和外殼產生的。從0到1 |
Rube | Rubik的立方體操作產生的結構的一部分。從0到1 |
回流 | 通過反射產生的結構的一部分。從0到1 |
Invs | 通過反轉產生的結構的一部分。從0到1 |
劈 | 通過切碎而產生的結構的一部分。從0到1 |
沉默的 | 由隨機變形對結構產生的結構的一部分。從0到1 |
MCR | 跨界的0.50突變率 |
SCR | 0.00交叉:交換率 |
LCR | 0.00交叉:晶格向量的突變強度 |
ACRS | 0.10跨界:原子位置的突變強度 |
SDST | 0.00失真:交換率 |
ldst | 0.00失真:晶格向量的突變強度 |
adst | 0.20失真:原子位置的突變強度 |
ELP | 0.30隨機:納米顆粒橢圓度 |