提供腳本來產生隨機進程樹並將這些樹模擬到事件日誌中。
有關生成器和模擬器工作原理的詳細信息,請參閱 Jouck、Toon 和 Benoît Depaire 的論文。 “PTandLogGenerator:人工事件資料產生器。” 2016 年 BPM 示範軌道論文集 (BPMD 2016),1789:23-27。裡約熱內盧:CEUR 研討會記錄,2016 年。
輸入:群體的參數檔案(範例參數檔案位於“/data/parameter_files”資料夾中)。
csv 檔案的每一行描述一個群體的特徵:mode;min;max;sequence;choice;parallel;loop;or;silent;duplicate;lt_dependency;infrequent;no_models;unfold;max_repeat
如果 lt_dependency <= 0:這應該始終為 0(False)
如果 lt_dependency > 0:這可以是 1 或 0(True 或 False)
模式:最常見的可見活動數
min:可見活動的最小數量
max:可見活動的最大數量
序列:向樹添加序列運算符的機率
choice:向樹添加選擇運算符的機率
並行:向樹添加並行運算符的機率
循環:向樹添加循環運算符的機率
or:向樹添加 or 運算符的機率
沉默:將沉默活動加入選擇或循環運算符的機率
重複:重複活動標籤的機率
lt_dependency:向樹添加隨機依賴的機率
不頻繁:做出選擇具有不頻繁路徑的機率
no_models:從模型群體產生的樹的數量
展開:是否展開循環以便在依賴項中包含下面的選擇:0=False,1=True
max_repeat:迴圈的最大重複次數(僅當unfolding為True時使用)
輸出:「data/trees」資料夾中進程樹的集合:
Newick 樹格式 (*.nw)
流程樹標記語言 (*.ptml)
(可選)影像檔案 (*.png)
用法:可從命令列呼叫:
$pythongenerate_newick_trees.py [-h] [--t [超時]] [--g [graphviz]] 輸入
從輸入群體產生流程樹。
位置參數:
輸入:輸入 csv 格式的文件,其中指定了總體參數,例如:../data/parameter_files/example_parameters.csv
可選參數:
-h, --help : 顯示此說明訊息並退出
--t 逾時秒後中止樹生成,預設=10000
--g 表示是否渲染樹的graphviz影像,預設=False
輸入:
newick 樹檔案中的進程樹
size:事件日誌中的追蹤數
噪音:插入噪音的機率
時間戳:包括時間戳(每個活動的開始和結束?)
輸出:XES 格式(預設)或 csv 檔案格式的事件日誌 'case_id', 'act_name'[,'start_time','end_time']
用法:可從命令列調用
呼叫外掛: $pythongenerate_logs.py [-h] [--i [input_folder]] [--t [timestamps]] [--f [format]] 大小噪聲
模擬進程樹中的事件日誌。
位置參數:
size:要模擬的跡線數量
噪音:將噪音插入跡線的機率
可選參數:
-h, --help : 顯示此說明訊息並退出
--i [input_folder] : 指定trees資料夾的相對位址,預設=../data/trees/
--t [timestamps] : 指示是否包含時間戳,預設=False
--f [format] : 指示日誌使用哪種格式:xes 或 csv,預設=xes
輸入:
進程樹範例(預設資料夾:../data/trees/)
目標確定性水平
(每個決策的)輸入節點的最大數量
最大間隔數(離散化數值)
每個日誌中產生的多個案例
*輸出:具有案例屬性的事件日誌樣本
*用法:執行generate_data_trees_and_logs.py並調整參數