ランダムなプロセス ツリーを生成し、これらのツリーをイベント ログにシミュレートするスクリプトを提供します。
ジェネレーターとシミュレーターの仕組みの詳細については、Jouck、Toon、Benoit Depaire の論文を参照してください。 「PTandLogGenerator: 人工イベント データのジェネレーター」 BPM デモ トラック 2016 の議事録 (BPMD 2016)、1789:23–27。リオデジャネイロ: CEUR ワークショップ議事録、2016 年。http://ceur-ws.org/Vol-1789/。
入力: 母集団のパラメータ ファイル (パラメータ ファイルの例は「/data/parameter_files」フォルダにあります)。
CSV ファイルの各行は、1 つの母集団を特徴付けます: モード;最小;最大;シーケンス;選択;並列;ループ;または;サイレント;重複;lt_dependency;infrequent;no_models;unfold;max_repeat
lt_dependency <= 0 の場合: これは常に 0 (False) である必要があります。
lt_dependency > 0 の場合: 1 または 0 (True または False) になります。
モード: 表示されるアクティビティの最も頻繁な数
min: 表示されるアクティビティの最小数
max: 表示されるアクティビティの最大数
sequence: シーケンス演算子をツリーに追加する確率
Choice: 選択演算子をツリーに追加する確率
並列: 並列演算子をツリーに追加する確率
ループ: ループ演算子をツリーに追加する確率
or: or 演算子をツリーに追加する確率
サイレント: サイレント アクティビティを選択演算子またはループ演算子に追加する確率
重複: アクティビティラベルが重複する確率
lt_dependency: ツリーにランダムな依存関係を追加する確率
低頻度: 選択を行う確率が低頻度のパスを持つ
no_models: モデル母集団から生成するツリーの数
展開: 依存関係の下に選択肢を含めるためにループを展開するかどうか: 0=False、1=True
max_repeat: ループの最大繰り返し数 (展開が True の場合にのみ使用されます)
出力: 「data/trees」フォルダー内のプロセス ツリーのコレクション:
newick ツリー形式 (*.nw)
プロセス ツリー マークアップ言語 (*.ptml)
(オプション) 画像ファイル (*.png)
使用法: コマンドラインから呼び出し可能:
$pythongenerate_newick_trees.py [-h] [--t [タイムアウト]] [--g [graphviz]] 入力
入力母集団からプロセス ツリーを生成します。
位置引数:
input: 入力パラメータが指定されている入力 csv 形式のファイル、例: ../data/parameter_files/example_parameters.csv
オプションの引数:
-h, --help : このヘルプ メッセージを表示して終了します
--t タイムアウト秒後にツリー生成を中止します、デフォルト = 10000
--g はツリーの graphviz イメージをレンダリングするかどうかを示します。デフォルト = False
入力:
newick ツリー ファイル内のプロセス ツリー
サイズ: イベント ログ内のトレースの数
ノイズ: ノイズが挿入される確率
タイムスタンプ: タイムスタンプを含めます (各アクティビティの開始と終了?)
出力: XES 形式 (デフォルト) または CSV ファイル形式のイベント ログ 'case_id', 'act_name'[,'start_time','end_time']
使用法: コマンドラインから呼び出し可能
呼び出しプラグイン: $pythongenerate_logs.py [-h] [--i [input_folder]] [--t [timestamps]] [--f [format]] サイズ ノイズ
プロセス ツリーからイベント ログをシミュレートします。
位置引数:
size: シミュレートするトレースの数
ノイズ: トレースにノイズが挿入される確率
オプションの引数:
-h, --help : このヘルプ メッセージを表示して終了します
--i [input_folder] :trees フォルダーへの相対アドレスを指定します。デフォルト = ../data/trees/
--t [タイムスタンプ] : タイムスタンプを含めるかどうかを示します。デフォルト = False
--f [形式] : ログに使用する形式を指定します: xes または csv、デフォルト=xes
入力:
プロセス ツリーのサンプル (デフォルトのフォルダー: ../data/trees/)
目標決定レベル
(各決定の) 入力ノードの最大数
間隔の最大数 (数値を離散化するため)
各ログに生成するケースの数
*出力: ケース属性を含むイベント ログのサンプル
*使用法:generate_data_trees_and_logs.py を実行し、パラメーターを調整します。