무작위 프로세스 트리를 생성하고 이러한 트리를 이벤트 로그로 시뮬레이션하는 스크립트를 제공합니다.
생성기 및 시뮬레이터의 작동에 대한 자세한 정보는 Jouck, Toon 및 Benoît Depaire 논문에서 찾을 수 있습니다. “PTandLogGenerator: 인공 이벤트 데이터 생성기.” BPM 데모 트랙 2016 간행물(BPMD 2016), 1789:23–27. 리우데자네이루: CEUR 워크숍 절차, 2016. http://ceur-ws.org/Vol-1789/.
입력: 모집단에 대한 매개변수 파일(예제 매개변수 파일은 '/data/parameter_files' 폴더에 있음)
csv 파일의 각 줄은 하나의 모집단을 특성화합니다. mode;min;max;sequence;choice;parallel;loop;or;silent;duplicate;lt_dependent;infrequent;no_models;unfold;max_repeat
lt_dependent <= 0인 경우: 항상 0이어야 합니다(False).
lt_dependent > 0인 경우: 1 또는 0일 수 있습니다(True 또는 False).
모드: 표시되는 활동의 가장 빈번한 수
min: 표시되는 활동의 최소 수
max: 표시되는 최대 활동 수
시퀀스: 트리에 시퀀스 연산자를 추가할 확률
선택: 트리에 선택 연산자를 추가할 확률
병렬: 트리에 병렬 연산자를 추가할 확률
loop: 루프 연산자를 트리에 추가할 확률
or: 트리에 or 연산자를 추가할 확률
자동: 선택 또는 루프 연산자에 자동 활동을 추가할 확률
중복: 활동 라벨이 중복될 확률
lt_dependent: 트리에 임의의 종속성을 추가할 확률
드물게: 선택을 할 확률이 드물게 발생하는 경로를 가집니다.
no_models: 모델 모집단에서 생성할 트리 수
전개: 종속성 아래에 선택 항목을 포함하기 위해 루프를 전개할지 여부: 0=거짓, 1=참
max_repeat: 루프의 최대 반복 횟수(펼침이 True인 경우에만 사용됨)
출력: 'data/trees' 폴더에 프로세스 트리 모음:
뉴윅 트리 형식(*.nw)
프로세스 트리 마크업 언어(*.ptml)
(선택) 이미지 파일(*.png)
사용법: 명령줄에서 호출 가능:
$python generate_newick_trees.py [-h] [--t [시간 초과]] [--g [graphviz]] 입력
입력 모집단에서 프로세스 트리를 생성합니다.
위치 인수:
입력: 모집단 매개변수가 지정된 입력 csv 형식 파일(예: ../data/parameter_files/example_parameters.csv)
선택적 인수:
-h, --help : 이 도움말 메시지를 표시하고 종료합니다.
--t 시간 초과(초) 후 트리 생성을 중단합니다. 기본값은 10000입니다.
--g는 나무의 graphviz 이미지를 렌더링할지 여부를 나타냅니다. 기본값은 False입니다.
입력:
뉴윅 트리 파일의 트리 처리
크기: 이벤트 로그의 추적 수
노이즈: 노이즈가 삽입될 확률
타임스탬프: 타임스탬프 포함(각 활동의 시작과 끝?)
출력: XES 형식(기본값) 또는 csv 파일 형식 'case_id', 'act_name'[,'start_time','end_time']의 이벤트 로그
사용법: 명령줄에서 호출 가능
호출 플러그인: $python generate_logs.py [-h] [--i [input_folder]] [--t [타임스탬프]] [--f [형식]] 크기 노이즈
프로세스 트리에서 이벤트 로그를 시뮬레이션합니다.
위치 인수:
크기: 시뮬레이션할 트레이스 수
노이즈: 트레이스에 노이즈를 삽입할 확률
선택적 인수:
-h, --help : 이 도움말 메시지를 표시하고 종료합니다.
--i [input_folder] : 나무 폴더에 대한 상대 주소를 지정합니다(기본값=../data/trees/).
--t [timestamps] : 타임스탬프 포함 여부를 나타냅니다. 기본값은 False입니다.
--f [형식] : 로그에 사용할 형식을 나타냅니다(xes 또는 csv, 기본값=xes).
입력:
프로세스 트리 샘플(기본 폴더: ../data/trees/)
목표 결정성 수준
(각 결정의) 최대 입력 노드 수
최대 간격 수(숫자 값을 이산화하기 위해)
각 로그에서 생성할 케이스 수
*출력: 케이스 속성이 포함된 이벤트 로그 샘플
*사용법: generate_data_trees_and_logs.py를 실행하고 매개변수를 조정하세요.