Ce référentiel contient le code source de la thèse Generative AI for Business Process Management - Suitability of Modalities
. L'objectif est d'évaluer la faisabilité de créer des modèles de processus à partir de documents multimodaux avec une IA générative. Le référentiel utilise du code et des données du référentiel SAP SAM.
L'exemple de code dans ce référentiel est sous licence comme suit. Notez qu’une licence différente s’applique à l’ensemble de données lui-même !
Copyright (c) 2024 by SAP.
Licensed under the Apache License, Version 2.0 (the "License");
you may not use this file except in compliance with the License.
You may obtain a copy of the License at
http://www.apache.org/licenses/LICENSE-2.0
Unless required by applicable law or agreed to in writing, software
distributed under the License is distributed on an "AS IS" BASIS,
WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
See the License for the specific language governing permissions and
limitations under the License.
La licence suivante s'applique à l'ensemble de données dans le dossier de données.
Copyright (c) 2024 by SAP.
SAP grants to Recipient a non-exclusive copyright license to the Model Collection to use the Model Collection for Non-Commercial Research purposes of evaluating Recipient’s algorithms or other academic research artefacts against the Model Collection. Any rights not explicitly granted herein are reserved to SAP. For the avoidance of doubt, no rights to make derivative works of the Model Collection is granted and the license granted hereunder is for Non-Commercial Research purposes only.
"Model Collection" shall mean all files in the archive (which are JSON, XML, or other representation of business process models or other models).
"Recipient" means any natural person receiving the Model Collection.
"Non-Commercial Research" means research solely for the advancement of knowledge whether by a university or other learning institution and does not include any commercial or other sales objectives.
Des informations détaillées, y compris les composants tiers et leurs informations de licence/droit d'auteur, sont disponibles via l'outil REUSE.
Nous fournissons deux fichiers conda environnement.yml qui peuvent être utilisés pour créer un nouvel environnement et installer les dépendances requises :
environment.yml
: contient les dépendances abstraites (pandas, numpy, ...).environment-lock.yml
: contient des versions pour toutes les dépendances et les dépendances transitives pour garantir des résultats reproductibles.Vous pouvez utiliser la commande conda suivante pour créer l'environnement :
conda env create -f environment.yml
ou
conda env create -f environment-lock.yml
Nous fournissons plusieurs notebooks Jupyter.
Le notebook Jupyter data_set_preparation fournit une présentation pas à pas de la création de l'ensemble de données.
Le notebook Jupyter explore_the_dataset donne des informations sur les caractéristiques de l'ensemble de données créé.
Le bpmn_genération Jupyter Notebook crée des modèles de processus à partir de documentations multimodales à l'aide de GPT-4V et d'invites à tir nul, à tir unique et à quelques tirs.
L'évaluation Jupyter Notebook introduit un cadre d'évaluation pour calculer les scores de similarité des modèles de processus générés et des modèles de vérité terrain. De plus, il applique le cadre et présente les résultats.
├── data
│ ├── examples <- Some example models for illustrating main ideas.
| └── sapsam
│ ├── cleaned <- The created dataset.
| ├── enriched <- Original SAP-SAM data set enriched by some meta data
| ├── evaluations <- Evaluation results
| ├── generated <- Generated process models
| ├── raw <- Original SAP-SAM data set
| └── tmp <- Temporary data
├── notebooks <- Jupyter notebooks.
├── src
| ├── multimodalgenai <- Source code for use in this project.
│ └── sapsam <- Adapted clone of the [SAP SAM repo](https://github.com/signavio/sap-sam)
├── LICENSE <- License that applies to the example code in this repository.
├── README.md <- The top-level README for developers using this project.
├── Thesis_Gen-AI-for-BPM-Modalities_Marvin-Voelter_v04_2024-03-21_final_blurred.pdf <- Thesis with more detailed explanations and thoughts
├── environment-lock.yml <- Contains versions for all dependencies and the transitive dependencies to ensure reproducible results.
├── environment.yml <- Contains the abstract dependencies (pandas, numpy, ...).
└── setup.py <- Makes project pip installable (pip install -e .) such that src can be imported.
Ce projet est ouvert aux demandes/suggestions de fonctionnalités, aux rapports de bogues, etc. via les problèmes GitHub. Les contributions et les commentaires sont encouragés et toujours les bienvenus. Pour plus d'informations sur la manière de contribuer, la structure du projet, ainsi que des informations supplémentaires sur les contributions, consultez nos directives de contribution.
En tant que membres, contributeurs et dirigeants, nous nous engageons à faire de la participation à notre communauté une expérience sans harcèlement pour tous. En participant à ce projet, vous acceptez de respecter son code de conduite à tout moment.