databooks
est un package destiné à faciliter la collaboration entre les data scientists utilisant des notebooks Jupyter, en réduisant le nombre de conflits git entre différents notebooks et en résolvant les conflits git lorsqu'ils sont rencontrés.
Les principales caractéristiques comprennent :
databooks
sont construits sur :
pip install databooks
Spécifiez simplement les chemins des fichiers du bloc-notes pour supprimer les métadonnées. Ce faisant, nous pouvons déjà éviter de nombreux conflits.
$ databooks meta [OPTIONS] PATHS...
Spécifiez les chemins d'accès des fichiers de bloc-notes présentant des conflits à corriger. Ensuite, databooks
trouve les notebooks sources qui ont provoqué les conflits et les compare (donc pas de manipulation JSON !)
$ databooks fix [OPTIONS] PATHS...
Spécifiez les chemins des blocs-notes à vérifier, une expression ou une recette de ce que vous souhaitez appliquer. databooks
exécuteront vos vérifications et généreront des erreurs si un bloc-notes n'est pas conforme aux valeurs de métadonnées souhaitées. Cette fonctionnalité avancée permet aux utilisateurs d'appliquer des balises de cellules, l'exécution séquentielle des cellules, le nombre maximum de cellules, entre autres choses !
Consultez nos documents pour en savoir plus !
$ databooks assert [OPTIONS] PATHS...
Au lieu de lancer Jupyter et d’ouvrir le navigateur pour inspecter les notebooks, jetez-y un coup d’œil rapide dans le terminal. Il vous suffit de spécifier le(s) chemin(s) du(des) notebook(s).
$ databooks show [OPTIONS] PATHS...
Similaire à git diff, mais pour les notebooks ! Afficher une riche différence des notebooks dans le terminal. Fonctionne pour comparer l'index git avec le répertoire de travail actuel, en comparant les branches ou les blobs.
$ databooks diff [OPTIONS] [REF_BASE] [REF_REMOTE] [PATHS]...
Ce projet est sous licence selon les termes de la licence MIT.