Scie à table
Aperçu
Tablesaw est une bibliothèque de trames de données et de visualisation qui prend en charge le chargement, le nettoyage, la transformation, le filtrage et la synthèse des données. Si vous travaillez avec des données en Java, cela peut vous faire gagner du temps et des efforts. Tablesaw prend également en charge les statistiques descriptives et peut être utilisé pour préparer des données afin de travailler avec des bibliothèques d'apprentissage automatique telles que Smile, Tribuo, H20.ai, DL4J.
Caractéristiques de la scie à table
Traitement et transformation des données
- Importez des données à partir de fichiers texte SGBDR, Excel, CSV, TSV, JSON, HTML ou à largeur fixe, qu'ils soient locaux ou distants (http, S3, etc.)
- Exportez les données vers des fichiers CSV, JSON, HTML ou à largeur fixe.
- Combinez des tableaux en ajoutant ou en joignant
- Ajouter et supprimer des colonnes ou des lignes
- Trier, regrouper, filtrer, modifier, transposer, etc.
- Opérations Mapper/Réduire
- Gérer les valeurs manquantes
Visualisation
Tablesaw prend en charge la visualisation des données en fournissant un wrapper pour la bibliothèque de traçage JavaScript Plot.ly. Voici quelques exemples de la nouvelle bibliothèque en action.
Statistiques
- Statistiques descriptives : moyenne, min, max, médiane, somme, produit, écart type, variance, centiles, moyenne géométrique, asymétrie, aplatissement, etc.
Commencer
Ajoutez tableaw-core à votre projet. Vous pouvez trouver le numéro de version de la dernière version dans les notes de version :
< dependency >
< groupId >tech.tablesaw</ groupId >
< artifactId >tablesaw-core</ artifactId >
< version >VERSION_NUMBER_GOES_HERE</ version >
</ dependency >
Vous pouvez également ajouter des projets de soutien :
-
tablesaw-beakerx
- pour utiliser Tablesaw dans BeakerX -
tablesaw-excel
- pour utiliser les classeurs Excel -
tablesaw-html
- pour utiliser HTML -
tablesaw-json
- pour utiliser JSON -
tablesaw-jsplot
- pour créer des graphiques
Projets de soutien externes - en dehors de cette organisation :
- tablesaw-parquet - pour utiliser le format de fichier Apache Parquet avec Tablesaw (signaler un problème)
Documentation et assistance
- Commencez ici : https://jtablesaw.github.io/tablesaw/gettingstarted
- Consultez ensuite notre page de documentation : https://jtablesaw.github.io/tablesaw/ et le guide de l'utilisateur de Tablesaw.
- Posez des questions, faites des suggestions ou dites-nous comment vous utilisez Tablesaw dans le nouveau forum de discussion GitHub.
- Les demandes de fonctionnalités et les rapports de bogues peuvent être effectués dans l'onglet Problèmes.
Intégrations
Cahiers Jupyter
- Nous vous recommandons d'essayer Tablesaw dans les notebooks Jupyter, qui vous permet d'expérimenter Tablesaw de manière plus interactive. Commencez par installer BeakerX et essayez l'exemple de bloc-notes Tablesaw
- Une deuxième façon d'utiliser Tablesaw dans les notebooks Jupyter consiste à utiliser IJava, qui prend en charge Tablesaw. Gary Sharpe a écrit un excellent didacticiel qui vous montre comment utiliser les tracés Tablesaw. Gary a écrit un certain nombre d'autres didacticiels présentant Tablesaw :
- Organiser les données avec Java et Jupyter
- Dataframes avec Tablesaw - JSON
- Dataframes avec Tablesaw - Fichiers CSV
- Une troisième approche consiste à utiliser Google Colab. Encore une fois, Gary Sharpe propose un excellent tutoriel : Premiers pas avec les Dataframes utilisant Java et Google Colab
Autres intégrations
- Les utilisations d'Eclipse peuvent trouver etablesaw utiles. Il fournit une intégration Eclipse visant à transformer Eclipse en un atelier de données.
- Vous pouvez utiliser Tablesaw avec de nombreuses bibliothèques d'apprentissage automatique. Pour voir un exemple d'utilisation de Tablesaw avec Smile, consultez l'exemple de bloc-notes Tablesaw Jupyter.
- Vous pouvez utiliser quandl4j-tablesaw si vous souhaitez charger des données financières et économiques de Quandl dans Tablesaw. Ceci est également démontré dans l'exemple de bloc-notes Tablesaw.