Tischkreissäge
Überblick
Tablesaw ist eine Datenrahmen- und Visualisierungsbibliothek, die das Laden, Bereinigen, Transformieren, Filtern und Zusammenfassen von Daten unterstützt. Wenn Sie mit Daten in Java arbeiten, können Sie Zeit und Mühe sparen. Tablesaw unterstützt auch deskriptive Statistiken und kann zur Vorbereitung von Daten für die Arbeit mit Bibliotheken für maschinelles Lernen wie Smile, Tribuo, H20.ai und DL4J verwendet werden.
Funktionen der Tischkreissäge
Datenverarbeitung und -transformation
- Importieren Sie Daten aus RDBMS-, Excel-, CSV-, TSV-, JSON-, HTML- oder Textdateien mit fester Breite, unabhängig davon, ob sie lokal oder remote sind (http, S3 usw.).
- Exportieren Sie Daten in CSV-, JSON-, HTML- oder Dateien mit fester Breite.
- Kombinieren Sie Tabellen durch Anhängen oder Verknüpfen
- Spalten oder Zeilen hinzufügen und entfernen
- Sortieren, gruppieren, filtern, bearbeiten, transponieren usw.
- Operationen zuordnen/reduzieren
- Behandeln Sie fehlende Werte
Visualisierung
Tablesaw unterstützt die Datenvisualisierung, indem es einen Wrapper für die JavaScript-Plotbibliothek Plot.ly bereitstellt. Hier sind einige Beispiele der neuen Bibliothek in Aktion.
Statistiken
- Beschreibende Statistiken: Mittelwert, Minimum, Maximum, Median, Summe, Produkt, Standardabweichung, Varianz, Perzentile, geometrisches Mittel, Schiefe, Kurtosis usw.
Erste Schritte
Fügen Sie tableaw-core zu Ihrem Projekt hinzu. Die Versionsnummer für die neueste Version finden Sie in den Versionshinweisen:
< dependency >
< groupId >tech.tablesaw</ groupId >
< artifactId >tablesaw-core</ artifactId >
< version >VERSION_NUMBER_GOES_HERE</ version >
</ dependency >
Sie können auch unterstützende Projekte hinzufügen:
-
tablesaw-beakerx
– zur Verwendung von Tablesaw in BeakerX -
tablesaw-excel
– zur Verwendung von Excel-Arbeitsmappen -
tablesaw-html
– für die Verwendung von HTML -
tablesaw-json
– zur Verwendung von JSON -
tablesaw-jsplot
– zum Erstellen von Diagrammen
Externe Unterstützungsprojekte – außerhalb dieser Organisation :
- tablesaw-parquet – zur Verwendung des Apache Parquet-Dateiformats mit Tablesaw (Problem melden)
Dokumentation und Support
- Beginnen Sie hier: https://jtablesaw.github.io/tablesaw/gettingstarted
- Dann sehen Sie sich unsere Dokumentationsseite an: https://jtablesaw.github.io/tablesaw/ und das Tablesaw-Benutzerhandbuch.
- Stellen Sie Fragen, machen Sie Vorschläge oder erzählen Sie uns im neuen GitHub-Diskussionsforum, wie Sie Tablesaw verwenden.
- Funktionsanfragen und Fehlerberichte können auf der Registerkarte „Probleme“ gestellt werden.
Integrationen
Jupyter-Notizbücher
- Wir empfehlen, Tablesaw in Jupyter-Notebooks auszuprobieren, damit Sie interaktiver mit Tablesaw experimentieren können. Beginnen Sie mit der Installation von BeakerX und testen Sie das Beispiel-Tablesaw-Notebook
- Eine zweite Möglichkeit, Tablesaw in Jupyter-Notebooks zu verwenden, ist IJava, das über eine integrierte Unterstützung für Tablesaw verfügt. Gary Sharpe hat ein hervorragendes Tutorial geschrieben, das Ihnen zeigt, wie Sie Tablesaw-Plots verwenden. Gary hat eine Reihe anderer Tutorials geschrieben, in denen Tablesaw zum Einsatz kommt:
- Aufgeräumte Daten mit Java & Jupyter
- Datenrahmen mit Tablesaw – JSON
- Datenrahmen mit Tablesaw – CSV-Dateien
- Ein dritter Ansatz ist die Verwendung von Google Colab. Auch hier hat Gary Sharpe ein hervorragendes Tutorial: Erste Schritte mit Dataframes unter Verwendung von Java und Google Colab
Andere Integrationen
- Eclipse-Anwendungen können Etablesaw nützlich finden. Es bietet eine Eclipse-Integration mit dem Ziel, Eclipse in eine Daten-Workbench zu verwandeln.
- Sie können Tablesaw mit vielen Bibliotheken für maschinelles Lernen verwenden. Ein Beispiel für die Verwendung von Tablesaw mit Smile finden Sie im Beispiel-Notizbuch Tablesaw Jupyter
- Sie können quandl4j-tablesaw verwenden, wenn Sie Finanz- und Wirtschaftsdaten aus Quandl in Tablesaw laden möchten. Dies wird auch im Beispiel-Tablesaw-Notizbuch demonstriert