テーブルソー
概要
Tablesaw は、データのロード、クリーニング、変換、フィルタリング、要約をサポートするデータフレームおよび視覚化ライブラリです。 Java でデータを操作する場合、時間と労力を節約できる可能性があります。 Tablesaw は記述統計もサポートしており、Smile、Tribuo、H20.ai、DL4J などの機械学習ライブラリを操作するためのデータを準備するために使用できます。
テーブルソーの特徴
データの処理と変換
- ローカルまたはリモート (http、S3 など) に関係なく、RDBMS、Excel、CSV、TSV、JSON、HTML、または固定幅テキスト ファイルからデータをインポートします。
- データを CSV、JSON、HTML、または固定幅ファイルにエクスポートします。
- 追加または結合してテーブルを結合する
- 列または行の追加と削除
- 並べ替え、グループ化、フィルター、編集、転置など。
- マップ/リデュース操作
- 欠損値の処理
視覚化
Tablesaw は、Plot.ly JavaScript プロット ライブラリのラッパーを提供することにより、データの視覚化をサポートします。新しいライブラリが実際に動作している例をいくつか紹介します。
統計
- 記述統計: 平均、最小、最大、中央値、合計、積、標準偏差、分散、パーセンタイル、幾何平均、歪度、尖度など。
はじめる
tablesaw-core をプロジェクトに追加します。最新リリースのバージョン番号は、リリース ノートで確認できます。
< dependency >
< groupId >tech.tablesaw</ groupId >
< artifactId >tablesaw-core</ artifactId >
< version >VERSION_NUMBER_GOES_HERE</ version >
</ dependency >
サポートするプロジェクトを追加することもできます。
-
tablesaw-beakerx
- BeakerX 内で Tablesaw を使用するための tablesaw-excel
- Excel ワークブックを使用するためのtablesaw-html
- HTML を使用するためのtablesaw-json
- JSON を使用するためtablesaw-jsplot
- グラフの作成用
外部支援プロジェクト -この組織の外:
- tablesaw-parquet - Tablesaw で Apache Parquet ファイル形式を使用する場合 (レポートの問題)
ドキュメントとサポート
- ここから始めてください: https://jtablesaw.github.io/tablesaw/gettingstarted
- 次に、ドキュメント ページ: https://jtablesaw.github.io/tablesaw/ および Tablesaw ユーザー ガイドを参照してください。
- 新しい GitHub ディスカッション フォーラムで、質問したり、提案したり、Tablesaw をどのように使用しているかを教えてください。
- 機能リクエストとバグレポートは、[問題] タブで行うことができます。
統合
ジュピター ノートブック
- Jupyter ノートブック内で Tablesaw を試してみることをお勧めします。これにより、よりインタラクティブな方法で Tablesaw を試すことができます。まず、BeakerX をインストールし、サンプルの Tablesaw ノートブックを試してください。
- Jupyter ノートブック内で Tablesaw を使用する 2 番目の方法は、Tablesaw のサポートが組み込まれている IJava を使用する方法です。 Gary Sharpe は、Tablesaw プロットの使用方法を示す優れたチュートリアルを作成しました。 Gary は、Tablesaw を取り上げた他にも多くのチュートリアルを作成しています。
- Java と Jupyter でデータを整頓
- Tablesaw を使用したデータフレーム — JSON
- Tablesaw を使用したデータフレーム — CSV ファイル
- 3 番目のアプローチは、Google Colab を使用することです。繰り返しになりますが、Gary Sharpe が優れたチュートリアルを提供しています:Getting Started with Dataframes using Java and Google Colab
その他の統合
- Eclipse を使用すると etablesaw が便利になる場合があります。 Eclipse をデータ ワークベンチに変えることを目的とした Eclipse 統合を提供します。
- Tablesaw は多くの機械学習ライブラリとともに利用できます。 Smile で Tablesaw を使用する例を確認するには、サンプルの Tablesaw Jupyter ノートブックをチェックしてください。
- 財務および経済データを Quandl から Tablesaw にロードしたい場合は、quandl4j-tablesaw を使用できます。これは、サンプル Tablesaw ノートブックでも実証されています。