英式鋸
概述
Tablesaw是一個資料框架和視覺化函式庫,支援載入、清理、轉換、過濾和匯總資料。如果您使用 Java 處理數據,它可能會節省您的時間和精力。 Tablesaw 還支援描述性統計,可用於準備數據,以便與 Smile、Tribuo、H20.ai、DL4J 等機器學習庫一起使用。
桌鋸特點
資料處理與轉換
- 從 RDBMS、Excel、CSV、TSV、JSON、HTML 或固定寬度文字檔案匯入數據,無論它們是本地還是遠端(http、S3 等)
- 將資料匯出到 CSV、JSON、HTML 或固定寬度檔案。
- 透過附加或連接來合併表
- 新增和刪除列或行
- 排序、分組、篩選、編輯、轉置等
- 映射/歸約操作
- 處理缺失值
視覺化
Tablesaw 透過為 Plot.ly JavaScript 繪圖庫提供包裝器來支援資料視覺化。以下是新庫的一些實際應用範例。
統計數據
- 描述性統計:平均值、最小值、最大值、中位數、總和、乘積、標準差、變異數、百分位數、幾何平均值、偏度、峰度等。
入門
將 tablesaw-core 新增至您的專案中。您可以在發行說明中找到最新版本的版本號碼:
< dependency >
< groupId >tech.tablesaw</ groupId >
< artifactId >tablesaw-core</ artifactId >
< version >VERSION_NUMBER_GOES_HERE</ version >
</ dependency >
您也可以新增支援項目:
-
tablesaw-beakerx
- 用於在 BeakerX 內使用 Tablesaw -
tablesaw-excel
- 用於使用 Excel 工作簿 tablesaw-html
- 用於使用 HTML-
tablesaw-json
- 用於使用 JSON -
tablesaw-jsplot
- 用於建立圖表
外部支持項目 -本組織之外:
- Tablesaw-parquet - 用於在 Tablesaw 中使用 Apache Parquet 檔案格式(報表問題)
文件和支援
- 從這裡開始:https://jtablesaw.github.io/tablesaw/gettingstarted
- 然後查看我們的文件頁面:https://jtablesaw.github.io/tablesaw/ 和 Tablesaw 使用者指南。
- 在新的 GitHub 討論論壇中提出問題、提出建議或告訴我們您如何使用 Tablesaw。
- 可以在問題標籤上提出功能請求和錯誤報告。
整合
Jupyter 筆記本
- 我們建議在 Jupyter Notebook 中嘗試 Tablesaw,這樣您可以以更具互動性的方式嘗試 Tablesaw。首先安裝 BeakerX 並嘗試範例 Tablesaw 筆記本
- 在 Jupyter Notebook 中使用 Tablesaw 的第二種方法是使用 IJava,它內建了對 Tablesaw 的支援。 Gary Sharpe 編寫了一個出色的教程,向您展示如何使用 Tablesaw 圖。 Gary 寫了許多其他以 Tablesaw 為特色的教學:
- 使用 Java 和 Jupyter 整理數據
- 使用 Tablesaw 的資料框 — JSON
- 使用 Tablesaw 的資料框 — CSV 文件
- 第三種方法是使用 Google Colab。同樣,Gary Sharpe 有一個很棒的教學:使用 Java 和 Google Colab 開始使用 Dataframes
其他集成
- 使用 Eclipse 可能會發現 etablesaw 很有用。它提供 Eclipse 集成,旨在將 Eclipse 轉變為資料工作台。
- 您可以將 Tablesaw 與許多機器學習庫結合使用。若要查看將 Tablesaw 與 Smile 結合使用的範例,請查看範例 Tablesaw Jupyter 筆記本
- 如果您想將 Quandl 中的金融和經濟數據載入到 Tablesaw 中,您可以使用 quandl4j-tablesaw。範例 Tablesaw 筆記本中也示範了這一點