一般自述文件
WDS-JniPMML-XLL 的主要目標是為 Excel 提供模型評估器。特別是,存取標準 PMML 評估器是使用和/或比較的起點。後續版本將包含其他模型規格並實現其他評估器。
使用簡單介紹請參考文件文章。
除了其他評估器之外,提供對標準 PMML 評估器 jpmml(跨程式語言)的存取還存在技術挑戰。在幕後,為了創建一個快速高效的Excel 介面,使用戶免受技術細節的影響,常用的插件語言(C#/VB/VBA) 必須從工作簿中獲取資料(多列,可能多行),對其進行轉換,在 Java 中呼叫 jpmml,然後將適當的資料(可能具有多個列和行)傳回工作簿。
這項工作並不排除用另一種語言編寫 PMML 評估器(或重寫 jpmml,這可能是個好主意)。然而,正如其他評估者所添加的那樣,基於通用 Excel 的介面提供了比較的基礎。
透過此版本,WDS-JniPMML-XLL 提供:
- 一對 Excel 外掛程式 (XLL) 和 VBA 支援:
- 評估 PMML 模型
- 作為 Excel 函數調用
- 使用事實上的標準實現,jpmml.evaluator
- 使用工作表內表中的輸入資料
使用 XmlMap 的可導出 ListObjects,但提供了一個方便的工具- 每次呼叫可以評估一個或多個觀察結果(行)
- 結果作為正常函數輸出返回
- 透過可緩存模型提高效率
- 額外的資料整理工具
- 匯入/匯出 HDF5 複合資料集
- 導入/匯出平面文件
- 附加 VBA 模組處理
- jpmml.evaluator 的 Java 包裝器
- 可透過 jni 從 XLL 調用
- 可從命令列獨立測試
但是,可以使用 JVM 透過 Excel AddIn 進行呼叫。- 輸入和輸出資料可以是:
- HDF5 複合資料集
- 平面文件
- 在記憶體中(透過 jni 調用時)
- 包含啟動腳本和範例
- WDS-JniPMML-XLL-Launch.bat:用於啟動新 Excel 實例的腳本,無需安裝即可執行 AddIn
- WDS-JniPMML-XLL-Test-Launch.bat:用於執行 AddIn 和範例工作簿 WDS-JniPMML-XLL-Test.xlsm 的腳本
- 測試/資料:常見 PMML 案例的測試集
一些專案組織說明
- JniPMML-[AAA]:與專案目標直接相關的語言特定程式庫
- 盡可能並儘可能接近的程式碼命名約定和結構在不同語言中保持相似。
- WDS-[AAA]:可以獨立於 JniPMML-[AAA] 程式庫使用的特定語言的實用程式庫
- lib:編譯後的最終產品,可以直接使用
- 腳本:製作腳本,特別是用於跨語言文件構建
先決條件
- 64 位元 Excel
不過,如果編譯的話,可能會增加 32 位元。- 存取 VBA 專案物件模型(如果使用 VBA 模組處理程序)
- HDF5 和 HDFView
- 編譯時需要 HDF5 和 HDFView 函式庫,但可以刪除該功能。
- 提供的 jar 至少需要 HDFView 位於啟動 Excel 時作為命令列選項傳入的路徑或路徑上
- Java jdk-12
使用最新的 HDFView 安裝時需要。- 編譯環境
github 配置適用於 Visual Studio Community Edition 和 Intellij Community Edition。- 文檔Fx
DocFx 用於文件構建,包括 JavaDoc 端的 DocFxDoclet。
許可說明
Wypasek Data Science, Inc. (WDataSci) 在其公共 github 網站上發布的所有程式碼貢獻和開發均根據 MIT 授權發布。來自其他來源的程式碼同樣如此註明,並且可能包含其他軟體的任何組件、XLL 和/或 jar(例如,Apache 的 Maven 或 ExcelDna 可能從其他來源捆綁)與常用的 IDE 專案和/一起發布或使用於生成它們的解決方案檔案。