Allgemeine ReadMe
Das Hauptziel von WDS-JniPMML-XLL besteht darin, Modellevaluatoren für Excel bereitzustellen. Insbesondere der Zugriff auf den Standard-PMML-Evaluator ist ein Ausgangspunkt, sowohl für die Nutzung als auch für den Vergleich. Spätere Versionen werden andere Modellspezifikationen enthalten und andere Evaluatoren implementieren.
Eine kurze Einführung in die Verwendung finden Sie in den Dokumentationsartikeln.
Abgesehen von anderen Evaluatoren besteht eine technische Herausforderung darin, den Zugriff auf den Standard-PMML-Evaluator jpmml bereitzustellen, der sprachenübergreifend ist. Unter der Haube müssen die üblichen Add-in-Sprachen (C#/VB/VBA) Daten aus der Arbeitsmappe übernehmen (in mehreren Spalten und möglicherweise mehreren Zeilen), sie umwandeln, um eine schnelle, effiziente Excel-Schnittstelle zu erstellen, die den Benutzer von den technischen Details isoliert. Rufen Sie jpmml in Java auf und geben Sie dann die entsprechenden Daten (mit möglicherweise mehreren Spalten und Zeilen) an die Arbeitsmappe zurück.
Dieser Aufwand schließt nicht aus, einen PMML-Evaluator in einer anderen Sprache zu schreiben (oder jpmml neu zu schreiben, was eine gute Idee sein kann). Wie andere Gutachter jedoch auch hinzufügen, bietet eine gemeinsame Excel-basierte Schnittstelle eine Vergleichsbasis.
Durch diese Version bietet WDS-JniPMML-XLL:
- Ein Paar Excel-AddIns (XLLs) und VBA-Unterstützung für:
- Evaluierung von PMML-Modellen
- Als Excel-Funktionsaufruf
- Verwendung der De-facto- Standardimplementierung jpmml.evaluator
- Verwenden von Eingabedaten aus einer In-Worksheet-Tabelle
Verwendet XmlMap-exportierbare ListObjects, stellt jedoch Tools zur Erleichterung bereit- Kann pro Aufruf eine oder mehrere Beobachtungen (Zeilen) auswerten
- Ergebnisse, die als normale Funktionsausgaben zurückgegeben werden
- Mit zwischenspeicherbaren Modellen für mehr Effizienz
- Zusätzliche Datenverarbeitungstools für
- Importieren/Exportieren von zusammengesetzten HDF5-Datensätzen
- Importieren/Exportieren von Flatfiles
- Zusätzliche Handhabung von VBA-Modulen
- Ein Java-Wrapper von jpmml.evaluator
- Aus der XLL über jni aufrufbar
- Als Standalone-Version über die Befehlszeile testbar
Kann aber über das Excel-Add-In mit der JVM aufgerufen werden.- Eingabe- und Ausgabedaten können sein:
- HDF5-Verbunddatensätze
- Flache Dateien
- Im Speicher (wie beim Aufruf über jni)
- Ein Startskript und Beispiele sind enthalten
- WDS-JniPMML-XLL-Launch.bat: ein Skript zum Starten einer neuen Excel-Instanz, wobei die AddIns ohne Installation ausgeführt werden
- WDS-JniPMML-XLL-Test-Launch.bat: ein Skript zum Ausführen der AddIns und der Beispielarbeitsmappe WDS-JniPMML-XLL-Test.xlsm
- test/data: Ein Testsatz der üblichen PMML-Fälle
Ein paar Hinweise zur Projektorganisation
- JniPMML-[AAA]: Sprachspezifische Bibliotheken, die sich direkt auf die Projektziele beziehen
- Wo immer möglich und so nah wie möglich werden die Konventionen und die Struktur der Codenamen in allen Sprachen ähnlich gehalten.
- WDS-[AAA]: Sprachspezifische Hilfsbibliotheken, die unabhängig von den JniPMML-[AAA]-Bibliotheken verwendet werden können
- lib: kompilierte Endprodukte, die direkt verwendet werden können
- Skripte: Erstellen Sie Skripte, insbesondere für die sprachübergreifende Dokumentationserstellung
Voraussetzungen
- 64-Bit-Excel
Allerdings könnten beim Kompilieren möglicherweise 32 Bit hinzugefügt werden.- Zugriff auf das VBA-Projektobjektmodell (bei Verwendung der VBA-Modulhandler).
- HDF5 und HDFView
- Beim Kompilieren sind die HDF5- und HDFView-Bibliotheken erforderlich, die Funktionalität könnte jedoch entfernt werden.
- Für die bereitgestellten JAR-Dateien muss sich mindestens HDFView im Pfad befinden oder der Pfad muss beim Starten von Excel als Befehlszeilenoption übergeben werden
- Java jdk-12
Erforderlich bei Verwendung der neuesten HDFView-Installation.- Kompilierungsumgebung
Die Github-Konfigurationen gelten für Visual Studio Community Edition und Intellij Community Edition.- DocFx
DocFx wird für den Dokumentationsaufbau verwendet, einschließlich DocFxDoclet auf der JavaDoc-Seite.
Lizenzhinweis
Alle Codebeiträge und Entwicklungen von Wypasek Data Science, Inc. (WDataSci), die auf seiner öffentlichen Github-Site veröffentlicht werden, werden unter der MIT-Lizenz veröffentlicht. Code aus anderen Quellen wird als solcher gekennzeichnet, und alle Assemblys, XLLs und/oder Jars, die möglicherweise andere Software enthalten (z. B. Maven oder ExcelDna von Apache aus anderen Quellen), werden zusammen mit dem häufig verwendeten IDE-Projekt und/oder veröffentlicht. oder Lösungsdateien, die zu ihrer Generierung verwendet wurden.