Lisez-moi général
L'objectif principal de WDS-JniPMML-XLL est de fournir des évaluateurs de modèles pour Excel. En particulier, l’accès à l’évaluateur standard PMML constitue un point de départ, tant pour une utilisation que/ou pour une comparaison. Les versions ultérieures incluront d'autres spécifications de modèle et implémenteront d'autres évaluateurs.
Veuillez consulter les articles de documentation pour une brève introduction à l'utilisation.
Mis à part les autres évaluateurs, il existe un défi technique pour fournir un accès à l'évaluateur PMML standard, jpmml, qui est un langage de programmation croisé. Sous le capot, pour créer une interface Excel rapide et efficace qui isole l'utilisateur des détails techniques, les langages complémentaires habituels (C#/VB/VBA) doivent récupérer les données du classeur (en plusieurs colonnes et éventuellement plusieurs lignes), les transformer, appelez le jpmml en Java, puis renvoyez les données appropriées (avec éventuellement plusieurs colonnes et lignes) au classeur.
Cet effort n'empêche pas d'écrire un évaluateur PMML (ou de réécrire jpmml, ce qui peut être une bonne idée) dans un autre langage. Cependant, comme d'autres évaluateurs l'ont ajouté, une interface commune basée sur Excel fournit une base de comparaison.
Grâce à cette version, WDS-JniPMML-XLL fournit :
- Une paire de compléments Excel (XLL) et la prise en charge de VBA pour :
- Évaluation des modèles PMML
- En tant qu'appel de fonction Excel
- En utilisant l'implémentation standard de facto , jpmml.evaluator
- Utilisation des données d'entrée d'un tableau dans une feuille de calcul
Utilise des ListObjects exportables par XmlMap, mais fournit des outils pour faciliter- Peut évaluer une ou plusieurs observations (lignes) par appel
- Résultats renvoyés sous forme de sorties de fonction normales
- Avec des modèles pouvant être mis en cache pour plus d'efficacité
- Outils supplémentaires de gestion des données pour
- Importation/exportation d'ensembles de données composés HDF5
- Importer/Exporter des fichiers plats
- Gestion supplémentaire du module VBA
- Un wrapper Java de jpmml.evaluator
- Appelable depuis XLL via jni
- Testable de manière autonome à partir de la ligne de commande
Mais il peut être appelé via le complément Excel à l’aide de la JVM.- Les données d'entrée et de sortie peuvent être :
- Ensembles de données composés HDF5
- Fichiers plats
- En mémoire (comme lors d'un appel via jni)
- Un script de lancement et des exemples sont inclus
- WDS-JniPMML-XLL-Launch.bat : un script pour lancer une nouvelle instance Excel, exécutant les AddIns sans installer
- WDS-JniPMML-XLL-Test-Launch.bat : un script pour exécuter les compléments et l'exemple de classeur WDS-JniPMML-XLL-Test.xlsm
- test/data : Un ensemble de tests des cas PMML habituels
Quelques notes d'organisation du projet
- JniPMML-[AAA] : bibliothèques spécifiques au langage directement liées aux objectifs du projet
- Dans la mesure du possible et aussi proches que possible, les conventions et la structure de dénomination des codes restent similaires dans toutes les langues.
- WDS-[AAA] : bibliothèques d'utilitaires spécifiques au langage qui peuvent être utilisées indépendamment des bibliothèques JniPMML-[AAA]
- lib : produits finaux compilés pouvant être utilisés directement
- scripts : créer des scripts, pour la construction de documentation multilingue en particulier
Conditions préalables
- Excel 64 bits
Bien que, lors de la compilation, 32 bits pourraient éventuellement être ajoutés.- Accès au modèle objet du projet VBA (si vous utilisez les gestionnaires de module VBA
- HDF5 et HDFView
- Les bibliothèques HDF5 et HDFView sont requises lors de la compilation, mais la fonctionnalité pourrait être supprimée.
- Les fichiers jar fournis nécessitent qu'au moins HDFView soit sur le chemin ou sur le chemin transmis comme option de ligne de commande lors du démarrage d'Excel.
- Javajdk-12
Requis lors de l'utilisation de la dernière installation de HDFView.- Environnement de compilation
Les configurations github concernent Visual Studio Community Edition et Intellij Community Edition.- DocFx
DocFx est utilisé pour la construction de la documentation, y compris DocFxDoclet du côté JavaDoc.
Remarque sur la licence
Toutes les contributions de code et les développements de Wypasek Data Science, Inc. (WDataSci) publiés sur son site public github sont publiés sous la licence MIT. Le code provenant d'autres sources est noté comme tel, et tous les assemblys, XLL et/ou fichiers JAR pouvant contenir d'autres logiciels (par exemple, comme Maven ou ExcelDna d'Apache peuvent être regroupés à partir d'autres sources) sont publiés avec le projet IDE couramment utilisé et/ ou les fichiers de solution utilisés pour les générer.