Léame general
El objetivo principal de WDS-JniPMML-XLL es proporcionar evaluadores de modelos para Excel. En particular, el acceso al evaluador PMML estándar es un punto de partida, tanto para su uso como para su comparación. Las versiones posteriores incluirán otras especificaciones del modelo e implementarán otros evaluadores.
Consulte los artículos de documentación para obtener una breve introducción sobre su uso.
Aparte de otros evaluadores, existe un desafío técnico para proporcionar acceso al evaluador PMML estándar, jpmml, que son lenguajes de programación cruzada. En el fondo, para crear una interfaz de Excel rápida y eficiente que aísle al usuario de los detalles técnicos, los lenguajes complementarios habituales (C#/VB/VBA) deben tomar datos del libro (en varias columnas y posiblemente varias filas), transformarlos, Llame a jpmml en Java y luego devuelva los datos apropiados (posiblemente con varias columnas y filas) al libro de trabajo.
Este esfuerzo no impide escribir un evaluador PMML (o reescribir jpmml, lo que puede ser una buena idea) en otro idioma. Sin embargo, como se agregaron otros evaluadores, una interfaz común basada en Excel proporciona una base para la comparación.
A través de esta versión, WDS-JniPMML-XLL proporciona:
- Un par de complementos de Excel (XLL) y compatibilidad con VBA para:
- Evaluación de modelos PMML
- Como una llamada de función de Excel
- Usando la implementación estándar de facto , jpmml.evaluator
- Usar datos de entrada de una tabla en la hoja de trabajo
Utiliza ListObjects exportables con XmlMap, pero proporciona herramientas para facilitar- Puede evaluar una o varias observaciones (filas) por llamada
- Los resultados se devuelven como salidas de funciones normales.
- Con modelos almacenables en caché para mayor eficiencia
- Herramientas adicionales de manipulación de datos para
- Importación/exportación de conjuntos de datos compuestos HDF5
- Importar/exportar archivos planos
- Manejo de módulos VBA adicionales
- Un contenedor Java de jpmml.evaluator
- Invocable desde XLL a través de jni
- Comprobable de forma independiente desde la línea de comando
Pero se puede llamar a través del complemento de Excel utilizando la JVM.- Los datos de entrada y salida pueden ser:
- Conjuntos de datos compuestos HDF5
- Archivos planos
- En la memoria (como cuando se llama a través de jni)
- Se incluye un script de inicio y ejemplos.
- WDS-JniPMML-XLL-Launch.bat: un script para iniciar una nueva instancia de Excel y ejecutar los complementos sin instalar
- WDS-JniPMML-XLL-Test-Launch.bat: un script para ejecutar los complementos y el libro de ejemplo WDS-JniPMML-XLL-Test.xlsm
- prueba/datos: un conjunto de pruebas de los casos habituales de PMML
Algunas notas sobre la organización del proyecto
- JniPMML-[AAA]: bibliotecas específicas del idioma que se relacionan directamente con los objetivos del proyecto
- Siempre que sea posible y lo más parecido posible, las convenciones y la estructura de nomenclatura de códigos se mantienen similares en todos los idiomas.
- WDS-[AAA]: bibliotecas de utilidades específicas del idioma que se pueden utilizar independientemente de las bibliotecas JniPMML-[AAA]
- lib: productos finales compilados que podrían usarse directamente
- scripts: crear scripts, en particular para la creación de documentación en varios idiomas
Requisitos previos
- Excel de 64 bits
Aunque, si se compila, es posible agregar 32 bits.- Acceso al modelo de objetos del proyecto VBA (si se utilizan los controladores del módulo VBA
- HDF5 y HDFView
- Las bibliotecas HDF5 y HDFView son necesarias al compilar, pero la funcionalidad podría eliminarse.
- Los archivos jar proporcionados requieren que al menos HDFView esté en la ruta o en la ruta pasada como una opción de línea de comando al iniciar Excel.
- java jdk-12
Requerido cuando se utiliza la última instalación de HDFView.- Entorno de compilación
Las configuraciones de github son para Visual Studio Community Edition y Intellij Community Edition.- DocFx
DocFx se utiliza para la compilación de la documentación, incluido DocFxDoclet en el lado de JavaDoc.
Nota de licencia
Todas las contribuciones y el desarrollo de código de Wypasek Data Science, Inc. (WDataSci) publicados en su sitio público github se publican bajo la licencia MIT. El código de otras fuentes se indica como tal, y cualquier ensamblado, XLL y/o jar que pueda contener otro software (por ejemplo, Maven de Apache o ExcelDna pueden agruparse desde otras fuentes) se publican junto con el proyecto IDE de uso común y/o o archivos de solución utilizados para generarlos.