Общие сведения
Основная цель WDS-JniPMML-XLL — предоставить оценщики моделей для Excel. В частности, доступ к стандартному оценщику PMML является отправной точкой как для использования, так и для сравнения. Более поздние версии будут включать другие спецификации модели и реализовывать другие оценщики.
Пожалуйста, ознакомьтесь со статьями документации для краткого введения в использование.
Помимо других оценщиков, существует техническая проблема с предоставлением доступа к стандартному оценщику PMML, jpmml, который является языками кросс-программирования. Под капотом, чтобы создать быстрый и эффективный интерфейс Excel, изолирующий пользователя от технических деталей, обычные языки надстроек (C#/VB/VBA) должны брать данные из книги (в нескольких столбцах и, возможно, в нескольких строках), преобразовывать их, вызовите jpmml в Java, а затем верните соответствующие данные (возможно, с несколькими столбцами и строками) обратно в книгу.
Эти усилия не исключают написания оценщика PMML (или переписывания jpmml, что может быть хорошей идеей) на другом языке. Однако, как и другие оценщики, общий интерфейс на базе Excel обеспечивает основу для сравнения.
В этой версии WDS-JniPMML-XLL обеспечивает:
- Пара надстроек Excel (XLL) и поддержка VBA для:
- Оценка моделей PMML
- Как вызов функции Excel
- Используя стандартную реализацию де-факто , jpmml.evaluator
- Использование входных данных из таблицы на листе
Использует экспортируемые объекты ListObject с помощью XmlMap, но предоставляет инструменты для облегчения- Может оценивать одно или несколько наблюдений (строк) за один вызов.
- Результаты возвращаются как обычные выходные данные функции
- С кэшируемыми моделями для повышения эффективности
- Дополнительные инструменты обработки данных для
- Импорт/экспорт наборов данных соединений HDF5
- Импорт/экспорт плоских файлов
- Дополнительная обработка модуля VBA
- Java-оболочка jpmml.evaluator.
- Вызов из XLL через jni
- Тестируется автономно из командной строки.
Но его можно вызвать через надстройку Excel с использованием JVM.- Входными и выходными данными могут быть:
- Составные наборы данных HDF5
- Плоские файлы
- В памяти (как при вызове через jni)
- Сценарий запуска и примеры включены.
- WDS-JniPMML-XLL-Launch.bat: сценарий для запуска нового экземпляра Excel, запуска надстроек без установки.
- WDS-JniPMML-XLL-Test-Launch.bat: сценарий для запуска надстроек и пример книги WDS-JniPMML-XLL-Test.xlsm
- тест/данные: тестовый набор обычных случаев PMML.
Несколько заметок по организации проекта
- JniPMML-[AAA]: библиотеки для конкретного языка, которые напрямую связаны с целями проекта.
- По возможности и как можно ближе соглашения и структура именования кода остаются одинаковыми для всех языков.
- WDS-[AAA]: служебные библиотеки для конкретного языка, которые можно использовать независимо от библиотек JniPMML-[AAA]
- lib: скомпилированные конечные продукты, которые можно использовать напрямую.
- сценарии: создание сценариев, в частности, для создания межъязыковой документации.
Предварительные условия
- 64-битный Excel
Хотя при компиляции возможно можно было бы добавить и 32 бита.- Доступ к объектной модели проекта VBA (при использовании обработчиков модулей VBA).
- HDF5 и HDFView
- Для компиляции необходимы библиотеки HDF5 и HDFView, но эту функциональность можно удалить.
- Для предоставленных файлов jar требуется, чтобы по крайней мере HDFView находился в пути или пути, указанном в качестве параметра командной строки при запуске Excel.
- Java JDK-12
Требуется при использовании последней установки HDFView.- Компиляция среды
Конфигурации github предназначены для Visual Studio Community Edition и Intellij Community Edition.- DocFx
DocFx используется для сборки документации, включая DocFxDoclet на стороне JavaDoc.
Примечание о лицензии
Весь код и разработки Wypasek Data Science, Inc. (WDataSci), опубликованные на общедоступном сайте GitHub, выпускаются под лицензией MIT. Код из других источников отмечается как таковой, и любые сборки, XLL и/или jar-файлы, которые могут содержать другое программное обеспечение (например, Apache Maven или ExcelDna могут быть объединены из других источников), выпускаются вместе с широко используемым проектом IDE и/или или файлы решений, использованные для их создания.