Hardhat — это пакет , ориентированный на разработчиков, предназначенный для упрощения создания новых пакетов моделирования и одновременного продвижения хороших стандартов пакетов моделирования R, изложенных в наборе самоуверенных соглашений для пакетов моделирования R.
каска преследует четыре основные цели:
Легко, последовательно и надежно предварительно обрабатывайте данные во время подгонки и во время прогнозирования с помощью mold()
и forge()
.
Предоставьте один источник достоверных данных для общих функций проверки входных данных, таких как проверка того, содержат ли новые данные во время прогнозирования те же необходимые столбцы, которые использовались во время подбора.
Предоставьте дополнительные служебные функции для дополнительных общих задач, таких как добавление столбцов пересечений, стандартизация вывода predict()
и извлечение ценной информации на уровне классов и факторов из предикторов.
Переосмыслите базовую инфраструктуру предварительной обработки R stats::model.matrix()
и stats::model.frame()
используя более строгие подходы, найденные в model_matrix()
и model_frame()
.
Идея состоит в том, чтобы максимально снизить нагрузку на создание хорошего интерфейса моделирования и вместо этого позволить разработчику пакета сосредоточиться на написании базовой реализации своей новой модели. Это приносит пользу не только разработчику, но и пользователю пакета моделирования, поскольку стандартизация позволяет пользователям строить набор «ожиданий» вокруг того, что должна возвращать любая функция моделирования и как они должны с ней взаимодействовать.
Вы можете установить выпущенную версию защитного шлема от CRAN с помощью:
install.packages( " hardhat " )
И версия для разработки с GitHub:
# install.packages("pak")
pak :: pak( " tidymodels/hardhat " )
Чтобы узнать, как использовать каску, посмотрите примеры:
vignette("mold", "hardhat")
: узнайте, как предварительно обрабатывать данные в нужное время с помощью mold()
.
vignette("forge", "hardhat")
: узнайте, как предварительно обрабатывать новые данные во время прогнозирования с помощью forge()
.
vignette("package", "hardhat")
: узнайте, как использовать mold()
и forge()
для создания нового пакета моделирования.
Вы также можете посмотреть, как Макс Кун обсуждает, как использовать каску для создания нового пакета моделирования с нуля на XI конференции Jornadas de Usuarios de R здесь.
Этот проект выпущен с Кодексом поведения участника. Внося свой вклад в этот проект, вы соглашаетесь соблюдать его условия.
Вопросы и обсуждения о пакетах tidymodels, моделировании и машинном обучении пишите в сообществе RStudio.
Если вы считаете, что столкнулись с ошибкой, сообщите о проблеме.
В любом случае научитесь создавать и публиковать репрекс (минимальный воспроизводимый пример), чтобы четко доносить информацию о своем коде.
Ознакомьтесь с более подробной информацией о рекомендациях по участию в пакетах tidymodels и о том, как получить помощь.