hardhat은 새로운 모델링 패키지를 쉽게 생성하는 동시에 R 모델링 패키지에 대한 독선적인 규칙 세트에 의해 제시된 우수한 R 모델링 패키지 표준을 홍보하도록 설계된 개발자 중심 패키지입니다.
안전모에는 네 가지 주요 목표가 있습니다.
mold()
및 forge()
사용하여 맞춤 시간과 예측 시간에 데이터를 쉽고 일관되며 강력하게 전처리합니다.
예측 시 새 데이터에 적합 시 사용된 것과 동일한 필수 열이 포함되어 있는지 확인하는 등 일반적인 입력 검증 기능에 대한 단일 정보 소스를 제공합니다.
절편 열 추가, predict()
출력 표준화, 예측 변수에서 귀중한 클래스 및 요인 수준 정보 추출과 같은 추가적인 일반적인 작업을 위한 추가 유틸리티 기능을 제공합니다.
model_matrix()
및 model_frame()
에 있는 더 엄격한 접근 방식을 사용하여 stats::model.matrix()
및 stats::model.frame()
의 기본 R 전처리 인프라를 다시 생각해 보세요.
좋은 모델링 인터페이스를 만드는 부담을 최대한 줄이고 대신 패키지 개발자가 새 모델의 핵심 구현을 작성하는 데 집중할 수 있도록 하는 것이 아이디어입니다. 이는 개발자뿐만 아니라 모델링 패키지 사용자에게도 이익이 됩니다. 표준화를 통해 사용자는 모델링 기능이 무엇을 반환해야 하는지, 그리고 어떻게 상호 작용해야 하는지에 대한 일련의 "기대"를 구축할 수 있기 때문입니다.
다음을 사용하여 CRAN에서 출시된 hardhat 버전을 설치할 수 있습니다.
install.packages( " hardhat " )
GitHub의 개발 버전은 다음과 같습니다.
# install.packages("pak")
pak :: pak( " tidymodels/hardhat " )
안전모 사용 방법에 대해 알아보려면 비네팅을 확인하세요.
vignette("mold", "hardhat")
: mold()
사용하여 적절한 시간에 데이터를 전처리하는 방법을 알아봅니다.
vignette("forge", "hardhat")
: forge()
사용하여 예측 시 새 데이터를 전처리하는 방법을 알아봅니다.
vignette("package", "hardhat")
: 새로운 모델링 패키지를 생성하는 데 도움이 되는 mold()
및 forge()
사용 방법을 알아봅니다.
여기 XI Jornadas de Usuarios de R 컨퍼런스에서 Max Kuhn이 안전모를 사용하여 처음부터 새로운 모델링 패키지를 구축하는 방법에 대해 논의하는 것을 볼 수도 있습니다.
이 프로젝트는 기여자 행동 강령과 함께 출시되었습니다. 이 프로젝트에 기여함으로써 귀하는 해당 조건을 준수하는 데 동의하게 됩니다.
tidymodels 패키지, 모델링 및 기계 학습에 대한 질문과 토론은 RStudio Community에 게시하세요.
버그가 발생했다고 생각되면 문제를 제출해 주세요.
어느 쪽이든, 코드에 대해 명확하게 전달하기 위해 표현(최소하고 재현 가능한 예제)을 만들고 공유하는 방법을 알아보세요.
tidymodels 패키지에 대한 기여 지침과 도움을 받는 방법에 대한 자세한 내용을 확인하세요.