hardhat adalah paket yang berfokus pada pengembang yang dirancang untuk memudahkan pembuatan paket pemodelan baru, sekaligus mempromosikan standar paket pemodelan R yang baik sebagaimana ditetapkan oleh serangkaian Konvensi untuk Paket Pemodelan R.
hardhat memiliki empat tujuan utama:
Praproses data dengan mudah, konsisten, dan kuat pada waktu yang tepat dan waktu prediksi dengan mold()
dan forge()
.
Menyediakan satu sumber kebenaran untuk fungsi validasi masukan umum, seperti memeriksa apakah data baru pada waktu prediksi berisi kolom wajib yang sama dengan yang digunakan pada waktu yang tepat.
Menyediakan fungsi utilitas tambahan untuk tugas-tugas umum tambahan, seperti menambahkan kolom intersep, menstandardisasi keluaran predict()
, dan mengekstrak informasi tingkat kelas dan faktor yang berharga dari prediktor.
Bayangkan kembali infrastruktur prapemrosesan R dasar dari stats::model.matrix()
dan stats::model.frame()
menggunakan pendekatan yang lebih ketat yang ditemukan di model_matrix()
dan model_frame()
.
Idenya adalah untuk mengurangi beban pembuatan antarmuka pemodelan yang baik sebanyak mungkin, dan membiarkan pengembang paket fokus pada penulisan implementasi inti model baru mereka. Hal ini tidak hanya menguntungkan pengembang, tetapi juga pengguna paket pemodelan, karena standardisasi memungkinkan pengguna untuk membangun serangkaian “ekspektasi” seputar fungsi pemodelan apa yang harus dikembalikan, dan bagaimana mereka harus berinteraksi dengannya.
Anda dapat menginstal hardhat versi rilis dari CRAN dengan:
install.packages( " hardhat " )
Dan versi pengembangan dari GitHub dengan:
# install.packages("pak")
pak :: pak( " tidymodels/hardhat " )
Untuk mempelajari cara menggunakan hardhat, lihat sketsanya:
vignette("mold", "hardhat")
: Pelajari cara melakukan praproses data pada waktu yang tepat dengan mold()
.
vignette("forge", "hardhat")
: Pelajari cara melakukan praproses data baru pada waktu prediksi dengan forge()
.
vignette("package", "hardhat")
: Pelajari cara menggunakan mold()
dan forge()
untuk membantu membuat paket pemodelan baru.
Anda juga dapat menonton Max Kuhn mendiskusikan cara menggunakan hardhat untuk membangun paket pemodelan baru dari awal pada konferensi XI Jornadas de Usuarios de R di sini.
Proyek ini dirilis dengan Kode Etik Kontributor. Dengan berkontribusi pada proyek ini, Anda setuju untuk mematuhi ketentuannya.
Untuk pertanyaan dan diskusi tentang paket rapimodels, pemodelan, dan pembelajaran mesin, silakan posting di Komunitas RStudio.
Jika Anda merasa mengalami bug, silakan kirimkan masalahnya.
Apa pun pilihannya, pelajari cara membuat dan membagikan reprex (contoh minimal yang dapat direproduksi), untuk mengomunikasikan kode Anda dengan jelas.
Lihat detail lebih lanjut tentang pedoman kontribusi untuk paket model rapi dan cara mendapatkan bantuan.