hardhat เป็นแพ็คเกจ ที่เน้นนักพัฒนา ซึ่งออกแบบมาเพื่ออำนวยความสะดวกในการสร้างแพ็คเกจการสร้างแบบจำลองใหม่ ในขณะเดียวกันก็ส่งเสริมมาตรฐานแพ็คเกจการสร้างแบบจำลอง R ที่ดีตามที่กำหนดโดยชุดอนุสัญญาที่ให้ความเห็นสำหรับแพ็คเกจการสร้างแบบจำลอง R
hardhat มีสี่เป้าหมายหลัก:
ประมวลผลข้อมูลล่วงหน้าได้อย่างง่ายดาย สม่ำเสมอ และมีประสิทธิภาพในเวลาที่เหมาะสมและเวลาคาดการณ์ด้วย mold()
และ forge()
ระบุแหล่งความจริงแหล่งเดียวสำหรับฟังก์ชันการตรวจสอบความถูกต้องอินพุตทั่วไป เช่น การตรวจสอบว่าข้อมูลใหม่ ณ เวลาคาดการณ์มีคอลัมน์ที่จำเป็นเหมือนกันซึ่งใช้ในเวลาที่เหมาะสมหรือไม่
จัดเตรียมฟังก์ชันอรรถประโยชน์เพิ่มเติมสำหรับงานทั่วไปเพิ่มเติม เช่น การเพิ่มคอลัมน์สกัดกั้น การกำหนด predict()
ให้เป็นมาตรฐาน และการดึงข้อมูลระดับคลาสและปัจจัยอันมีค่าจากตัวทำนาย
ลองจินตนาการถึงโครงสร้างพื้นฐานการประมวลผลล่วงหน้าฐาน R ของ stats::model.matrix()
และ stats::model.frame()
โดยใช้แนวทางที่เข้มงวดกว่าที่พบใน model_matrix()
และ model_frame()
แนวคิดคือการลดภาระในการสร้างอินเทอร์เฟซการสร้างแบบจำลองที่ดีให้มากที่สุดเท่าที่จะเป็นไปได้ และปล่อยให้นักพัฒนาแพ็คเกจมุ่งเน้นไปที่การเขียนการใช้งานหลักของโมเดลใหม่แทน สิ่งนี้ไม่เพียงเป็นประโยชน์ต่อนักพัฒนาเท่านั้น แต่ยังรวมถึงผู้ใช้แพ็คเกจการสร้างแบบจำลองด้วย เนื่องจากมาตรฐานช่วยให้ผู้ใช้สามารถสร้างชุด "ความคาดหวัง" เกี่ยวกับฟังก์ชันการสร้างแบบจำลองใด ๆ ที่ควรกลับมา และวิธีที่พวกเขาควรโต้ตอบกับมัน
คุณสามารถติดตั้ง hardhat เวอร์ชันที่วางจำหน่ายจาก CRAN ด้วย:
install.packages( " hardhat " )
และเวอร์ชันการพัฒนาจาก GitHub ด้วย:
# install.packages("pak")
pak :: pak( " tidymodels/hardhat " )
หากต้องการเรียนรู้เกี่ยวกับวิธีใช้หมวกแข็ง โปรดดูบทความสั้น:
vignette("mold", "hardhat")
: เรียนรู้วิธีประมวลผลข้อมูลล่วงหน้าในเวลาที่เหมาะสมด้วย mold()
vignette("forge", "hardhat")
: เรียนรู้วิธีประมวลผลข้อมูลใหม่ล่วงหน้าในเวลาคาดการณ์ด้วย forge()
vignette("package", "hardhat")
: เรียนรู้วิธีใช้ mold()
และ forge()
เพื่อช่วยในการสร้างแพ็คเกจการสร้างแบบจำลองใหม่
คุณยังสามารถรับชม Max Kuhn พูดคุยถึงวิธีใช้หมวกแข็งเพื่อสร้างแพ็คเกจการสร้างแบบจำลองใหม่ตั้งแต่เริ่มต้นในการประชุม XI Jornadas de Usuarios de R ที่นี่
โครงการนี้เผยแพร่พร้อมกับจรรยาบรรณของผู้ร่วมให้ข้อมูล การมีส่วนร่วมในโครงการนี้แสดงว่าคุณตกลงที่จะปฏิบัติตามข้อกำหนดของโครงการ
สำหรับคำถามและการอภิปรายเกี่ยวกับแพ็คเกจ tidymodels การสร้างโมเดล และการเรียนรู้ของเครื่อง โปรดโพสต์บนชุมชน RStudio
หากคุณคิดว่าคุณพบข้อบกพร่อง โปรดส่งปัญหา
ไม่ว่าจะด้วยวิธีใด เรียนรู้วิธีสร้างและแบ่งปัน reprex (ตัวอย่างขั้นต่ำที่สามารถทำซ้ำได้) เพื่อสื่อสารเกี่ยวกับโค้ดของคุณอย่างชัดเจน
ดูรายละเอียดเพิ่มเติมเกี่ยวกับแนวทางการสนับสนุนสำหรับแพ็คเกจ tidymodels และวิธีรับความช่วยเหลือ