โครงการนี้เป็นหนึ่งในข้อกำหนดภายในโมดูลระดับสูงกว่าปริญญาตรีของฉันที่เรียกว่าสถิติประยุกต์ เป้าหมายหลักของโครงการนี้คือการสร้างแบบจำลองที่ถูกต้องในการทำนายราคาตั๋วสายการบินตามคุณสมบัติ รูปแบบการเรียนรู้ของเครื่องที่ใช้ในโครงการนี้คือการถดถอยเชิงเส้นอย่างง่ายและการถดถอยเชิงเส้นหลายครั้ง นอกจากนี้ซีรีส์ที่ใช้ Auto ARIMA จะดำเนินการเพื่อคาดการณ์ราคาของสายการบินเฉพาะในปี 2566 การไหลของกระบวนการหลักของโครงการนี้กำลังดำเนินการวิเคราะห์ข้อมูลเชิงสำรวจการประมวลผลข้อมูลล่วงหน้าการวิเคราะห์ correaltion การฝึกอบรมแบบจำลองการวิเคราะห์เวลา และการทดสอบสมมติฐานโดยใช้ ADF
โครงการมีรหัสในภาษา R โดยใช้ R Studio IDE
มี 2 ชุดข้อมูลที่ใช้ในโครงการนี้ซึ่งอยู่ในโฟลเดอร์ "ชุดข้อมูล"
รหัสเต็มสามารถดูได้ในไฟล์ "code.r"
หากใครต้องการใช้ส่วนหนึ่งของรหัส กรุณาอ้างอิง ขอบคุณ.
การวิจัยในปัจจุบันภายในโดเมนนี้บ่งบอกว่าราคาตั๋วสายการบินสามารถคาดการณ์ได้โดยใช้ชุดของคุณสมบัติบางอย่างซึ่งอาจเป็น บริษัท ที่มีประโยชน์และนักท่องเที่ยวเพื่ออนุมานราคาและเวลาที่ดีที่สุดในการซื้อตั๋วเครื่องบิน เนื่องจากราคาตั๋วเครื่องบินมีความผันผวนเนื่องจากมีราคาตามฤดูกาลเป็นครั้งคราวจึงเป็นเรื่องยากที่จะได้รับการคาดการณ์ที่แม่นยำ ดังนั้นคำถามหลักในขณะนี้เป็นไปได้ที่จะทำนายราคาตั๋วตามคุณสมบัติที่เกี่ยวข้องกับเที่ยวบินเองเช่นระยะเวลาการบินจำนวนหยุด ฯลฯ
ในระหว่างการวิเคราะห์สหสัมพันธ์มีการระบุความสัมพันธ์เชิงบวกที่แข็งแกร่งของ 0.92 ระหว่างราคาเฉลี่ยและวันที่เหลือเหลือเพื่อซื้อตั๋ว นี่คือความสัมพันธ์ที่แข็งแกร่งที่สุดของความสัมพันธ์ทั้งหมดที่ก่อตั้งขึ้น การวิเคราะห์การถดถอยเชิงเส้นพบว่าคุณลักษณะ“ ราคาเฉลี่ย” และ“ Days_left” สามารถอธิบายได้ 62.53% ของการเปลี่ยนแปลงของ“ ราคาเฉลี่ย” นอกจากนี้การวิเคราะห์ Timeseries คาดการณ์ว่าในเดือนเมษายน 2566 ราคาตั๋วสำหรับเครื่องบินเจ็ตสายการบินคือ₹ 12431.34
โดยรวมแล้วการค้นพบในโครงการนี้สรุปได้ว่าคุณสมบัติสามารถใช้ในการทำนายราคาตั๋วสายการบิน อย่างไรก็ตามคุณสมบัติเพิ่มเติมอาจได้รับการพิจารณาเช่นสภาพอากาศหรือขยายชุดข้อมูลมากขึ้นด้วยตัวแปรตัวเลขเพื่อทำนายผลลัพธ์ที่แม่นยำยิ่งขึ้น
โครงการครอบคลุมกระบวนการทั้งหมดตั้งแต่การประมวลผลข้อมูลล่วงหน้าไปจนถึงการพัฒนาแบบจำลองการถดถอยเชิงเส้น ผลลัพธ์ที่พบในโครงการนี้ครอบคลุมคำถามทางสถิติทั้งหมดที่กล่าวถึงก่อนหน้านี้ การประมวลผลข้อมูลล่วงหน้าได้ดำเนินการเพื่อแปลงข้อมูลเป็นมาตรฐานที่เหมาะสมสำหรับแบบจำลองการถดถอยเชิงเส้น การวิเคราะห์สหสัมพันธ์เสร็จสมบูรณ์เพื่อระบุตัวแปรที่ขึ้นอยู่กับซึ่งกันและกันซึ่งมีประโยชน์สำหรับการวิเคราะห์การถดถอยเชิงเส้น จากการวิเคราะห์ความสัมพันธ์แบบจำลองการถดถอยเชิงเส้นถูกสร้างขึ้นเพื่อทำการทำนายตั๋วราคาบินของสายการบิน นอกจากนี้ยังมีการวิเคราะห์ Timeseries เพื่อคาดการณ์ราคาตั๋วของสายการบินเจ็ทแอร์เวย์สในปี 2566 ซึ่งคือ₹ 12431.34 ในที่สุดการทดสอบสมมติฐานโดยใช้ Augmented Dickey Fuller (ADF) หรือการทดสอบรูทหน่วยจะดำเนินการเพื่อระบุว่าชุดเวลานั้นอยู่กับที่หรือไม่
โดยรวมแล้วคุณสมบัติที่ให้ไว้สามารถอนุมานตั๋วราคาสายการบินได้ อย่างไรก็ตามไม่ได้ใช้คุณสมบัติทั้งหมดและแข็งแกร่งพอที่จะบรรลุงานนี้ ดังนั้นการปรับปรุงในอนาคตสามารถทำได้ในกรณีที่มีการพิจารณาปัจจัยเพิ่มเติมเช่นสภาพอากาศหรือขยายชุดข้อมูลมากขึ้นด้วยตัวแปรตัวเลขมากขึ้นซึ่งสามารถใช้ในการทำนายผลลัพธ์ที่แม่นยำยิ่งขึ้น