Dieses Projekt war eine der Anforderungen in meinem Postgraduierten -Modul, die als Applied Statistics bezeichnet werden. Das Hauptziel dieses Projekts ist es, ein genaues Modell für die Vorhersage von Flugticketpreisen auf der Grundlage der Funktionen zu generieren. Die in diesem Projekt verwendeten Modelle für maschinelles Lernen sind eine einfache lineare Regression und mehrere lineare Regression. Darüber hinaus wird eine Timeserien mit Auto-Arima durchgeführt, um den Preis einer bestimmten Fluggesellschaft im Jahr 2023 zu prognostizieren. Der Hauptprozessfluss dieses Projekts besteht darin und Hypothesentest unter Verwendung von ADF.
Das Projekt wird in der R -Sprache mit der R Studio IDE codiert.
In diesem Projekt werden 2 Datensatz verwendet, die sich im Ordner "Datensatz" befinden.
Der vollständige Code kann in der Datei "code.r" angezeigt werden.
Wenn jemand einen Teil des Codes verwenden möchte. Bitte verweisen Sie es. Danke.
Aktuelle Untersuchungen in diesem Bereich implizieren, dass die Ticketpreise für Fluggesellschaften mit einer Reihe bestimmter Funktionen vorhergesagt werden können, die nützliche Unternehmen und Touristen sein können, um den Preis abzuschließen, und wann ist der beste Zeitpunkt, um ein Flugticket zu kaufen. Da der Preis für ein Flugticket von Zeit zu Zeit zu einem saisonalen Preis angewendet wird, ist es schwierig, eine genaue Vorhersage zu erhalten. Die Hauptfrage ist nun möglich, den Ticketpreis auf der Grundlage von Merkmalen im Zusammenhang mit dem Flug selbst wie Flugdauer, Anzahl der Stopps usw. vorherzusagen.
Während der Korrelationsanalyse wird eine starke positive Korrelation von 0,92 zwischen dem Durchschnittspreis und den verbleibenden Tagen für den Kauf des Tickets ermittelt. Dies war der stärkste aller gegründeten Korrelation. In der linearen Regressionsanalyse wurde festgestellt, dass das Merkmal „Durchschnittspreis“ und „Days_Left“ 62,53% der Variation des „Durchschnittspreises“ erklären könnten. Darüber hinaus prognostizierte die Timeries -Analyse, dass der Ticketpreis für Jet Airways im April 2023 £ 12431,34 beträgt.
Insgesamt kommen die Ergebnisse in diesem Projekt zu dem Schluss, dass die Funktionen verwendet werden können, um den Ticketpreis der Fluggesellschaft vorherzusagen. Trotzdem könnten mehr Funktionen in Betracht gezogen werden, z. B. Wetterbedingungen oder Erweiterung des Datensatzes mit numerischen Variablen, um ein genaueres Ergebnis vorherzusagen.
Das Projekt deckt den gesamten Prozess von der Vorverarbeitung von Daten bis zur Entwicklung eines linearen Regressionsmodells ab. Die in diesem Projekt gefundenen Ergebnisse umfassen alle zuvor genannten statistischen Fragen. Die Vorverarbeitung von Daten wurde durchgeführt, um die Daten für das lineare Regressionsmodell in einen geeigneten Standard zu verwandeln. Eine Korrelationsanalyse wird abgeschlossen, um zu identifizieren, welche Variablen stark voneinander abhängen, die für die lineare Regressionsanalyse von Vorteil sind. Basierend auf der Korrelationsanalyse wurde das lineare Regressionsmodell erstellt, um die Vorhersage des Flugtickets für Flugpreise für Fluggesellschaften durchzuführen. Darüber hinaus wird eine Timeseries -Analyse durchgeführt, um den Preis für das Ticket von Jet Airways Airline im Jahr 2023 zu prognostizieren, was 12431,34 GBP beträgt. Schließlich wird Hypothesentests mit Augmented Dickey Fuller (ADF) oder Einheitenwurzeltest durchgeführt, um festzustellen, ob die Timeseries stationär sind oder nicht.
Insgesamt können die bereitgestellten Funktionen das Price -Ticket der Fluggesellschaft abgeben. Es werden jedoch nicht alle Funktionen verwendet und stark genug, um diese Aufgabe zu erreichen. Daher kann eine zukünftige Verbesserung durchgeführt werden, wenn mehr Faktoren in Betracht gezogen werden können, z. B. Wetterbedingungen oder die Erweiterung des Datensatzes mehr mit numerischen Variablen, die verwendet werden können, um ein genaueres Ergebnis vorherzusagen.