このプロジェクトは、Applied Statisticsと呼ばれる私の大学院モジュール内の要件の1つでした。このプロジェクトの主な目的は、機能に基づいて航空会社のチケット価格を予測する際に正確なモデルを生成することです。このプロジェクトで使用される機械学習モデルは、単純な線形回帰と複数の線形回帰です。さらに、Auto Arimaを使用したTimeeriesが2023年の特定の航空会社の価格を予測するために実行されます。このプロジェクトの主なプロセスフローは、探索的データ分析、データの前処理、相互作用分析、モデルトレーニング、タイムリー分析を実行することです。 ADFを使用した仮説テスト。
このプロジェクトは、R Studio IDEを使用してR言語でコーディングされています。
このプロジェクトには、「データセット」フォルダーにある2つのデータセットが使用されています。
完全なコードは、「code.r」ファイルで表示できます。
誰かがコードの一部を使用したい場合。参照してください。ありがとう。
このドメイン内の現在の調査は、航空券の価格を予測できることを意味します。特定の機能のセットを使用して、価格を推定するために有用な企業や観光客になり、航空券を購入するのに最適な時期です。季節の価格が時々適用されるため、航空券の価格が変動するため、正確な予測を取得することは困難です。したがって、主な問題は、飛行期間、停留所数など、飛行自体に関連する機能に基づいてチケット価格を予測できることです。
相関分析中、0.92の強い正の相関が、チケットを購入するために残りの日数と残りの日の間に特定されます。これは、確立されたすべての相関の中で最も強いものでした。線形回帰分析では、機能「平均価格」と「days_left」が「平均価格」の変動の62.53%を説明できることを発見しました。さらに、Timeseries分析では、2023年4月にJet Airwaysのチケット価格が12431.34であると予測していました。
全体として、このプロジェクトの調査結果は、この機能を使用して航空会社のチケット価格を予測できると結論付けています。それにもかかわらず、より正確な結果を予測するために、数値変数を使用して、気象条件やデータセットの拡大など、より多くの機能を考慮することができます。
このプロジェクトは、データの前処理から線形回帰モデルの開発まで、すべてのプロセスをカバーしています。このプロジェクトで見つかった結果には、前述のすべての統計的質問が含まれます。データの前処理を実行して、データを線形回帰モデルに適した標準に変換しました。相関分析が完了し、線形回帰分析に有益な相互に強く依存している変数が識別されます。相関分析に基づいて、航空会社のフライト価格チケットで予測を実行するために線形回帰モデルが作成されました。さらに、2023年にジェットエアウェイズ航空会社のチケットの価格を予測するために、タイムリーの分析が行われています。最後に、拡張Dickey Fuller(ADF)またはユニットルートテストを使用した仮説検査を実行して、Timeseriesが静止しているかどうかを特定します。
全体として、提供される機能は航空会社の価格券を推測できます。ただし、すべての機能が使用されているわけではなく、このタスクを達成するのに十分な強さです。したがって、より正確な結果を予測するために使用できる、より多くの数値変数を使用して、気象条件やデータセットをさらに拡大するなど、より多くの要因を考慮することができる場合の将来の改善を行うことができます。