Kami telah menggunakan 2 set data untuk ini. Kumpulan data pertama telah diperoleh dari situs web "Dunia Emas". Dataset ini adalah untuk harga emas global dari 1978 hingga 2018. Ini adalah data bulanan.
Karena dataset ini bukan harga pasar emas yang sebenarnya, kami memutuskan untuk mendapatkan harga pasar emas di India. Tidak ada set data yang tersedia untuk hal yang sama. Kami mengikis data pasar dari Gold Price India dari 2011 - 2018 untuk setiap bulan. Karena data dikikis dari web, kami memverifikasi secara manual sebelum menggunakan hal yang sama untuk analitik.
Kami preprocess semua data dengan menggunakan teknik dasar seperti menjatuhkan semua baris dengan nilai yang hilang (tidak ada!). Yang paling preprocessing dilakukan pada tanggal, karena data dikumpulkan dari sumber yang berbeda, tanggal berada dalam format yang berbeda dan mereka diformat ke format umum yang akan dipahami oleh Matplotlib untuk merencanakannya dengan tepat.
● Regresi berganda
Kami mencoba membuat model regresi sederhana. Ini adalah model regresi berganda dengan parameter input sebagai rata -rata bergerak dari 1 bulan terakhir dan 2 bulan terakhir. Kami dapat dengan jelas mengamati overfitting dalam model ini. Overfitting ini dapat dikaitkan dengan data yang tidak stasiun.
● Periksa stasioneritas
Untuk memeriksa stasioneritas data, kami memplot data bersama dengan tanggal. Hanya dengan melihat plot, kita dapat menyimpulkan bahwa datanya non-stasioner. Kita juga dapat melihat dari histogram (dalam kode) bahwa data memiliki musim dan beberapa komponen tren. Kami juga melakukan tes Dickey-Fuller untuk mengkonfirmasi stasioneritas. Kita dapat melihat statistik ADF lebih tinggi dari nilai kritis mana pun, dan nilai p jauh lebih besar dari 0,05, jadi kami tidak dapat menolak hipotesis nol bahwa data tidak stasioner.
● Buat stasioner data untuk membuat data stasioner, kami menggunakan teknik paling sederhana untuk mengambil transformasi log.
Kita dapat mengamati bahwa tidak ada perubahan dan data masih non-stasioner. Kami sekarang mencoba melakukan perbedaan pada data ini. Kami melakukan perbedaan pesanan 2 dan mengamati hasil berikut. Kami dapat melihat bahwa statistik ADF kurang dari 1% nilai kritis sehingga kami dapat menolak hipotesis nol dan menyimpulkan dengan tingkat kepercayaan 99% bahwa data tersebut stasioner. Kami sekarang dapat menggunakan data ini untuk pemodelan lebih lanjut.
● Model regresi lagi
Kami menggunakan model regresi lama lagi untuk data stasioner ini. Kami melihat hasil berikut. Kami memperoleh nilai S kuadrat R 30% yang di bawah par. Dan kesalahan root mean square juga sangat tinggi. Meskipun RMSE adalah statistik absolut dan tidak dapat digunakan untuk menilai kebaikan kesesuaian, kami akan menggunakan nilai ini untuk perbandingan lebih lanjut dengan model lain
● Plot ACF dan PACF
Kami sekarang mencoba memplot ACF IE Autocorrelation dan PACF yaitu plot autokorelasi parsial untuk data ini untuk menemukan nilai p, q, d untuk membuat model ARIMA.
● Model Sarima
Kami memodelkan data ini menggunakan model Sarima. Model Sarima adalah singkatan dari ARIMA Model musiman. Model Sarima lebih baik daripada model Arima sederhana ketika ada data musiman. Yaitu data Timeseries memiliki siklus berulang. Kami mengamati bahwa model tersebut lebih cocok daripada model sebelumnya.
Di bawah ini adalah hasil dan diagnostik model. Kita melihat bahwa nilai kuasi R adalah 73% yang dapat diterima dan kesalahan RMS telah berkurang menjadi 1715 dari 5000, yang merupakan pertanda baik.
Kami sekarang menggunakan yang lain (dataset pasar India) untuk mencoba dan menemukan tren menarik dalam fluktuasi harga. Yang menarik selama berbagai tahun harga emas telah maksimal selama musim pernikahan yang sesuai dengan tahun itu. Kita juga dapat melihat tren siklik dalam harga, ada 6-8 tahun pertumbuhan bullish diikuti oleh 6-8 tahun pasar bearish. Sederhananya selain itu tidak ada tren yang jelas dalam data. Harga maksimum selalu adalah Maret-April atau September-Oktober yang jatuh selama atau tepat sebelum musim pernikahan.
Kami sekarang memiliki model yang dapat memprediksi harga emas dengan akurasi hampir 73% dan telah menemukan korelasi yang menarik antara harga pasar emas dan musim pernikahan di India.
Kita dapat dengan aman menyimpulkan bahwa harga emas di pasar dunia dan pasar India regional sangat fluktuatif dan bergantung pada banyak faktor eksternal yang tidak dapat dimodelkan dengan mudah.
Untuk pekerjaan di masa depan, kami dapat menggunakan dan membangun model kami yang ada untuk membangun sistem rekomendasi yang menyarankan pengguna waktu yang tepat untuk membeli dan menjual emas untuk orang -orang yang tertarik berinvestasi dalam emas.