우리는 이것을 위해 2 개의 데이터 세트를 사용했습니다. 첫 번째 데이터 세트는 "World Gold Council 's 웹 사이트에서 얻었습니다. 이 데이터 세트는 1978 년부터 2018 년까지 글로벌 금 가격을위한 것입니다.이 데이터는 월별 데이터입니다.
이 데이터 세트는 금의 실제 시장 가격이 아니기 때문에 인도에서 금의 시장 가격을 얻기로 결정했습니다. 동일하게 사용할 수있는 데이터 세트가 없었습니다. 우리는 매월 2011 년부터 2018 년까지 Gold Price India의 시장 데이터를 긁었습니다. 웹에서 데이터가 긁히기 때문에 분석에 동일하게 사용하기 전에 수동으로 확인했습니다.
우리는 결 측값으로 모든 행을 삭제하는 것과 같은 기본 기술을 사용하여 모든 데이터를 전처리합니다 (아무것도 없었습니다!). 데이터가 다른 소스에서 수집되었으므로 날짜는 다른 형식으로 수집되었으며, Matplotlib에 의해 적절하게 플로팅하기 위해 이해되는 일반적인 형식으로 형식화 되었기 때문에 가장 전처리는 날짜에 이루어졌습니다.
● 다중 회귀
간단한 회귀 모델을 만들려고 노력합니다. 입력 매개 변수가 지난 1 개월의 이동 평균과 지난 2 개월의 다중 회귀 모델입니다. 우리는이 모델에서 과적으로 피적을 명확하게 관찰 할 수 있습니다.
● 정면 성을 점검하십시오
데이터의 정면성을 확인하기 위해 날짜와 함께 데이터를 플로팅합니다. 줄거리를 보면 데이터가 비 연립적이라는 결론을 내릴 수 있습니다. 또한 히스토그램 (코드)에서 데이터에 계절성과 트렌드 구성 요소가 있음을 알 수 있습니다. 또한 정면 성을 확인하기 위해 Dickey-Fuller 테스트를 수행했습니다. 우리는 ADF 통계가 임계 값보다 높고 P 값이 0.05보다 훨씬 높기 때문에 데이터가 비 연립이라는 귀무 가설을 거부 할 수는 없습니다.
● 데이터를 고정시켜 데이터를 고정 시키면 로그 변환을 수행하는 가장 간단한 기술을 사용합니다.
우리는 변화가없고 데이터가 여전히 비정규적임을 알 수 있습니다. 이제이 데이터에 대한 차이점을 수행하려고합니다. 우리는 순서 2의 차이를 수행하고 다음 결과를 관찰합니다. ADF 통계량이 1% 중요 값 미만이라는 것을 알 수 있으므로 귀무 가설을 거부하고 데이터가 고정되어 있음을 신뢰 수준으로 99%로 결론을 내릴 수 있습니다. 이제이 데이터를 사용하여 추가 모델링을 할 수 있습니다.
● 회귀 모델을 다시
이 고정 데이터에 대해 이전 회귀 모델을 다시 사용합니다. 우리는 다음과 같은 결과를 봅니다. 우리는 30%의 r 제곱 값을 얻습니다. 그리고 루트 평균 제곱 오차도 매우 높습니다. RMSE는 절대 통계이며 착용감을 판단하는 데 사용될 수는 없지만 다른 모델과의 추가 비교를 위해이 값을 사용할 것입니다.
● ACF 및 PACF 플롯
우리는 이제 ACF IE 자
● 사리마 모델
우리는 Sarima 모델을 사용 하여이 데이터를 모델링합니다. Sarima 모델은 계절별 Arima 모델을 나타냅니다. Sarima 모델은 계절 데이터가있을 때 간단한 ARIMA 모델보다 더 좋습니다. 즉 Timeseries 데이터는 반복되는주기를 가지고 있습니다. 우리는 모델이 이전 모델보다 훨씬 더 잘 적합하다는 것을 관찰합니다.
다음은 모델의 결과와 진단입니다. R 제곱 값은 73%이며 RMS 오류는 5000에서 1715로 감소했으며 이는 좋은 신호입니다.
우리는 이제 가격 변동의 흥미로운 트렌드를 시도하고 찾기 위해 다른 (Indian Market DataSet)를 사용합니다.이 간격으로 여러 해 동안 금의 가격은 그 해에 해당하는 결혼식 시즌 동안 최대였습니다. 우리는 또한 가격의주기적인 추세를 볼 수 있으며, 6-8 년의 강세 성장과 6-8 년의 약세 시장이 있습니다. 그 외에는 데이터에 명백한 경향이 없습니다. 최대 가격은 항상 3 월 -4 월 또는 9 월 -10 월이었으며 결혼 시즌 또는 바로 직전에 떨어집니다.
우리는 이제 거의 73% 정확도로 금 가격을 예측할 수있는 모델을 가지고 있으며 금의 시장 가격과 인도의 결혼 시즌 사이에 흥미로운 상관 관계를 발견했습니다.
우리는 세계 시장과 지역 인도 시장의 금 가격이 매우 변동적이고 쉽게 모델링 할 수없는 많은 외부 요인에 의존한다고 안전하게 결론을 내릴 수 있습니다.
향후 작업을 위해, 우리는 기존 모델을 사용하고 구축하여 사용자에게 금에 투자하는 데 관심이있는 사람들을 위해 금을 사고 팔기에 적절한시기를 제안하는 추천 시스템을 구축 할 수 있습니다.