قاعدة كود لـ "شبكات الخصومة الزمنية للسلاسل الزمنية (Timegan)"
المؤلفون: Jinsung Yoon ، دانييل جاريت ، ميهلا فان دير شار
المرجع: Jinsung Yoon ، Daniel Jarrett ، Mihaela van der Schaar ، "شبكات العدوانية التوليدية للسلسلة الزمنية ،" أنظمة معالجة المعلومات العصبية (Neups) ، 2019.
رابط الورق: https://papers.nips.cc/paper/8789- الوقت-----
الاتصال: [email protected]
يحتوي هذا الدليل على تطبيقات إطار عمل Timegan لتوليد بيانات السلسلة الزمنية الاصطناعية باستخدام مجموعة بيانات اصطناعية واحدة ومجموعتين من بيانات العالم الحقيقي.
- بيانات الجيب: الاصطناعية
- بيانات الأسهم: https://finance.yahoo.com/quote/goog/history؟p=goog
- بيانات الطاقة: http://archive.ics.uci.edu/ml/datasets/appliances+energy+prediction
لتشغيل خط الأنابيب للتدريب والتقييم على إطار الوقت ، ما عليك سوى تشغيل Python3 -M main_timegan.py أو انظر تعليمي jupyter -notebook لـ timegan في tutorial_timegan.ipynb.
لاحظ أنه يمكن استخدام أي بنية نموذجية كمولد ونموذج تمييز مثل RNNs أو المحولات.
رمز شرح
(1) data_loading.py
- تحويل بيانات السلسلة الزمنية الخام إلى بيانات السلسلة الزمنية المعالجة مسبقًا (بيانات GOOGLD)
- إنشاء بيانات جيب
(2) دليل المقاييس (أ) التصور _metrics.py
- تحليل PCA و T-SNE بين البيانات الأصلية والبيانات الاصطناعية (ب) التمييز _metrics.py
- استخدم RNN بعد المخصصة لتصنيف البيانات الأصلية والبيانات الاصطناعية (C) Predictive_Metrics.py
- استخدم RNN بعد المخصصة للتنبؤ بخطوة واحدة إلى الأمام (الميزة الأخيرة)
(3) Timegan.py
- استخدم بيانات السلسلة الزمنية الأصلية كمجموعة تدريب لبيانات السلسلة الزمنية الاصطناعية
(4) main_timegan.py
- الإبلاغ عن الدرجات التمييزية والتنبئي لمجموعة البيانات وتحليل T-SNE و PCA
(5) utils.py
- بعض وظائف الأداة المساعدة للمقاييس و timegan.
مدخلات الأوامر:
- data_name: الجيب أو الأسهم أو الطاقة
- seq_len: طول التسلسل
- الوحدة النمطية: GRU ، LSTM ، أو LSTMLN
- hidden_dim: أبعاد خفية
- num_layers: عدد الطبقات
- التكرارات: عدد تكرارات التدريب
- Batch_size: عدد العينات في كل دفعة
- metric_iterations: عدد التكرارات للحساب المتري
لاحظ أنه يجب تحسين معلمات الشبكة لمجموعات البيانات المختلفة.
مثال الأمر
$ python3 main_timegan.py --data_name stock --seq_len 24 --module gru
--hidden_dim 24 --num_layer 3 --iteration 50000 --batch_size 128
--metric_iteration 10
المخرجات
- ORI_DATA: البيانات الأصلية
- generated_data: بيانات اصطناعية تم إنشاؤها
- metric_results: درجات تمييزية وتنبئ
- التصور: تحليل PCA و TSNE