تنزيل smote_variants - تنزيل رمز المصدر smote

جيثب

 _ _ _
 ___ _ __ ___ ___ | | _ ___ __ __ _ _ __ (_) __ _ _ __ | | _ ___
/ __ || '_ `_  / _  | __ | / _  _____   / // _` || '__ || | / _` || '_  | __ |/ __ |
 __  | | | | | || (_) || | _ | __ /| _____ |  v /| (_ | | | | | | (_ | | | | | | | _  __ 
| ___/| _ | | _ | | _ |  ___/  __ |  ___ |  _/  __ ، _ || _ | | _ |  __ ، _ || _ | | _ |  __ || ___/

أمناء الضرب للتعلم غير متوازن

آخر الأخبار

الإصدار 1.0.0 خارج
تقلص التقنيات المضافة
وأضاف smotewb ، بفضل szghlm
التطبيقات المطبقة لمعظم التقنيات لتعزيز الأداء
مجموعة أدوات التقييم واختيار النماذج المحسنة وتحسينها
تغطية اختبار 100 ٪
10.0 PEP8 المطابقة (بواسطة Pylint)
polynom_fit_smote الانقسام إلى 4 تقنيات مختلفة
تمت إضافة Symprod مع تطبيق Over Sampler 86 ، وذلك بفضل incouchkun

مقدمة

تنفذ الحزمة 86 متغيرًا من تقنية الأقسام الاصطناعية (SMOTE). إلى جانب التطبيقات ، يتم تزويد إطار اختيار النماذج سهل الاستخدام لتمكين التقييم السريع لتقنيات الإفراط في التغلب على مجموعات البيانات غير المرئية.

التقنيات التي تم تنفيذها: [smote] ، [smote_tomeklinks] ، [smote_enn] ، [borderline_smote1] ، [borderline_smote2] ، [adasyn] ، [ahc] ، [lle_smote] ، [quest_smote] ، [smmo] ، [polynom_fit_smote] ، stefanowski ] ، [adoms] ، [safe_level_smote] ، [msmote] ، [de_oversampling] ، [smobd] ، [sundo] ، [msyn] ، [svm_balance] ، [trim_smote] ، [smote_rsb] ، [prowsyn] ، [sl_graph_smote] ، [nrsboundary_smote] ، [lvq_smote] ، [soi_cj] ، [rose] ، [smote_out] ، [smote_cosine] ، [selection_smote] ، [ln_smote] ، [mwmote] ، [pdfos] ، [ipade_id] ، [rwo_sampling] ، ] ، [deago] ، [gazzah] ، [mct] ، [adg] ، [smote_ipf] ، [kerneladasyn] ، [mot2ld] ، [v_synth] ، [oups] ، [smote_d] ، [smote_pso] ، [cure_smote] ، [somo] ، [isomap_hybrid] ، [ce_smote] ، [edge_det_smote] ، [cbso] ، [e_smote] ، [dbsmote] ، [asmobd] ، [assembled_smote] ، [sdsmote] ، [dsmote] ، [g_smote] ، [nt_smote] ] , [Lee] , [SPY] , [SMOTE_PSOBAT] , [MDO] , [Random_SMOTE] , [ISMOTE] , [VIS_RST] , [GASMOTE] , [A_SUWO] , [SMOTE_FRST_2T] , [AND_SMOTE] , [NRAS] , [AMSCO] ، [SSO] ، [NDO_Sampling] ، [DSRBF] ، [Gaussian_smote] ، [Kmeans_smote] ، [superized_smote] ، [sn_smote] ، [CCR] ، [ANS] ، ]

المقارنة والتقييم

للحصول على مقارنة مفصلة وتقييم لجميع التقنيات التي تم تنفيذها ، راجع link_to_comparison_paper

اقتباس

إذا كنت تستخدم هذه الحزمة في بحثك ، فيرجى التفكير في الاستشهاد بالأوراق أدناه.

preprint تصف الحزمة انظر link_to_package_paper

bibtex للحزمة:

 @article { smote-variants ,
  author = { Gy"orgy Kov'acs } ,
  title = { smote-variants: a Python Implementation of 85 Minority Oversampling Techniques } ,
  journal = { Neurocomputing } ,
  note = { (IF-2019=4.07) } ,
  volume = { 366 } ,
  pages = { 352--354 } ,
  year = { 2019 } ,
  group = { journal } ,
  code = { https://github.com/analyticalmindsltd/smote_variants } ,
  doi = { 10.1016/j.neucom.2019.06.100 }
}

للاطلاع على preprint للدراسة المقارنة ، راجع link_to_evaluation_paper

bibtex للمقارنة والتقييم:

 @article { smote-comparison ,
  author = { Gy"orgy Kov'acs } ,
  title = { An empirical comparison and evaluation of minority oversampling techniques on a large number of imbalanced datasets } ,
  journal = { Applied Soft Computing } ,
  note = { (IF-2019=4.873) } ,
  volume = { 83 } ,
  pages = { 105662 } ,
  year = { 2019 } ,
  link = { https://www.sciencedirect.com/science/article/pii/S1568494619304429 } ,
  group = { journal } ,
  code = { https://github.com/analyticalmindsltd/smote_variants } ,
  doi = { 10.1016/j.asoc.2019.105662 }
}

تثبيت

يمكن استنساخ الحزمة من GitHub بالطريقة المعتادة ، وأحدث إصدار مستقر متاح أيضًا في مستودع PYPI:

pip install smote-variants

الوثائق

للحصول على وثائق مفصلة ، راجع http://smote-variants.readthedocs.io.
للحصول على برنامج تعليمي على YouTube ، تحقق https://www.youtube.com/watch؟v=gsk7akqpm60

أفضل الممارسات

التطبيع/التقييس/التحجيم/اختيار الميزة

تعمل معظم تقنيات الإفراط في الإلغاء في المساحة الإقليدية التي تنطوي عليها السمات. لذلك ، من المهم للغاية تطبيع/توسيع السمات بشكل مناسب. مع عدم وجود معرفة بأهمية السمات ، فإن التطبيع/التقييس هو محاولة جيدة. وجود بعض المعرفة بالمجال أو أهمية السمة من تصنيف Bootstrap ، فإن تحجيم نطاقات السمات وفقًا لأهميتها أمر معقول أيضًا. بدلاً من ذلك ، قد يحسن اختيار المجموعة الفرعية أيضًا النتائج عن طريق الإفراط في العمل في المساحة الفرعية الأنسب.

اختيار النموذج لعدد العينات المراد إنشاء

التصنيف بعد الإفراط في التخطيط حساس للغاية لعدد عينات الأقليات التي يتم إنشاؤها. نادراً ما يكون التوازن بين مجموعة البيانات هو الخيار الصحيح ، حيث أن معظم المصنفات تعمل بشكل أكثر كفاءة إذا كانت كثافة العينات الإيجابية والسلبية بالقرب من حدود القرار هي نفسها تقريبًا. إذا لم يكن لمشعبات الطبقات الإيجابية والسلبية نفس الحجم تقريبًا ، فلا يمكن أن تحقق موازنة مجموعة البيانات ذلك. علاوة على ذلك ، في بعض المناطق ، يمكن أن يعود الموقف: إذا كان مشعب فئة الأقلية أصغر بكثير من فئة الأغلبية ، فإن الموازنة ستحول فئة الأقلية إلى الأغلبية في البيئات المحلية على طول حدود القرار.

الحل هو تطبيق اختيار النموذج لعدد العينات التي يتم إنشاؤها. تحتوي جميع التقنيات التي تم تنفيذها تقريبًا في حزمة `smote-variants` على معلمة تسمى `proportion` . تتحكم هذه المعلمة في عدد العينات التي يجب توليدها ، وهي عدد عينات الأقليات التي تم إنشاؤها هي `proportion*(N_maj - N_min)` ، أي تحديد معلمة النسبة إلى 1 سيوازن مجموعة البيانات. يوصى بشدة بتنفيذ اختيار النموذج المتقاطع لمجموعة مثل `proportion` = 0.1 ، 0.2 ، 0.5 ، 1.0 ، 2.0 ، 5.0.

استخدام العينة

الإفراط الثنائي

 import smote_variants as sv
import imbalanced_databases as imbd

dataset = imbd . load_iris0 ()
X , y = dataset [ 'data' ], dataset [ 'target' ]

oversampler = sv . distance_SMOTE ()

# X_samp and y_samp contain the oversampled dataset
X_samp , y_samp = oversampler . sample ( X , y )

تعدد الأسماك الزائدة

 import smote_variants as sv
import sklearn . datasets as datasets

dataset = datasets . load_wine ()
X , y = dataset [ 'data' ], dataset [ 'target' ]

oversampler = sv . MulticlassOversampling ( oversampler = 'distance_SMOTE' ,
                                      oversampler_params = { 'random_state' : 5 })

# X_samp and y_samp contain the oversampled dataset
X_samp , y_samp = oversampler . sample ( X , y )

اختيار أفضل العزلة المفرطة

 from sklearn . neighbors import KNeighborsClassifier
from sklearn . tree import DecisionTreeClassifier
import smote_variants as sv
import sklearn . datasets as datasets

dataset = datasets . load_breast_cancer ()

dataset = { 'data' : dataset [ 'data' ],
          'target' : dataset [ 'target' ],
          'name' : 'breast_cancer' }

classifiers = [( 'sklearn.neighbors' , 'KNeighborsClassifier' , {}),
              ( 'sklearn.tree' , 'DecisionTreeClassifier' , {})]

oversamplers = sv . queries . get_all_oversamplers ( n_quickest = 2 )

os_params = sv . queries . generate_parameter_combinations ( oversamplers ,
                                                      n_max_comb = 2 )

# samp_obj and cl_obj contain the oversampling and classifier objects which give the
# best performance together
samp_obj , cl_obj = sv . evaluation . model_selection ( dataset = dataset ,
                                                oversamplers = os_params ,
                                                classifiers = classifiers ,
                                                validator_params = { 'n_splits' : 2 ,
                                                                  'n_repeats' : 1 },
                                                n_jobs = 5 )

# training the best techniques using the entire dataset
X_samp , y_samp = samp_obj . sample ( dataset [ 'data' ],
                                dataset [ 'target' ])
cl_obj . fit ( X_samp , y_samp )

التكامل مع خطوط أنابيب Sklearn

 import smote_variants as sv
import imblearn . datasets as imb_datasets

from sklearn . model_selection import train_test_split , GridSearchCV
from sklearn . pipeline import Pipeline
from sklearn . preprocessing import StandardScaler
from sklearn . neighbors import KNeighborsClassifier

libras = imb_datasets . fetch_datasets ()[ 'libras_move' ]
X , y = libras [ 'data' ], libras [ 'target' ]

oversampler = ( 'smote_variants' , 'MulticlassOversampling' ,
                { 'oversampler' : 'distance_SMOTE' , 'oversampler_params' : {}})

classifier = ( 'sklearn.neighbors' , 'KNeighborsClassifier' , {})

# Constructing a pipeline which contains oversampling and classification
# as the last step.
model = Pipeline ([( 'scale' , StandardScaler ()),
                ( 'clf' , sv . classifiers . OversamplingClassifier ( oversampler , classifier ))])

model . fit ( X , y )

التكامل مع بحث شبكة Sklearn

 import smote_variants as sv
import imblearn . datasets as imb_datasets

from sklearn . model_selection import train_test_split , GridSearchCV
from sklearn . pipeline import Pipeline
from sklearn . preprocessing import StandardScaler
from sklearn . neighbors import KNeighborsClassifier

libras = imb_datasets . fetch_datasets ()[ 'libras_move' ]
X , y = libras [ 'data' ], libras [ 'target' ]

oversampler = ( 'smote_variants' , 'MulticlassOversampling' ,
                { 'oversampler' : 'distance_SMOTE' , 'oversampler_params' : {}})

classifier = ( 'sklearn.neighbors' , 'KNeighborsClassifier' , {})

# Constructing a pipeline with oversampling and classification as the last step
model = Pipeline ([( 'scale' , StandardScaler ()),
                ( 'clf' , sv . classifiers . OversamplingClassifier ( oversampler , classifier ))])

param_grid = { 'clf__oversampler' :[( 'smote_variants' , 'distance_SMOTE' , { 'proportion' : 0.5 }),
                                ( 'smote_variants' , 'distance_SMOTE' , { 'proportion' : 1.0 }),
                                ( 'smote_variants' , 'distance_SMOTE' , { 'proportion' : 1.5 })]}

# Specifying the gridsearch for model selection
grid = GridSearchCV ( model ,
                  param_grid = param_grid ,
                  cv = 3 ,
                  n_jobs = 1 ,
                  verbose = 2 ,
                  scoring = 'accuracy' )

# Fitting the pipeline
grid . fit ( X , y )

مساهمة

لا تتردد في تنفيذ أي تقنيات الإفراط في الإفراط ودعونا نناقش الرموز بمجرد أن يكون طلب السحب جاهزًا!

مراجع

[Shosote]

Chawla ، NV and Bowyer ، KW and Hall ، Lo and Kegelmeyer ، WP ، "{Smote}: تقنية أخذ العينات الإفراط في الأقلية الاصطناعية" ، مجلة أبحاث الذكاء الاصطناعي ، 2002 ، ص 321-357

[smote_tomeklinks]

Batista و Gustavo Eapa و Prati ، Ronaldo C. and Monard ، ماريا كارولينا ، "دراسة لسلوك عدة طرق لتحقيق التوازن بين بيانات التدريب على التعلم الآلي" ، SIGKDD Explor. Newsl. ، 2004 ، pp. 20-29

[smote_enn]

[Borderline_Smote1]

HA ، "الحدود الحدودية: طريقة جديدة للانتعاش في مجموعات البيانات غير المتوازنة" ، التقدم في الحوسبة الذكية ، 2005 ، الصفحات 878-887

[Borderline_Smote2]

[Adasyn]

He ، H. and Bai ، Y. and Garcia ، EA and Li ، S.

[AHC]

جيل كوهين وميلاني هيلاريو وهوجو ساكس وستيفان هوغونيت وأنطوان جيسبولر ، "التعلم من البيانات غير المتوازنة في مراقبة العدوى النوسومية" ، الذكاء الاصطناعي في الطب ، 2006 ، ص 7 - 18

[lle_smote]

Wang ، J. and Xu ، M. and Wang ، H. and Zhang ، J.

[RISTING_SMOTE]

De la Calleja ، J. and Fuentes ، O. ، "طريقة عينة من العوامل المفرطة على المسافة للتعلم من مجموعات البيانات غير المتوازنة" ، وقائع الذكاء الاصطناعي الدولي في فلوريدا ، 2007 ، ص 634-635

[SMMO]

دي لا كاليجا ، خورخي وفوينتيس ، أولاك وغونزاليس ، خيسوس ، "اختيار أمثلة من الأقليات من البيانات الخاطئة من أجل الإفراط في أخذ العينات". ، وقائع مؤتمر جمعية أبحاث الذكاء الاصطناعي الدولي الحادي والعشرين في فلوريدا ، 2008 ، الصفحات 276-281

[polynom_fit_smote]

Gazzah ، S. and Amara ، NEB ، "أساليب الإفراط في الإفراط القائمة على التركيب متعدد الحدود لمجموعات البيانات غير المتوازنة" ، 2008 ورشة عمل IPR الدولية الثامنة حول أنظمة تحليل المستندات ، 2008 ، ص. 677-684

[ستيفانوفسكي]

Stefanowski ، Jerzy و Wilk ، Szymon ، "المعالجة الانتقائية المسبقة للبيانات غير المتوازنة لتحسين أداء التصنيف" ، وقائع المؤتمر الدولي العاشر لتخزين البيانات واكتشاف المعرفة ، 2008 ، ص 283-292

[Adoms]

Tang ، S. and Chen ، S.

[SAFE_LEVEL_SMOTE]

Bunkhumpornpat ، chumphol و sinapiromsaran ، Krung و Lursinsap ، Chidchanok ، "Smote-level-level: تقنية الأقلية ذات المستوى الآمن في المركز الثالث عشر في التقدم في المعرفة Discovery و Data Mining ، 2009 ، pp. 475--482

[msmote]

Hu و Shengguo و Liang و Yanfeng و MA و Lintao و He ، Ying ، "MSMOTE: تحسين أداء التصنيف عندما تكون بيانات التدريب غير متوازنة" ، وقائع ورشة العمل الدولية الثانية لعام 2009 في علوم الكمبيوتر وهندسة - المجلد 02 ، 2009 ، ص. 13 -17

[de_oversampling]

Chen ، L. and Cai ، Z. and Chen ، L. and Gu ، Q. 81-85

[SMOBD]

Cao ، Q. and Wang ، S.

[صندو]

Cateni ، S. and Colla ، V. and Vannucci ، M. 402-407

[Msyn]

FA ، "طريقة أخذ العينات القائمة على الهامش للتعلم من مجموعات البيانات غير المتوازنة" ، التقدم في اكتشاف المعرفة وتعدين البيانات ، 2011 ، ص. 309-1320

[SVM_BALANCE]

Farquad ، Mah and Bose ، Indranil ، "معالجة البيانات غير المتوازنة باستخدام آلة ناقلات الدعم" ، Decis. دعم Syst. ، 2012 ، ص. 226--233

[trim_smote]

Puntumapo ، "نهج قائم على التقليم للبحث عن منطقة دقيقة ومعممة للأقليات الاصطناعية المفرطة" ، التقدم في اكتشاف المعرفة وتعدين البيانات ، 2012 ، الصفحات 371-382

[smote_rsb]

Ramento ، "Smote-RSB*: نهج معالجة مسبقة هجينة يعتمد على الإفراط في التخطيط والأخطاء السفلية لمجموعات بيانات غير متوازنة عالية باستخدام نظرية مجموعات Smote و Rough" ، أنظمة المعرفة والمعرفة ، 2012 ، ص. 245-265

[Prowsyn]

Baru ، "Prowsyn: القرب تقنية الإفراط في التغلب الاصطناعي للتعلم غير المتوازن لمجموعة البيانات" ، التقدم في اكتشاف المعرفة وتعدين البيانات ، 2013 ، ص. 317-328

[sl_graph_smote]

Bunkhumpornpat ، chumpol و subpaiboonkit ، Sitthichoke ، "الرسم البياني على المستوى الآمن لتقنيات أخذ العينات الإفراط في الأقليات الاصطناعية" ، الندوة الدولية الثالثة عشرة حول الاتصالات والمعلومات ، 2013 ، الصفحات 570-575

[nrsboundary_smote]

Feng ، Hu and Hang ، Li ، "خوارزمية جديدة للحدود التي تستند إلى نموذج المجموعة الخشنة: NRSBOUNDARY-SMOTE" ، المشكلات الرياضية في الهندسة ، 2013 ، الصفحات 10.

[lvq_smote]

Munehiro Nakamura و Yusuke Kajiwara و Atsushi Otsuka و Haruhiko Kimura ، "LVQ-SMOTE-تعليمية أقلية اصطناعية قائمة على المتجه على البيانات الطبية الحيوية" ، Biodata Mining ، 2013

[soi_cj]

Sánchez ، Atlántida I. and Morales ، Eduardo و Gonzalez ، يسوع ، "التغلب على الحالات الاصطناعية باستخدام التجميع" ، المجلة الدولية لأدوات الذكاء الاصطناعي ، 2013 ، ص.

[وَردَة]

Menard ، "تدريب وتقييم قواعد التصنيف مع البيانات غير المتوازنة" ، استخراج البيانات واكتشاف المعرفة ، 2014 ، الصفحات 92-122

[smote_out]

Fajri Koto ، "Smote-Out ، Smote-cosine ، و Smote المختارة: استراتيجية تعزيز للتعامل مع عدم التوازن في مستوى البيانات" ، 2014 المؤتمر الدولي لعلوم الكمبيوتر والمعلومات المتقدمة ، 2014 ، الصفحات 280-284

[smote_cosine]

[select_smote]

[ln_smote]

Maciejewski ، T. and Stefanowski ، J.

[MWMOTE]

Barua ، S. and Islam ، MM و Yao ، X. and Murase ، K.

[PDFOS]

Ming Gao و Xia Hong و Sheng Chen و Chris J. Harris و Emad Khalaf ، "PDFOS: PDF التقدير القائم على الإفراط في أخذ العينات لمشاكل غير متوازنة من فئتين" ، الحوسبة العصبية ، 2014 ، ص. 248-259

[ipade_id]

Victoria López و Isaac Triguero و Cristóbal J. Carmona و Salvador García و Francisco Herrera ، "معالجة التصنيف غير المتوازن مع تقنيات توليد الحالة: Ipade -ID" ، Neurocoputing ، 2014 ، ص 15 - 28

[rwo_sampling]

Zhang ، Huaxzhang and Li ، Mingfang ، "RWO-Sampling: A Random Walk Adpling Neakping to Dival Data Data" ، Information Fusion ، 2014 ، pp.

[Neater]

Almogahed ، BA و Kakadiaris ، IA ، "Neater: تصفية البيانات المفرطة العينين باستخدام نظرية اللعبة غير المتعددة" ، 2014 المؤتمر الدولي 22 حول التعرف على الأنماط ، 2014 ، ص. 1371-1376

[Deago]

Bellinger ، C. and Japkowicz ، N. and Drummond ، C.

[غزة]

Gazzah ، S. and Hechkel ، A. and Essoukri Ben Amara ، N.

[MCT]

Jiang ، Liangxiao و Qiu ، Chen and Li ، Chaoqun ، "تقنية استنساخ أقلية جديدة للتعلم الحساس للتكاليف" ، المجلة الدولية للاعتراف بالأنماط والذكاء الاصطناعي ، 2015 ، ص. 1551004

[ADG]

Pourhabib ، A. and Mallick ، Bani K. و Ding ، Yu ، "تقنية استنساخ أقلية جديدة للتعلم الحساس للتكاليف" ، مجلة أبحاث التعلم الآلي ، 2015 ، الصفحات 2695-2724

[smote_ipf]

خوسيه أ. ساوز وجوليان لوينجو وجيرزي ستيفانوفسكي وفرانسيسكو هيريرا ، "Smote -IPF: معالجة مشكلة صاخبة ومتأثرة في التصنيف غير متوازن من خلال طريقة إعادة أخذ العينات مع التصفية" ، علوم المعلومات ، 2015 ، ص. 184 - 203

[kerneladasyn]

Tang ، B. و He ، H. ، "Kerneladasyn: توليد البيانات الاصطناعية التكيفية القائمة على Kernel للتعلم غير المتوازنة" ، 2015 IEEE Congress on Agotalary (CEC) ، 2015 ، pp. 664-671

[MOT2LD]

الحادي عشر ، "طريقة الإفراط في أخذ الأقلية الاصطناعية تعتمد على الكثافة المحلية في الفضاء المنخفض الأبعاد للتعلم غير المتوازن" ، أنظمة قاعدة البيانات للتطبيقات المتقدمة ، 2015 ، الصفحات 3-18

[v_synth]

يونغ ، الثاني ، وليام أ. Appl. ، 2015 ، pp. 1041-1054

[OUPS]

William A. Rivera و Petros Xanthopoulos ، "أساليب أخذ العينات الإفراط في التوليف المسبق لزيادة حساسية التصنيف في مجموعات البيانات غير المتوازنة" ، أنظمة الخبراء مع التطبيقات ، 2016 ، ص 124 - 135

[smote_d]

Torre ، "Smote-D A النسخة الحتمية من Smote" ، التعرف على الأنماط ، 2016 ، الصفحات 177-188

[smote_pso]

Jair Cervantes و Farid Garcia-Lamont و Lisbeth Rodriguez و Asdrúbal López و José Ruiz Castilla و Adrian Trueba ، "الطريقة المستندة إلى PSO لتصنيف SVM على مجموعات البيانات المنحرفة" ، Neurocputing ، 2017 ، 187-187-197.

[cure_smote]

M ، "خوارزمية Cure-smote والخوارزمية الهجينة لاختيار الميزات وتحسين المعلمة استنادًا إلى الغابات العشوائية" ، BMC Bioinformatics ، 2017 ، pp. 169

[سومو]

Georgios Douzas و Fernando Bacao ، "Overgling Map Overgling (SOMO) لتعلم مجموعة البيانات غير المتوازنة" ، أنظمة الخبراء مع التطبيقات ، 2017 ، الصفحات 40 - 52

[isomap_hybrid]

Gu و Qiong و Cai و Zhihua و Zhu ، Li ، "تصنيف مجموعات البيانات غير المتوازنة باستخدام خوارزمية إعادة أخذ العينات المختلطة على أساس ISOMAP" ، وقائع الندوة الدولية الرابعة حول التقدم في الحساب والذكاء ، 2009 ، ص. 287- -296

[CE_SMOTE]

Chen ، S. and Guo ، G. and Chen ، L. ، "طريقة جديدة للإفراط في أخذ العينات تستند إلى مجموعات الكتلة" ، 2010 المؤتمر الدولي 24 IEEE حول شبكات المعلومات المتقدمة والتطبيقات ، 2010 ، الصفحات 599-604

[edge_det_smote]

Kang ، Y. and Won ، S.

[CBSO]

Baru ، "تقنية جديدة من الأقلية الاصطناعية المفرطة للتعلم مجموعة البيانات غير متوازنة" ، معالجة المعلومات العصبية ، 2011 ، الصفحات 735-744

[E_Smote]

Deepa ، T. and Punithavalli ، M. ، "A Smote Technique لاختيار الميزات في مجموعة بيانات غير متوازنة عالية الأبعاد" ، 2011 المؤتمر الدولي الثالث حول تكنولوجيا الكمبيوتر الإلكترونيات ، 2011 ، الصفحات 322-324

[DBSMote]

Bunkhumpornpa ، "DBSMOTE: تقنية الإفراط في أخذ العينات الأقلية القائمة على الكثافة" ، الذكاء التطبيقي ، 2012 ، ص 664-684

[ASMOBD]

Senzhang Wang و Zhoujun Li و Wenhan Chao و Qinghua Cao ، "تطبيق تقنية التكييف الإفراط في أخذ العينات القائمة على كثافة البيانات و SVM حساسة التكلفة للتعلم غير المتوازن" ، المؤتمر الدولي المشترك لعام 2012 على الشبكات العصبية (IJCNN) ، 2012 ، pp. -8

[Assembled_smote]

Zhou ، B. and Yang ، C. and Guo ، H. and Hu ، J. ص. 1-7

[sdsmote]

Li ، K. and Zhang ، W. and Lu ، Q. and Fang ، X. ، ص 34-38

[DSMOTE]

Mahmoudi ، S. and Moradi ، P. and Akhlaghian ، F. and Moradi ، R. ، ص. 152-158

[G_Smote]

Sandhan ، T. and Choi ، JY ، "معالجة مجموعات البيانات غير المتوازنة من خلال أخذ العينات الهجينة الموجهة جزئيًا للتعرف على الأنماط" ، 2014 المؤتمر الدولي 22 حول التعرف على الأنماط ، 2014 ، الصفحات 1449-1453

[nt_smote]

Xu و YH و LI و H. و LE و LP و Tian ، XY ، "تقنية الأقلية الاصطناعية الثلاثي المثلثية للتنبؤ غير المتوازن على عينات صغيرة من شركات السياحة الصينية والضيافة" ، 2014 المؤتمر الدولي السابع للعلوم الحسابية والعلوم الحسابية ، 2014 ، الصفحات 534-538

[لي]	Lee و Jaedong و Kim و Noo-Ri و Lee و Jee Hyong ، "تقنية عطلات مفرطة مع رفض التعلم الصف غير متوازن" ، وقائع المؤتمر الدولي التاسع حول إدارة المعلومات في كل مكان ، 2015 ، ص 102: 1 -102: 6

[جاسوس]

Dang ، XT و Tran ، DH و Hirose ، O. and Satou ، K. 280-285

[smote_psobat]

Li ، J. and Fong ، S. and Zhuang ، Y.

[MDO]

Abdi ، L. and Hashemi ، S. ، "لمكافحة المشكلات غير المتوازنة متعددة الفقار

[Random_Smote]

Don ، "نهج جديد للغاية للأخذ العينات: SMOTE العشوائي للتعلم من مجموعات البيانات غير المتوازنة" ، المعرفة Scienc ، 2011 ، الصفحات 343-352

[Ismote]

L ، "طريقة أخذ عينات جديدة للبيانات غير المتوازنة" ، وقائع مؤتمر 2013 الأتمتة الذكي الصينية ، 2013 ، ص 547-554

[vis_rst]

Borowsk ، "تصنيف البيانات غير المتوازنة: نهج جديد لإعادة أخذ العينات يجمع بين مجموعات Smote و Rough المحسنة متعددة الاستخدامات" ، أنظمة معلومات الكمبيوتر والإدارة الصناعية ، 2016 ، ص 31-42

[Gasmote]

جيان ، "خوارزمية جديدة لتصنيف بيانات عدم التوازن القائمة على الخوارزمية الجينية المحسنة Smote" ، المجلة العربية للعلوم والهندسة ، 2016 ، ص 3255-3266

[A_SUWO]

Iman Nekooeimehr و Susana K. Lai-Yuen ، "التكييف شبه غير الخاضع للإشراف (A-Suwo) لمجموعات البيانات غير المتوازنة" ، أنظمة الخبراء مع التطبيقات ، 2016 ، ص. 405-416

[smote_frst_2t]

RAMENTO ، "التعلم غير المتوازن الغامض لتشخيص صيانة قاطع الدائرة عالية الجهد: خوارزمية Smote-Frst-2T" ، التطبيقات الهندسية للذكاء الاصطناعي ، 2016 ، ص. 134-139

[و_smote]

Yun و Jaesub و Ha و Jihyun و Lee ، Jong-Seok ، "التحديد التلقائي لحجم الحي في Smote" ، وقائع المؤتمر الدولي العاشر حول إدارة المعلومات والاتصالات في كل مكان ، 2016 ، ص 100: 1-100: 8

[NRAS]

William A. Rivera ، "الحد من الضوضاء ، أخذ عينات زائدة من الاصطناعية لمجموعات البيانات غير المتوازنة من الدرجة" ، علوم المعلومات ، 2017 ، الصفحات 146 - 161

[Amsco]

Jinyan Li و Simon Fong و Raymond K. Wong و Victor W. Chu ، "اندماج Swarm متعدد الأهداف للتكيف لتصنيف البيانات غير المتوازنة" ، Information Fusion ، 2018 ، pp. 1 - 24

[SSO]

رون ، "تقنية الإفراط في الحساسية العشوائية للبيانات غير المتوازنة" ، التعلم الآلي وعلم الإنترنت ، 2014 ، الصفحات 161-171

[ndo_sampling]

Zhang ، L. و Wang ، W.

[DSRBF]

فرانسيسكو فرنانديز نافارو وسيسار هيرفاس مارتنيز وبيدرو أنطونيو جوتيريز ، "إجراء عدد مفرط ديناميكي يعتمد على حساسية لمشاكل متعددة الطبقة" ، التعرف على الأنماط ، 2011 ، ص. 1821-1833

[Gaussian_smote]

Hansoo Lee و Jonggeun Kim و Sungshin Kim ، "خوارزمية Smote التي تتخذ من غاوسي مقراً لها لحل توزيعات الفئة المنحرفة" ، Int. J. Fuzzy Logic and Intelligent Systems ، 2017 ، pp. 229-234

[kmeans_smote]

جورجيوس دوزاس وفرناندو باكو وفيليكس الماضيان ، "تحسين التعلم غير المتوازن من خلال طريقة الإفراط في الإرشاد القائم على K -Means و Smote" ، علوم المعلومات ، 2018 ، الصفحات 1 - 20

[superired_smote]

Hu و Jun و He و Xue و Yu و Dong-Jun و Yang و Xi-Bei و Yang و Jing-Yu و Shen ، Hong-Bin ، "خوارزمية جديدة للإفراط في أخذ العينات مع تطبيق على تنبؤات بقايا البروتين النوكليوتيد" ، PLOS One ، 2014 ، pp. 1-10

[sn_smote]

Garc {'i} ، "Smote المحيطة بالحيات للتعلم من مجموعات البيانات غير المتوازنة" ، التقدم في الذكاء الاصطناعي ، 2012 ، الصفحات 347-362

[CCR]

Koziarski و Michał و Wozniak ، Michal ، "CCR: خوارزمية تنظيف وعودة إلى إعادة تشكيل مجمعة لتصنيف البيانات غير المتوازنة" ، المجلة الدولية للرياضيات التطبيقية وعلوم الكمبيوتر ، 2017 ، الصفحات 727-736

[الجواب]

Siriseriwan ، W and Sinapiromsaran ، Krung ، "تقنية التكييف التكيفية للأقلية الاصطناعية تحت معالجة 1NN Outcast" ، Songklanakarin Journal of Science and Technology ، 2017 ، pp. 565-576

[cluster_smote]

Cieslak ، DA and Chawla ، NV و Striegel ، A.

[Symprod]

Kunakorntum ، I. and Hinthong ، W. and Phunchongharn ، P.

[smotewb]

Sağlam ، F. and Cengiz ، MA ، "A Novel Reshampling Technique Detection Trough Trough Detection وإجراء التعزيز" ، أنظمة الخبراء مع التطبيقات ، 2022 ، ص. 117023

يوسع