
_ _ _
___ _ __ ___ ___ | | _ ___ __ __ __ _ _ __ (_) __ _ _ __ | | _ ___
/ __ || '_ `_ / _ | __ | / _ _____ / // _` || '__ || | / _` || '_ | __ |/ __ |
__ | | | | | || (_) || | _ | __ /| _____ | V /| (_ | || | | || (_ | || | | || | _ __
| ___/| _ | | _ | | _ | ___/ __ | ___ | _/ __, _ || _ | | _ | __, _ || _ | | _ | __ || ___/
Smote-varian untuk pembelajaran yang tidak seimbang
Berita terbaru
- 1.0.0 rilis keluar
- Teknik undersampling ditambahkan
- Smotewb ditambahkan, berkat @szghlm
- Implementasi yang di vektor untuk sebagian besar teknik untuk meningkatkan kinerja
- Toolkit evaluasi dan pemilihan model yang diperbaiki dan ditingkatkan
- Cakupan uji 100%
- 10.0 Pep8 Conformancy (oleh Pylint)
- polynom_fit_smote split menjadi 4 teknik berbeda
- Symprod ditambahkan sebagai oversampler ke -86 yang diimplementasikan, terima kasih kepada @intouchkun
Perkenalan
Paket ini mengimplementasikan 86 varian teknik oversampling minoritas sintetis (Smote). Selain implementasi, kerangka kerja pemilihan model yang mudah digunakan disediakan untuk memungkinkan evaluasi cepat teknik oversampling pada kumpulan data yang tidak terlihat.
The implemented techniques: [SMOTE] , [SMOTE_TomekLinks] , [SMOTE_ENN] , [Borderline_SMOTE1] , [Borderline_SMOTE2] , [ADASYN] , [AHC] , [LLE_SMOTE] , [distance_SMOTE] , [SMMO] , [polynom_fit_SMOTE] , [Stefanowski ], [Adoms], [safe_level_smote], [msmote], [de_oversampling], [smobd], [sundo], [msyn], [svm_balance], [trim_smote], [smote_rsb], [prowsyn], [sl_graph_smote], [Nrsboundary_smote], [lvq_smote], [soi_cj], [rose], [smote_out], [smote_cosine], [selected_smote], [ln_smote], [mwmote], [neater], [ipade_id], [rwo_sampling], [neater], [ipade_id], [rwo_sampling], [neater], [nea. ], [Deago], [gazzah], [mct], [adg], [smote_ipf], [kerneladasyn], [mot2ld], [v_synth], [oups], [smote_d], [smote_pso], [Cure_smote], [Somo], [isomap_hybrid], [ce_smote], [edge_det_smote], [cbso], [e_smote], [dbsmote], [asmobd], [rakitan_smote], [sdsmote], [dsmote], [g_smote], [nt_smote], [dsmote], [g_smote], [nt_smote ], [Lee], [spy], [smote_psobat], [mdo], [random_smote], [isMote], [vis_rst], [gasmote], [a_suwo], [smote_frst_2t], [dan_smote], [nraS], [Amsco], [sso], [ndo_sampling], [dsrbf], [gaussian_smote], [kmeans_smote], [supervised_smote], [sn_smote], [ccr], [ans], [cluster_smote], [symprod], [smotewb ]
Perbandingan dan Evaluasi
Untuk perbandingan dan evaluasi terperinci dari semua teknik yang diimplementasikan, lihat Link_to_Comparison_paper
Kutipan
Jika Anda menggunakan paket ini dalam penelitian Anda, harap pertimbangkan mengutip makalah di bawah ini.
Preprint menggambarkan paket lihat link_to_package_paper
Bibtex untuk paket:
@article { smote-variants ,
author = { Gy"orgy Kov'acs } ,
title = { smote-variants: a Python Implementation of 85 Minority Oversampling Techniques } ,
journal = { Neurocomputing } ,
note = { (IF-2019=4.07) } ,
volume = { 366 } ,
pages = { 352--354 } ,
year = { 2019 } ,
group = { journal } ,
code = { https://github.com/analyticalmindsltd/smote_variants } ,
doi = { 10.1016/j.neucom.2019.06.100 }
}
Untuk preprint dari studi perbandingan, lihat link_to_evaluasi_paper
Bibtex untuk perbandingan dan evaluasi:
@article { smote-comparison ,
author = { Gy"orgy Kov'acs } ,
title = { An empirical comparison and evaluation of minority oversampling techniques on a large number of imbalanced datasets } ,
journal = { Applied Soft Computing } ,
note = { (IF-2019=4.873) } ,
volume = { 83 } ,
pages = { 105662 } ,
year = { 2019 } ,
link = { https://www.sciencedirect.com/science/article/pii/S1568494619304429 } ,
group = { journal } ,
code = { https://github.com/analyticalmindsltd/smote_variants } ,
doi = { 10.1016/j.asoc.2019.105662 }
}
Instalasi
Paket dapat dikloning dari Github dengan cara yang biasa, dan versi stabil terbaru juga tersedia di repositori PYPI:
pip install smote-variants
Dokumentasi
- Untuk dokumentasi terperinci, lihat http://smote-variants.readthedocs.io.
- Untuk tutorial YouTube, periksa https://www.youtube.com/watch?v=gsk7akqpm60
Praktik terbaik
Normalisasi/standardisasi/penskalaan/pemilihan fitur
Sebagian besar teknik oversampling beroperasi di ruang Euclidean yang tersirat oleh atribut. Oleh karena itu, sangat penting untuk menormalkan/skala atribut dengan tepat. Tanpa pengetahuan tentang pentingnya atribut, normalisasi/standardisasi adalah percobaan pertama yang baik. Memiliki beberapa pengetahuan domain atau atribut penting dari klasifikasi bootstrap, penskalaan rentang atribut sesuai dengan kepentingannya juga masuk akal. Atau, pemilihan subset fitur juga dapat meningkatkan hasil dengan pekerjaan oversampling di subruang yang paling cocok.
Pemilihan model untuk jumlah sampel yang akan dihasilkan
Klasifikasi setelah oversampling sangat sensitif terhadap jumlah sampel minoritas yang dihasilkan. Menyeimbangkan dataset jarang merupakan pilihan yang tepat, karena sebagian besar pengklasifikasi beroperasi paling efisien jika kepadatan sampel positif dan negatif di dekat batas keputusan kira -kira sama. Jika manifold kelas positif dan negatif tidak memiliki ukuran yang sama, menyeimbangkan dataset tidak dapat mencapai ini. Selain itu, di daerah -daerah tertentu bahkan dapat mengembalikan situasi: jika manifold kelas minoritas jauh lebih kecil daripada kelas mayoritas, menyeimbangkan akan mengubah kelas minoritas menjadi mayoritas di lingkungan lokal di sepanjang batas keputusan.
Solusinya adalah menerapkan pemilihan model untuk jumlah sampel yang dihasilkan. Hampir semua teknik yang diimplementasikan dalam paket `smote-variants`
memiliki parameter yang disebut` `proportion`
. Parameter ini mengontrol berapa banyak sampel untuk menghasilkan, yaitu, jumlah sampel minoritas yang dihasilkan adalah `proportion*(N_maj - N_min)`
, yaitu, mengatur parameter proporsi ke 1 akan menyeimbangkan dataset. Sangat disarankan untuk melakukan pemilihan model silang-validasi untuk kisaran seperti `proportion`
= 0,1, 0,2, 0,5, 1,0, 2,0, 5,0.
Penggunaan Sampel
Oversampling biner
import smote_variants as sv
import imbalanced_databases as imbd
dataset = imbd . load_iris0 ()
X , y = dataset [ 'data' ], dataset [ 'target' ]
oversampler = sv . distance_SMOTE ()
# X_samp and y_samp contain the oversampled dataset
X_samp , y_samp = oversampler . sample ( X , y )
Oversampling multiclass
import smote_variants as sv
import sklearn . datasets as datasets
dataset = datasets . load_wine ()
X , y = dataset [ 'data' ], dataset [ 'target' ]
oversampler = sv . MulticlassOversampling ( oversampler = 'distance_SMOTE' ,
oversampler_params = { 'random_state' : 5 })
# X_samp and y_samp contain the oversampled dataset
X_samp , y_samp = oversampler . sample ( X , y )
Pemilihan oversampler terbaik
from sklearn . neighbors import KNeighborsClassifier
from sklearn . tree import DecisionTreeClassifier
import smote_variants as sv
import sklearn . datasets as datasets
dataset = datasets . load_breast_cancer ()
dataset = { 'data' : dataset [ 'data' ],
'target' : dataset [ 'target' ],
'name' : 'breast_cancer' }
classifiers = [( 'sklearn.neighbors' , 'KNeighborsClassifier' , {}),
( 'sklearn.tree' , 'DecisionTreeClassifier' , {})]
oversamplers = sv . queries . get_all_oversamplers ( n_quickest = 2 )
os_params = sv . queries . generate_parameter_combinations ( oversamplers ,
n_max_comb = 2 )
# samp_obj and cl_obj contain the oversampling and classifier objects which give the
# best performance together
samp_obj , cl_obj = sv . evaluation . model_selection ( dataset = dataset ,
oversamplers = os_params ,
classifiers = classifiers ,
validator_params = { 'n_splits' : 2 ,
'n_repeats' : 1 },
n_jobs = 5 )
# training the best techniques using the entire dataset
X_samp , y_samp = samp_obj . sample ( dataset [ 'data' ],
dataset [ 'target' ])
cl_obj . fit ( X_samp , y_samp )
Integrasi dengan pipa sklearn
import smote_variants as sv
import imblearn . datasets as imb_datasets
from sklearn . model_selection import train_test_split , GridSearchCV
from sklearn . pipeline import Pipeline
from sklearn . preprocessing import StandardScaler
from sklearn . neighbors import KNeighborsClassifier
libras = imb_datasets . fetch_datasets ()[ 'libras_move' ]
X , y = libras [ 'data' ], libras [ 'target' ]
oversampler = ( 'smote_variants' , 'MulticlassOversampling' ,
{ 'oversampler' : 'distance_SMOTE' , 'oversampler_params' : {}})
classifier = ( 'sklearn.neighbors' , 'KNeighborsClassifier' , {})
# Constructing a pipeline which contains oversampling and classification
# as the last step.
model = Pipeline ([( 'scale' , StandardScaler ()),
( 'clf' , sv . classifiers . OversamplingClassifier ( oversampler , classifier ))])
model . fit ( X , y )
Integrasi dengan pencarian grid sklearn
import smote_variants as sv
import imblearn . datasets as imb_datasets
from sklearn . model_selection import train_test_split , GridSearchCV
from sklearn . pipeline import Pipeline
from sklearn . preprocessing import StandardScaler
from sklearn . neighbors import KNeighborsClassifier
libras = imb_datasets . fetch_datasets ()[ 'libras_move' ]
X , y = libras [ 'data' ], libras [ 'target' ]
oversampler = ( 'smote_variants' , 'MulticlassOversampling' ,
{ 'oversampler' : 'distance_SMOTE' , 'oversampler_params' : {}})
classifier = ( 'sklearn.neighbors' , 'KNeighborsClassifier' , {})
# Constructing a pipeline with oversampling and classification as the last step
model = Pipeline ([( 'scale' , StandardScaler ()),
( 'clf' , sv . classifiers . OversamplingClassifier ( oversampler , classifier ))])
param_grid = { 'clf__oversampler' :[( 'smote_variants' , 'distance_SMOTE' , { 'proportion' : 0.5 }),
( 'smote_variants' , 'distance_SMOTE' , { 'proportion' : 1.0 }),
( 'smote_variants' , 'distance_SMOTE' , { 'proportion' : 1.5 })]}
# Specifying the gridsearch for model selection
grid = GridSearchCV ( model ,
param_grid = param_grid ,
cv = 3 ,
n_jobs = 1 ,
verbose = 2 ,
scoring = 'accuracy' )
# Fitting the pipeline
grid . fit ( X , y )
Kontribusi
Jangan ragu untuk menerapkan teknik oversampling lebih lanjut dan mari kita bahas kode segera setelah permintaan tarik siap!
Referensi
[Smote] | Chawla, NV dan Bowyer, KW dan Hall, Lo dan Kegelmeyer, WP, "{Smote}: Teknik Pengambilan Sampel Minoritas Sintetis", Jurnal Penelitian Kecerdasan Buatan, 2002, hlm. 321--357 |
[Smote_tomeklinks] | Batista, Gustavo Eapa dan Prati, Ronaldo C. dan Monard, Maria Carolina, "Sebuah studi tentang perilaku beberapa metode untuk menyeimbangkan data pelatihan pembelajaran mesin", SIGKDD Explor. Newsl., 2004, hlm. 20--29 |
[Smote_enn] | Batista, Gustavo Eapa dan Prati, Ronaldo C. dan Monard, Maria Carolina, "Sebuah studi tentang perilaku beberapa metode untuk menyeimbangkan data pelatihan pembelajaran mesin", SIGKDD Explor. Newsl., 2004, hlm. 20--29 |
[Borderline_smote1] | Ha, "Borderline-Smote: Metode Pengambilan Samping Baru dalam Set Pembelajaran Data yang Tidak Seimbang", Kemajuan dalam Komputasi Cerdas, 2005, hlm. 878--887 |
[Borderline_smote2] | Ha, "Borderline-Smote: Metode Pengambilan Samping Baru dalam Set Pembelajaran Data yang Tidak Seimbang", Kemajuan dalam Komputasi Cerdas, 2005, hlm. 878--887 |
[Adasyn] | Dia, H. dan Bai, Y. dan Garcia, Ea dan Li, S., "{ADASYN}: Pendekatan pengambilan sampel sintetis adaptif untuk pembelajaran yang tidak seimbang", Prosiding Ijcnn, 2008, hlm. 1322--1328 |
[Ahc] | Gilles Cohen dan Mélanie Hilario dan Hugo Sax dan Stéphane Hugonnet dan Antoine Geissbuhler, "Belajar dari data yang tidak seimbang dalam pengawasan infeksi nosokomial", Kecerdasan Buatan dalam Kedokteran, 2006, hlm. 7 - 18 |
[Lle_smote] | Wang, J. dan Xu, M. dan Wang, H. dan Zhang, J., "Klasifikasi data yang tidak seimbang dengan menggunakan algoritma Smote dan embedding linier lokal", 2006 Konferensi Internasional ke -8 tentang Pemrosesan Sinyal, 2006, hlm. |
[distar_smote] | De La Calleja, J. dan Fuentes, O., "Metode sampel over-sampling berbasis jarak untuk belajar dari set data yang tidak seimbang", Prosiding Kecerdasan Buatan Florida Internasional Twentieth, 2007, hlm. 634--635 |
[SMMO] | De La Calleja, Jorge dan Fuentes, Olac dan González, Jesús, "Memilih contoh minoritas dari data yang salah diklasifikasikan untuk pengambilan sampel berlebihan." , Prosiding Konferensi Masyarakat Penelitian Intelijen Buatan Florida Internasional Kedua Puluh Satu, 2007, 276-281 |
[polynom_fit_smote] | Gazzah, S. dan Amara, NEB, "Pendekatan oversampling baru berdasarkan pemasangan polinomial untuk set data yang tidak seimbang", 2008 Lokakarya Internasional IAPR kedelapan tentang Sistem Analisis Dokumen, 2008, hlm. 677-684 |
[Stefanowski] | Stefanowski, Jerzy dan Wilk, Szymon, "Selektif Pra-Pemrosesan Data yang tidak seimbang untuk meningkatkan kinerja klasifikasi", Prosiding Konferensi Internasional ke-10 tentang Pergudangan Data dan Penemuan Pengetahuan, 2008, hlm. 283--292 |
[Adom] | Tang, S. dan Chen, S., "Mekanisme Generasi Contoh Kelas Minoritas Sintetis", Konferensi Internasional 2008 tentang Teknologi Informasi dan Aplikasi dalam Biomedis, 2008, hlm. 444-447 |
[Safe_level_smote] | Bunkhumpornpat, Chumphol and Sinapiromsaran, Krung and Lursinsap, Chidchanok, "Safe-Level-SMOTE: Safe-Level-Synthetic Minority Over-Sampling TEchnique for Handling the Class Imbalanced Problem" , Proceedings of the 13th Pacific-Asia Conference on Advances in Knowledge Discovery dan Data Mining, 2009, hlm. 475--482 |
[Msmote] | Hu, Shengguo dan Liang, Yanfeng dan MA, Lintao dan He, Ying, "Msmote: Meningkatkan Kinerja Klasifikasi Ketika Data Pelatihan Tidak Seimbang", Prosiding Lokakarya Internasional Kedua 2009 tentang Ilmu Komputer dan Teknik - Volume 02, 2009, hlm. --7 |
[De_oversambling] | Chen, L. dan Cai, Z. dan Chen, L. dan Gu, Q., "Algoritma resampling hibrida evolusi-evolusi diferensial baru pada dataset yang tidak seimbang", Konferensi Internasional Ketiga 2010 tentang Penemuan Pengetahuan dan Data Mining, 2010, hlm. 81-85 |
[SMOBD] | Cao, Q. dan Wang, S., "Menerapkan teknik pengambilan sampel yang berlebihan berdasarkan kepadatan data dan SVM yang peka terhadap biaya terhadap pembelajaran yang tidak seimbang", Konferensi Internasional 2011 tentang Manajemen Informasi, Manajemen Inovasi dan Teknik Industri, 2011, hlm. 543-548 |
[Sundo] | Cateni, S. dan Colla, V. dan Vannucci, M., "Metode resampling baru untuk klasifikasi dataset yang tidak seimbang untuk masalah industri dan dunia nyata lainnya", Konferensi Internasional ke-11 2011 tentang Desain dan Aplikasi Sistem Cerdas, 2011, hlm. 402-407 |
[Msyn] | FA, "Metode Pengambilan Sampel Berbasis Margin untuk Belajar dari Dataset yang Tidak Seimbang", Kemajuan dalam Penemuan Pengetahuan dan Data Mining, 2011, hlm. 309--320 |
[Svm_balance] | Farquad, Mah dan Bose, Indranil, "Preprocessing Data Tidak Seimbang Menggunakan Dukungan Mesin Vektor", Decis. Support Syst., 2012, hlm. 226--233 |
[Trim_smote] | Puntumapo, "Pendekatan Berbasis Pemangkasan untuk Mencari Wilayah yang Tepat dan General untuk Pengambilan Samping Minoritas Sintetis", Kemajuan dalam Penemuan Pengetahuan dan Penambangan Data, 2012, hlm. 371--382 |
[Smote_rsb] | Ramento, "Smote-RSB*: Pendekatan preprocessing hybrid berdasarkan oversampling dan undersampling untuk set data yang tidak seimbang menggunakan teori Smote and Rough Sets", Sistem Pengetahuan dan Informasi, 2012, hlm. 245--265 |
[Prowsyn] | Baru, "Prowsyn: Proximity Teknik Oversampling Sintetis Tertimbang untuk Pembelajaran Set Data yang Tidak Seimbang", Kemajuan dalam Penemuan Pengetahuan dan Penambangan Data, 2013, hlm. 317--328 |
[Sl_graph_smote] | Bunkhumpornpat, chumpol dan subpaiboonkit, sinthichoke, "grafik tingkat aman untuk teknik pengambilan sampel minoritas sintetis", Simposium Internasional ke-13 tentang Teknologi Komunikasi dan Informasi, 2013, hlm. 570-575 |
[Nrsboundary_smote] | Feng, Hu dan Hang, Li, "Algoritma Oversampling Batas Boundary Berdasarkan Model Set Kasar Lingkungan: Nrsboundary-Smote", Masalah Matematika dalam Teknik, 2013, hlm. 10 |
[Lvq_smote] | Munehiro Nakamura dan Yusuke Kajiwara dan Atsushi Otsuka dan Haruhiko Kimura, "LVQ-Smote-Pembelajaran Vektor Berbasis Kuantisasi Minoritas Sintetis Over-Sampling Teknik untuk Data Biomedis", Biodata Mining, 2013 |
[Soi_cj] | Sánchez, Atlanntida I. dan Morales, Eduardo dan Gonzalez, Jesus, "oversampling sintetis dari contoh menggunakan pengelompokan", Jurnal Internasional Alat Kecerdasan Buatan, 2013, hlm. |
[MAWAR] | Menard, "Pelatihan dan Menilai Aturan Klasifikasi dengan Data yang Tidak Seimbang", Penambangan Data dan Penemuan Pengetahuan, 2014, hlm. 92--122 |
[Smote_out] | Fajri Koto, "Smote-Out, Smote-Cosine, dan Selected-Smote: Strategi Peningkatan untuk Menangani Ketidakseimbangan di Tingkat Data", Konferensi Internasional 2014 tentang Ilmu Komputer Lanjutan dan Sistem Informasi, 2014, hlm. 280-284 |
[Smote_cosine] | Fajri Koto, "Smote-Out, Smote-Cosine, dan Selected-Smote: Strategi Peningkatan untuk Menangani Ketidakseimbangan di Tingkat Data", Konferensi Internasional 2014 tentang Ilmu Komputer Lanjutan dan Sistem Informasi, 2014, hlm. 280-284 |
[Selected_smote] | Fajri Koto, "Smote-Out, Smote-Cosine, dan Selected-Smote: Strategi Peningkatan untuk Menangani Ketidakseimbangan di Tingkat Data", Konferensi Internasional 2014 tentang Ilmu Komputer Lanjutan dan Sistem Informasi, 2014, hlm. 280-284 |
[Ln_smote] | Maciejewski, T. dan Stefanowski, J., "Perpanjangan lingkungan setempat dari Smote for Mining Data yang tidak seimbang", Simposium IEEE 2011 tentang Kecerdasan Komputasi dan Penambangan Data (CIDM), 2011, hlm. 104-111 |
[Mwmote] | Barua, S. dan Islam, MM dan Yao, X. dan Murase, K., "MWMote-Mayoritas Teknik Oversampling Minoritas Tertimbang untuk Pembelajaran Set Data yang Tidak Seimbang", Transaksi IEEE pada Pengetahuan dan Rekayasa Data, 2014, hlm. 405-425 |
[Pdfos] | Ming Gao dan Xia Hong dan Sheng Chen dan Chris J. Harris dan Emad Khalaf, "PDFOS: Estimasi PDF Berbasis sampel berlebihan untuk masalah dua kelas yang tidak seimbang", Neurocomputing, 2014, hlm. 248-259 |
[Ipade_id] | Victoria López dan Isaac Triguero dan Cristóbal J. Carmona dan Salvador García dan Francisco Herrera, "menangani klasifikasi yang tidak seimbang dengan teknik generasi instan: iPade -id", Neurocomputing, 2014, hlm. 15 - 28 |
[Rwo_sampling] | Zhang, Huaxzhang dan Li, Mingfang, "RWO-Sampling: Pendekatan pengambilan sampel yang berjalan acak untuk klasifikasi data yang tidak seimbang", Fusion Informasi, 2014, hlm. |
[Lebih rapi] | Almogahed, BA dan Kakadiaris, IA, "Neater: Penyaringan Data yang Di-Sample Menggunakan Teori Game Non-Kooperatif", 2014 Konferensi Internasional ke-22 tentang Pengakuan Pola, 2014, hlm. 1371-1376 |
[Deago] | Bellinger, C. dan Japkowicz, N. dan Drummond, C., "Oversampling Sintetis untuk Deteksi Ancaman Radioaktif Lanjutan", 2015 Konferensi Internasional ke-14 IEEE tentang Pembelajaran Mesin dan Aplikasi (ICMLA), 2015, hlm. 948-953 |
[Gazzah] | Gazzah, S. dan Hechkel, A. dan Essoukri Ben Amara, N., "Metode Pengambilan Sampel Hibrida untuk Data yang tidak seimbang", 2015 IEEE Multi-Konferensi Internasional ke-12 tentang Sistem, Perangkat Sinyal (SSD15), 2015, hlm. 1-6 |
[MCT] | Jiang, Liangxiao dan Qiu, Chen dan Li, Chaoqun, "Teknik kloning minoritas baru untuk pembelajaran yang peka terhadap biaya", Jurnal Internasional Pengakuan Pola dan Kecerdasan Buatan, 2015, hlm. 1551004 |
[ADG] | Pourhabib, A. dan Mallick, Bani K. dan Ding, Yu, "Teknik kloning minoritas baru untuk pembelajaran yang peka terhadap biaya", Journal of Machine Learning Research, 2015, hlm. 2695--2724 |
[Smote_ipf] | José A. Sáez dan Julián Luengo dan Jerzy Stefanowski dan Francisco Herrera, "Smote -IPF: Mengatasi Masalah Contoh Berisik dan Borderline dalam Klasifikasi yang Tidak Seimbang Dengan Metode Pengambilan Sampel dengan Penyaringan", Informasi Ilmu Informasi, 2015, hlm. 184 - 203 |
[Kerneladasyn] | Tang, B. dan He, H., "Kerneladasyn: Generasi Data Sintetis Adaptif Berdasarkan Kernel Untuk Pembelajaran yang Tidak Seimbang", Kongres IEEE 2015 tentang Komputasi Evolusi (CEC), 2015, hlm. 664-671 |
[MOT2LD] | XI, "Metode oversampling minoritas sintetis berdasarkan kepadatan lokal di ruang dimensi rendah untuk pembelajaran yang tidak seimbang", sistem basis data untuk aplikasi canggih, 2015, hlm. 3--18 |
[V_synth] | Young, II, William A. dan Nykl, Scott L. dan Weckman, Gary R. dan Chelberg, David M., "Menggunakan diagram Voronoi untuk meningkatkan kinerja klasifikasi ketika memodelkan dataset yang tidak seimbang", Neural Comput. Appl., 2015, hlm. 1041--1054 |
[OUPS] | William A. Rivera dan Petros Xanthopoulos, "Metode Pengambilan Samping Sintetis Priori untuk meningkatkan sensitivitas klasifikasi dalam set data yang tidak seimbang", Sistem Pakar dengan Aplikasi, 2016, hlm. 124 - 135 |
[Smote_d] | Torre, "Smote-D Versi Deterministik Smote", Pola Pengenalan, 2016, hlm. 177--188 |
[Smote_pso] | Jair Cervantes dan Farid Garcia-Lamont dan Lisbeth Rodriguez dan Asdrúbal López dan José Ruiz Castilla dan Adrian Trueba, "Metode berbasis PSO untuk klasifikasi SVM pada set data yang miring", Neurocomputing, 2017, hlm. 187-197 |
[Cure_smote] | M, "Algoritma Cure-Smote dan Algoritma Hybrid untuk Pemilihan Fitur dan Optimalisasi Parameter Berdasarkan Hutan Acak", BMC Bioinformatics, 2017, hlm. 169 |
[Somo] | Georgios Douzas dan Fernando Bacao, "Mandiri Pengorganisasian Mandiri (SOMO) untuk pembelajaran set data yang tidak seimbang", Sistem Pakar dengan Aplikasi, 2017, hlm. 40 - 52 |
[Isomap_hybrid] | Gu, Qiong dan Cai, Zhihua dan Zhu, Li, "Klasifikasi set data yang tidak seimbang dengan menggunakan algoritma sampel ulang hibrida berdasarkan Isomap", Prosiding Simposium Internasional ke-4 tentang Kemajuan dalam Perhitungan dan Intelijen, 2009, hlm. 287- -296 |
[Ce_smote] | Chen, S. dan Guo, G. dan Chen, L., "Metode pengambilan sampel baru berdasarkan ansambel cluster", Konferensi Internasional IEEE ke-24 IEEE tentang Jaringan Informasi Lanjutan dan Lokakarya Aplikasi, 2010, hlm. 599-604 |
[Edge_det_smote] | Kang, Y. dan Won, S., "Algoritma Keputusan Berat untuk Teknik Oversampling pada Pembelajaran Kelas-Imbalanis", ICCAS 2010, 2010, hlm. 182-186 |
[CBSO] | Buru, "Teknik Oversampling Minoritas Sintetis Baru untuk Pembelajaran Set Data yang Tidak Seimbang", Pemrosesan Informasi Saraf, 2011, hlm. 735--744 |
[E_smote] | Deepa, T. dan Punithavalli, M., "Teknik E-Smote untuk Pemilihan Fitur dalam Dataset Ketidakseimbangan Dimensi Tinggi", Konferensi Internasional ke-3 tentang Teknologi Komputer Elektronik, 2011, hlm. 322-324 |
[Dbsmote] | Bunkhumpornpa, "DBSMote: Teknik Pengambilan Sampel Minoritas Sintetis Berbasis Kepadatan", Applied Intelligence, 2012, hlm. 664--684 |
[Asmobd] | Senzhang Wang dan Zhoujun Li dan Wenhan Chao dan Qinghua Cao, "Menerapkan teknik pengambilan sampel yang adaptif berdasarkan kepadatan data dan SVM yang peka terhadap biaya untuk pembelajaran yang tidak seimbang", Konferensi Gabungan Internasional 2012 tentang Networks Neural (IJCNN), 2012, hal. -8 |
[Assled_smote] | Zhou, B. dan Yang, C. dan Guo, H. dan Hu, J., "SVM kuasi-linear dikombinasikan dengan Smote yang dirakit untuk klasifikasi data yang tidak seimbang", Konferensi Gabungan Internasional 2013 tentang Neural Networks (IJCNN), 2013, hlm. 1-7 |
[SDSMOTE] | Li, K. dan Zhang, W. dan Lu, Q. dan Fang, X., "Metode klasifikasi data smote smote yang ditingkatkan berdasarkan gelar dukungan", Konferensi Internasional 2014 tentang Identifikasi, Informasi dan Pengetahuan di Internet of Things, 2014 , hlm. 34-38 |
[DSmote] | Mahmoudi, S. dan Moradi, P. dan Akhlaghian, F. dan Moradi, R., "Keanekaragaman dan metrik yang dapat dipisahkan dalam teknik pengambilan sampel untuk klasifikasi data yang tidak seimbang", 2014 Konferensi Internasional ke-4 tentang Komputer dan Rekayasa Pengetahuan (ICCKE), 2014 , hlm. 152-158 |
[G_smote] | Sandhan, T. dan Choi, JY, "Menangani kumpulan data yang tidak seimbang dengan pengambilan sampel hibrida yang dipandu sebagian untuk pengakuan pola", 2014 Konferensi Internasional ke-22 tentang Pengenalan Pola, 2014, hlm. 1449-1453 |
[Nt_smote] | Xu, YH dan Li, H. dan Le, LP dan Tian, XY, "Teknik Pengambilan Sampel Minoritas Sintetis Triangular Lingkungan untuk Prediksi yang Tidak Seimbang pada Sampel Kecil Perusahaan Pariwisata dan Perhotelan Tiongkok", Konferensi Gabungan Internasional Ketujuh tentang Ilmu Komputasi dan Optimasi Optimalisasi " , 2014, hlm. 534-538 |
[Lee] | Lee, Jaedong dan Kim, Noo-Ri dan Lee, Jee-Hyong, "Teknik Pengambilan Samping dengan Penolakan untuk Pembelajaran Kelas yang Tidak Seimbang", Prosiding Konferensi Internasional ke-9 tentang Manajemen Informasi dan Komunikasi di mana-mana, 2015, hlm. 102: 1 --102: 6 |
[MENGINTAI] | Dang, XT dan Tran, DH dan Hirose, O. dan Satou, K., "Spy: Metode Resampling Novel untuk Meningkatkan Kinerja Klasifikasi dalam Data yang Tidak Seimbang", Konferensi Internasional Ketujuh tentang Pengetahuan dan Sistem Rekayasa (KSE), 2015, PP . 280-285 |
[Smote_psobat] | Li, J. dan Fong, S. dan Zhuang, Y., "Mengoptimalkan Smote oleh Metaheuristik dengan Jaringan Saraf dan Pohon Keputusan", 2015 Simposium Internasional ke-3 tentang Komputasi dan Intelijen Bisnis (ISCBI), 2015, hlm. 26-32 |
[MDO] | Abdi, L. dan Hashemi, S., "untuk memerangi masalah-masalah yang tidak seimbang multi-kelas dengan menggunakan teknik pengambilan sampel yang berlebihan", transaksi IEEE pada pengetahuan dan rekayasa data, 2016, hlm. 238-251 |
[Random_smote] | Don, "Pendekatan Pengambilan Samping Baru: Racun Acak Untuk Belajar Dari Set Data yang Tidak Seimbang", Pengetahuan Ilmu Pengetahuan, 2011, hlm. 343--352 |
[Ismote] | L, "Metode Pengambilan Sampel Kombinasi Baru untuk Data yang Tidak Seimbang", Prosiding Konferensi Otomasi Cerdas Tiongkok 2013, 2013, hlm. 547--554 |
[Vis_rst] | Borowsk, "Klasifikasi Data yang tidak seimbang: Pendekatan pengambilan sampel baru yang menggabungkan Smote dan Rough Sets yang lebih baik", Sistem Informasi Komputer dan Manajemen Industri, 2016, hlm. 31--42 |
[Gasmote] | Jian, "Algoritma baru untuk Klasifikasi Data Ketidakseimbangan berdasarkan algoritma genetika meningkatkan Smote", Arab Journal for Science and Engineering, 2016, hlm. 3255--3266 |
[A_suwo] | Iman Nekooeimhr dan Susana K. Lai-yuen, "Adaptif semi-unsupervised bobot oversampling (A-suwo) untuk set data yang tidak seimbang", Sistem Pakar dengan Aplikasi, 2016, hlm. 405-416 |
[Smote_frst_2t] | Ramento, "Pembelajaran Fuzzy-Rough yang tidak seimbang untuk diagnosis pemeliharaan pemutus sirkuit tegangan tinggi: algoritma smote-frst-2t", aplikasi teknik kecerdasan buatan, 2016, hlm. 134-139 |
[And_smote] | Yun, Jaesub dan Ha, Jihyun dan Lee, Jong-seok, "Penentuan Otomatis Ukuran Lingkungan di Smote", Prosiding Konferensi Internasional ke-10 tentang Manajemen Informasi dan Komunikasi di mana-mana, 2016, hlm. 100: 1--100: 8 |
[NRAS] | William A. Rivera, "Pengurangan Kebisingan A Priori Sintetis Over -Sampling untuk Kumpulan Data yang Tidak Seimbang Kelas", Informasi Ilmu, 2017, hlm. 146 - 161 |
[Amsco] | Jinyan Li dan Simon Fong dan Raymond K. Wong dan Victor W. Chu, "Adaptive Multi -Objective Swarm Fusion untuk klasifikasi data yang tidak seimbang", Fusion Informasi, 2018, hlm. 1 - 24 |
[SSO] | Ron, "Teknik Sensitivitas Sensitivitas Stokastik untuk Data yang Tidak Seimbang", Pembelajaran Mesin dan Cybernetics, 2014, hlm. 161--171 |
[Ndo_sampling] | Zhang, L. dan Wang, W., "Metode pengambilan sampel ulang untuk pembelajaran ketidakseimbangan kelas dengan data kredit", Konferensi Internasional Teknologi Informasi, Teknik Komputer dan Ilmu Manajemen, 2011, hlm. 393-397 |
[DSRBF] | Francisco Fernández-Navarro dan César Hervás-Martínez dan Pedro Antonio Gutiérrez, "prosedur pengambilan sampel yang dinamis berdasarkan sensitivitas untuk masalah multi-kelas", pengenalan pola, 2011, hlm. 1821-1833 |
[Gaussian_smote] | Hansoo Lee dan Jonggeun Kim dan Sungshin Kim, "Algoritma Smote yang berbasis di Gaussian untuk menyelesaikan distribusi kelas miring", Int. J. Fuzzy Logic and Intelligent Systems, 2017, hlm. 229-234 |
[kmeans_smote] | Georgios Douzas dan Fernando Bacao dan Felix Last, "Meningkatkan pembelajaran yang tidak seimbang melalui metode oversampling heuristik berdasarkan K -means dan Smote", Information Sciences, 2018, hlm. 1 - 20 |
[Diawasi_smote] | Hu, Jun dan He, Xue dan Yu, Dong-Jun dan Yang, Xi-Bei dan Yang, Jing-Yu dan Shen, Hong-Bin, "Algoritma pengambilan sampel yang baru diawasi dengan aplikasi untuk prediksi residu pengikat protein-nukleotida" " , PLoS One, 2014, hlm. 1-10 |
[Sn_smote] | Garc {'i}, "Smote berbasis lingkungan sekitarnya untuk belajar dari set data yang tidak seimbang", Kemajuan dalam Kecerdasan Buatan, 2012, hlm. 347--362 |
[CCR] | Koziarski, Michał dan Wozniak, Michal, "CCR: Algoritma pembersihan dan resampling gabungan untuk klasifikasi data yang tidak seimbang", Jurnal Internasional Matematika Terapan dan Ilmu Komputer, 2017, hlm. 727-736 |
[ANS] | Siriseriwan, W dan Sinapiromsaran, Krung, "Teknik Oversampling Minoritas Sintetis Tetangga Adaptif Di Bawah Penanganan 1nn Di Buang", Songklanakarin Journal of Science and Technology, 2017, hlm. 565-576 |
[cluster_smote] | Cieslak, DA dan Chawla, NV dan Striegel, A., "Memerangi Ketidakseimbangan dalam Dataset Intrusi Jaringan", Konferensi Internasional IEEE 2006 tentang Granular Computing, 2006, hlm. 732-737 |
[Symprod] | Kunakorntum, I. dan Hinthong, W. dan Phunchongharn, P., "Minoritas sintetis berdasarkan distribusi probabilistik (Symprod) oversampling untuk set data yang tidak seimbang", IEEE Access, 2020, hlm. 114692 - 114704 " |
[Smotewb] | Sağlam, F. dan Cengiz, MA, "Teknik Resampling Berbasis Smote melalui Deteksi Kebisingan dan Prosedur Peningkatan", Sistem Pakar dengan Aplikasi, 2022, hlm. 117023 |