download smote_variants - smote_variants download de código fonte

Github

 _ _ _
 ___ _ __ ___ ___ | | _ ___ __ __ __ _ _ __ (_) __ _ _ __ | | _ ___
/ __ || '_ `_  / _  | __ | / _  _____   / // _` || '__ || | / _` || '_  | __ |/ __ |
 __  | | | | | || (_) || | _ | __ /| _____ |  v /| (_ || | | || (_ || | | || | _  __ 
| ___/| _ | | _ | | _ |  ___/  __ |  ___ |  _/  __, _ || _ | | _ |  __, _ || _ | | _ |  __ || ___//

Variantes de Smotes para aprendizado desequilibrado

Últimas notícias

1.0.0 O lançamento está fora
Técnicas de amostragem de subestimação adicionadas
Smotewb acrescentou, graças a @szghlm
implementações vetorizadas para a maioria das técnicas para aumentar o desempenho
um kit de ferramentas de avaliação e seleção de modelo refatorado e aprimorado
Cobertura de teste de 100%
10.0 Conformância PEP8 (por Pylint)
polynom_fit_smote dividido em 4 técnicas diferentes
Symprod acrescentou como o 86º super -amostrador implementado, graças a @iTouchkun

Introdução

O pacote implementa 86 variantes da técnica de superamostragem de minorias sintéticas (Smote). Além das implementações, uma estrutura de seleção de modelo fácil de usar é fornecida para permitir a avaliação rápida das técnicas de superamostragem nos conjuntos de dados invisíveis.

The implemented techniques: [SMOTE] , [SMOTE_TomekLinks] , [SMOTE_ENN] , [Borderline_SMOTE1] , [Borderline_SMOTE2] , [ADASYN] , [AHC] , [LLE_SMOTE] , [distance_SMOTE] , [SMMO] , [polynom_fit_SMOTE] , [Stefanowski ,, [Adoms], [Safe_Level_smote], [msmote], [de_oversampling], [smobd], [sundo], [msyn], [svm_balance], [trim_smote], [smote_rsb], [prowsyn], [slogn_smote] e [NRSBoundary_SMOTE] , [LVQ_SMOTE] , [SOI_CJ] , [ROSE] , [SMOTE_OUT] , [SMOTE_Cosine] , [Selected_SMOTE] , [LN_SMOTE] , [MWMOTE] , [PDFOS] , [IPADE_ID] , [RWO_sampling] , [NEATER ], [Deago], [Gazzah], [McT], [ADG], [Smote_IPF], [Kerneladasyn], [Mot2ld], [v_synth], [Ops], [smote_d], [smote_pso], [cure_smote], [SOMO], [ISOMAP_HYBRID], [CE_SMOTE], [Edge_Det_Smote], [CBSO], [e_smote], [dbsmote], [asmobd], [SOPLED_SMOTE], [SDSMOTE], [dsmote], [g_smote], [nTote], [sdsmote], [dsmote], [g_smote], [nTote], [sdsmote], [dsMote], [g_smote], [nTote], [nTotes], [dsmote], [g_smote], [nTote], [sdsmote], [dsmote], [g_smote], [nTote], [nTote], [nTote. ,, [Lee], [Spy], [Smote_PSOBAT], [MDO], [Random_smote], [ismote], [vis_rst], [gasmote], [a_suwo], [smote_frst_2t], [e_smote], [nRas], [smote_frst_2t], [e_smote], [nRas], [smote_frst_2t], [e_smote], [nRas], [smote_frst_2t], [e_smote], [nRas], [smote_frst_2t], [e_smote], [NRAS], [AMSCO] , [SSO] , [NDO_sampling] , [DSRBF] , [Gaussian_SMOTE] , [kmeans_SMOTE] , [Supervised_SMOTE] , [SN_SMOTE] , [CCR] , [ANS] , [cluster_SMOTE] , [SYMPROD] , [SMOTEWB ]

Comparação e avaliação

Para uma comparação e avaliação detalhadas de todas as técnicas implementadas, consulte link_to_comparison_paper

Citação

Se você usar este pacote em sua pesquisa, considere citar os trabalhos abaixo.

Pré -impressão descrevendo o pacote Veja Link_to_Package_Paper

Bibtex para o pacote:

 @article { smote-variants ,
  author = { Gy"orgy Kov'acs } ,
  title = { smote-variants: a Python Implementation of 85 Minority Oversampling Techniques } ,
  journal = { Neurocomputing } ,
  note = { (IF-2019=4.07) } ,
  volume = { 366 } ,
  pages = { 352--354 } ,
  year = { 2019 } ,
  group = { journal } ,
  code = { https://github.com/analyticalmindsltd/smote_variants } ,
  doi = { 10.1016/j.neucom.2019.06.100 }
}

Para a pré -impressão do estudo comparativo, consulte Link_TO_Evaluation_Paper

Bibtex para a comparação e avaliação:

 @article { smote-comparison ,
  author = { Gy"orgy Kov'acs } ,
  title = { An empirical comparison and evaluation of minority oversampling techniques on a large number of imbalanced datasets } ,
  journal = { Applied Soft Computing } ,
  note = { (IF-2019=4.873) } ,
  volume = { 83 } ,
  pages = { 105662 } ,
  year = { 2019 } ,
  link = { https://www.sciencedirect.com/science/article/pii/S1568494619304429 } ,
  group = { journal } ,
  code = { https://github.com/analyticalmindsltd/smote_variants } ,
  doi = { 10.1016/j.asoc.2019.105662 }
}

Instalação

O pacote pode ser clonado do GitHub da maneira usual, e a mais recente versão estável também está disponível no repositório Pypi:

pip install smote-variants

Documentação

Para uma documentação detalhada, consulte http://smote-variants.readthedocs.io.
Para um tutorial do YouTube, verifique https://www.youtube.com/watch?v=gsk7akqpm60

Práticas recomendadas

Normalização/padronização/escala/seleção de recursos

A maioria das técnicas de superamostragem opera no espaço euclidiano implícito nos atributos. Portanto, é extremamente importante normalizar/dimensionar os atributos adequadamente. Sem conhecimento sobre a importância dos atributos, a normalização/padronização é uma boa primeira tentativa. Tendo algum conhecimento de domínio ou importância de atributo da classificação de bootstrap, a escala de variações de atributos de acordo com sua importância também é razoável. Como alternativa, a seleção de subconjuntos de recursos também pode melhorar os resultados, com o trabalho excessivo no subespaço mais adequado.

Seleção de modelo para o número de amostras a serem geradas

A classificação após a superamostragem é altamente sensível ao número de amostras minoritárias que estão sendo geradas. O equilíbrio do conjunto de dados raramente é a escolha certa, pois a maioria dos classificadores opera de maneira mais eficiente se a densidade de amostras positivas e negativas próximas ao limite de decisão for aproximadamente a mesma. Se os coletores das classes positivas e negativas não tiverem o mesmo tamanho aproximadamente, o equilíbrio do conjunto de dados não poderá conseguir isso. Além disso, em certas regiões, ele pode até reverter a situação: se o coletor da classe minoritária for muito menor que o da classe majoritária, o equilíbrio transformará a classe minoritária na maioria nos ambientes locais ao longo do limite de decisão.

A solução é aplicar a seleção de modelo para o número de amostras que estão sendo geradas. Quase todas as técnicas implementadas no pacote `smote-variants` têm um parâmetro chamado `proportion` . Esse parâmetro controla quantas amostras geram, a saber, o número de amostras minoritárias geradas é `proportion*(N_maj - N_min)` , ou seja, definir o parâmetro de proporção como 1 equilibrará o conjunto de dados. É altamente recomendável realizar a seleção de modelo validada cruzada para um intervalo como `proportion` = 0,1, 0,2, 0,5, 1,0, 2,0, 5,0.

Uso de amostra

Operamostragem binária

 import smote_variants as sv
import imbalanced_databases as imbd

dataset = imbd . load_iris0 ()
X , y = dataset [ 'data' ], dataset [ 'target' ]

oversampler = sv . distance_SMOTE ()

# X_samp and y_samp contain the oversampled dataset
X_samp , y_samp = oversampler . sample ( X , y )

Overamostragem de excesso de multiclasse

 import smote_variants as sv
import sklearn . datasets as datasets

dataset = datasets . load_wine ()
X , y = dataset [ 'data' ], dataset [ 'target' ]

oversampler = sv . MulticlassOversampling ( oversampler = 'distance_SMOTE' ,
                                      oversampler_params = { 'random_state' : 5 })

# X_samp and y_samp contain the oversampled dataset
X_samp , y_samp = oversampler . sample ( X , y )

Seleção do melhor amostrador

 from sklearn . neighbors import KNeighborsClassifier
from sklearn . tree import DecisionTreeClassifier
import smote_variants as sv
import sklearn . datasets as datasets

dataset = datasets . load_breast_cancer ()

dataset = { 'data' : dataset [ 'data' ],
          'target' : dataset [ 'target' ],
          'name' : 'breast_cancer' }

classifiers = [( 'sklearn.neighbors' , 'KNeighborsClassifier' , {}),
              ( 'sklearn.tree' , 'DecisionTreeClassifier' , {})]

oversamplers = sv . queries . get_all_oversamplers ( n_quickest = 2 )

os_params = sv . queries . generate_parameter_combinations ( oversamplers ,
                                                      n_max_comb = 2 )

# samp_obj and cl_obj contain the oversampling and classifier objects which give the
# best performance together
samp_obj , cl_obj = sv . evaluation . model_selection ( dataset = dataset ,
                                                oversamplers = os_params ,
                                                classifiers = classifiers ,
                                                validator_params = { 'n_splits' : 2 ,
                                                                  'n_repeats' : 1 },
                                                n_jobs = 5 )

# training the best techniques using the entire dataset
X_samp , y_samp = samp_obj . sample ( dataset [ 'data' ],
                                dataset [ 'target' ])
cl_obj . fit ( X_samp , y_samp )

Integração com Pipelines Sklearn

 import smote_variants as sv
import imblearn . datasets as imb_datasets

from sklearn . model_selection import train_test_split , GridSearchCV
from sklearn . pipeline import Pipeline
from sklearn . preprocessing import StandardScaler
from sklearn . neighbors import KNeighborsClassifier

libras = imb_datasets . fetch_datasets ()[ 'libras_move' ]
X , y = libras [ 'data' ], libras [ 'target' ]

oversampler = ( 'smote_variants' , 'MulticlassOversampling' ,
                { 'oversampler' : 'distance_SMOTE' , 'oversampler_params' : {}})

classifier = ( 'sklearn.neighbors' , 'KNeighborsClassifier' , {})

# Constructing a pipeline which contains oversampling and classification
# as the last step.
model = Pipeline ([( 'scale' , StandardScaler ()),
                ( 'clf' , sv . classifiers . OversamplingClassifier ( oversampler , classifier ))])

model . fit ( X , y )

Integração com Sklearn Grid Search

 import smote_variants as sv
import imblearn . datasets as imb_datasets

from sklearn . model_selection import train_test_split , GridSearchCV
from sklearn . pipeline import Pipeline
from sklearn . preprocessing import StandardScaler
from sklearn . neighbors import KNeighborsClassifier

libras = imb_datasets . fetch_datasets ()[ 'libras_move' ]
X , y = libras [ 'data' ], libras [ 'target' ]

oversampler = ( 'smote_variants' , 'MulticlassOversampling' ,
                { 'oversampler' : 'distance_SMOTE' , 'oversampler_params' : {}})

classifier = ( 'sklearn.neighbors' , 'KNeighborsClassifier' , {})

# Constructing a pipeline with oversampling and classification as the last step
model = Pipeline ([( 'scale' , StandardScaler ()),
                ( 'clf' , sv . classifiers . OversamplingClassifier ( oversampler , classifier ))])

param_grid = { 'clf__oversampler' :[( 'smote_variants' , 'distance_SMOTE' , { 'proportion' : 0.5 }),
                                ( 'smote_variants' , 'distance_SMOTE' , { 'proportion' : 1.0 }),
                                ( 'smote_variants' , 'distance_SMOTE' , { 'proportion' : 1.5 })]}

# Specifying the gridsearch for model selection
grid = GridSearchCV ( model ,
                  param_grid = param_grid ,
                  cv = 3 ,
                  n_jobs = 1 ,
                  verbose = 2 ,
                  scoring = 'accuracy' )

# Fitting the pipeline
grid . fit ( X , y )

Contribuição

Sinta -se à vontade para implementar outras técnicas de superamostragem e vamos discutir os códigos assim que a solicitação de tração estiver pronta!

Referências

[Smote]

Chawla, NV e Bowyer, KW e Hall, Lo e Kegelmeyer, WP, "{Smote}: Técnica de Overmpling Minoritária Sintética", Journal of Artificial Intelligence Research, 2002, pp. 321--357

[Smote_tomeklinks]

Batista, Gustavo Epa e Prati, Ronaldo C. e Monard, Maria Carolina, "Um estudo do comportamento de vários métodos para equilibrar dados de treinamento de aprendizado de máquina", Sigkdd Explor. Newsl., 2004, pp. 20--29

[Smote_enn]

[Borderline_smote1]

Ha, "Smote limítrofe: um novo método de amostragem excessiva em conjuntos de dados desequilibrados aprendizado", Advances in Intelligent Computing, 2005, pp. 878--887

[Borderline_smote2]

Ha, "Smote limítrofe: um novo método de amostragem excessiva em conjuntos de dados desequilibrados aprendizado", Advances in Intelligent Computing, 2005, pp. 878--887

[Adasyn]

Ele, H. e Bai, Y. e Garcia, EA e Li, S., "{Adasyn}: abordagem de amostragem sintética adaptativa para aprendizado desequilibrado", Proceedings of Ijcnn, 2008, pp. 1322--1328

[AHC]

Gilles Cohen e Mélanie Hilario e Hugo Sax e Stéphane Hugonnet e Antoine Geissbuhler, "Aprendendo com dados desequilibrados na vigilância da infecção nosocomial", Inteligência Artificial em Medicina, 2006, pp. 7 - 18

[Lle_smote]

Wang, J. e Xu, M. e Wang, H. e Zhang, J., "Classificação de dados desequilibrados usando o algoritmo de Smote e a incorporação localmente linear", 2006 8ª Conferência Internacional sobre Processamento de Sinais, 2006, pp.

[a distância_smote]

De La Calleja, J. e Fuentes, O., "Um método de amostragem excessiva baseada em distância para aprender com conjuntos de dados desequilibrados", Anais do vigésimo Inteligência Artificial Internacional da Flórida, 2007, pp. 634--635

[SMMO]

De la Calleja, Jorge e Fuentes, Olac e González, Jesús, "Selecionando exemplos minoritários de dados classificados incorretamente para amostragem excessiva". .

[polynom_fit_smote]

Gazzah, S. e Amara, NEB, "Novas abordagens de superamostragem baseadas no encaixe polinomial para conjuntos de dados desequilibrados", 2008 O oitavo workshop internacional da IAPR em sistemas de análise de documentos, 2008, pp. 677-684

[Stefanowski]

Stefanowski, Jerzy e Wilk, Szymon, "Pré-processamento seletivo de dados desequilibrados para melhorar o desempenho da classificação", Anais da 10ª Conferência Internacional sobre Data Warehousing and Knowledge Discovery, 2008, pp. 283--292

[Adoms]

Tang, S. e Chen, S., "O mecanismo de geração de exemplos de classe minoritária sintética", conferência internacional de 2008 sobre tecnologia da informação e aplicações na Biomedicine, 2008, pp. 444-447

[Safe_Level_smote]

Bunkhumpornpat, Chumphol e Sinapiromsaran, Krung e Lursinsap, Chidchanok, "Smoto de nível seguro: Minoria-síntética de nível seguro Técnica de amostragem excessiva para lidar com o problema de classe desequilibrado", Anais da 13ª Conferência do Pacífico-Ásia sobre Advances na descoberta de conhecimento e Data Mining, 2009, pp. 475--482

[Msmote]

Hu, Shengguo e Liang, Yanfeng e MA, Lintao e ele, Ying, "Msmote: Melhorando o desempenho da classificação ao treinar dados é desequilibrado", Anais do Segundo Oficina Internacional de 2009 sobre Ciência e Engenharia da Computação - Volume 02, 2009, pp. 13 --17

[DE_OVERSAMPLING]

Chen, L. e Cai, Z. e Chen, L. e Gu, Q., "Um novo algoritmo de reamostragem híbrido de agrupamento de evolução diferencial sobre conjuntos de dados desequilibrados", Terceira Conferência Internacional sobre Descoberta de Conhecimento e Mineração de Dados, 2010, pp. 81-85

[SMOBD]

Cao, Q. e Wang, S., "Aplicando a técnica de amostragem excessiva com base na densidade de dados e no SVM sensível ao custo ao aprendizado desequilibrado", 2011 Conferência Internacional sobre Gerenciamento de Informações, Gerenciamento de Inovação e Engenharia Industrial, 2011, pp. 543-548

[SUNDO]

Cateni, S. e Colla, V. e Vannucci, M., "Novo método de reamostragem para a classificação de conjuntos de dados desequilibrados para problemas industriais e outros problemas do mundo real", 2011ª Conferência Internacional sobre Design e Aplicações de Sistemas Inteligentes, 2011, pp. 402-407

[Msyn]

FA, "Método de amostragem excessiva baseada em margem para aprender com conjuntos de dados desequilibrados", Avanços na descoberta do conhecimento e mineração de dados, 2011, pp. 309--320

[SVM_BALANCE]

Farquad, Mah e Bose, Indranil, "Pré -processamento de dados desequilibrados usando a máquina de vetor de suporte", decis. Apoio Syst., 2012, pp. 226--233

[TRIM_SMOTE]

Puntumapo, "Uma abordagem baseada em poda para pesquisar a região precisa e generalizada por amostragem sobre minorias sintéticas", Advances in Knowledge Discovery and Data Mining, 2012, pp. 371--382

[Smote_rsb]

Ramento, "Smote-RSB*: Uma abordagem de pré-processamento híbrida com base em superamostragem e subamostra para obter altos conjuntos de dados desequilibrados usando teoria de Smote e Rough Sets", Knowledge and Information Systems, 2012, pp. 245--265

[Prowsyn]

Baru, "Prowsyn: Técnica de superamostragem sintética ponderada por proximidade para aprendizado de conjunto de dados desequilibrado", Avanços na descoberta do conhecimento e mineração de dados, 2013, pp. 317--328

[SL_GRAPH_SMOTE]

Bunkhumpornpat, Chumpol e SubpaiBoonkit, Sitthichoke, "Gráfico de nível seguro para técnicas de amostragem excessiva das minorias sintéticas", 13º Simpósio Internacional sobre Comunicações e Tecnologias da Informação, 2013, pp. 570-575

[NRSBOUNDARY_SMOTE]

Feng, Hu e Hang, Li, "Um novo algoritmo de superamostragem de limites baseado no Bairro Rough Set Model: NRSboundary-Smote", Problemas Matemáticos em Engenharia, 2013, pp. 10

[Lvq_smote]

Munehiro Nakamura e Yusuke Kajiwara e Atsushi Otsuka e Haruhiko Kimura, "LVQ-Smote-Aprendendo a minoria sintética baseada em vetores para a técnica de amostragem para dados biomédicos", Biodata Mining, 2013

[SOI_CJ]

Sánchez, Atlántida I. e Morales, Eduardo e Gonzalez, Jesus, "Operampling sintético de instâncias usando agrupamentos", International Journal of Artificial Intelligence Tools, 2013, pp.

[ROSA]

Menard, "Treinando e avaliando regras de classificação com dados desequilibrados", Mineração de dados e descoberta de conhecimento, 2014, pp. 92--122

[Smote_out]

FAJRI KOTO, "Ferir-out, Smote-Cosine e Selected-Smote: Uma estratégia de aprimoramento para lidar com o desequilíbrio no nível de dados", Conferência Internacional de 2014 sobre Ciência e Informação Avançada de Computação, 2014, pp. 280-284

[Smote_cosine]

[Selected_smote]

[Ln_smote]

Maciejewski, T. e Stefanowski, J., "Extensão local da vizinhança de Smote para mineração de dados desequilibrados", 2011 Simpósio IEEE sobre inteligência computacional e mineração de dados (CIDM), 2011, pp. 104-111

[Mwmote]

Barua, S. e Islam, MM e Yao, X. e Murase, K., "MWMote-Manority ponderou Tecnique de Opertempling minoritária para aprendizado de dados de dados desequilibrado", IEEE Transactions on Knowledge and Data Engineering, 2014, pp. 405-425

[PDFOs]

Ming Gao e Xia Hong e Sheng Chen e Chris J. Harris e Emad Khalaf, "PDFOs: estimativa de PDF baseada em excesso de amostragem para problemas desequilibrados de duas classes", Neurocomputing, 2014, pp. 248-259

[Ipade_id]

Victoria López e Isaac Triguero e Cristóbal J. Carmona e Salvador García e Francisco Herrera, "abordando a classificação desequilibrada com técnicas de geração de instâncias: Ipade -ID", Neurocomputing, 2014, pp. 15 - 28

[RWO_SAMPLING]

Zhang, Huaxzhang e Li, Mingfang, "Rwo-Sampling: uma abordagem de amostragem excessiva de caminhada aleatória para classificação de dados desequilibrada", Information Fusion, 2014, pp.

[NEATER]

Almogahed, BA e Kakadiaris, IA, "NEATER: Filtragem de dados de amostragem excessiva usando teoria de jogos não cooperativos", 2014 22ª Conferência Internacional sobre Reconhecimento de Padrões, 2014, pp. 1371-1376

[Deago]

Bellinger, C. e Japkowicz, N. e Drummond, C., "Overamostragem sintética para detecção avançada de ameaças radioativas", 2015 IEEE 14ª Conferência Internacional sobre Aprendizado e Aplicações de Máquina (ICMLA), 2015, pp. 948-953

[Gazzah]

Gazzah, S. e Hechkel, A. e Essoukri Ben Amara, N., "Um método de amostragem híbrida para dados desequilibrados", 2015 IEEE 12º International Multi-Conference em sistemas, Signals Dispositices (SSD15), 2015, pp. 1-6

[MCT]

Jiang, Liangxiao e Qiu, Chen e Li, Chaoqun, "Uma nova técnica de clonagem minoritária para aprendizado sensível ao custo", International Journal of Pattern Reconhecimento e Inteligência Artificial, 2015, pp. 1551004

[ADG]

Pourhabib, A. e Mallick, Bani K. e Ding, Yu, "Uma nova técnica de clonagem minoritária para aprendizado sensível ao custo", Journal of Machine Learning Research, 2015, pp. 2695--2724

[Smote_ipf]

José A. Sáez e Julián Luengo e Jerzy Stefanowski e Francisco Herrera, "Smote - IPF: abordando os exemplos barulhentos e limítrofes em classificação desequilibrada por um método de re -amostragem com filtragem", Information Sciences, 2015, pp. 184 - 203

[Kerneladasyn]

Tang, B. e ele, H., "Kerneladasyn: Geração de dados sintéticos adaptativos baseados no kernel para aprendizado desequilibrado", 2015 Congresso IEEE sobre Computação Evolutiva (CEC), 2015, pp. 664-671

[MOT2LD]

XI, "Um método de superamostragem de minoria sintética baseada em densidades locais em espaço de baixa dimensão para aprendizado desequilibrado", Sistemas de banco de dados para aplicações avançadas, 2015, pp. 3--18

[V_synth]

Young, II, William A. e Nykl, Scott L. e Weckman, Gary R. e Chelberg, David M., "Usando diagramas de voronoi para melhorar o desempenho da classificação ao modelar conjuntos de dados desequilibrados", Neural Comput. Appl., 2015, pp. 1041--1054

[OUPS]

William A. Rivera e Petros Xanthopoulos, "A priori métodos sintéticos de amostragem excessiva para aumentar a sensibilidade da classificação em conjuntos de dados desequilibrados", Sistemas especializados com aplicativos, 2016, pp. 124 - 135

[Smote_d]

Torre, "Smoted-D uma versão determinística de Smote", Reconhecimento de padrões, 2016, pp. 177--188

[Smote_pso]

Jair Cervantes e Farid Garcia-Lamont e Lisbeth Rodriguez e Asdrúbal López e José Ruiz Castilla e Adrian Trueba, "Método baseado em PSO para classificação SVM em conjuntos de dados distorcidos", Neurocomputing, 2017, pp.

[Cure_smote]

M, "Algoritmo de cura-smote e algoritmo híbrido para seleção de recursos e otimização de parâmetros baseados em florestas aleatórias", BMC Bioinformatics, 2017, pp. 169

[SOMO]

Georgios Douzas e Fernando Bacao, "Mapa auto -organizado Operampling (SOMO) para aprendizado de conjunto de dados desequilibrado", Sistemas especializados com Applications, 2017, pp. 40 - 52

[ISOMAP_HYBRID]

Gu, Qiong e Cai, Zhihua e Zhu, Li, "Classificação de conjuntos de dados desequilibrados usando o algoritmo de re-amostragem híbrido baseado em Isomap", Anais do 4º Simpósio Internacional sobre Avanços na Computação e Inteligência, 2009, pp. 287- -296

[CE_SMOTE]

Chen, S. e Guo, G. e Chen, L., "Um novo método de amostragem excessiva baseado em conjuntos de cluster", 2010 IEEE 24ª Conferência Internacional sobre redes de informações avançadas e aplicativos Workshops, 2010, pp. 599-604

[Edge_Det_smote]

Kang, Y. e Won, S., "Algoritmo de decisão de peso para a técnica de supermo-amostragem em aprendizado de classe impebe", ICCAS 2010, 2010, pp. 182-186

[CBSO]

Baru, "Uma nova técnica de superamostragem de minorias sintéticas para o aprendizado do conjunto de dados desequilibrado", Neural Information Processing, 2011, pp. 735--744

[E_smote]

Deepa, T. e Punithavalli, M., "Uma técnica de e-smote para seleção de recursos em conjunto de dados desequilibrado de alta dimensão", 2011, 3ª Conferência Internacional sobre Tecnologia da Computação de Eletrônicos, 2011, pp. 322-324

[Dbsmote]

Bunkhumpornpa, "DBSMote: Técnica de Sampling Sampling Basey Minority Sampling baseado em densidade", Applied Intelligence, 2012, pp. 664--684

[Asmobd]

Senzhang Wang e Zhoujun Li e Wenhan Chao e Qinghua Cao, "Aplicando a técnica adaptativa de amostragem excessiva com base na densidade de dados e no SVM sensível ao custo para o aprendizado desequilibrado", a Conferência Internacional Internacional sobre Redes Neurais (IJCNN), 2012, pp. 1 -8

[SOPLED_SMOTE]

Zhou, B. e Yang, C. e Guo, H. e Hu, J., "Um SVM quase linear, combinado com o Smotes Montado para Classificação de Dados Debalanceados", a Conferência Conjunta Internacional de 2013 sobre Redes Neurais (IJCNN), 2013, pp. 1-7

[Sdsmote]

Li, K. e Zhang, W. e Lu, Q. e Fang, X., "Um método aprimorado de classificação de dados desequilibrados com base no grau de suporte", Conferência Internacional de 2014 sobre Identificação, Informação e Conhecimento na Internet das Coisas, 2014 , pp. 34-38

[Dsmote]

Mahmoudi, S. e Moradi, P. e Akhlaghian, F. e Moradi, R., "Diversidade e métricas separáveis na técnica de amostragem excessiva para classificação de dados desequilibrada", 2014 4ª Conferência Internacional sobre Computador e Engenharia de Conhecimento (ICCKE), 2014 , pp. 152-158

[G_smote]

Sandhan, T. e Choi, JY, "Lidando com conjuntos de dados desequilibrados por amostragem híbrida parcialmente guiada para reconhecimento de padrões", 2014 22ª Conferência Internacional sobre Reconhecimento de Padrões, 2014, pp. 1449-1453

[Nt_smote]

Xu, YH e Li, H. e Le, LP e Tian, XY, "Técnica de excesso de amostragem minoritária triangular do bairro para previsão desequilibrada em pequenas amostras de turismo e otimização da computação chinesa", Sétima Conferência Internacional Internacional sobre Ciências Computacionais e Otimização , 2014, pp. 534-538

[Lee]

Lee, Jaedong e Kim, Noo-Ri e Lee, Jee-Hyong, "Uma técnica de amostragem excessiva com rejeição para aprendizado de classe desequilibrado", Anais da 9ª Conferência Internacional sobre Gerenciamento e Comunicação onipresentes de informações, 2015, pp. 102: 1 --102: 6

[ESPIÃO]

Dang, Xt e Tran, DH e Hirose, O. e Satou, K., "Spy: um novo método de reamostragem para melhorar o desempenho da classificação em dados desequilibrados", 2015 Sétima Conferência Internacional sobre Engenharia de Conhecimento e Sistemas (KSE), 2015, pp 280-285

[Smote_psobat]

Li, J. e Fong, S. e Zhuang, Y., "Otimizando a queda por metaheurísticas com rede neural e árvore de decisão", 2015 3º Simpósio Internacional sobre Inteligência Computacional e de Negócios (ISCBI), 2015, pp. 26-32

[MDO]

Abdi, L. e Hashemi, S., "Para combater problemas desequilibrados de várias classes por meio de técnicas de amostragem excessiva", IEEE Transactions on Knowledge and Data Engineering, 2016, pp. 238-251

[Random_smote]

Don, "Uma nova abordagem de amostragem excessiva: Smote aleatória para aprender com conjuntos de dados desequilibrados", Knowledge Scienc, 2011, pp. 343--352

[Ismote]

L, "Um novo método de amostragem de combinação para dados desequilibrados", Proceedings of 2013 Chinese Intelligent Automation Conference, 2013, pp. 547--554

[Vis_rst]

Borowsk, "Classificação de dados desequilibrada: uma nova abordagem de re-amostragem combinando um Smote e Conjuntos Rougalhos Melhorados Versáteis", Sistemas de Informação em Computador e Gerenciamento Industrial, 2016, pp. 31--42

[Gasmote]

Jian, "Um novo algoritmo para classificação de dados de desequilíbrio baseado no algoritmo genético Melhorado", Arabian Journal for Science and Engineering, 2016, pp. 3255--3266

[A_suwo]

Iman Nekooeimehr e Susana K. Lai-Yuen, "Adaptive semi-supervisionado super amostragem ponderada (A-suwo) para conjuntos de dados desequilibrados", Sistemas especializados com Applications, 2016, pp. 405-416

[Smote_frst_2t]

Ramento, "Aprendizagem desequilibrada e desequilibrada para o diagnóstico de manutenção do disjuntor de alta tensão: o algoritmo Smote-FRST-2T", Aplicações de engenharia da inteligência artificial, 2016, pp. 134-139

[E_smote]

Yun, Jaesub e Ha, Jihyun e Lee, Jong-seok, "Determinação automática do tamanho da vizinhança em Smote", Anais da 10ª Conferência Internacional sobre Gerenciamento e Comunicação de Informações Obíquas, 2016, pp. 100: 1--100: 8

[NRAS]

William A. Rivera, "Redução de ruído a priori amostragem sintética para conjuntos de dados desequilibrados de classe", Information Sciences, 2017, pp. 146 - 161

[AMSCO]

Jinyan Li e Simon Fong e Raymond K. Wong e Victor W. Chu, "Fusão de enxame multi -objetiva adaptável para classificação de dados desequilibrada", Information Fusion, 2018, pp. 1 - 24

[SSO]

Ron, "Técnica de superamostragem de sensibilidade estocástica para dados desequilibrados", Machine Learning and CyberNetics, 2014, pp. 161--171

[NDO_SAMPLING]

Zhang, L. e Wang, W., "Um método de re-amostragem para aprendizado de desequilíbrio de classe com dados de crédito", 2011 Conferência Internacional de Tecnologia da Informação, Engenharia de Computação e Ciências da Gerenciamento, 2011, pp. 393-397

[DSRBF]

Francisco Fernández-Navarro e César Hervás-Martínez e Pedro Antonio Gutiérrez, "Um procedimento dinâmico de amostragem excessiva baseada na sensibilidade para problemas de várias classes", Reconhecimento de padrões, 2011, pp. 1821-1833

[Gaussian_smote]

Hansoo Lee e Jonggeun Kim e Sungshin Kim, "Algoritmo de Smote Gaussian para resolver distribuições de classe distorcidas", int. J. Fuzzy Logic and Intelligent Systems, 2017, pp. 229-234

[Kmeans_smote]

Georgios Douzas e Fernando Bacao e Felix por último, "Melhorando o aprendizado desequilibrado por meio de um método de superamostragem heurística baseado em K -Means and Smote", Information Sciences, 2018, pp. 1 - 20

[Supervisionado_smote]

Hu, Jun e ele, Xue e Yu, Dong-Jun e Yang, Xi-Bei e Yang, Jing-Yu e Shen, Hong-Bin, "Um novo algoritmo supervisionado de amostragem excessiva com aplicação na previsão de resíduos de ligação à proteína-nucleotídeo" , PLOS ONE, 2014, pp. 1-10

[Sn_smote]

Garc {'i}, "Smote de bairro circundante para aprender com conjuntos de dados desequilibrados", Progress in Artificial Intelligence, 2012, pp. 347--362

[CCR]

Koziarski, Michał e Wozniak, Michal, "CCR: um algoritmo combinado de limpeza e reamostragem para classificação de dados desequilibrada", International Journal of Applied Mathematics and Computer Science, 2017, pp. 727-736

[Ans]

Siriseriwan, W e Sinapiromsaran, Krung, "Técnica de superamostragem minoritária sintética do vizinho adaptativo sob o manuseio de pária 1NN", Songklanakarin Journal of Science and Technology, 2017, pp. 565-576

[cluster_smote]

Cieslak, DA e Chawla, NV e Striegel, A., "Combatendo o desequilíbrio em conjuntos de dados de intrusão de rede", 2006 Conferência Internacional IEEE sobre Computação Granular, 2006, pp. 732-737

[Symprod]

Kunakorntum, I. e Hinthong, W. e Phunchongharn, P., "Uma minoria sintética baseada na distribuição probabilística (SYMPROD) superamostragem para conjuntos de dados desequilibrados", IEEE Access, 2020, pp. 114692 - 114704

[Smotewb]

Sağlam, F. e Cengiz, MA, "Uma nova técnica de reamostragem baseada em Smote Smoted Trough Trough Rouise Detecção e o procedimento de reforço", Sistemas especializados com aplicações, 2022, pp. 117023

Expandir