
_ _ _
___ _ __ ___ ___ | | _ ___ __ __ __ _ _ __ (_) __ _ _ __ | | _ ___
/ __ || '_ `_ / _ | __ | / _ _____ / // _` || '__ || | / _` || '_ | __ |/ __ |
__ | | | | | || (_) || | _ | __ /| _____ | v /| (_ || | | || (_ || | | || | _ __
| ___/| _ | | _ | | _ | ___/ __ | ___ | _/ __, _ || _ | | _ | __, _ || _ | | _ | __ || ___//
Variantes de Smotes para aprendizado desequilibrado
Últimas notícias
- 1.0.0 O lançamento está fora
- Técnicas de amostragem de subestimação adicionadas
- Smotewb acrescentou, graças a @szghlm
- implementações vetorizadas para a maioria das técnicas para aumentar o desempenho
- um kit de ferramentas de avaliação e seleção de modelo refatorado e aprimorado
- Cobertura de teste de 100%
- 10.0 Conformância PEP8 (por Pylint)
- polynom_fit_smote dividido em 4 técnicas diferentes
- Symprod acrescentou como o 86º super -amostrador implementado, graças a @iTouchkun
Introdução
O pacote implementa 86 variantes da técnica de superamostragem de minorias sintéticas (Smote). Além das implementações, uma estrutura de seleção de modelo fácil de usar é fornecida para permitir a avaliação rápida das técnicas de superamostragem nos conjuntos de dados invisíveis.
The implemented techniques: [SMOTE] , [SMOTE_TomekLinks] , [SMOTE_ENN] , [Borderline_SMOTE1] , [Borderline_SMOTE2] , [ADASYN] , [AHC] , [LLE_SMOTE] , [distance_SMOTE] , [SMMO] , [polynom_fit_SMOTE] , [Stefanowski ,, [Adoms], [Safe_Level_smote], [msmote], [de_oversampling], [smobd], [sundo], [msyn], [svm_balance], [trim_smote], [smote_rsb], [prowsyn], [slogn_smote] e [NRSBoundary_SMOTE] , [LVQ_SMOTE] , [SOI_CJ] , [ROSE] , [SMOTE_OUT] , [SMOTE_Cosine] , [Selected_SMOTE] , [LN_SMOTE] , [MWMOTE] , [PDFOS] , [IPADE_ID] , [RWO_sampling] , [NEATER ], [Deago], [Gazzah], [McT], [ADG], [Smote_IPF], [Kerneladasyn], [Mot2ld], [v_synth], [Ops], [smote_d], [smote_pso], [cure_smote], [SOMO], [ISOMAP_HYBRID], [CE_SMOTE], [Edge_Det_Smote], [CBSO], [e_smote], [dbsmote], [asmobd], [SOPLED_SMOTE], [SDSMOTE], [dsmote], [g_smote], [nTote], [sdsmote], [dsmote], [g_smote], [nTote], [sdsmote], [dsMote], [g_smote], [nTote], [nTotes], [dsmote], [g_smote], [nTote], [sdsmote], [dsmote], [g_smote], [nTote], [nTote], [nTote. ,, [Lee], [Spy], [Smote_PSOBAT], [MDO], [Random_smote], [ismote], [vis_rst], [gasmote], [a_suwo], [smote_frst_2t], [e_smote], [nRas], [smote_frst_2t], [e_smote], [nRas], [smote_frst_2t], [e_smote], [nRas], [smote_frst_2t], [e_smote], [nRas], [smote_frst_2t], [e_smote], [NRAS], [AMSCO] , [SSO] , [NDO_sampling] , [DSRBF] , [Gaussian_SMOTE] , [kmeans_SMOTE] , [Supervised_SMOTE] , [SN_SMOTE] , [CCR] , [ANS] , [cluster_SMOTE] , [SYMPROD] , [SMOTEWB ]
Comparação e avaliação
Para uma comparação e avaliação detalhadas de todas as técnicas implementadas, consulte link_to_comparison_paper
Citação
Se você usar este pacote em sua pesquisa, considere citar os trabalhos abaixo.
Pré -impressão descrevendo o pacote Veja Link_to_Package_Paper
Bibtex para o pacote:
@article { smote-variants ,
author = { Gy"orgy Kov'acs } ,
title = { smote-variants: a Python Implementation of 85 Minority Oversampling Techniques } ,
journal = { Neurocomputing } ,
note = { (IF-2019=4.07) } ,
volume = { 366 } ,
pages = { 352--354 } ,
year = { 2019 } ,
group = { journal } ,
code = { https://github.com/analyticalmindsltd/smote_variants } ,
doi = { 10.1016/j.neucom.2019.06.100 }
}
Para a pré -impressão do estudo comparativo, consulte Link_TO_Evaluation_Paper
Bibtex para a comparação e avaliação:
@article { smote-comparison ,
author = { Gy"orgy Kov'acs } ,
title = { An empirical comparison and evaluation of minority oversampling techniques on a large number of imbalanced datasets } ,
journal = { Applied Soft Computing } ,
note = { (IF-2019=4.873) } ,
volume = { 83 } ,
pages = { 105662 } ,
year = { 2019 } ,
link = { https://www.sciencedirect.com/science/article/pii/S1568494619304429 } ,
group = { journal } ,
code = { https://github.com/analyticalmindsltd/smote_variants } ,
doi = { 10.1016/j.asoc.2019.105662 }
}
Instalação
O pacote pode ser clonado do GitHub da maneira usual, e a mais recente versão estável também está disponível no repositório Pypi:
pip install smote-variants
Documentação
- Para uma documentação detalhada, consulte http://smote-variants.readthedocs.io.
- Para um tutorial do YouTube, verifique https://www.youtube.com/watch?v=gsk7akqpm60
Práticas recomendadas
Normalização/padronização/escala/seleção de recursos
A maioria das técnicas de superamostragem opera no espaço euclidiano implícito nos atributos. Portanto, é extremamente importante normalizar/dimensionar os atributos adequadamente. Sem conhecimento sobre a importância dos atributos, a normalização/padronização é uma boa primeira tentativa. Tendo algum conhecimento de domínio ou importância de atributo da classificação de bootstrap, a escala de variações de atributos de acordo com sua importância também é razoável. Como alternativa, a seleção de subconjuntos de recursos também pode melhorar os resultados, com o trabalho excessivo no subespaço mais adequado.
Seleção de modelo para o número de amostras a serem geradas
A classificação após a superamostragem é altamente sensível ao número de amostras minoritárias que estão sendo geradas. O equilíbrio do conjunto de dados raramente é a escolha certa, pois a maioria dos classificadores opera de maneira mais eficiente se a densidade de amostras positivas e negativas próximas ao limite de decisão for aproximadamente a mesma. Se os coletores das classes positivas e negativas não tiverem o mesmo tamanho aproximadamente, o equilíbrio do conjunto de dados não poderá conseguir isso. Além disso, em certas regiões, ele pode até reverter a situação: se o coletor da classe minoritária for muito menor que o da classe majoritária, o equilíbrio transformará a classe minoritária na maioria nos ambientes locais ao longo do limite de decisão.
A solução é aplicar a seleção de modelo para o número de amostras que estão sendo geradas. Quase todas as técnicas implementadas no pacote `smote-variants`
têm um parâmetro chamado `proportion`
. Esse parâmetro controla quantas amostras geram, a saber, o número de amostras minoritárias geradas é `proportion*(N_maj - N_min)`
, ou seja, definir o parâmetro de proporção como 1 equilibrará o conjunto de dados. É altamente recomendável realizar a seleção de modelo validada cruzada para um intervalo como `proportion`
= 0,1, 0,2, 0,5, 1,0, 2,0, 5,0.
Uso de amostra
Operamostragem binária
import smote_variants as sv
import imbalanced_databases as imbd
dataset = imbd . load_iris0 ()
X , y = dataset [ 'data' ], dataset [ 'target' ]
oversampler = sv . distance_SMOTE ()
# X_samp and y_samp contain the oversampled dataset
X_samp , y_samp = oversampler . sample ( X , y )
Overamostragem de excesso de multiclasse
import smote_variants as sv
import sklearn . datasets as datasets
dataset = datasets . load_wine ()
X , y = dataset [ 'data' ], dataset [ 'target' ]
oversampler = sv . MulticlassOversampling ( oversampler = 'distance_SMOTE' ,
oversampler_params = { 'random_state' : 5 })
# X_samp and y_samp contain the oversampled dataset
X_samp , y_samp = oversampler . sample ( X , y )
Seleção do melhor amostrador
from sklearn . neighbors import KNeighborsClassifier
from sklearn . tree import DecisionTreeClassifier
import smote_variants as sv
import sklearn . datasets as datasets
dataset = datasets . load_breast_cancer ()
dataset = { 'data' : dataset [ 'data' ],
'target' : dataset [ 'target' ],
'name' : 'breast_cancer' }
classifiers = [( 'sklearn.neighbors' , 'KNeighborsClassifier' , {}),
( 'sklearn.tree' , 'DecisionTreeClassifier' , {})]
oversamplers = sv . queries . get_all_oversamplers ( n_quickest = 2 )
os_params = sv . queries . generate_parameter_combinations ( oversamplers ,
n_max_comb = 2 )
# samp_obj and cl_obj contain the oversampling and classifier objects which give the
# best performance together
samp_obj , cl_obj = sv . evaluation . model_selection ( dataset = dataset ,
oversamplers = os_params ,
classifiers = classifiers ,
validator_params = { 'n_splits' : 2 ,
'n_repeats' : 1 },
n_jobs = 5 )
# training the best techniques using the entire dataset
X_samp , y_samp = samp_obj . sample ( dataset [ 'data' ],
dataset [ 'target' ])
cl_obj . fit ( X_samp , y_samp )
Integração com Pipelines Sklearn
import smote_variants as sv
import imblearn . datasets as imb_datasets
from sklearn . model_selection import train_test_split , GridSearchCV
from sklearn . pipeline import Pipeline
from sklearn . preprocessing import StandardScaler
from sklearn . neighbors import KNeighborsClassifier
libras = imb_datasets . fetch_datasets ()[ 'libras_move' ]
X , y = libras [ 'data' ], libras [ 'target' ]
oversampler = ( 'smote_variants' , 'MulticlassOversampling' ,
{ 'oversampler' : 'distance_SMOTE' , 'oversampler_params' : {}})
classifier = ( 'sklearn.neighbors' , 'KNeighborsClassifier' , {})
# Constructing a pipeline which contains oversampling and classification
# as the last step.
model = Pipeline ([( 'scale' , StandardScaler ()),
( 'clf' , sv . classifiers . OversamplingClassifier ( oversampler , classifier ))])
model . fit ( X , y )
Integração com Sklearn Grid Search
import smote_variants as sv
import imblearn . datasets as imb_datasets
from sklearn . model_selection import train_test_split , GridSearchCV
from sklearn . pipeline import Pipeline
from sklearn . preprocessing import StandardScaler
from sklearn . neighbors import KNeighborsClassifier
libras = imb_datasets . fetch_datasets ()[ 'libras_move' ]
X , y = libras [ 'data' ], libras [ 'target' ]
oversampler = ( 'smote_variants' , 'MulticlassOversampling' ,
{ 'oversampler' : 'distance_SMOTE' , 'oversampler_params' : {}})
classifier = ( 'sklearn.neighbors' , 'KNeighborsClassifier' , {})
# Constructing a pipeline with oversampling and classification as the last step
model = Pipeline ([( 'scale' , StandardScaler ()),
( 'clf' , sv . classifiers . OversamplingClassifier ( oversampler , classifier ))])
param_grid = { 'clf__oversampler' :[( 'smote_variants' , 'distance_SMOTE' , { 'proportion' : 0.5 }),
( 'smote_variants' , 'distance_SMOTE' , { 'proportion' : 1.0 }),
( 'smote_variants' , 'distance_SMOTE' , { 'proportion' : 1.5 })]}
# Specifying the gridsearch for model selection
grid = GridSearchCV ( model ,
param_grid = param_grid ,
cv = 3 ,
n_jobs = 1 ,
verbose = 2 ,
scoring = 'accuracy' )
# Fitting the pipeline
grid . fit ( X , y )
Contribuição
Sinta -se à vontade para implementar outras técnicas de superamostragem e vamos discutir os códigos assim que a solicitação de tração estiver pronta!
Referências
[Smote] | Chawla, NV e Bowyer, KW e Hall, Lo e Kegelmeyer, WP, "{Smote}: Técnica de Overmpling Minoritária Sintética", Journal of Artificial Intelligence Research, 2002, pp. 321--357 |
[Smote_tomeklinks] | Batista, Gustavo Epa e Prati, Ronaldo C. e Monard, Maria Carolina, "Um estudo do comportamento de vários métodos para equilibrar dados de treinamento de aprendizado de máquina", Sigkdd Explor. Newsl., 2004, pp. 20--29 |
[Smote_enn] | Batista, Gustavo Epa e Prati, Ronaldo C. e Monard, Maria Carolina, "Um estudo do comportamento de vários métodos para equilibrar dados de treinamento de aprendizado de máquina", Sigkdd Explor. Newsl., 2004, pp. 20--29 |
[Borderline_smote1] | Ha, "Smote limítrofe: um novo método de amostragem excessiva em conjuntos de dados desequilibrados aprendizado", Advances in Intelligent Computing, 2005, pp. 878--887 |
[Borderline_smote2] | Ha, "Smote limítrofe: um novo método de amostragem excessiva em conjuntos de dados desequilibrados aprendizado", Advances in Intelligent Computing, 2005, pp. 878--887 |
[Adasyn] | Ele, H. e Bai, Y. e Garcia, EA e Li, S., "{Adasyn}: abordagem de amostragem sintética adaptativa para aprendizado desequilibrado", Proceedings of Ijcnn, 2008, pp. 1322--1328 |
[AHC] | Gilles Cohen e Mélanie Hilario e Hugo Sax e Stéphane Hugonnet e Antoine Geissbuhler, "Aprendendo com dados desequilibrados na vigilância da infecção nosocomial", Inteligência Artificial em Medicina, 2006, pp. 7 - 18 |
[Lle_smote] | Wang, J. e Xu, M. e Wang, H. e Zhang, J., "Classificação de dados desequilibrados usando o algoritmo de Smote e a incorporação localmente linear", 2006 8ª Conferência Internacional sobre Processamento de Sinais, 2006, pp. |
[a distância_smote] | De La Calleja, J. e Fuentes, O., "Um método de amostragem excessiva baseada em distância para aprender com conjuntos de dados desequilibrados", Anais do vigésimo Inteligência Artificial Internacional da Flórida, 2007, pp. 634--635 |
[SMMO] | De la Calleja, Jorge e Fuentes, Olac e González, Jesús, "Selecionando exemplos minoritários de dados classificados incorretamente para amostragem excessiva". . |
[polynom_fit_smote] | Gazzah, S. e Amara, NEB, "Novas abordagens de superamostragem baseadas no encaixe polinomial para conjuntos de dados desequilibrados", 2008 O oitavo workshop internacional da IAPR em sistemas de análise de documentos, 2008, pp. 677-684 |
[Stefanowski] | Stefanowski, Jerzy e Wilk, Szymon, "Pré-processamento seletivo de dados desequilibrados para melhorar o desempenho da classificação", Anais da 10ª Conferência Internacional sobre Data Warehousing and Knowledge Discovery, 2008, pp. 283--292 |
[Adoms] | Tang, S. e Chen, S., "O mecanismo de geração de exemplos de classe minoritária sintética", conferência internacional de 2008 sobre tecnologia da informação e aplicações na Biomedicine, 2008, pp. 444-447 |
[Safe_Level_smote] | Bunkhumpornpat, Chumphol e Sinapiromsaran, Krung e Lursinsap, Chidchanok, "Smoto de nível seguro: Minoria-síntética de nível seguro Técnica de amostragem excessiva para lidar com o problema de classe desequilibrado", Anais da 13ª Conferência do Pacífico-Ásia sobre Advances na descoberta de conhecimento e Data Mining, 2009, pp. 475--482 |
[Msmote] | Hu, Shengguo e Liang, Yanfeng e MA, Lintao e ele, Ying, "Msmote: Melhorando o desempenho da classificação ao treinar dados é desequilibrado", Anais do Segundo Oficina Internacional de 2009 sobre Ciência e Engenharia da Computação - Volume 02, 2009, pp. 13 --17 |
[DE_OVERSAMPLING] | Chen, L. e Cai, Z. e Chen, L. e Gu, Q., "Um novo algoritmo de reamostragem híbrido de agrupamento de evolução diferencial sobre conjuntos de dados desequilibrados", Terceira Conferência Internacional sobre Descoberta de Conhecimento e Mineração de Dados, 2010, pp. 81-85 |
[SMOBD] | Cao, Q. e Wang, S., "Aplicando a técnica de amostragem excessiva com base na densidade de dados e no SVM sensível ao custo ao aprendizado desequilibrado", 2011 Conferência Internacional sobre Gerenciamento de Informações, Gerenciamento de Inovação e Engenharia Industrial, 2011, pp. 543-548 |
[SUNDO] | Cateni, S. e Colla, V. e Vannucci, M., "Novo método de reamostragem para a classificação de conjuntos de dados desequilibrados para problemas industriais e outros problemas do mundo real", 2011ª Conferência Internacional sobre Design e Aplicações de Sistemas Inteligentes, 2011, pp. 402-407 |
[Msyn] | FA, "Método de amostragem excessiva baseada em margem para aprender com conjuntos de dados desequilibrados", Avanços na descoberta do conhecimento e mineração de dados, 2011, pp. 309--320 |
[SVM_BALANCE] | Farquad, Mah e Bose, Indranil, "Pré -processamento de dados desequilibrados usando a máquina de vetor de suporte", decis. Apoio Syst., 2012, pp. 226--233 |
[TRIM_SMOTE] | Puntumapo, "Uma abordagem baseada em poda para pesquisar a região precisa e generalizada por amostragem sobre minorias sintéticas", Advances in Knowledge Discovery and Data Mining, 2012, pp. 371--382 |
[Smote_rsb] | Ramento, "Smote-RSB*: Uma abordagem de pré-processamento híbrida com base em superamostragem e subamostra para obter altos conjuntos de dados desequilibrados usando teoria de Smote e Rough Sets", Knowledge and Information Systems, 2012, pp. 245--265 |
[Prowsyn] | Baru, "Prowsyn: Técnica de superamostragem sintética ponderada por proximidade para aprendizado de conjunto de dados desequilibrado", Avanços na descoberta do conhecimento e mineração de dados, 2013, pp. 317--328 |
[SL_GRAPH_SMOTE] | Bunkhumpornpat, Chumpol e SubpaiBoonkit, Sitthichoke, "Gráfico de nível seguro para técnicas de amostragem excessiva das minorias sintéticas", 13º Simpósio Internacional sobre Comunicações e Tecnologias da Informação, 2013, pp. 570-575 |
[NRSBOUNDARY_SMOTE] | Feng, Hu e Hang, Li, "Um novo algoritmo de superamostragem de limites baseado no Bairro Rough Set Model: NRSboundary-Smote", Problemas Matemáticos em Engenharia, 2013, pp. 10 |
[Lvq_smote] | Munehiro Nakamura e Yusuke Kajiwara e Atsushi Otsuka e Haruhiko Kimura, "LVQ-Smote-Aprendendo a minoria sintética baseada em vetores para a técnica de amostragem para dados biomédicos", Biodata Mining, 2013 |
[SOI_CJ] | Sánchez, Atlántida I. e Morales, Eduardo e Gonzalez, Jesus, "Operampling sintético de instâncias usando agrupamentos", International Journal of Artificial Intelligence Tools, 2013, pp. |
[ROSA] | Menard, "Treinando e avaliando regras de classificação com dados desequilibrados", Mineração de dados e descoberta de conhecimento, 2014, pp. 92--122 |
[Smote_out] | FAJRI KOTO, "Ferir-out, Smote-Cosine e Selected-Smote: Uma estratégia de aprimoramento para lidar com o desequilíbrio no nível de dados", Conferência Internacional de 2014 sobre Ciência e Informação Avançada de Computação, 2014, pp. 280-284 |
[Smote_cosine] | FAJRI KOTO, "Ferir-out, Smote-Cosine e Selected-Smote: Uma estratégia de aprimoramento para lidar com o desequilíbrio no nível de dados", Conferência Internacional de 2014 sobre Ciência e Informação Avançada de Computação, 2014, pp. 280-284 |
[Selected_smote] | FAJRI KOTO, "Ferir-out, Smote-Cosine e Selected-Smote: Uma estratégia de aprimoramento para lidar com o desequilíbrio no nível de dados", Conferência Internacional de 2014 sobre Ciência e Informação Avançada de Computação, 2014, pp. 280-284 |
[Ln_smote] | Maciejewski, T. e Stefanowski, J., "Extensão local da vizinhança de Smote para mineração de dados desequilibrados", 2011 Simpósio IEEE sobre inteligência computacional e mineração de dados (CIDM), 2011, pp. 104-111 |
[Mwmote] | Barua, S. e Islam, MM e Yao, X. e Murase, K., "MWMote-Manority ponderou Tecnique de Opertempling minoritária para aprendizado de dados de dados desequilibrado", IEEE Transactions on Knowledge and Data Engineering, 2014, pp. 405-425 |
[PDFOs] | Ming Gao e Xia Hong e Sheng Chen e Chris J. Harris e Emad Khalaf, "PDFOs: estimativa de PDF baseada em excesso de amostragem para problemas desequilibrados de duas classes", Neurocomputing, 2014, pp. 248-259 |
[Ipade_id] | Victoria López e Isaac Triguero e Cristóbal J. Carmona e Salvador García e Francisco Herrera, "abordando a classificação desequilibrada com técnicas de geração de instâncias: Ipade -ID", Neurocomputing, 2014, pp. 15 - 28 |
[RWO_SAMPLING] | Zhang, Huaxzhang e Li, Mingfang, "Rwo-Sampling: uma abordagem de amostragem excessiva de caminhada aleatória para classificação de dados desequilibrada", Information Fusion, 2014, pp. |
[NEATER] | Almogahed, BA e Kakadiaris, IA, "NEATER: Filtragem de dados de amostragem excessiva usando teoria de jogos não cooperativos", 2014 22ª Conferência Internacional sobre Reconhecimento de Padrões, 2014, pp. 1371-1376 |
[Deago] | Bellinger, C. e Japkowicz, N. e Drummond, C., "Overamostragem sintética para detecção avançada de ameaças radioativas", 2015 IEEE 14ª Conferência Internacional sobre Aprendizado e Aplicações de Máquina (ICMLA), 2015, pp. 948-953 |
[Gazzah] | Gazzah, S. e Hechkel, A. e Essoukri Ben Amara, N., "Um método de amostragem híbrida para dados desequilibrados", 2015 IEEE 12º International Multi-Conference em sistemas, Signals Dispositices (SSD15), 2015, pp. 1-6 |
[MCT] | Jiang, Liangxiao e Qiu, Chen e Li, Chaoqun, "Uma nova técnica de clonagem minoritária para aprendizado sensível ao custo", International Journal of Pattern Reconhecimento e Inteligência Artificial, 2015, pp. 1551004 |
[ADG] | Pourhabib, A. e Mallick, Bani K. e Ding, Yu, "Uma nova técnica de clonagem minoritária para aprendizado sensível ao custo", Journal of Machine Learning Research, 2015, pp. 2695--2724 |
[Smote_ipf] | José A. Sáez e Julián Luengo e Jerzy Stefanowski e Francisco Herrera, "Smote - IPF: abordando os exemplos barulhentos e limítrofes em classificação desequilibrada por um método de re -amostragem com filtragem", Information Sciences, 2015, pp. 184 - 203 |
[Kerneladasyn] | Tang, B. e ele, H., "Kerneladasyn: Geração de dados sintéticos adaptativos baseados no kernel para aprendizado desequilibrado", 2015 Congresso IEEE sobre Computação Evolutiva (CEC), 2015, pp. 664-671 |
[MOT2LD] | XI, "Um método de superamostragem de minoria sintética baseada em densidades locais em espaço de baixa dimensão para aprendizado desequilibrado", Sistemas de banco de dados para aplicações avançadas, 2015, pp. 3--18 |
[V_synth] | Young, II, William A. e Nykl, Scott L. e Weckman, Gary R. e Chelberg, David M., "Usando diagramas de voronoi para melhorar o desempenho da classificação ao modelar conjuntos de dados desequilibrados", Neural Comput. Appl., 2015, pp. 1041--1054 |
[OUPS] | William A. Rivera e Petros Xanthopoulos, "A priori métodos sintéticos de amostragem excessiva para aumentar a sensibilidade da classificação em conjuntos de dados desequilibrados", Sistemas especializados com aplicativos, 2016, pp. 124 - 135 |
[Smote_d] | Torre, "Smoted-D uma versão determinística de Smote", Reconhecimento de padrões, 2016, pp. 177--188 |
[Smote_pso] | Jair Cervantes e Farid Garcia-Lamont e Lisbeth Rodriguez e Asdrúbal López e José Ruiz Castilla e Adrian Trueba, "Método baseado em PSO para classificação SVM em conjuntos de dados distorcidos", Neurocomputing, 2017, pp. |
[Cure_smote] | M, "Algoritmo de cura-smote e algoritmo híbrido para seleção de recursos e otimização de parâmetros baseados em florestas aleatórias", BMC Bioinformatics, 2017, pp. 169 |
[SOMO] | Georgios Douzas e Fernando Bacao, "Mapa auto -organizado Operampling (SOMO) para aprendizado de conjunto de dados desequilibrado", Sistemas especializados com Applications, 2017, pp. 40 - 52 |
[ISOMAP_HYBRID] | Gu, Qiong e Cai, Zhihua e Zhu, Li, "Classificação de conjuntos de dados desequilibrados usando o algoritmo de re-amostragem híbrido baseado em Isomap", Anais do 4º Simpósio Internacional sobre Avanços na Computação e Inteligência, 2009, pp. 287- -296 |
[CE_SMOTE] | Chen, S. e Guo, G. e Chen, L., "Um novo método de amostragem excessiva baseado em conjuntos de cluster", 2010 IEEE 24ª Conferência Internacional sobre redes de informações avançadas e aplicativos Workshops, 2010, pp. 599-604 |
[Edge_Det_smote] | Kang, Y. e Won, S., "Algoritmo de decisão de peso para a técnica de supermo-amostragem em aprendizado de classe impebe", ICCAS 2010, 2010, pp. 182-186 |
[CBSO] | Baru, "Uma nova técnica de superamostragem de minorias sintéticas para o aprendizado do conjunto de dados desequilibrado", Neural Information Processing, 2011, pp. 735--744 |
[E_smote] | Deepa, T. e Punithavalli, M., "Uma técnica de e-smote para seleção de recursos em conjunto de dados desequilibrado de alta dimensão", 2011, 3ª Conferência Internacional sobre Tecnologia da Computação de Eletrônicos, 2011, pp. 322-324 |
[Dbsmote] | Bunkhumpornpa, "DBSMote: Técnica de Sampling Sampling Basey Minority Sampling baseado em densidade", Applied Intelligence, 2012, pp. 664--684 |
[Asmobd] | Senzhang Wang e Zhoujun Li e Wenhan Chao e Qinghua Cao, "Aplicando a técnica adaptativa de amostragem excessiva com base na densidade de dados e no SVM sensível ao custo para o aprendizado desequilibrado", a Conferência Internacional Internacional sobre Redes Neurais (IJCNN), 2012, pp. 1 -8 |
[SOPLED_SMOTE] | Zhou, B. e Yang, C. e Guo, H. e Hu, J., "Um SVM quase linear, combinado com o Smotes Montado para Classificação de Dados Debalanceados", a Conferência Conjunta Internacional de 2013 sobre Redes Neurais (IJCNN), 2013, pp. 1-7 |
[Sdsmote] | Li, K. e Zhang, W. e Lu, Q. e Fang, X., "Um método aprimorado de classificação de dados desequilibrados com base no grau de suporte", Conferência Internacional de 2014 sobre Identificação, Informação e Conhecimento na Internet das Coisas, 2014 , pp. 34-38 |
[Dsmote] | Mahmoudi, S. e Moradi, P. e Akhlaghian, F. e Moradi, R., "Diversidade e métricas separáveis na técnica de amostragem excessiva para classificação de dados desequilibrada", 2014 4ª Conferência Internacional sobre Computador e Engenharia de Conhecimento (ICCKE), 2014 , pp. 152-158 |
[G_smote] | Sandhan, T. e Choi, JY, "Lidando com conjuntos de dados desequilibrados por amostragem híbrida parcialmente guiada para reconhecimento de padrões", 2014 22ª Conferência Internacional sobre Reconhecimento de Padrões, 2014, pp. 1449-1453 |
[Nt_smote] | Xu, YH e Li, H. e Le, LP e Tian, XY, "Técnica de excesso de amostragem minoritária triangular do bairro para previsão desequilibrada em pequenas amostras de turismo e otimização da computação chinesa", Sétima Conferência Internacional Internacional sobre Ciências Computacionais e Otimização , 2014, pp. 534-538 |
[Lee] | Lee, Jaedong e Kim, Noo-Ri e Lee, Jee-Hyong, "Uma técnica de amostragem excessiva com rejeição para aprendizado de classe desequilibrado", Anais da 9ª Conferência Internacional sobre Gerenciamento e Comunicação onipresentes de informações, 2015, pp. 102: 1 --102: 6 |
[ESPIÃO] | Dang, Xt e Tran, DH e Hirose, O. e Satou, K., "Spy: um novo método de reamostragem para melhorar o desempenho da classificação em dados desequilibrados", 2015 Sétima Conferência Internacional sobre Engenharia de Conhecimento e Sistemas (KSE), 2015, pp 280-285 |
[Smote_psobat] | Li, J. e Fong, S. e Zhuang, Y., "Otimizando a queda por metaheurísticas com rede neural e árvore de decisão", 2015 3º Simpósio Internacional sobre Inteligência Computacional e de Negócios (ISCBI), 2015, pp. 26-32 |
[MDO] | Abdi, L. e Hashemi, S., "Para combater problemas desequilibrados de várias classes por meio de técnicas de amostragem excessiva", IEEE Transactions on Knowledge and Data Engineering, 2016, pp. 238-251 |
[Random_smote] | Don, "Uma nova abordagem de amostragem excessiva: Smote aleatória para aprender com conjuntos de dados desequilibrados", Knowledge Scienc, 2011, pp. 343--352 |
[Ismote] | L, "Um novo método de amostragem de combinação para dados desequilibrados", Proceedings of 2013 Chinese Intelligent Automation Conference, 2013, pp. 547--554 |
[Vis_rst] | Borowsk, "Classificação de dados desequilibrada: uma nova abordagem de re-amostragem combinando um Smote e Conjuntos Rougalhos Melhorados Versáteis", Sistemas de Informação em Computador e Gerenciamento Industrial, 2016, pp. 31--42 |
[Gasmote] | Jian, "Um novo algoritmo para classificação de dados de desequilíbrio baseado no algoritmo genético Melhorado", Arabian Journal for Science and Engineering, 2016, pp. 3255--3266 |
[A_suwo] | Iman Nekooeimehr e Susana K. Lai-Yuen, "Adaptive semi-supervisionado super amostragem ponderada (A-suwo) para conjuntos de dados desequilibrados", Sistemas especializados com Applications, 2016, pp. 405-416 |
[Smote_frst_2t] | Ramento, "Aprendizagem desequilibrada e desequilibrada para o diagnóstico de manutenção do disjuntor de alta tensão: o algoritmo Smote-FRST-2T", Aplicações de engenharia da inteligência artificial, 2016, pp. 134-139 |
[E_smote] | Yun, Jaesub e Ha, Jihyun e Lee, Jong-seok, "Determinação automática do tamanho da vizinhança em Smote", Anais da 10ª Conferência Internacional sobre Gerenciamento e Comunicação de Informações Obíquas, 2016, pp. 100: 1--100: 8 |
[NRAS] | William A. Rivera, "Redução de ruído a priori amostragem sintética para conjuntos de dados desequilibrados de classe", Information Sciences, 2017, pp. 146 - 161 |
[AMSCO] | Jinyan Li e Simon Fong e Raymond K. Wong e Victor W. Chu, "Fusão de enxame multi -objetiva adaptável para classificação de dados desequilibrada", Information Fusion, 2018, pp. 1 - 24 |
[SSO] | Ron, "Técnica de superamostragem de sensibilidade estocástica para dados desequilibrados", Machine Learning and CyberNetics, 2014, pp. 161--171 |
[NDO_SAMPLING] | Zhang, L. e Wang, W., "Um método de re-amostragem para aprendizado de desequilíbrio de classe com dados de crédito", 2011 Conferência Internacional de Tecnologia da Informação, Engenharia de Computação e Ciências da Gerenciamento, 2011, pp. 393-397 |
[DSRBF] | Francisco Fernández-Navarro e César Hervás-Martínez e Pedro Antonio Gutiérrez, "Um procedimento dinâmico de amostragem excessiva baseada na sensibilidade para problemas de várias classes", Reconhecimento de padrões, 2011, pp. 1821-1833 |
[Gaussian_smote] | Hansoo Lee e Jonggeun Kim e Sungshin Kim, "Algoritmo de Smote Gaussian para resolver distribuições de classe distorcidas", int. J. Fuzzy Logic and Intelligent Systems, 2017, pp. 229-234 |
[Kmeans_smote] | Georgios Douzas e Fernando Bacao e Felix por último, "Melhorando o aprendizado desequilibrado por meio de um método de superamostragem heurística baseado em K -Means and Smote", Information Sciences, 2018, pp. 1 - 20 |
[Supervisionado_smote] | Hu, Jun e ele, Xue e Yu, Dong-Jun e Yang, Xi-Bei e Yang, Jing-Yu e Shen, Hong-Bin, "Um novo algoritmo supervisionado de amostragem excessiva com aplicação na previsão de resíduos de ligação à proteína-nucleotídeo" , PLOS ONE, 2014, pp. 1-10 |
[Sn_smote] | Garc {'i}, "Smote de bairro circundante para aprender com conjuntos de dados desequilibrados", Progress in Artificial Intelligence, 2012, pp. 347--362 |
[CCR] | Koziarski, Michał e Wozniak, Michal, "CCR: um algoritmo combinado de limpeza e reamostragem para classificação de dados desequilibrada", International Journal of Applied Mathematics and Computer Science, 2017, pp. 727-736 |
[Ans] | Siriseriwan, W e Sinapiromsaran, Krung, "Técnica de superamostragem minoritária sintética do vizinho adaptativo sob o manuseio de pária 1NN", Songklanakarin Journal of Science and Technology, 2017, pp. 565-576 |
[cluster_smote] | Cieslak, DA e Chawla, NV e Striegel, A., "Combatendo o desequilíbrio em conjuntos de dados de intrusão de rede", 2006 Conferência Internacional IEEE sobre Computação Granular, 2006, pp. 732-737 |
[Symprod] | Kunakorntum, I. e Hinthong, W. e Phunchongharn, P., "Uma minoria sintética baseada na distribuição probabilística (SYMPROD) superamostragem para conjuntos de dados desequilibrados", IEEE Access, 2020, pp. 114692 - 114704 |
[Smotewb] | Sağlam, F. e Cengiz, MA, "Uma nova técnica de reamostragem baseada em Smote Smoted Trough Trough Rouise Detecção e o procedimento de reforço", Sistemas especializados com aplicações, 2022, pp. 117023 |