Um conjunto de dados de imagens de alta qualidade contendo frutas e vegetais. Estão incluídas as seguintes frutas e vegetais: Maçãs (diferentes variedades: Crimson Snow, Golden, Golden-Red, Granny Smith, Pink Lady, Red, Red Delicious), Damasco, Abacate, Abacate Maduro, Banana (Amarelo, Vermelho, Lady Finger) , Beterraba Vermelha, Mirtilo, Cacto, Melão (2 variedades), Carambula, Couve-flor, Cereja (variedades diferentes, Rainier), Cera de Cereja (Amarelo, Vermelho, Preto), Castanha, Clementina, Cocos, milho (com casca), pepino (amadurecido), tâmaras, berinjela, figo, raiz de gengibre, granadilha, uva (azul, rosa, branca (diferentes variedades)), toranja (rosa, branca), goiaba, avelã, mirtilo, Kiwi, Caqui, Couve-rábano, Kumsquats, Limão (normal, Meyer), Limão, Lichia, Mandarina, Manga (Verde, Vermelha), Mangostão, Maracujá, Melão Piel de Sapo, Amora, Nectarina (Regular, Plana), Noz (Floresta, Noz-pecã), Cebola (Vermelha, Branca), Laranja, Mamão, Maracujá, Pêssego (diferentes variedades), Pepino, Pêra (diferentes variedades, Abate, Forelle, Kaiser, Monster, Red, Stone, Williams), Pimenta (Vermelha, Verde, Laranja, Amarela), Physalis (normal, com casca), Abacaxi (normal, Mini), Pitahaya Red, Ameixa (diferentes variedades), Romã, Docinho de Pomelo, Batata (Vermelha, Doce, Branca), Marmelo, Rambutan, Framboesa, Groselha, Salak, Morango (normal, Cunha), Tamarillo, Tangelo, Tomate (diferentes variedades, Marrom, Vermelho Cereja, Amarelo, não amadurecido, Coração), Noz, Melancia.
Número total de imagens: 90483.
Tamanho do conjunto de treinamento: 67.692 imagens (uma fruta ou vegetal por imagem).
Tamanho do conjunto de teste: 22.688 imagens (uma fruta ou vegetal por imagem).
Tamanho do conjunto de múltiplas frutas: 103 imagens (mais de uma fruta (ou classe de fruta) por imagem)
Número de aulas: 131 (frutas e verduras).
Tamanho da imagem: 100x100 pixels.
Formato do nome do arquivo: image_index_100.jpg (por exemplo, 32_100.jpg) ou r_image_index_100.jpg (por exemplo, r_32_100.jpg) ou r2_image_index_100.jpg ou r3_image_index_100.jpg. "r" significa fruta girada. "r2" significa que a fruta foi girada em torno do 3º eixo. "100" vem do tamanho da imagem (100x100 pixels).
Diferentes variedades da mesma fruta (maçã, por exemplo) são armazenadas como pertencentes a classes diferentes.
As pastas Treinamento e Teste contêm imagens para fins de treinamento e teste.
A pasta test-multiple_fruits contém imagens com múltiplas frutas. Alguns deles são parcialmente cobertos por outras frutas. Este é um excelente teste para detecção no mundo real.
A pasta src/image_classification contém o código python para treinar a rede neural. Ele usa a biblioteca TensorFlow 2.0.
A pasta src/image_classification_tf_1.8.0 contém a versão antiga do código python para treinar a rede neural. Ele usa a biblioteca TensorFlow 1.8.0.
A pasta src/utils contém o código C++ usado para extrair frutas ou vegetais do fundo.
A pasta papers contém os artigos de pesquisa relacionados a este conjunto de dados.
O conjunto de dados também pode ser baixado de: Kaggle
Horea Muresan, Mihai Oltean, Reconhecimento de frutas a partir de imagens usando aprendizagem profunda, Acta Univ. Sapientiae, Informatica Vol. 10, Edição 1, pp. 26-42, 2018.
Frutas e hortaliças foram plantadas no eixo de um motor de baixa rotação (3 rpm) e um pequeno filme de 20 segundos foi gravado.
Uma câmera Logitech C920 foi utilizada para filmar os frutos. Esta é uma das melhores webcams disponíveis.
Atrás das frutas colocamos uma folha de papel branca como fundo.
Porém devido às variações nas condições de iluminação, o fundo não era uniforme e escrevemos um algoritmo dedicado que extrai a fruta do fundo. Este algoritmo é do tipo Flood Fill: partimos de cada borda da imagem e marcamos todos os pixels ali, depois marcamos todos os pixels encontrados na vizinhança dos pixels já marcados para os quais a distância entre as cores é menor que um valor prescrito. Repetimos o passo anterior até que não seja possível marcar mais pixels.
Todos os pixels marcados são considerados como fundo (que é então preenchido com branco) e o restante dos pixels são considerados pertencentes ao objeto.
O valor máximo para a distância entre 2 pixels vizinhos é um parâmetro do algoritmo e é definido (por tentativa e erro) para cada filme.
As fotos da pasta test-multiple_fruits foram tiradas com um telefone Nexus 5X.
Executamos o TensorFlow com base nesses dados e os resultados são apresentados neste artigo de pesquisa.
As frutas foram filmadas nas datas abaixo (AAAA.MM.DD):
25/02/2017 - Maçã (dourada).
28.02.2017 - Maçã (Vermelho Amarelo 1, vermelho, dourado2), Kiwi, Pêra, Toranja, Limão, Laranja, Morango.
05/03/2017 - Maçã (dourado3, Braeburn, Granny Smith, vermelho2).
07/03/2017 - Apple (vermelho3).
10/05/2017 - Ameixa, Pêssego, Pêssego liso, Damasco, Nectarina, Romã.
27/05/2017 - Abacate, Mamão, Uva, Cereja.
25/12/2017 - Carambula, Cacto, Granadilla, Caqui, Kumsquats, Maracujá, Abacate maduro, Marmelo.
28/12/2017 - Clementina, Cocos, Manga, Limão, Lichia.
31/12/2017 - Apple Red Delicious, Pêra Monster, Uva Branca.
14.01.2018 - Banana, Toranja Rosa, Mandarina, Abacaxi, Tangelo.
19.01.2018 - Mirtilo, Framboesa.
26/01/2018 - Tâmaras, Maracujá, Ameixa 2, Salak, Tamarillo.
05.02.2018 - Goiaba, Uva Branca 2, Limão Meyer
07/02/2018 - Banana Vermelha, Pepino, Pitahaya Vermelha.
08/02/2018 - Pear Abate, Pear Williams.
22/05/2018 - Limão girado, Romã girada.
24/05/2018 - Cereja Rainier, Cereja 2, Fatia de Morango.
26/05/2018 - Melão (2 variedades).
31.05.2018 - Melão Piel de Sapo.
05.06.2018 - Abacaxi Mini, Physalis, Physalis com Casca, Rumbutan.
08.06.2018 - Amoreira, Groselha.
16.06.2018 - Vermelho Cereja, Avelã, Noz, Tomate.
17.06.2018 - Cera Cereja (Amarelo, Vermelho, Preto).
19.08.2018 - Maçã Vermelha Amarela 2, Uva Azul, Uva Branca 2, Uva Branca 3, Pêssego 2, Ameixa 3, Tomate Marrom, Tomate 1-4.
20.12.2018 - Noz Pecan, Pêra Kaiser, Tomate Amarelo.
21/12/2018 - Banana Lady Finger, Castanha, Mangostão.
22/12/2018 - Pomelo querido.
21/04/2019 - Maçã Crimson Snow, Maçã Pink Lady, Mirtilo, Couve-rábano, Manga Vermelha, Pêra Vermelha, Pimenta (Vermelho, Amarelo, Verde).
18.06.2019 - Beterraba Vermelha, Milho, Raiz de Gengibre, Nectarina Plana, Nozes Florestais, Cebola Vermelha, Cebola Vermelha Descascada, Cebola Branca, Batata Vermelha, Batata Vermelha Lavada, Batata Doce, Batata Branca.
07.07.2019 - Couve Flor, Berinjela, Pêra Forelle, Pimenta Laranja, Coração de Tomate.
22.09.2019 - Casca de Milho, Pepino Maduro, Figo, Pêra 2, Caroço de Pêra, Tomate Não Amadurecido, Melancia.
Licença MIT
Direitos autorais (c) 2017-2020 Mihai Oltean, Horea Muresan
É concedida permissão, gratuitamente, a qualquer pessoa que obtenha uma cópia deste software e dos arquivos de documentação associados (o "Software"), para negociar o Software sem restrições, incluindo, sem limitação, os direitos de usar, copiar, modificar, mesclar , publicar, distribuir, sublicenciar e/ou vender cópias do Software e permitir que as pessoas a quem o Software seja fornecido o façam, sujeito às seguintes condições:
O aviso de direitos autorais acima e este aviso de permissão serão incluídos em todas as cópias ou partes substanciais do Software.
O SOFTWARE É FORNECIDO "COMO ESTÁ", SEM GARANTIA DE QUALQUER TIPO, EXPRESSA OU IMPLÍCITA, INCLUINDO, MAS NÃO SE LIMITANDO ÀS GARANTIAS DE COMERCIALIZAÇÃO, ADEQUAÇÃO A UM DETERMINADO FIM E NÃO VIOLAÇÃO. EM NENHUM CASO OS AUTORES OU DETENTORES DE DIREITOS AUTORAIS SERÃO RESPONSÁVEIS POR QUALQUER RECLAMAÇÃO, DANOS OU OUTRA RESPONSABILIDADE, SEJA EM UMA AÇÃO DE CONTRATO, ATO ILÍCITO OU DE OUTRA FORMA, DECORRENTE DE, OU EM CONEXÃO COM O SOFTWARE OU O USO OU OUTRAS NEGOCIAÇÕES NO SOFTWARE.