Un conjunto de datos de alta calidad de imágenes que contienen frutas y verduras. Se incluyen las siguientes frutas y verduras: Manzanas (diferentes variedades: Crimson Snow, Golden, Golden-Red, Granny Smith, Pink Lady, Red, Red Delicious), Albaricoque, Aguacate, Aguacate maduro, Plátano (Yellow, Red, Lady Finger) , Remolacha Roja, Arándano, Nopal, Melón (2 variedades), Carambula, Coliflor, Cereza (diferentes variedades, Rainier), Cera de Cereza (Amarillo, Rojo, Negro), Castaña, Clementina, Cocos, Maíz (con cáscara), pepino (madurado), dátiles, berenjena, higo, raíz de jengibre, granadilla, uva (azul, rosa, blanca (diferentes variedades)), pomelo (rosa, blanco), guayaba, avellana, arándano, kiwi, caqui , colinabo, kumsquats, limón (normal, Meyer), lima, lichi, mandarina, mango (verde, rojo), mangostán, maracuyá, melón piel de sapo, morera, Nectarina (Regular, Plana), Nuez (Bosque, Pecan), Cebolla (Roja, Blanca), Naranja, Papaya, Maracuyá, Melocotón (diferentes variedades), Pepino, Pera (diferentes variedades, Abate, Forelle, Kaiser, Monster, Red , Stone, Williams), Pimiento (Rojo, Verde, Naranja, Amarillo), Physalis (normal, con cáscara), Piña (normal, Mini), Pitahaya Roja, Ciruela (diferentes variedades), Granada, Pomelo Sweetie, Patata (Roja, Dulce, Blanco), Membrillo, Rambután, Frambuesa, Grosella, Salak, Fresa (normal, Cuña), Tamarillo, Tangelo, Tomate (diferentes variedades, Granate, Rojo Cereza, Amarillo, sin madurar, Corazón), Nuez, Sandía.
Número total de imágenes: 90483.
Tamaño del conjunto de entrenamiento: 67692 imágenes (una fruta o verdura por imagen).
Tamaño del conjunto de prueba: 22688 imágenes (una fruta o verdura por imagen).
Tamaño del conjunto de múltiples frutas: 103 imágenes (más de una fruta (o clase de fruta) por imagen)
Número de clases: 131 (frutas y verduras).
Tamaño de imagen: 100x100 píxeles.
Formato de nombre de archivo: image_index_100.jpg (por ejemplo, 32_100.jpg) o r_image_index_100.jpg (por ejemplo, r_32_100.jpg) o r2_image_index_100.jpg o r3_image_index_100.jpg. "r" significa fruta rotada. "r2" significa que la fruta giró alrededor del tercer eje. "100" proviene del tamaño de la imagen (100x100 píxeles).
Diferentes variedades de la misma fruta (manzana, por ejemplo) se almacenan como pertenecientes a diferentes clases.
Las carpetas Capacitación y Prueba contienen imágenes con fines de capacitación y prueba.
La carpeta test-multiple_fruits contiene imágenes con varias frutas. Algunos de ellos están parcialmente cubiertos por otros frutos. Esta es una prueba excelente para la detección en el mundo real.
La carpeta src/image_classification contiene el código Python para entrenar la red neuronal. Utiliza la biblioteca TensorFlow 2.0.
La carpeta src/image_classification_tf_1.8.0 contiene la versión anterior del código Python para entrenar la red neuronal. Utiliza la biblioteca TensorFlow 1.8.0.
La carpeta src/utils contiene el código C++ utilizado para extraer las frutas o verduras del fondo.
La carpeta artículos contiene los artículos de investigación relacionados con este conjunto de datos.
El conjunto de datos también se puede descargar desde: Kaggle
Horea Muresan, Mihai Oltean, Reconocimiento de frutas a partir de imágenes mediante aprendizaje profundo, Acta Univ. Sapientiae, Informática vol. 10, Número 1, págs. 26-42, 2018.
Se plantaron frutas y verduras en el eje de un motor de baja velocidad (3 rpm) y se grabó una película corta de 20 segundos.
Para filmar las frutas se utilizó una cámara Logitech C920. Esta es una de las mejores cámaras web disponibles.
Detrás de las frutas colocamos una hoja de papel blanca como fondo.
Sin embargo, debido a las variaciones en las condiciones de iluminación, el fondo no era uniforme y escribimos un algoritmo dedicado que extrae la fruta del fondo. Este algoritmo es del tipo relleno por inundación: comenzamos desde cada borde de la imagen y marcamos todos los píxeles allí, luego marcamos todos los píxeles que se encuentran en la vecindad de los píxeles ya marcados para los cuales la distancia entre colores es menor que un valor prescrito. Repetimos el paso anterior hasta que no se puedan marcar más píxeles.
Todos los píxeles marcados se consideran fondo (que luego se rellena de blanco) y el resto de píxeles se consideran pertenecientes al objeto.
El valor máximo de la distancia entre 2 píxeles vecinos es un parámetro del algoritmo y se establece (mediante prueba y error) para cada película.
Las imágenes de la carpeta test-multiple_fruits se tomaron con un teléfono Nexus 5X.
Hemos ejecutado TensorFlow con estos datos y los resultados se presentan en este artículo de investigación.
Las frutas se filmaron en las fechas que se indican a continuación (AAAA.MM.DD):
25.02.2017 - Manzana (dorada).
28.02.2017 - Manzana (Rojo Amarillo 1, Rojo, Dorado2), Kiwi, Pera, Pomelo, Limón, Naranja, Fresa.
05.03.2017 - Manzana (golden3, Braeburn, Granny Smith, red2).
07.03.2017 - Manzana (rojo3).
10.05.2017 - Ciruela, Melocotón, Melocotón plano, Albaricoque, Nectarina, Granada.
27.05.2017 - Aguacate, Papaya, Uva, Cereza.
25.12.2017 - Carambula, Nopal, Granadilla, Kaki, Kumsquats, Maracuyá, Aguacate maduro, Membrillo.
28.12.2017 - Clementina, Cocos, Mango, Lima, Lichi.
31.12.2017 - Apple Red Delicious, Pear Monster, Uva Blanca.
14.01.2018 - Plátano, Pomelo Rosa, Mandarina, Piña, Tangelo.
19.01.2018 - Arándano, Frambuesa.
26.01.2018 - Dátiles, Maracuyá, Ciruela 2, Salak, Tamarillo.
05.02.2018 - Guayaba, Uva Blanca 2, Limón Meyer
07.02.2018 - Plátano Rojo, Pepino, Pitahaya Roja.
08.02.2018 - Pera Abate, Pera Williams.
22.05.2018 - Limón rotado, Granada rotada.
24.05.2018 - Cherry Rainier, Cherry 2, Cuña de fresa.
26.05.2018 - Melón (2 variedades).
31.05.2018 - Melón Piel de Sapo.
05.06.2018 - Piña Mini, Physalis, Physalis con Cáscara, Rumbután.
08.06.2018 - Morera, Grosella.
16.06.2018 - Rojo Cereza, Avellana, Nuez, Tomate.
17.06.2018 - Cera de cereza (amarillo, rojo, negro).
2018.08.19 - Rojo Manzana Amarillo 2, Azul Uva, Blanco Uva 2, Blanco Uva 3, Melocotón 2, Ciruela 3, Tomate Granate, Tomate 1-4.
2018.12.20 - Nuez Pecana, Pera Kaiser, Tomate Amarillo.
21.12.2018 - Banana Lady Finger, Castaño, Mangostán.
22.12.2018 - Pomelo cariño.
21.04.2019 - Manzana Crimson Snow, Manzana Pink Lady, Arándano, Colinabo, Mango Rojo, Pera Roja, Pimienta (Roja, Amarilla, Verde).
18.06.2019 - Remolacha Roja, Maíz, Raíz de Jengibre, Nectarina Plana, Bosque de Nueces, Cebolla Roja, Cebolla Roja Pelada, Cebolla Blanca, Patata Roja, Patata Roja Lavada, Patata Dulce, Patata Blanca.
07.07.2019 - Coliflor, Berenjena, Pera Forelle, Pimiento Naranja, Corazón De Tomate.
22.09.2019 - Cáscara de Maíz, Pepino Maduro, Higo, Pera 2, Hueso de Pera, Tomate sin Madurar, Sandía.
Licencia MIT
Copyright (c) 2017-2020 Mihai Oltean, Horea Muresan
Por el presente se otorga permiso, sin cargo, a cualquier persona que obtenga una copia de este software y los archivos de documentación asociados (el "Software"), para operar con el Software sin restricciones, incluidos, entre otros, los derechos de uso, copia, modificación, fusión. , publicar, distribuir, sublicenciar y/o vender copias del Software, y permitir que las personas a quienes se les proporciona el Software lo hagan, sujeto a las siguientes condiciones:
El aviso de derechos de autor anterior y este aviso de permiso se incluirán en todas las copias o partes sustanciales del Software.
EL SOFTWARE SE PROPORCIONA "TAL CUAL", SIN GARANTÍA DE NINGÚN TIPO, EXPRESA O IMPLÍCITA, INCLUYENDO PERO NO LIMITADO A LAS GARANTÍAS DE COMERCIABILIDAD, IDONEIDAD PARA UN PROPÓSITO PARTICULAR Y NO INFRACCIÓN. EN NINGÚN CASO LOS AUTORES O TITULARES DE DERECHOS DE AUTOR SERÁN RESPONSABLES DE NINGÚN RECLAMO, DAÑO U OTRA RESPONSABILIDAD, YA SEA EN UNA ACCIÓN CONTRACTUAL, AGRAVIO O DE OTRA MANERA, QUE SURJA DE, FUERA DE O EN RELACIÓN CON EL SOFTWARE O EL USO U OTRAS NEGOCIOS EN EL SOFTWARE.