TensorFlow Datasets proporciona muchos conjuntos de datos públicos como tf.data.Datasets
.
Para instalar y utilizar TFDS, le recomendamos encarecidamente que comience con nuestra guía de introducción . Pruébelo de forma interactiva en un cuaderno Colab.
Nuestra documentación contiene:
# !pip install tensorflow-datasets
import tensorflow_datasets as tfds
import tensorflow as tf
# Construct a tf.data.Dataset
ds = tfds . load ( 'mnist' , split = 'train' , as_supervised = True , shuffle_files = True )
# Build your input pipeline
ds = ds . shuffle ( 1000 ). batch ( 128 ). prefetch ( 10 ). take ( 5 )
for image , label in ds :
pass
TFDS se ha creado teniendo en cuenta estos principios:
Si esos casos de uso no están satisfechos, envíenos sus comentarios.
Agregar un conjunto de datos es realmente sencillo siguiendo nuestra guía.
Solicite un conjunto de datos abriendo un problema de GitHub de solicitud de conjunto de datos.
Y vote sobre el conjunto actual de solicitudes agregando una reacción de aprobación al problema.
Incluya la siguiente cita cuando utilice tensorflow-datasets
para un artículo, además de cualquier cita específica de los conjuntos de datos utilizados.
@misc { TFDS ,
title = { {TensorFlow Datasets}, A collection of ready-to-use datasets } ,
howpublished = { url{https://www.tensorflow.org/datasets} } ,
}
Esta es una biblioteca de utilidades que descarga y prepara conjuntos de datos públicos. No alojamos ni distribuimos estos conjuntos de datos, no garantizamos su calidad o equidad, ni afirmamos que usted tiene licencia para utilizar el conjunto de datos. Es su responsabilidad determinar si tiene permiso para utilizar el conjunto de datos según la licencia del mismo.
Si es propietario de un conjunto de datos y desea actualizar alguna parte del mismo (descripción, cita, etc.), o no desea que su conjunto de datos se incluya en esta biblioteca, comuníquese con nosotros a través de un problema de GitHub. ¡Gracias por tu contribución a la comunidad ML!
Si está interesado en obtener más información sobre las prácticas responsables de IA, incluida la equidad, consulte Prácticas responsables de IA de Google.
tensorflow/datasets
tiene licencia Apache 2.0. Ver el archivo LICENSE
.