TensorFlow Datasets fournit de nombreux ensembles de données publics sous le nom de tf.data.Datasets
.
Pour installer et utiliser TFDS, nous vous encourageons fortement à commencer par notre guide de démarrage . Essayez-le de manière interactive dans un notebook Colab.
Notre documentation contient :
# !pip install tensorflow-datasets
import tensorflow_datasets as tfds
import tensorflow as tf
# Construct a tf.data.Dataset
ds = tfds . load ( 'mnist' , split = 'train' , as_supervised = True , shuffle_files = True )
# Build your input pipeline
ds = ds . shuffle ( 1000 ). batch ( 128 ). prefetch ( 10 ). take ( 5 )
for image , label in ds :
pass
TFDS a été construit en gardant ces principes à l'esprit :
Si ces cas d'utilisation ne sont pas satisfaits, veuillez nous envoyer vos commentaires.
L'ajout d'un ensemble de données est très simple en suivant notre guide.
Demandez un ensemble de données en ouvrant un problème GitHub de demande d’ensemble de données.
Et votez sur l'ensemble actuel de demandes en ajoutant une réaction positive au problème.
Veuillez inclure la citation suivante lorsque vous utilisez tensorflow-datasets
pour un article, en plus de toute citation spécifique aux ensembles de données utilisés.
@misc { TFDS ,
title = { {TensorFlow Datasets}, A collection of ready-to-use datasets } ,
howpublished = { url{https://www.tensorflow.org/datasets} } ,
}
Il s'agit d'une bibliothèque d'utilitaires qui télécharge et prépare des ensembles de données publics. Nous n'hébergeons ni ne distribuons ces ensembles de données, ne garantissons pas leur qualité ou leur équité, ni ne prétendons que vous disposez de la licence pour utiliser l'ensemble de données. Il est de votre responsabilité de déterminer si vous avez l'autorisation d'utiliser l'ensemble de données sous la licence de l'ensemble de données.
Si vous êtes propriétaire d'un ensemble de données et souhaitez en mettre à jour une partie (description, citation, etc.), ou si vous ne souhaitez pas que votre ensemble de données soit inclus dans cette bibliothèque, veuillez nous contacter via un problème GitHub. Merci pour votre contribution à la communauté ML !
Si vous souhaitez en savoir plus sur les pratiques responsables de l'IA, y compris l'équité, veuillez consulter les pratiques responsables de l'IA de Google AI.
tensorflow/datasets
est sous licence Apache 2.0. Voir le fichier LICENSE
.