O TensorFlow Datasets fornece muitos conjuntos de dados públicos como tf.data.Datasets
.
Para instalar e usar o TFDS, recomendamos fortemente que você comece com nosso guia de primeiros passos . Experimente interativamente em um notebook Colab.
Nossa documentação contém:
# !pip install tensorflow-datasets
import tensorflow_datasets as tfds
import tensorflow as tf
# Construct a tf.data.Dataset
ds = tfds . load ( 'mnist' , split = 'train' , as_supervised = True , shuffle_files = True )
# Build your input pipeline
ds = ds . shuffle ( 1000 ). batch ( 128 ). prefetch ( 10 ). take ( 5 )
for image , label in ds :
pass
O TFDS foi construído com estes princípios em mente:
Se esses casos de uso não forem satisfeitos, envie-nos comentários.
Adicionar um conjunto de dados é muito simples seguindo nosso guia.
Solicite um conjunto de dados abrindo um problema do GitHub de solicitação de conjunto de dados.
E vote no conjunto atual de solicitações adicionando uma reação positiva ao problema.
Inclua a seguinte citação ao usar tensorflow-datasets
para um artigo, além de qualquer citação específica para os conjuntos de dados usados.
@misc { TFDS ,
title = { {TensorFlow Datasets}, A collection of ready-to-use datasets } ,
howpublished = { url{https://www.tensorflow.org/datasets} } ,
}
Esta é uma biblioteca utilitária que baixa e prepara conjuntos de dados públicos. Não hospedamos ou distribuímos esses conjuntos de dados, não garantimos sua qualidade ou imparcialidade, nem afirmamos que você tem licença para usar o conjunto de dados. É sua responsabilidade determinar se você tem permissão para usar o conjunto de dados sob a licença do conjunto de dados.
Se você é proprietário de um conjunto de dados e deseja atualizar qualquer parte dele (descrição, citação, etc.), ou não deseja que seu conjunto de dados seja incluído nesta biblioteca, entre em contato por meio de um problema no GitHub. Obrigado pela sua contribuição para a comunidade ML!
Se você estiver interessado em aprender mais sobre práticas responsáveis de IA, incluindo justiça, consulte Práticas responsáveis de IA do Google AI.
tensorflow/datasets
é licenciado pelo Apache 2.0. Veja o arquivo LICENSE
.