TensorFlow Datasets предоставляет множество общедоступных наборов данных как tf.data.Datasets
.
Чтобы установить и использовать TFDS, мы настоятельно рекомендуем начать с нашего руководства по началу работы . Попробуйте сделать это в интерактивном режиме в блокноте Colab.
Наша документация содержит:
# !pip install tensorflow-datasets
import tensorflow_datasets as tfds
import tensorflow as tf
# Construct a tf.data.Dataset
ds = tfds . load ( 'mnist' , split = 'train' , as_supervised = True , shuffle_files = True )
# Build your input pipeline
ds = ds . shuffle ( 1000 ). batch ( 128 ). prefetch ( 10 ). take ( 5 )
for image , label in ds :
pass
TFDS был создан с учетом следующих принципов:
Если эти варианты использования вас не устраивают, пришлите нам отзыв.
Добавить набор данных очень просто, следуя нашему руководству.
Запросите набор данных, открыв задачу запроса набора данных на GitHub.
И проголосуйте за текущий набор запросов, поставив лайк на проблему.
Пожалуйста, включите следующую цитату при использовании tensorflow-datasets
для статьи в дополнение к любой цитате, относящейся к используемым наборам данных.
@misc { TFDS ,
title = { {TensorFlow Datasets}, A collection of ready-to-use datasets } ,
howpublished = { url{https://www.tensorflow.org/datasets} } ,
}
Это служебная библиотека, которая загружает и подготавливает общедоступные наборы данных. Мы не размещаем и не распространяем эти наборы данных, не ручаемся за их качество или справедливость и не заявляем, что у вас есть лицензия на использование набора данных. Вы несете ответственность за определение того, есть ли у вас разрешение на использование набора данных в соответствии с лицензией на набор данных.
Если вы являетесь владельцем набора данных и хотите обновить какую-либо его часть (описание, цитату и т. д.) или не хотите, чтобы ваш набор данных был включен в эту библиотеку, свяжитесь с нами через вопрос на GitHub. Спасибо за ваш вклад в сообщество ML!
Если вы хотите узнать больше об ответственных методах работы с искусственным интеллектом, в том числе о справедливости, ознакомьтесь с разделом «Ответственные методы работы с искусственным интеллектом» Google AI.
tensorflow/datasets
имеет лицензию Apache 2.0. См. файл LICENSE
.