TensorFlow Datasets stellt viele öffentliche Datensätze als tf.data.Datasets
bereit.
Um TFDS zu installieren und zu verwenden, empfehlen wir Ihnen dringend, mit unserem Leitfaden „Erste Schritte“ zu beginnen. Probieren Sie es interaktiv in einem Colab-Notizbuch aus.
Unsere Dokumentation enthält:
# !pip install tensorflow-datasets
import tensorflow_datasets as tfds
import tensorflow as tf
# Construct a tf.data.Dataset
ds = tfds . load ( 'mnist' , split = 'train' , as_supervised = True , shuffle_files = True )
# Build your input pipeline
ds = ds . shuffle ( 1000 ). batch ( 128 ). prefetch ( 10 ). take ( 5 )
for image , label in ds :
pass
TFDS wurde unter Berücksichtigung dieser Prinzipien entwickelt:
Wenn diese Anwendungsfälle nicht zufriedenstellend sind, senden Sie uns bitte Feedback.
Das Hinzufügen eines Datensatzes ist ganz einfach, wenn Sie unserer Anleitung folgen.
Fordern Sie einen Datensatz an, indem Sie ein Dataset-Request-GitHub-Problem öffnen.
Und stimmen Sie über die aktuellen Anfragen ab, indem Sie eine „Daumen hoch“-Reaktion zum Thema hinzufügen.
Wenn Sie tensorflow-datasets
für eine Arbeit verwenden, fügen Sie bitte zusätzlich zu allen Zitaten, die sich auf die verwendeten Datensätze beziehen, das folgende Zitat an.
@misc { TFDS ,
title = { {TensorFlow Datasets}, A collection of ready-to-use datasets } ,
howpublished = { url{https://www.tensorflow.org/datasets} } ,
}
Dies ist eine Dienstprogrammbibliothek, die öffentliche Datensätze herunterlädt und vorbereitet. Wir hosten oder verteilen diese Datensätze nicht, garantieren nicht für ihre Qualität oder Fairness und behaupten nicht, dass Sie über eine Lizenz zur Nutzung des Datensatzes verfügen. Es liegt in Ihrer Verantwortung, festzustellen, ob Sie die Berechtigung zur Nutzung des Datensatzes im Rahmen der Lizenz des Datensatzes haben.
Wenn Sie Eigentümer eines Datensatzes sind und einen Teil davon aktualisieren möchten (Beschreibung, Zitat usw.) oder nicht möchten, dass Ihr Datensatz in diese Bibliothek aufgenommen wird, wenden Sie sich bitte über ein GitHub-Problem an uns. Vielen Dank für Ihren Beitrag zur ML-Community!
Wenn Sie mehr über verantwortungsvolle KI-Praktiken, einschließlich Fairness, erfahren möchten , lesen Sie bitte die verantwortungsvollen KI-Praktiken von Google AI.
tensorflow/datasets
ist für Apache 2.0 lizenziert. Siehe die LICENSE
Datei.