TensorFlow Datasets は、多くのパブリック データセットをtf.data.Datasets
として提供します。
TFDS をインストールして使用するには、入門ガイドから始めることを強くお勧めします。 Colab ノートブックでインタラクティブに試してみてください。
私たちのドキュメントには次のものが含まれています。
# !pip install tensorflow-datasets
import tensorflow_datasets as tfds
import tensorflow as tf
# Construct a tf.data.Dataset
ds = tfds . load ( 'mnist' , split = 'train' , as_supervised = True , shuffle_files = True )
# Build your input pipeline
ds = ds . shuffle ( 1000 ). batch ( 128 ). prefetch ( 10 ). take ( 5 )
for image , label in ds :
pass
TFDS は、次の原則を念頭に置いて構築されています。
これらのユースケースが満足できない場合は、フィードバックをお送りください。
データセットの追加は、ガイドに従えば非常に簡単です。
データセット リクエスト GitHub 発行を開いてデータセットをリクエストします。
そして、問題に対する賛成の反応を追加して、現在の一連のリクエストに投票します。
論文にtensorflow-datasets
を使用する場合は、使用したデータセットに固有の引用に加えて、次の引用を含めてください。
@misc { TFDS ,
title = { {TensorFlow Datasets}, A collection of ready-to-use datasets } ,
howpublished = { url{https://www.tensorflow.org/datasets} } ,
}
これは、公開データセットをダウンロードして準備するユーティリティ ライブラリです。当社は、これらのデータセットをホストまたは配布したり、その品質や公平性を保証したり、ユーザーがデータセットを使用するライセンスを持っていると主張したりすることはありません。データセットのライセンスに基づいてデータセットを使用する許可があるかどうかを判断するのはあなたの責任です。
データセットの所有者で、その一部 (説明、引用など) を更新したい場合、またはデータセットをこのライブラリに含めたくない場合は、GitHub の問題を通じてご連絡ください。 ML コミュニティへの貢献に感謝します。
公平性を含む責任ある AI の実践について詳しく知りたい場合は、Google AI の責任ある AI の実践をご覧ください。
tensorflow/datasets
Apache 2.0 ライセンスを取得しています。 LICENSE
ファイルを参照してください。