datasets
v4.9.7
TensorFlow Datasets 提供了許多公共資料集作為tf.data.Datasets
。
要安裝和使用 TFDS,我們強烈建議從我們的入門指南開始。在 Colab 筆記本中以互動方式嘗試。
我們的文件包含:
# !pip install tensorflow-datasets
import tensorflow_datasets as tfds
import tensorflow as tf
# Construct a tf.data.Dataset
ds = tfds . load ( 'mnist' , split = 'train' , as_supervised = True , shuffle_files = True )
# Build your input pipeline
ds = ds . shuffle ( 1000 ). batch ( 128 ). prefetch ( 10 ). take ( 5 )
for image , label in ds :
pass
TFDS 的建構考慮了以下原則:
如果這些用例不滿意,請向我們發送回饋。
按照我們的指南添加資料集非常簡單。
透過開啟資料集請求 GitHub 問題來請求資料集。
並透過對問題添加“豎起大拇指”反應來對當前的一組請求進行投票。
在論文中使用tensorflow-datasets
集時,除了特定於所用資料集的任何引用外,請包含以下引用。
@misc { TFDS ,
title = { {TensorFlow Datasets}, A collection of ready-to-use datasets } ,
howpublished = { url{https://www.tensorflow.org/datasets} } ,
}
這是一個下載和準備公共資料集的實用程式庫。我們不託管或散佈這些資料集,不保證其品質或公平性,也不聲稱您擁有使用該資料集的許可。您有責任確定您是否有權根據資料集的許可使用該資料集。
如果您是資料集擁有者並希望更新其任何部分(描述、引用等),或不希望您的資料集包含在此資料庫中,請透過 GitHub 問題與我們聯絡。感謝您對 ML 社群的貢獻!
如果您有興趣了解有關負責任的人工智慧實踐(包括公平性)的更多信息,請參閱 Google AI 的負責任的人工智慧實踐。
tensorflow/datasets
已獲得 Apache 2.0 許可。請參閱LICENSE
文件。