datasets下載 - datasets原始碼下載

datasets

其他源碼

v4.9.7

下載

TensorFlow 資料集

TensorFlow Datasets 提供了許多公共資料集作為tf.data.Datasets 。

文件

要安裝和使用 TFDS，我們強烈建議從我們的入門指南開始。在 Colab 筆記本中以互動方式嘗試。

我們的文件包含：

教程和指南
所有可用資料集的列表
API 參考

 # !pip install tensorflow-datasets
import tensorflow_datasets as tfds
import tensorflow as tf

# Construct a tf.data.Dataset
ds = tfds . load ( 'mnist' , split = 'train' , as_supervised = True , shuffle_files = True )

# Build your input pipeline
ds = ds . shuffle ( 1000 ). batch ( 128 ). prefetch ( 10 ). take ( 5 )
for image , label in ds :
  pass

TFDS核心價值觀

TFDS 的建構考慮了以下原則：

簡單性：標準用例應該開箱即用
效能：TFDS遵循最佳實踐，可以實現最先進的速度
確定性/再現性：所有使用者以相同的順序獲得相同的範例
可自訂性：高級用戶可以進行細粒度的控制

如果這些用例不滿意，請向我們發送回饋。

想要特定的資料集嗎？

按照我們的指南添加資料集非常簡單。

透過開啟資料集請求 GitHub 問題來請求資料集。

並透過對問題添加“豎起大拇指”反應來對當前的一組請求進行投票。

引文

在論文中使用tensorflow-datasets集時，除了特定於所用資料集的任何引用外，請包含以下引用。

 @misc { TFDS ,
  title = { {TensorFlow Datasets}, A collection of ready-to-use datasets } ,
  howpublished = { url{https://www.tensorflow.org/datasets} } ,
}