datasets
v4.9.7
TensorFlow Datasets 提供了许多公共数据集作为tf.data.Datasets
。
要安装和使用 TFDS,我们强烈建议从我们的入门指南开始。在 Colab 笔记本中以交互方式尝试。
我们的文档包含:
# !pip install tensorflow-datasets
import tensorflow_datasets as tfds
import tensorflow as tf
# Construct a tf.data.Dataset
ds = tfds . load ( 'mnist' , split = 'train' , as_supervised = True , shuffle_files = True )
# Build your input pipeline
ds = ds . shuffle ( 1000 ). batch ( 128 ). prefetch ( 10 ). take ( 5 )
for image , label in ds :
pass
TFDS 的构建考虑了以下原则:
如果这些用例不满意,请向我们发送反馈。
按照我们的指南添加数据集非常简单。
通过打开数据集请求 GitHub 问题来请求数据集。
并通过对问题添加“竖起大拇指”反应来对当前的一组请求进行投票。
在论文中使用tensorflow-datasets
集时,除了特定于所使用数据集的任何引文之外,请包含以下引文。
@misc { TFDS ,
title = { {TensorFlow Datasets}, A collection of ready-to-use datasets } ,
howpublished = { url{https://www.tensorflow.org/datasets} } ,
}
这是一个下载和准备公共数据集的实用程序库。我们不托管或分发这些数据集,不保证其质量或公平性,也不声称您拥有使用该数据集的许可。您有责任确定您是否有权根据数据集的许可使用该数据集。
如果您是数据集所有者并希望更新其任何部分(描述、引用等),或者不希望您的数据集包含在此库中,请通过 GitHub 问题与我们联系。感谢您对 ML 社区的贡献!
如果您有兴趣了解有关负责任的人工智能实践(包括公平性)的更多信息,请参阅 Google AI 的负责任的人工智能实践。
tensorflow/datasets
已获得 Apache 2.0 许可。请参阅LICENSE
文件。