📜  PyTorch-数据集

📅  最后修改于: 2020-12-10 05:24:14             🧑  作者: Mango


在本章中,我们将重点关注torchvision.datasets及其各种类型。 PyTorch包括以下数据集加载器-

  • MNIST
  • COCO(字幕和检测)

数据集包含以下给出的两种功能中的大多数-

  • 变换-接收图像并返回标准内容的修改版本的函数。这些可以与转换一起组成。

  • Target_transform-一个获取目标并对其进行转换的函数。例如,接受标题字符串并返回世界索引的张量。

MNIST

以下是MNIST数据集的示例代码-

dset.MNIST(root, train = TRUE, transform = NONE, 
target_transform = None, download = FALSE)

参数如下-

  • root-存在已处理数据的数据集的根目录。

  • 训练-正确=训练集,错误=测试集

  • download -True =从互联网下载数据集并将其放在根中。

可可

这需要安装COCO API。以下示例用于演示使用PyTorch的数据集的COCO实现-

import torchvision.dataset as dset
import torchvision.transforms as transforms
cap = dset.CocoCaptions(root = ‘ dir where images are’, 
annFile = ’json annotation file’,
transform = transforms.ToTensor())
print(‘Number of samples: ‘, len(cap))
print(target)

实现的输出如下-

Number of samples: 82783
Image Size: (3L, 427L, 640L)