📜  PyTorch-加载数据

📅  最后修改于: 2020-12-10 05:22:47             🧑  作者: Mango


PyTorch包含一个名为torchvision的软件包,该软件包用于加载和准备数据集。它包括两个基本功能,即Dataset和DataLoader,它们有助于数据集的转换和加载。

数据集

数据集用于从给定的数据集中读取和转换数据点。下面提到要实现的基本语法-

trainset = torchvision.datasets.CIFAR10(root = './data', train = True,
   download = True, transform = transform)

DataLoader用于混洗和批处理数据。它可用于与多处理工作者并行加载数据。

trainloader = torch.utils.data.DataLoader(trainset, batch_size = 4,
   shuffle = True, num_workers = 2)

示例:加载CSV文件

我们使用Python软件包Panda加载csv文件。原始文件具有以下格式:(图像名称,68个界标-每个界标都有ax,y坐标)。

landmarks_frame = pd.read_csv('faces/face_landmarks.csv')

n = 65
img_name = landmarks_frame.iloc[n, 0]
landmarks = landmarks_frame.iloc[n, 1:].as_matrix()
landmarks = landmarks.astype('float').reshape(-1, 2)