📜  如何在 python 中加载 mnist 数据集(1)

📅  最后修改于: 2023-12-03 15:24:19.790000             🧑  作者: Mango

如何在 Python 中加载 MNIST 数据集

简介

MNIST 数据集是一个手写数字识别数据集,其中包含 60000 个训练样本和 10000 个测试样本。该数据集经常被用于测试机器学习算法的性能。

在本教程中,我们将介绍如何在 Python 中加载 MNIST 数据集。

步骤
1. 安装必要的库

在加载 MNIST 数据集之前,我们需要先安装必要的库。具体来说,我们需要安装 numpy 和 tensorflow。

pip install numpy
pip install tensorflow
2. 导入必要的库

在安装必要的库后,我们需要在 Python 代码中导入它们。具体来说,我们需要导入以下库:

import numpy as np
import tensorflow as tf
from tensorflow.keras.datasets import mnist
3. 加载 MNIST 数据集

加载 MNIST 数据集很简单。我们只需要使用以下代码:

(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

该代码将训练图像和标签存储在 train_images 和 train_labels 变量中,将测试图像和标签存储在 test_images 和 test_labels 变量中。

4. 数据集的结构

下面是数据集的详细结构:

  • train_images:形状为 (60000, 28, 28) 的 NumPy 数组,表示 60000 个训练图像,每个图像的大小为 28×28 像素。
  • train_labels:形状为 (60000,) 的 NumPy 数组,表示 60000 个训练图像的数字标签。
  • test_images:形状为 (10000, 28, 28) 的 NumPy 数组,表示 10000 个测试图像,每个图像的大小为 28×28 像素。
  • test_labels:形状为 (10000,) 的 NumPy 数组,表示 10000 个测试图像的数字标签。
5. 示例代码

下面是完整的示例代码:

import numpy as np
import tensorflow as tf
from tensorflow.keras.datasets import mnist

(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

print("训练图像的形状:", train_images.shape)
print("训练标签的形状:", train_labels.shape)
print("测试图像的形状:", test_images.shape)
print("测试标签的形状:", test_labels.shape)

该代码将打印出数据集中训练和测试图像/标签的形状。

总结

本文介绍了如何在 Python 中加载 MNIST 数据集。首先,我们安装了必要的库。然后,我们导入了这些库,并加载了 MNIST 数据集。最后,我们介绍了数据集的结构,并提供示例代码。