MNIST数据集简介

 MNIST数据集来自美国国家标准与技术研究所, National Institute of Standards and Technology (NIST)。训练集(training set)由来自250个不同人手写的数字构成,其中50%是高中学生,50%来自人口普查局(the Census Bureau)的工作人员。测试集(test set)也是同样比例的手写数字数据,但保证了测试集和训练集的作者集不相交。

  MNIST数据集一共有7万张图片,其中6万张是训练集,1万张是测试集。每张图片是28 × 28 28\times 2828×28的0 − 9 0-90−9的手写数字图片组成。每个图片是黑底白字的形式,黑底用0表示,白字用0-1之间的浮点数表示,越接近1,颜色越白。

MNIST 数据集包含了四个部分:

  1. 训练集图片: train-images-idx3-ubyte.gz (含60000个样本)
  2. 训练集标签: train-labels-idx1-ubyte.gz (含60000个标签)
  3. 测试集图片: t10k-images-idx3-ubyte.gz(含10000个样本)
  4. 测试集标签: t10k-labels-idx1-ubyte.gz (含10000个标签)

下载地址

MNIST数据集下载仓库- GitCode