.. _sec_kaggle_cifar10: 实战 Kaggle 比赛：图像分类 (CIFAR-10) ===================================== 之前几节中，我们一直在使用深度学习框架的高级API直接获取张量格式的图像数据集。但是在实践中，图像数据集通常以图像文件的形式出现。本节将从原始图像文件开始，然后逐步组织、读取并将它们转换为张量格式。我们在 :numref:`sec_image_augmentation`\ 中对CIFAR-10数据集做了一个实验。CIFAR-10是计算机视觉领域中的一个重要的数据集。本节将运用我们在前几节中学到的知识来参加CIFAR-10图像分类问题的Kaggle竞赛，比赛的网址是https://www.kaggle.com/c/cifar-10。 :numref:`fig_kaggle_cifar10`\ 显示了竞赛网站页面上的信息。为了能提交结果，首先需要注册一个Kaggle账户。 .. _fig_kaggle_cifar10: .. figure:: ../img/kaggle-cifar10.png :width: 600px CIFAR-10 图像分类竞赛页面上的信息。竞赛用的数据集可通过点击“Data”选项卡获取。首先，导入竞赛所需的包和模块。 .. raw:: html

.. raw:: html

.. raw:: latex \diilbookstyleinputcell .. code:: python import collections import math import os import shutil import pandas as pd from mxnet import gluon, init, npx from mxnet.gluon import nn from d2l import mxnet as d2l npx.set_np() .. raw:: html

.. raw:: html

.. raw:: latex \diilbookstyleinputcell .. code:: python import collections import math import os import shutil import pandas as pd import torch import torchvision from torch import nn from d2l import torch as d2l .. raw:: html

.. raw:: html

.. raw:: latex \diilbookstyleinputcell .. code:: python import warnings from d2l import paddle as d2l warnings.filterwarnings("ignore") import collections import math import os import shutil import paddle import paddle.vision as paddlevision import pandas as pd from paddle import nn .. raw:: html

.. raw:: html

获取并组织数据集 ---------------- 比赛数据集分为训练集和测试集，其中训练集包含50000张、测试集包含300000张图像。在测试集中，10000张图像将被用于评估，而剩下的290000张图像将不会被进行评估，包含它们只是为了防止手动标记测试集并提交标记结果。两个数据集中的图像都是png格式，高度和宽度均为32像素并有三个颜色通道（RGB）。这些图片共涵盖10个类别：飞机、汽车、鸟类、猫、鹿、狗、青蛙、马、船和卡车。 :numref:`fig_kaggle_cifar10`\ 的左上角显示了数据集中飞机、汽车和鸟类的一些图像。下载数据集 ~~~~~~~~~~ 登录Kaggle后，我们可以点击 :numref:`fig_kaggle_cifar10`\ 中显示的CIFAR-10图像分类竞赛网页上的“Data”选项卡，然后单击“Download All”按钮下载数据集。在\ ``../data``\ 中解压下载的文件并在其中解压缩\ ``train.7z``\ 和\ ``test.7z``\ 后，在以下路径中可以找到整个数据集： - ``../data/cifar-10/train/[1-50000].png`` - ``../data/cifar-10/test/[1-300000].png`` - ``../data/cifar-10/trainLabels.csv`` - ``../data/cifar-10/sampleSubmission.csv`` ``train``\ 和\ ``test``\ 文件夹分别包含训练和测试图像，\ ``trainLabels.csv``\ 含有训练图像的标签， ``sample_submission.csv``\ 是提交文件的范例。为了便于入门，我们提供包含前1000个训练图像和5个随机测试图像的数据集的小规模样本。要使用Kaggle竞赛的完整数据集，需要将以下\ ``demo``\ 变量设置为\ ``False``\ 。 .. raw:: html