深度学习实验——Pythorch实现mnist手写数字识别

import torch
import torch.nn as nn
import matplotlib.pyplot as plt
import torchvision
from torch.onnx.symbolic_opset11 import relu6
from torchvision import transforms

device =torch.device("cuda" if torch.cuda.is_available() else "cpu")
device

②导入并测试数据集

导入数据集，注意无法联网下载的时候就从本地加载，但需要先下载数据集放在文件目录下

dataPath = "G:\project_P1\data"
#获取训练数据
train_ds = torchvision.datasets.MNIST(
    root=dataPath,
    #只需要数据集中的训练集
    train=True,
    transform=transforms.ToTensor(),
    #因为本地数据集有MNIST，故不需要下载
    download=False
)
#获取测试数据
test_ds = torchvision.datasets.MNIST(
    root=dataPath,
    #不需要训练数据
    train=False,
    transform=transforms.ToTensor(),
    download=False
)

测试数据集

batch_size = 32
#用数据加载器加载数据
train_dl=torch.utils.data.DataLoader(
    train_ds,
    batch_size=batch_size,
    shuffle=True
)
test_dl=torch.utils.data.DataLoader(
    test_ds,
    batch_size=batch_size
)

imgs,labels=next(iter(train_dl))

import numpy as np
#指定图片的大小
plt.figure(figsize=(20,5))
for i,imgs in enumerate(imgs[:20]):
    npimg=np.squeeze(imgs.numpy())
    plt.subplot(2,10,i+1)
    plt.imshow(npimg,cmap=plt.cm.binary)
    plt.axis('off')
    plt.show()

注意如果想看img的形状大小可以用imgs.shape来查看

部分结果图（这里设置的是2行10列，但不知道结果为啥只有1列了，我还没搞懂）

2、构建网络

①了解网络架构

一般的网络都会包括特征提取网络和分类网络构成，卷积层和池化层主要用于图像特征的提取，分类网络则用于图片的分类

该实验当中的网络经过两次卷积-池化后，再经过flatten层和两次全连接

②实现模型

import torch.nn.functional as F

num_classes=10

class Model(nn.Module):
    def __init__(self):
        super().__init__()
        #特征提取网络
        self.conv1=nn.Conv2d(1,32,kernel_size=3)
        self.pool1=nn.MaxPool2d(2)
        self.conv2=nn.Conv2d(32,64,kernel_size=3)
        self.pool2=nn.MaxPool2d(2)
        #分类网络
        self.fc1=nn.Linear(1600,64)
        self.fc2=nn.Linear(64,num_classes)

    #前向传播
    def forward(self, x):
        x=self.pool1(F.relu(self.conv1(x)))
        x=self.pool2(F.relu(self.conv2(x)))

        x=torch.flatten(x,start_dim=1)

        x=F.relu(self.fc1(x))

        x=self.fc2(x)

        return x

③打印模型

from torchinfo import summary
model=Model().to(device)

summary(model)

可以看到该实验的模型框架详细信息

3、训练模型

（训练三步走：梯度清零、反向传播、更新权重）

设置超参数并编写训练函数，这里的优化器选择的是SGD

loss_fn=nn.CrossEntropyLoss()
learn_rate=1e-2
opt=torch.optim.SGD(model.parameters(),lr=learn_rate)

def train(dataloader,model,loss_fn,optimizer):
    size=len(dataloader.dataset)
    num_batches=len(dataloader)

    train_loss,train_acc=0,0

    for X,y in dataloader:
        X,y=X.to(device),y.to(device)

        #计算预测误差
        pred=model(X)
        loss=loss_fn(pred,y)
        #反向传播必备的三步走
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        #记录acc与loss
        train_acc+=(pred.argmax(1)==y).type(torch.float).sum().item()
        train_loss+=loss.item()

    train_acc/=size
    train_loss/=num_batches

    return train_acc,train_loss

测试函数同理，但是不需要对网络权重进行更新，因此不传入优化器，其余原理一致

模型训练

#设置训练的轮次为5
epochs=5
train_loss=[]
train_acc=[]
test_loss=[]
test_acc=[]

for epoch in range(epochs):
    model.train()
    epoch_train_acc,epoch_train_loss=train(train_dl,model,loss_fn,opt)

    model.eval()
    epoch_test_acc,epoch_test_loss=test(test_dl,model,loss_fn)
#将数据依次添加到对应的列表中
    train_acc.append(epoch_train_acc)
    train_loss.append(epoch_train_loss)
    test_acc.append(epoch_test_acc)
    test_loss.append(epoch_test_loss)

    template=('Epoch:{:2d},Train_acc:{:.1f}%,Train_loss:{:.3f},Test_acc:{:.1f}%,Test_loss:{:.3f}')
    print(template.format(epoch+1,epoch_train_acc*100,epoch_train_loss,epoch_test_acc*100,epoch_test_loss))
print('Done')

得到的训练过程如下

4、结果可视化

import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings("ignore")
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
plt.rcParams['figure.dpi']=100

from datetime import datetime
current_time=datetime.now()

epochs_range=range(epochs)

plt.figure(figsize=(12,3))
plt.subplot(1,2,1)

plt.plot(epochs_range,train_acc,label='Training Accuracy')
plt.plot(epochs_range,test_acc,label='Test Accuracy')
plt.legend(loc='lower right')
plt.title('Training and Validation Accuracy')
plt.xlabel(current_time)

plt.subplot(1,2,2)
plt.plot(epochs_range,train_loss,label='Training Loss')
plt.plot(epochs_range,test_loss,label='Test Loss')
plt.legend(loc='upper right')
plt.title('Training and Validation Loss')
plt.show()

结果在前文实验中可以看到结果