深度学习（十二）——神经网络：搭建小实战和Sequential的使用

2023-08-24 07:22:24 来源 : 博客园

一、torch.nn.Sequential代码栗子

官方文档：Sequential — PyTorch 2.0 documentation

# Using Sequential to create a small model. When `model` is run,# input will first be passed to `Conv2d(1,20,5)`. The output of# `Conv2d(1,20,5)` will be used as the input to the first# `ReLU`; the output of the first `ReLU` will become the input# for `Conv2d(20,64,5)`. Finally, the output of# `Conv2d(20,64,5)` will be used as input to the second `ReLU`model = nn.Sequential(          nn.Conv2d(1,20,5),          nn.ReLU(),          nn.Conv2d(20,64,5),          nn.ReLU()        )

在第一个变量名model中，依次执行nn.Convd2d(1,20,5)、nn.ReLU()、nn.Conv2d(20,64,5)、nn.ReLU()四个函数。这样写起来的好处是使代码更简洁。

由此可见，函数\(Sequential\)的主要作用为依次执行括号内的函数

(资料图)

二、神经网络搭建实战

采用\(CIFAR10\)中的数据，并对其进行简单的分类。以下图为例：

输入：3通道，32×32 → 经过一个5×5的卷积 → 变成32通道，32×32的图像 → 经过2×2的最大池化 → 变成32通道，16×16的图像.... → ... → 变成64通道，4×4的图像 → 把图像展平（Flatten）→ 变成64通道，1×1024 （64×4×4）的图像 → 通过两个线性层，最后\(out\_feature=10\) → 得到最终图像

以上，就是CIFAR10模型的结构。本节的代码也基于CIFAR10 model的结构构建。

1. 神经网络中的参数设计及计算（1）卷积层的参数设计（以第一个卷积层conv1为例）

输入图像为3通道，输出图像为32通道，故：\(in\_channels=3\)；\(out\_channels=32\)

卷积核尺寸为\(5×5\)

图像经过卷积层conv1前后的尺寸均为32×32，根据公式：

\[H_{out}=⌊\frac{H_{in}+2×padding[0]−dilation[0]×(kernel\_size[0]−1)−1}{stride[0]}+1⌋\]\[W_{out}=⌊\frac{W_{in}+2×padding[1]−dilation[1]×(kernel\_size[1]−1)−1}{stride[1]}+1⌋\]

可得：

\[H_{out}=⌊\frac{32+2×padding[0]−1×(5−1)−1}{stride[0]}+1⌋=32\]\[W_{out}=⌊\frac{32+2×padding[1]−1×(5−1)−1}{stride[1]}+1⌋=32\]

即：

\[\frac{27+2×padding[0]}{stride[0]}=31\]\[\frac{27+2×padding[1]}{stride[1]}=31\]

若\(stride[0]\)或\(stride[1]\)设置为2，那么上面的\(padding\)也会随之扩展为一个很大的数，这很不合理。所以这里设置：\(stride[0]=stride[1]=1\)，由此可得：\(padding[0]=padding[1]=2\)

其余卷积层的参数设计及计算方法均同上。

（2）最大池化操作的参数设计（以第一个池化操作maxpool1为例）由图可得，\(kennel\_size=2\)

其余最大池化参数设计方法均同上。

（3）线性层的参数设计

通过三次卷积和最大池化操作后，图像尺寸变为64通道4×4。之后使用\(Flatten()\)函数将图像展成一列，此时图像尺寸变为：1×(64×4×4)，即\(1×1024\)

因此，之后通过第一个线性层，\(in\_features=1024\)，\(out\_features=64\)

通过第二个线性层，\(in\_features=64\)，\(out\_features=10\)

2. 构建神经网络实战

import torchfrom torch import nnfrom torch.nn import Conv2d, MaxPool2d, Flatten, Linearclass Demo(nn.Module):    def __init__(self):        super(Demo,self).__init__()        # 搭建第一个卷积层:in_channels=3，out_channels=32，卷积核尺寸为5×5,通过计算得出：padding=2;stride默认情况下为1，不用设置        self.conv1=Conv2d(3,32,5,padding=2)        # 第一个最大池化操作,kennel_size=2        self.maxpool1=MaxPool2d(2)        # 第二个卷积层及最大池化操作        self.conv2=Conv2d(32,32,5,padding=2)        self.maxpool2=MaxPool2d(2)        # 第三个卷积层及最大池化操作        self.conv3=Conv2d(32,64,5,padding=2)        self.maxpool3=MaxPool2d(2)        # 展开图像        self.flatten=Flatten()        # 线性层参数设计        self.linear1=Linear(1024,64)        self.linear2=Linear(64,10)        # 如果是预测概率，那么取输出结果的最大值（它代表了最大概率）    def forward(self,x):        x = self.conv1(x)        x = self.maxpool1(x)        x = self.conv2(x)        x = self.maxpool2(x)        x = self.conv3(x)        x = self.maxpool3(x)        x = self.flatten(x)        x = self.linear1(x)   #如果线性层的1024和64不会计算，可以在self.flatten之后print(x.shape)查看尺寸，以此设定linear的参数        x = self.linear2(x)        return xdemo=Demo()print(demo)"""[Run]Demo(  (conv1): Conv2d(3, 32, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2))  (maxpool1): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)  (conv2): Conv2d(32, 32, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2))  (maxpool2): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)  (conv3): Conv2d(32, 64, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2))  (maxpool3): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)  (flatten): Flatten(start_dim=1, end_dim=-1)  (linear1): Linear(in_features=1024, out_features=64, bias=True)  (linear2): Linear(in_features=64, out_features=10, bias=True))可以看出，网络还是有模有样的"""#构建输入，测试神经网络input=torch.ones((64,3,32,32))  #构建图像，batch_size=64,3通道,32×32output=demo(input)print(output.shape)  #[Run] torch.Size([64, 10])

这里的\(forward\)函数写的有点烦，这时候\(Sequential\)函数的优越就体现出来了（墨镜黄豆）。下面是\(class\) \(Demo\)优化后的代码：

class Demo(nn.Module):    def __init__(self):        super(Demo,self).__init__()        self.model1=Sequential(            Conv2d(3,32,5,padding=2),            MaxPool2d(2),            Conv2d(32, 32, 5, padding=2),            MaxPool2d(2),            Conv2d(32, 64, 5, padding=2),            MaxPool2d(2),            Flatten(),            Linear(1024, 64),            Linear(64, 10)        )    def forward(self,x):        x=self.model1(x)        return x

极简主义者看过后表示很满意ε٩(๑> ₃ <)۶з

3. 可视化神经网络

from torch.utils.tensorboard import SummaryWriterwriter=SummaryWriter("logs_seq")writer.add_graph(demo,input)writer.close()

这样就可以清晰地看到神经网络的相关参数啦

关键词：

深度学习（十二）——神经网络：搭建小实战和Sequential的使用
2023-08-24
华为Mate 60系列或将首发卫星电话
2023-08-24
2连板中国科传(601858.SH)：数据库和知识服务平台仍处在培育发展期相关收入占整体收入比例较小
2023-08-24
北新路桥：联合体中标巫山县项目EPC
2023-08-24
A-史密斯：拿过MVP的36人中仅恩比德没进过分区决赛他或想离队
2023-08-24
3D引擎Unity推出Unity中国版：即将支持开源鸿蒙、阿里OS等系统
2023-08-24
天水：推动文旅高质量发展
2023-08-24
雷电+暴雨双预警！北京房山将有短时强降水，山区或有崩塌等灾害
2023-08-24
注意！市场交易特征维度这些底部特征已出现
2023-08-24
杭州青少年球员可以参加等级测试啦还能获得专属足球数字档案
2023-08-24
销售额翻10倍！“山东特产”知了猴火遍全国有人一晚可采10万只
2023-08-24
有了内马尔本泽马萨拉赫，隐隐感觉今年的亚冠要火！
2023-08-24
【地评线】东湖评论：激活文化自信的“一江春水”
2023-08-24
经开区“筑巢引凤” 孵化自动驾驶“小巨人”
2023-08-24
早晨起来如何快速排宿便_早晨起床怎么迅速排便
2023-08-24
6个受灾严重地区已发放灾后重建相关贷款超150亿元
2023-08-24
台青“首来族”寻根浙江：“家乡的感觉真好”
2023-08-24
红米K60 手机怎么会有两个闪光灯
2023-08-24
热浪、暴雨……欧洲遭遇“冰火两重天”
2023-08-24
天空：穆德里克和拉维亚缺席切尔西今日训练，布罗亚回归
2023-08-24
车被刮了找不到人怎么处理保险
2023-08-24
“减肥神药”司美格鲁肽，除了减重，还能显著降低心血管疾病风险
2023-08-24
8月21日基金净值：银华中证光伏产业ETF最新净值0.8699，跌2.74%
2023-08-24
MLED概念股H1财报汇总（一）：创维数字、兆驰、大族、士兰微
2023-08-24
第19届杭州亚运会5克和30克银质纪念币多少钱（2023年08月21日）
2023-08-24
中海油服：上半年归母净利润13.39亿元同比增长21.1%，
2023-08-24
今日丹麦克朗汇率最新中间价（2023年3月8日）
2023-08-24
市场出现诸多积极信号
2023-08-24
广西钦州消防：灵山县一商铺发生火灾，火势已被扑灭，未造成人员伤亡
2023-08-24
山河药辅股东户数增加7.56%，户均持股23.03万元
2023-08-24
图解银星能源中报：第二季度单季净利润同比增22.36%
2023-08-24
8月22日基金净值：工银金融地产混合A最新净值2.351，涨0.94%
2023-08-24
2023年8月23日济宁油价调整价格表
2023-08-24
今日处暑，即为出暑！气温下降，部分地区仍有阵雨
2023-08-24
万物新生（爱回收）二季度营收29.6亿元
2023-08-24