当前位置: 首页 > news >正文

广西建设网官网在线服务seowhy是什么意思中文

广西建设网官网在线服务,seowhy是什么意思中文,旅游网站建设规划书模板,wordpress怎么引用图片不显示不出来注#xff1a;本文为《动手学深度学习》开源内容#xff0c;部分标注了个人理解#xff0c;仅为个人学习记录#xff0c;无抄袭搬运意图 5.12 稠密连接网络#xff08;DenseNet#xff09; ResNet中的跨层连接设计引申出了数个后续工作。本节我们介绍其中的一个#xf… 注本文为《动手学深度学习》开源内容部分标注了个人理解仅为个人学习记录无抄袭搬运意图 5.12 稠密连接网络DenseNet ResNet中的跨层连接设计引申出了数个后续工作。本节我们介绍其中的一个稠密连接网络DenseNet [1]。 它与ResNet的主要区别如图5.10所示。 图5.10 ResNet左与DenseNet右在跨层连接上的主要区别使用相加和使用连结 图5.10中将部分前后相邻的运算抽象为模块 A A A和模块 B B B。与ResNet的主要区别在于DenseNet里模块 B B B的输出不是像ResNet那样和模块 A A A的输出相加而是在通道维上连结。这样模块 A A A的输出可以直接传入模块 B B B后面的层。在这个设计里模块 A A A直接跟模块 B B B后面的所有层连接在了一起。这也是它被称为“稠密连接”的原因。 DenseNet的主要构建模块是稠密块dense block和过渡层transition layer。前者定义了输入和输出是如何连结的后者则用来控制通道数使之不过大。 5.12.1 稠密块 DenseNet使用了ResNet改良版的“批量归一化、激活和卷积”结构我们首先在conv_block函数里实现这个结构。 import time import torch from torch import nn, optim import torch.nn.functional as Fimport sys sys.path.append(..) import d2lzh_pytorch as d2l device torch.device(cuda if torch.cuda.is_available() else cpu)def conv_block(in_channels, out_channels):blk nn.Sequential(nn.BatchNorm2d(in_channels), nn.ReLU(),nn.Conv2d(in_channels, out_channels, kernel_size3, padding1))return blk稠密块由多个conv_block组成每块使用相同的输出通道数。但在前向计算时我们将每块的输入和输出在通道维上连结。 class DenseBlock(nn.Module):def __init__(self, num_convs, in_channels, out_channels):super(DenseBlock, self).__init__()net []for i in range(num_convs):in_c in_channels i * out_channelsnet.append(conv_block(in_c, out_channels))self.net nn.ModuleList(net)self.out_channels in_channels num_convs * out_channels # 计算输出通道数def forward(self, X):for blk in self.net:Y blk(X)X torch.cat((X, Y), dim1) # 在通道维上将输入和输出连结return X在下面的例子中我们定义一个有2个输出通道数为10的卷积块。使用通道数为3的输入时我们会得到通道数为 3 2 × 10 23 32\times 1023 32×1023的输出。卷积块的通道数控制了输出通道数相对于输入通道数的增长因此也被称为增长率growth rate。 blk DenseBlock(2, 3, 10) X torch.rand(4, 3, 8, 8) Y blk(X) Y.shape # torch.Size([4, 23, 8, 8])5.12.2 过渡层 由于每个稠密块都会带来通道数的增加使用过多则会带来过于复杂的模型。过渡层用来控制模型复杂度。它通过 1 × 1 1\times1 1×1卷积层来减小通道数并使用步幅为2的平均池化层减半高和宽从而进一步降低模型复杂度。 def transition_block(in_channels, out_channels):blk nn.Sequential(nn.BatchNorm2d(in_channels), nn.ReLU(),nn.Conv2d(in_channels, out_channels, kernel_size1),nn.AvgPool2d(kernel_size2, stride2))return blk对上一个例子中稠密块的输出使用通道数为10的过渡层。此时输出的通道数减为10高和宽均减半。 blk transition_block(23, 10) blk(Y).shape # torch.Size([4, 10, 4, 4])5.12.3 DenseNet模型 我们来构造DenseNet模型。DenseNet首先使用同ResNet一样的单卷积层和最大池化层。 net nn.Sequential(nn.Conv2d(1, 64, kernel_size7, stride2, padding3),nn.BatchNorm2d(64), nn.ReLU(),nn.MaxPool2d(kernel_size3, stride2, padding1))类似于ResNet接下来使用的4个残差块DenseNet使用的是4个稠密块。同ResNet一样我们可以设置每个稠密块使用多少个卷积层。这里我们设成4从而与上一节的ResNet-18保持一致。稠密块里的卷积层通道数即增长率设为32所以每个稠密块将增加128个通道。 ResNet里通过步幅为2的残差块在每个模块之间减小高和宽。这里我们则使用过渡层来减半高和宽并减半通道数。 num_channels, growth_rate 64, 32 # num_channels为当前的通道数 num_convs_in_dense_blocks [4, 4, 4, 4]for i, num_convs in enumerate(num_convs_in_dense_blocks):DB DenseBlock(num_convs, num_channels, growth_rate)net.add_module(DenseBlosk_%d % i, DB)# 上一个稠密块的输出通道数num_channels DB.out_channels# 在稠密块之间加入通道数减半的过渡层if i ! len(num_convs_in_dense_blocks) - 1:net.add_module(transition_block_%d % i, transition_block(num_channels, num_channels // 2))num_channels num_channels // 2同ResNet一样最后接上全局池化层和全连接层来输出。 net.add_module(BN, nn.BatchNorm2d(num_channels)) net.add_module(relu, nn.ReLU()) net.add_module(global_avg_pool, d2l.GlobalAvgPool2d()) # GlobalAvgPool2d的输出: (Batch, num_channels, 1, 1) net.add_module(fc, nn.Sequential(d2l.FlattenLayer(), nn.Linear(num_channels, 10))) 我们尝试打印每个子模块的输出维度确保网络无误 X torch.rand((1, 1, 96, 96)) for name, layer in net.named_children():X layer(X)print(name, output shape:\t, X.shape)输出 0 output shape: torch.Size([1, 64, 48, 48]) 1 output shape: torch.Size([1, 64, 48, 48]) 2 output shape: torch.Size([1, 64, 48, 48]) 3 output shape: torch.Size([1, 64, 24, 24]) DenseBlosk_0 output shape: torch.Size([1, 192, 24, 24]) transition_block_0 output shape: torch.Size([1, 96, 12, 12]) DenseBlosk_1 output shape: torch.Size([1, 224, 12, 12]) transition_block_1 output shape: torch.Size([1, 112, 6, 6]) DenseBlosk_2 output shape: torch.Size([1, 240, 6, 6]) transition_block_2 output shape: torch.Size([1, 120, 3, 3]) DenseBlosk_3 output shape: torch.Size([1, 248, 3, 3]) BN output shape: torch.Size([1, 248, 3, 3]) relu output shape: torch.Size([1, 248, 3, 3]) global_avg_pool output shape: torch.Size([1, 248, 1, 1]) fc output shape: torch.Size([1, 10])5.12.4 获取数据并训练模型 由于这里使用了比较深的网络本节里我们将输入高和宽从224降到96来简化计算。 batch_size 256 # 如出现“out of memory”的报错信息可减小batch_size或resize train_iter, test_iter d2l.load_data_fashion_mnist(batch_size, resize96)lr, num_epochs 0.001, 5 optimizer torch.optim.Adam(net.parameters(), lrlr) d2l.train_ch5(net, train_iter, test_iter, batch_size, optimizer, device, num_epochs)输出 training on cuda epoch 1, loss 0.0020, train acc 0.834, test acc 0.749, time 27.7 sec epoch 2, loss 0.0011, train acc 0.900, test acc 0.824, time 25.5 sec epoch 3, loss 0.0009, train acc 0.913, test acc 0.839, time 23.8 sec epoch 4, loss 0.0008, train acc 0.921, test acc 0.889, time 24.9 sec epoch 5, loss 0.0008, train acc 0.929, test acc 0.884, time 24.3 sec小结 在跨层连接上不同于ResNet中将输入与输出相加DenseNet在通道维上连结输入与输出。DenseNet的主要构建模块是稠密块和过渡层。 参考文献 [1] Huang, G., Liu, Z., Weinberger, K. Q., van der Maaten, L. (2017). Densely connected convolutional networks. In Proceedings of the IEEE conference on computer vision and pattern recognition (Vol. 1, No. 2). 注除代码外本节与原书此节基本相同原书传送门
http://www.zqtcl.cn/news/974854/

相关文章:

  • 庄河网站建设如何上传文件到网站
  • 北京企业网站改版wordpress comer
  • 做租赁的行业网站腾讯云服务器用什么做网站
  • 承德优化网站建设建设旅游网网站软件
  • 金山专业网站建设科技作品手工
  • 企业网站开发丨薇大型门户网站制作教程
  • m开头的网站开发工具青少儿编程
  • 确定网站风格域名查询中国万网
  • 邢台网站优化定制网站内怎么做搜索
  • 深圳公司网站开发济宁医院网站建设
  • vr功能网站建设手机网站引导页js插件
  • 汕头企业建站系统模板沈阳网站建设q479185700棒
  • 外包公司做网站多少百度做推广一般要多少钱
  • asp静态网站用shopify 做网站
  • 政务公开和网站建设dedecms模板安装教程
  • 做网站公司选哪家erp财务软件怎么使用
  • 常州网站建设效果网站备案换公司吗
  • 网站排名方法客流统计系统厂家
  • 免费做网站怎么做网站吗广州工程
  • 如何做全景素材网站常州做网站价格
  • 网站域名删除时间查询wordpress首页文章显示图片
  • 做网站需要什么样的服务器用html制作购物网站
  • 运城市住房与城乡建设局网站电脑培训学校课程
  • 二级学院网站建设自评报告最简单网页制作软件
  • 不开网店怎么做淘宝网站建设部网站江苏金安
  • 厦门做网站最好的公司汽车之家官网首页网页
  • 企业网站seo价格免费的网站模版下载
  • 做推广用那个网站吗百度小程序有什么用
  • 上海优质网站seo有哪些wordpress点击阅读全部
  • 企业网站建设中企动力网站制作电话多少