湛江网站建设团队,做网站的主题有哪些,购物网站页面设计图片,越城区建设和交通运输局网站基于深度学习的运动目标检测#xff08;二#xff09;YOLOv2YOLOv3概述 1.YOLOv2概述2.YOLOv3概述2.1 新的基础网络结构#xff1a;2.2 采用多尺度预测机制。2.3 使用简单的逻辑回归进行分类 1.YOLOv2概述
对YOLO存在的不足#xff0c;业界又推出了YOLOv2。YOLOv2主要… 基于深度学习的运动目标检测二YOLOv2YOLOv3概述 1.YOLOv2概述2.YOLOv3概述2.1 新的基础网络结构2.2 采用多尺度预测机制。2.3 使用简单的逻辑回归进行分类 1.YOLOv2概述
对YOLO存在的不足业界又推出了YOLOv2。YOLOv2主要通过以下方法对模型进行优化
(1)使用Batch Normalization方法对模型中每一个卷积层的输入进行归一化缓解梯度消失加快收敛速度减少了训练时间同时提高了平均检测准确率。
(2)增加Anchors机制借助训练集的边框标签值使用k-means聚类的方法生成几种不同尺寸的Anchors。YOLOv2去掉了YOLO网络中的全连接层和最后一个池化层以提高特征的分辨率在最后一层卷积采样后使用Anchors机制旨在提高IoU。训练时在每个网格上预置Anchors以这些Anchors为基准计算损失函数。
(3)提出一个新的基础网络结构Darknet-19。Darknet-19是一个全卷积网络相比YOLO的主体结构它用一个average pooling层代替全连接层有利于更好地保留目标的空间位置信息。
(4)采用优化的直接位置预测方法根据设定的Anchors在网络最后一个卷积层输出的特征图上对每个网格进行边框预测先预测tx、ty、tw、th、to这5个值然后根据这5个值计算预测边框的位置信息和置信度。
通过以上改进YOLOv2在平均检测准确率和训练检测速度方面较YOLO均有明显的提高。作为一个中间版本我们了解即可。
2.YOLOv3概述
为了进一步提高性能人们又提出了YOLOv3。相比前两个版本YOLOv3在分类方法、网络结构方面做了较大改进具体实现如下
2.1 新的基础网络结构
Darknet-53。Darknet-53共有75层使用了一系列3×3、1×1的卷积其中包括53层卷积层其余为res层借鉴ResNetResidual Network残差网络的思想采用跳层连接的方式进一步优化网络性能。Darknet-53的网络结构如图所示。 在深度学习中越是深层次的网络越容易出现梯度消失导致网络退化即使使用了Batch Normalization等方法效果依然不太理想。2015年Kaiming He等人提出ResNet在当年的ILSVRC比赛中获得了冠军。ResNet的主要思想是在网络结构中增加了“直连通道”将某层的原始输出直接传递到后面的层中这种跳层连接结构能减少原始信息在传递过程中的损耗在一定程度上缓解了深度神经网络中的梯度消失问题。ResNet的原理如图所示。 在ResNet中如果用xl和xl1分别表示第l层的输入和输出Wl表示第l层的权重F表示该层的残差函数则xl和xl1之间的关系可以表示为xl1xlF(xl,Wl)。如果网络以这样的结构学习到第L层以xL表示第L层的输入xL和xl之间的关系可表达为 从而求得在此反向传递过程中损失函数的梯度 从上面公式括号里的两项可以看出1保证了梯度可以无损地传递第二项的大小由网络权重决定并且该项再小也不会导致梯度消失的问题。由此可见ResNet对原始输入信息的学习更容易、更准确。
Darknet-53通过引入res层将整个网络分成若干个小的ResNet结构单元通过逐级对残差的学习来控制梯度的传播以此来缓解训练中的梯度消失。
2.2 采用多尺度预测机制。
YOLOv3沿用了YOLOv2中的Anchors机制使用k-means方法聚类出9种大小不同的Anchors。为了充分利用这些AnchorsYOLOv3进一步细化网格划分将Anchors按大小平均分配给3种scale。
· scale1在Darknet-53后添加6层卷积层直接得到用以检测目标的特征图维度为13×13×(B×5C)对应最大的3种Anchors适用于大目标检测。
· sale2对网络第79层的输出进行上采样生成26×26×(B×5C)的特征图同时与第61层输出的特征图合并再进行一系列的卷积操作最终得到的特征图对应3个中等大小的Anchors适用于中目标检测。
· scale3对网络第91层的输出进行上采样生成52×52×(B×5C)的特征图先与第36层输出的特征图合并再进行系列卷积最终得到与3个最小的Anchors对应的特征图适用于小目标检测。通过这样的改进YOLOv3相比YOLOv2在小目标检测效果上有了较为明显的提高。
2.3 使用简单的逻辑回归进行分类
分类损失函数采用了binary cross-entropy loss二值交叉熵损失而且不再使用softmax进行分类。在softmax分类中得分最高的预测边框获得一个分类但是在很多情况下尤其是在对有遮挡或重叠的多目标检测时softmax并不适合。
通过不断的改进与创新YOLOv3使基于回归思想的YOLO系列模型的性能达到了一个峰值最大限度地兼顾了检测的实时性和准确率为危险物品的实时检测和跟踪、自动驾驶的环境信息采集等对实时性和准确率要求都较高的应用领域提供了非常有参考、研究价值的可靠模型。