中山如何制作网站,wordpress对接微信,网站建设电销职责,百度引擎搜索引擎图像卷积、步长、填充、特征图、多通道卷积、权重共享、感受野、池化
卷积神经网络的一些基本概念#xff1a;图像卷积、步长、填充、特征图、多通道卷积、权重共享、感受野、池化
1.图像卷积、步长、填充 图像卷积#xff1a;卷积核矩阵在一个原始图像矩阵上 “从上往下、…图像卷积、步长、填充、特征图、多通道卷积、权重共享、感受野、池化
卷积神经网络的一些基本概念图像卷积、步长、填充、特征图、多通道卷积、权重共享、感受野、池化
1.图像卷积、步长、填充 图像卷积卷积核矩阵在一个原始图像矩阵上 “从上往下、从左往右”滑动窗口进行卷积计算然后将所有结果组合到一起得到一个新的矩阵的过程。图1.13 用一个相同的卷积核对整幅图像进行进行卷积操作相当于对图像做一次全图滤波符合卷积核特征的部分得到的结果比较大不符合卷积核特征的部分得到的结果比较小因此卷积操作后的结果可以较好地表征该区域符合卷积核所描述的特征的程度。 一次完整的卷积会选出图片上所有符合这个卷积核的特征。 如果将大量图片作为训练集则卷积核最终会被训练成有意义的特征。例如识别飞机卷积核可以是机身或者飞机机翼的形状等。 步长Stride卷积核在图像上移动的步子不同的步长会影响输出图的尺寸。 更大的步长意味着空间分辨率的快速下降。 图1.14输入图都是5×5卷积核大小都是3×3。 Stride1卷积后的结果3×3 Streide2卷积后的结果2×2 填充Padding为了更好地控制输入和输出图的大小一般会对输入进行填充操作。 填充操作就是在原来输入图的边界外进行扩充使其变得更大卷积后的结果也会更大。 通常会设计卷积网络层时小心地进行填充从而精确地控制输入图和输出图的大小关系。 图1.15无填充和有填充卷积的对比结果。 没有填充输入为3×3的图输出为2×2的图分辨率降低。 有填充在原图周围填充一行或一列的0输出为4×4分辨率没有降低。 2.特征图与多通道卷积 特征图 图1.13展示的是单个图像的卷积而一个卷积神经网络其每一层都是由多个图组成的将其成为特征图或者特征平面如图1.16所示。 特征平面Frature Map包含高度、宽度和通道共三个维度形状为C×H×W。 多通道卷积 在卷积神经网络中要实现的是多通道卷积假设输入特征图大小是Ci×Hi×Wi输出特征图大小是C0×H0×W0则多通道卷积如图1.17所示。 其中每个出书特征图都由Ci个卷积核与通道数为Ci 的输入特征图进行逐通道卷积然后将结果相加一共需要Ci×C0个卷积核每Ci 个为一组共C0组。 3.权重共享
当对每组进行卷积时不同的通道使用不同的卷积核。但当卷积核在同一幅图的不同空间位置进行卷积时采取的是权重共享的模式这是卷积神经网络非常重要的概念。 局部连接思想来自生理学的感受野机制和图像的局部统计特性 权重共享可以使得图像在一个局部区域学习到的信息应用到其他区域使同样的目标在不同的位置能够提取到同样的特征。 局部连接和权重共享结构大大降低了参数量。 √卷积神经网络某一层的参数量由输入通道数N、输出通道数M和卷积核的大小r决定。
√一层连接的参数量N×M×r×r
4.感受野Receptive Field
可以将感受野理解为视觉感受区域的大小。
在卷积神经网络中感受野是特征平面上的一个点即神经元在输入图上对应的区域如图1.18所示。 如果一个神经元的大小受到输入层N×N的神经元区域的影响那么可以说该神经元的感受野是N×N因为它反映了N×N区域的信息。
图1.18Conv2中的像素点为5是由Conv1的2×2的区域得来的而该2×2区域是由原始图像的5×5区域计算而来因此该像素的感受野是5×5。可以看出感受野越大得到的全局信息就越多。
5.池化Pooling
图1.18中从原图到Conv1再到Conv2图像越来越小每过一级项相当于一次降采样这就是池化。
池化通过步长不为1的卷积来实现也可以通过插值采样实现本质上没有区别只是权重不同。
池化作用 池化层可以对输入的特征图进行压缩一方面使特征图变小简化网络计算的复杂度 PS池化操作会使特征图缩小有可能影响网络的准确度对此可以通过增加特征图的深度来弥补精度的缺失 另一方面可以提取主要特征有利于降低过拟合风险 池化层在一定程度上保持尺度不变形。 eg一辆车图像缩小了50%后仍然能认出这是一辆车说明处理后的图像仍然包含原始图像的最重要的特征。 图像压缩时去掉的只是一些冗余信息留下的信息则是具有尺度不变性的特征其最能表达图像的特征。
常见池化分类图1.19平均池化Average Pooling最大池化Max Pooling概念计算池化区域所有元素的平均值作为该区域池化后的值池化区域的最大值作为该区域池化后的值特点能够保留整体数据的特征能较好的突出背景信息能更好地保留纹理特征
套用卷积通用公式 o u t p u t [ ( i n p u t − f i l t e r S i z e 2 ∗ p a d d i n g ) / s t r i d e ] 1 output[(input-filterSize2*padding)/stride]1 output[(input−filterSize2∗padding)/stride]1 PS公式是向下取整 参考文献 1.《深度学习之图像识别 核心算法与实战案例 全彩版》言有三 著 出版社清华大学出版社 出版时间2023年7月第一版第一次印刷 ISBN978-7-302-63527-7