网站建设网址,做网站 斗地主,网页介绍怎么写,徐州人才网官方网站CNN卷积神经网络 解决的问题人类的视觉原理原理卷积层——提取特征池化层——数据降维全连接层——输出结果 应用图像处理自然语言处理 解决的问题
在CNN没有出现前#xff0c;图像对人工智能来说非常难处理。 主要原因#xff1a;
图像要处理的数据量太大了。图像由像素组… CNN卷积神经网络 解决的问题人类的视觉原理原理卷积层——提取特征池化层——数据降维全连接层——输出结果 应用图像处理自然语言处理 解决的问题
在CNN没有出现前图像对人工智能来说非常难处理。 主要原因
图像要处理的数据量太大了。图像由像素组成每个像素又由不同颜色组成一张1000×1000彩色RGB图像需要的参数是1000×1000×3需要三百万参数左右普通神经网络会全用全连接方法来学习整幅图像上的特征处理起来无论是计算还是存储都需要很大的资源。很难保留图像特征。一张图像做了一些翻转、旋转、缩放的那个操作的时候线性向量表示会发生很大的变化机器没法认为是同一张图。而CNN能够让机器“以视觉的方式看待图像数据”能利用视觉原理捕获到图像数据中的特征。
人类的视觉原理
深度学习是基于神经网络的实现的而神经网络是一种模仿生物神经网络结构和功能的数学模型或计算模型。所以深度学习的许多研究成果离不开对大脑认知原理的研究。CNN就借鉴了人类视觉系统层次结构。
人类的视觉原理瞳孔摄入原始像素信号然后大脑皮层某些细胞发现边缘和方向大脑进行抽象判断特征例如物体形状最后再进一步做出判断例如物体是个人。
下图是一个大脑进行人脸识别的示例图 通过模仿人类的视觉原理的特点来构造神经网络低层的识别图像初级特征若干曾底层特征组成更上一层的特征最终通过多个层级组合在顶层做出分类判断。
原理
CNNConvolutional Neural Network卷积神经网络结构可以分为3层卷积层、池化层和全连接层。
卷积层——提取特征
卷积层Convolutional Layer 主要作用是提取特征。
过程一个过滤器卷积核Filter来过滤图像各个小区域从而得到各个小区域的特征。卷积层通过卷积核的过滤提取出图片中局部的特征与人类视觉的特征提取类似。
实际应用的时候往往会有很多种卷积核不同卷积核识别不同的图像模式也就是不同的特征。
池化层——数据降维
池化层Max Pooling Layer) 提取某个区域的总结特征主要作用是下采样(Downsampling)能够数据降维但是不会损坏识别结果。
原因做完卷积后的图像依然很大1000*1000经过10种卷积核后得到1000×1000×10维度非常大。通过池化层能降低数据大小同时不会对识别结果造成破坏。
池化层函数是一种统计函数通常由最大池化提取区域内的最大特征、平均池化提取区域内的平均特征、混合池化等。
过程下图采用最大池化策略对4×4的矩阵按照2×2进行分开每个2×2取最大值保留下来。 好处除了降低参数量还有个优点就是能够避免过拟合。池化是提取某个区域的总结特征是对某个区域全局的考量减少了对具体像素的依赖性从而降低了过拟合风险。例如某个点其实是噪声但是池化总结特征的时候被舍弃了就没有影响如果不池化后续调参的时候还会考虑到噪声。
全连接层——输出结果
全连接层Fully Connected Layer主要作用是分类。通过卷积层和池化层的出来的特征需要让全连接层对前面总结好的特征做分类判断。
过程“全连接”前层网络中的所有神经元都与下一层的所有神经元连接。
应用
图像处理
图像分类Image Classification判断图片中的物体属于哪一个类别。 举例LeNet-5用来对手写字体识别被认为是最早的CNN模型作者LeCun Y也被誉为CNN之父。图像分割Image Segmentation为图片每个对象创造一个像素级别的掩膜。 分类语义分割和实例分割。 语义分割Semantic Segmentation为图像中的每个像素分配一个类别但是同一类别之间的对象不会区分。 实例分割Instance Segmetation实例分割还会对同一类别的对象进行区分。 下图中左边是语义分割右边是实例分割 目标检测Object Detection目标定位并且能对目标物体进行分类。 与目标定位的区别目标定位通常是针对单个检测对象而目标检测能检测多个对象。此外图像分类也是针对单个对象的。 与图像分割的区别目标检测和目标定位都只是定位出目标的位置通常是用一个方框表示而图像分割则是每个像素属于那个对象对象的轮廓会更加清楚。 超分辨率Super-Resolution提高原有图像的分辨率。
自然语言处理
除了在图像处理领域CNN 在自然语言处理Natural Language ProcessingNLP也有应用。
输入任何矩阵都可以作为CNN的输入所以输入也可以是词向量组成的矩阵即矩阵每一行代表一个词也可以是一个字符。
卷积过滤器“宽度”通常和输入矩阵的宽度相同也就是输入的词向量大小高度可能会有所不同也每次卷积多少个词。
池化进一步降低参数量避免过拟合例如最大池化、平均池化。