盐城seo网站优化软件,wordpress转为pdf,No餐饮网站建设,中小企业网站制作407来源#xff1a;科技行者概要#xff1a;计算机算法可以从面相判断一个人的性取向#xff0c;引发了对隐私、道德、伦理问题的争议。然而回过头去看#xff0c;在人工智能领域#xff0c;它是图像识别和机器人视觉的核心部分。最近斯坦福大学一篇论文《Deep neural networ… 来源科技行者概要计算机算法可以从面相判断一个人的性取向引发了对隐私、道德、伦理问题的争议。然而回过头去看在人工智能领域它是图像识别和机器人视觉的核心部分。最近斯坦福大学一篇论文《Deep neural networks are more accurate than humans at detecting sexual orientation from facial images》一出舆论哗然该论文研究指出计算机算法可以从面相判断一个人的性取向引发了对隐私、道德、伦理问题的争议。然而回过头去看这原本是一个卷积神经网络应用的技术文章在人工智能领域它是图像识别和机器人视觉的核心部分。图像识别技术是人工智能道路上的一座高峰如今你可以看到包括个人相册图片管理、刷脸解锁手机、刷脸上班打卡等广泛应用。你一定好奇图像识别是什么如何让机器理解一张图甚至一个动态的生物背后又用到了哪些技术今天我们就从源头挖一挖图像识别的概念、技术和应用。什么是“图像识别”从概念来看图像识别是指利用计算机对图像进行处理、分析和理解以识别不同模式的目标和对像人物、场景、位置、物体、动作等的技术。而图像识别算法一般采用机器学习方法模拟人脑看图随后计算机依靠大量的数据理解图像最后建立相关的标签和类别。整个识别过程的核心就是神经网络经过优胜劣汰目前已经发展到卷积神经网络CNN或ConvNets。据不完全统计科学家们从神经网络研究到卷积神经网络就花了从20世纪60年代末到20世纪80年代末的时间。让计算机看见经历了一个剥茧抽丝的神经网络演进过程我们先来看人如何辨识物体。人脑的神经细胞神经元包括很多彼此相邻并相连的层层数越多网络越“深”。单个神经元从其他神经元接收信号——可能高达10万个当其他神经元被触发时它们会对相连的神经元施加兴奋或抑制作用如果我们的第一个神经元输入加起来达到一定阈值电压threshold voltage时它也会被触发。也就是说人不但可以用眼看字当别人在他背上写字时他也认得出这个字来。就好比下图人一眼看过去就能感知到图片中存在某种层级hierarchy或者概念结构conceptual structure一层一层的地面是由草和水泥组成图中有一个小孩小孩在骑弹簧木马弹簧木马在草地上。关键点是我们知道这是小孩无论小孩在哪种环境都认识因此人类不需要重新学习小孩这个概念。但机器不同它需要经过多次反复的学习过程。我们再来看机器如何辨识物体。在人工神经网络中信号也在“神经元”之间传播但是神经网络不是发射电信号而是为各种神经元分配权重。 和权重较小的神经元相比权重更大的神经元会对下一层神经元产生更多的作用最后一层将这些加权输入放在一起以得出答案。比如要想让一个计算机认出“猫”需要建立一组数据库包含数千张猫的图像和数千张不含猫的图像分别标记“猫”和“不是猫”然后将图像数据提供给神经网络最终输出层将所有信息——尖耳朵、圆脸、胡须、黑鼻子、长尾巴——放在一起并给出一个答案猫。这种训练技术被称为监督学习supervised learning。还有一种技术叫做无监督学习Unsupervised learning就是使用未标记的数据计算机必须自己看图识物比如从“尖耳朵”辨别这是一只猫而不是其他动物。然而这些方法容易误导机器误把“尖耳朵”猫识别成狗或者把浣熊猫误认为暹罗猫。但是如果图片是这样的呢一个3 岁小孩都能识别出猫的照片计算机科学家们却花了多年时间教会计算机看图识物。关键就是自主训练量。直到20世纪80年代来自加拿大多伦多大学的“神经网络先驱”Geoff Hinton领导的小组提出了一种训练神经网络的方法叫做卷积神经网络意味着它不会陷入局部陷阱。于是强大的图形处理单元或GPU出现了研究人员因此可以在台式机上运行、操纵和处理图像而不用超级计算机了。同时大数据的加持让卷积神经网络应用越来越广泛。2007年美国斯坦福大学计算机科学系副教授李飞飞推出了ImageNet——一个来自互联网的数百万带有标签图像的数据库。ImageNet为神经网络提供了约1000万张图像和1000个不同的标签。一直到现在神经网络成为机器人视觉的核心工具。尽管现代神经网络包含许多层次——Google Photos有大约30层——但卷积神经网络的出现仍然是前进了一大步。当你教会计算机认图它需要反复学习与传统神经网络一样卷积神经网络也是由加权神经元层组成。但是它们不仅仅是模仿人脑的运作而是非常恰到好处地从视觉系统本身获得了灵感。卷积神经网络中的每个层都在图像上使用过滤器拾取特定的图案或特征。前几层检测到较大的特征例如下图斜线而后面的层拾取更细的细节并将其组织成诸如“耳朵”的复杂特征。图典型的卷积神经网络架构最终输出层像普通神经网络一样是完全连接的也就是说该层中的所有神经元都连接到上一层的所有神经元。它集合高度具体的特征——其中可能包括猫的狭缝状瞳孔、杏仁形眼睛、眼睛到鼻子的距离——并产生超精确的分类猫。在2012年谷歌用数千个未标记的YouTube剪辑缩略图培训了一个卷积神经网络看看会出现什么。毫不奇怪它变得擅长寻找猫视频。卷积神经网络如何进行图片处理基本上有三个步骤卷积层、池化层、采用下采样阵列作为常规全连接神经网络的输入。譬如从刚刚那张“小孩骑马图”可以分解出卷积神经网络辨识物体的五个步骤第一步把图片分解成部分重合的小图块 于是图片被分解成了 77 块同样大小的小图块。第二步把每个小图块输入到小型神经网络中重复这个步骤 77 次每次判断一张小图块然而有一个非常重要的不同对于每个小图块我们会使用同样的神经网络权重也就是说如果哪个小图块不一样我们就认为这个图块是“异常”interesting的。第三步把每一个小图块的结果都保存到一个新的数组当中我们不想并不想打乱小图块的顺序所以就把每个小图块按照图片上的顺序输入并保存结果就像这样第四步缩减像素采样第三步的结果是一个数组这个数组对应着原始图片中最异常的部分。但是这个数组依然很大:为了减小这个数组的大小我们利用一种叫做最大池化max pooling的函数来降采样downsample。但这依然不够让我们先来看每个 2×2 的方阵数组并且留下最大的数这里一旦我们找到组成 2×2 方阵的 4 个输入中任何异常的部分但我们就只保留这一个数。这样一来我们的数组大小就缩减了同时最重要的部分也保留住了。最后一步作出预测到现在为止我们已经把一个很大的图片缩减到了一个相对较小的数组。数组就是一串数字而已所以我们我们可以把这个数组输入到另外一个神经网络里面去。最后的这个神经网络会决定这个图片是否匹配。为了区分它和卷积的不同我们把它称作“全连接”网络“Fully Connected” Network。所以从开始到结束我们的五步就像管道一样被连接了起来整个过程中你可以把这些步骤任意组合、堆叠多次卷积层越多网络就越能识别出复杂的特征。当你想要缩小数据大小时也随时可以调用最大池化函数。而深层卷积网络Convolutional Neural Networks就是使用了多次卷积、最大池化和多个全连接层。为了实现卷积神经网络应用机器学习需要反复学习测试。如何构建卷积神经网络这里有一些API从零开始构建卷积神经网络费钱又耗时业内开放了一些APIApplication Programming Interface应用程序编程接口使开发者无需自己研究机器学习或计算机视觉专业知识。谷歌 Cloud VisionGoogleCloud Vision是谷歌的视觉识别API使用REST API。它基于开源的TensorFlow框架。它检测单个面部和物体并包含一个相当全面的标签集。另外谷歌图像搜索可以说是一个巨大的图像数据库基本上改变了我们处理图像的方式。这里有一张谷歌图像搜索的时间表。 IBM沃森视觉识别IBM沃森视觉识别是沃森开发者云Watson Developer Cloud的一部分并附带了一大批内置的类别但实际上是为根据你提供的图像来训练自定义定制类而构建的。它还支持一些很棒的功能包括NSFW和OCR检测如Google Cloud Vision。Facebook的MultiPathNet 3Facebook AI ResearchFAIR认为深度卷积神经网络让我们已经看到图像分类图像中有什么以及对象检测对象在哪里上的巨大进步见下图a和b但这只是一个开始目标是设计一种识别和分割图像中每个对象的技术如下图c。于是Facebook想将机器视觉推向下一个阶段——在像素级别上理解图像和对象。推动的主要新算法是DeepMask 1分段框架以及SharpMask 2细分模块。它们共同使FAIR的机器视觉系统能够检测并精确地描绘图像中的每个物体。识别流水线的最后阶段使用一个专门的卷积网络称之为MultiPathNet 3以其包含的对象类型例如人狗羊为每个对象掩码标记。Clarif.aiClarif.ai是一个新兴的图像识别服务也使用REST API。关于Clarif.ai的一个有趣的方面是它附带了一些模块有助于将其算法定制到特定主题如食物、旅行和婚礼。尽管上述API适用于少数一般应用程序但你可能仍然需要为特定任务开发自定义解决方案。幸运的是许多库可以通过处理优化和计算方面来使开发人员和数据科学家的生活变得更加容易从而使他们专注于训练模型。有许多库包括Theano、Torch、DeepLearning4J和TensorFlow已经成功应用于各种应用。-END-