当前位置: 首页 > news >正文

网站维护费怎么做分录wordpress 图片放大插件

网站维护费怎么做分录,wordpress 图片放大插件,wordpress文章点击数插件,wordpress做网站怎么样来源#xff1a;1024深度学习 概要#xff1a;卷积现在可能是深度学习中最重要的概念。正是靠着卷积和卷积神经网络#xff0c;深度学习才超越了几乎其他所有的机器学习手段。 译自Tim Dettmers的Understanding Convolution in Deep Learning。有太多的公开课、教程在反复传… 来源1024深度学习 概要卷积现在可能是深度学习中最重要的概念。正是靠着卷积和卷积神经网络深度学习才超越了几乎其他所有的机器学习手段。 译自Tim Dettmers的Understanding Convolution in Deep Learning。有太多的公开课、教程在反复传颂卷积神经网络的好却都没有讲什么是“卷积”似乎默认所有读者都有相关基础。这篇外文既友好又深入所以翻译了过来。文章高级部分通过流体力学量子力学等解释卷积的做法在我看来有点激进这些领域恐怕比卷积更深奥所以只需简略看看即可。以下是正文 卷积现在可能是深度学习中最重要的概念。正是靠着卷积和卷积神经网络深度学习才超越了几乎其他所有的机器学习手段。但卷积为什么如此强大它的原理是什么在这篇博客中我将讲解卷积及相关概念帮助你彻底地理解它。 网络上已经有不少博客讲解卷积和深度学习中的卷积但我发现它们都一上来就加入了太多不必要的数学细节艰深晦涩不利于理解主旨。这篇博客虽然也有很多数学细节但我会以可视化的方式一步步展示它们确保每个人都可以理解。文章第一部分旨在帮助读者理解卷积的概念和深度学习中的卷积网络。第二部分引入了一些高级的概念旨在帮助深度学习方向的研究者和高级玩家进一步加深对卷积的理解。 什么是卷积 整篇博客都会探讨这个问题但先把握行文脉络会很有帮助。那么粗略来讲什么是卷积呢你可以把卷积想象成一种混合信息的手段。想象一下装满信息的两个桶我们把它们倒入一个桶中并且通过某种规则搅拌搅拌。也就是说卷积是一种混合两种信息的流程。 卷积也可以形式化地描述事实上它就是一种数学运算跟减加乘除没有本质的区别。虽然这种运算本身很复杂但它非常有助于简化更复杂的表达式。在物理和工程上卷积被广泛地用于化简等式——等会儿简单地形式化描述卷积之后——我们将把这些领域的思想和深度学习联系起来以加深对卷积的理解。但现在我们先从实用的角度理解卷积。 我们如何对图像应用卷积 当我们在图像上应用卷积时我们在两个维度上执行卷积——水平和竖直方向。我们混合两桶信息第一桶是输入的图像由三个矩阵构成——RGB三通道其中每个元素都是0到255之间的一个整数。第二个桶是卷积核kernel单个浮点数矩阵。可以将卷积核的大小和模式想象成一个搅拌图像的方法。卷积核的输出是一幅修改后的图像在深度学习中经常被称作feature map。对每个颜色通道都有一个feature map。 边缘检测卷积核的效果 这是怎么做到的呢我们现在演示一下如何通过卷积来混合这两种信息。一种方法是从输入图片中取出一个与卷积核大小相同的区块——这里假设图片为100×100100×100卷积核大小为3×33×3那么我们取出的区块大小就是3×33×3——然后对每对相同位置的元素执行乘法后求和不同于矩阵乘法却类似向量内积这里是两个相同大小的矩阵的“点乘”。乘积的和就生成了feature map中的一个像素。当一个像素计算完毕后移动一个像素取下一个区块执行相同的运算。当无法再移动取得新区块的时候对feature map的计算就结束了。这个流程可以用如下的动画演示 RAM是输入图片Buffer是feature map 你可能注意到这里有个正规化因子m这里m的值为kernel的大小9这是为了保证输入图像和feature map的亮度相同。 为什么机器学习中图像卷积有用 图像中可能含有很多我们不关心的噪音。一个好例子是我和Jannek Thomas在Burda Bootcamp做的项目。Burda Bootcamp是一个让学生像黑客马拉松一样在非常短的时间内创造技术风暴的实验室。与9名同事一起我们在2个月内做了11个产品出来。其中之一是针对时尚图像用深度编码器做的搜索引擎你上传一幅时尚服饰的图片编码器自动找出款式类似的服饰。 如果你想要区分衣服的式样那么衣服的颜色就不那么重要了另外像商标之类的细节也不那么重要。最重要的可能是衣服的外形。一般来讲女装衬衫的形状与衬衣、夹克和裤子的外观非常不同。如果我们过滤掉这些多余的噪音那我们的算法就不会因颜色、商标之类的细节分心了。我们可以通过卷积轻松地实现这项处理。 我的同事Jannek Thomas通过索贝尔边缘检测滤波器与上上一幅图类似去掉了图像中除了边缘之外的所有信息——这也是为什么卷积应用经常被称作滤波而卷积核经常被称作滤波器更准确的定义在下面的原因。由边缘检测滤波器生成的feature map对区分衣服类型非常有用因为只有外形信息被保留下来。 彩图的左上角是搜索query其他是搜索结果你会发现自动编码器真的只关注衣服的外形而不是颜色。 再进一步有许多不同的核可以产生多种feature map比如锐化图像强调细节或者模糊图像减少细节并且每个feature map都可能帮助算法做出决策一些细节比如衣服上有3个纽扣而不是两个可能可以区分一些服饰。 使用这种手段——读入输入、变换输入、然后把feature map喂给某个算法——被称为特征工程。特征工程非常难很少有资料帮你上手。造成的结果是很少有人能熟练地在多个领域应用特征工程。特征工程是——纯手工——也是Kaggle比赛中最重要的技能。特征工程这么难的原因是对每种数据每种问题有用的特征都是不同的图像类任务的特征可能对时序类任务不起作用即使两个任务都是图像类的也很难找出相同的有效特征因为视待识别的物体的不同有用的特征也不同。这非常依赖经验。 所以特征工程对新手来讲特别困难。不过对图像而言是否可以利用卷积核自动找出某个任务中最适合的特征 进入卷积神经网络 卷积神经网络就是干这个的。不同于刚才使用固定数字的卷积核我们赋予参数给这些核参数将在数据上得到训练。随着卷积神经网络的训练这些卷积核为了得到有用信息在图像或feature map上的过滤工作会变得越来越好。这个过程是自动的称作特征学习。特征学习自动适配新的任务我们只需在新数据上训练一下自动找出新的过滤器就行了。这是卷积神经网络如此强大的原因——不需要繁重的特征工程了 通常卷积神经网络并不学习单一的核而是同时学习多层级的多个核。比如一个32x16x16的核用到256×256的图像上去会产生32个241×241的feature map。所以自动地得到了32个有用的新特征。这些特征可以作为下个核的输入。一旦学习到了多级特征我们简单地将它们传给一个全连接的简单的神经网络由它完成分类。这就是在概念上理解卷积神经网络所需的全部知识了池化也是个重要的主题但还是在另一篇博客中讲吧。 第二部分高级概念 我们现在对卷积有了一个良好的初步认识也知道了卷积神经网络在干什么、为什么它如此强大。现在让我们深入了解一下卷积运算中到底发生了什么。我们将认识到刚才对卷积的讲解是粗浅的并且这里有更优雅的解释。通过深入理解我们可以理解卷积的本质并将其应用到许多不同的数据上去。万事开头难第一步是理解卷积原理。 卷积定理 要理解卷积不得不提convolution theorem它将时域和空域上的复杂卷积对应到了频域中的元素间简单的乘积。这个定理非常强大在许多科学领域中得到了广泛应用。卷积定理也是快速傅里叶变换算法被称为20世纪最重要的算法之一的一个原因。 第一个等式是一维连续域上两个连续函数的卷积第二个等式是二维离散域图像上的卷积。这里指的是卷积指的是傅里叶变换表示傅里叶逆变换是一个正规化常量。这里的“离散”指的是数据由有限个变量构成像素一维指的是数据是一维的时间图像则是二维的视频则是三维的。 为了更好地理解卷积定理我们还需要理解数字图像处理中的傅里叶变换。 快速傅里叶变换 快速傅里叶变换是一种将时域和空域中的数据转换到频域上去的算法。傅里叶变换用一些正弦和余弦波的和来表示原函数。必须注意的是傅里叶变换一般涉及到复数也就是说一个实数被变换为一个具有实部和虚部的复数。通常虚部只在一部分领域有用比如将频域变换回到时域和空域上而在这篇博客里会被忽略掉。你可以在下面看到一个信号一个以时间为参数的有周期的函数通常称为信号是如何被傅里叶变换的 红色是时域蓝色为频域 你也许会说从没见过这些东西但我敢肯定你在生活中是见过的如果红色是一首音乐的话那么蓝色值就是你在你的MP3播放器屏幕上看到的频谱 傅里叶域上的图像 我们如何想象图片的频率呢想象一张只有两种模式的纸片现在把纸片竖起来顺着线条的方向看过去就会看到一个一个的亮点。这些以一定间隔分割黑白部分的波就代表着频率。在频域中低频率更接近中央而高频率更接近边缘。频域中高强度亮度、白色的位置代表着原始图像亮度改变的方向。这一点在接下来这张图与其对数傅里叶变换对傅里叶变换的实部取对数这样可以减小像素亮度的差别便于观察更广的亮度区域中特别明显 我们马上就可以发现傅里叶变换包含了关于物体朝向的信息。如果物体被旋转了一个角度从图像像素上可能很难判断但从频域上可以很明显地看出来。 这是个很重要的启发基于傅里叶定理我们知道卷积神经网络在频域上检测图像并且捕捉到了物体的方向信息。于是卷积神经网络就比传统算法更擅长处理旋转后的图像虽然还是比不上人类。 频率过滤与卷积 为什么卷积经常被描述为过滤为什么卷积核经常被称为过滤器呢通过下一个例子可以解释 如果我们对图像执行傅里叶变换并且乘以一个圆形背景填充黑色也就是0我们可以过滤掉所有的高频值它们会成为0因为填充是0。注意过滤后的图像依然有条纹模式但图像质量下降了很多——这就是jpeg压缩算法的工作原理虽然有些不同但用了类似的变换我们变换图形然后只保留部分频率最后将其逆变换为二维图片压缩率就是黑色背景与圆圈的比率。 我们现在将圆圈想象为一个卷积核然后就有了完整的卷积过程——就像在卷积神经网络中看到的那样。要稳定快速地执行傅里叶变换还需要许多技巧但这就是基本理念了。 现在我们已经理解了卷积定理和傅里叶变换我们可以将这些理念应用到其他科学领域以加强我们对深度学习中的卷积的理解。 流体力学的启发 流体力学为空气和水创建了大量的微分方程模型傅里叶变换不但简化了卷积也简化了微分或者说任何利用了微分方程的领域。有时候得到解析解的唯一方法就是对微分方程左右同时执行傅里叶变换。在这个过程中我们常常将解写成两个函数卷积的形式以得到更简单的表达。这是在一个维度上的应用还有在两个维度上的应用比如天文学。 扩散 你可以混合两种液体牛奶和咖啡只要施加一个外力汤勺搅拌——这被称为对流而且是个很快的过程。你也可以耐心等待两种液体自然混合——这被称为扩散通常是很慢的过程。 想象一下一个鱼缸被一块板子隔开两边各有不同浓度的盐水。抽掉板子后两边的盐水会逐步混合为同一个浓度。浓度差越大这个过程越剧烈。 现在想象一下一个鱼缸被 256×256 个板子分割为 256×256 个部分这个数字似乎不对每个部分都有不同浓度的盐水。如果你去掉所有的挡板浓度类似的小块间将不会有多少扩散但浓度差异大的区块间有巨大的扩散。这些小块就是像素点而浓度就是像素的亮度。浓度的扩散就是像素亮度的扩散。 这说明扩散现象与卷积有相似点——初始状态下不同浓度的液体或不同强度的像素。为了完成下一步的解释我们还需要理解传播子。 理解传播子 传播子就是密度函数表示流体微粒应该往哪个方向传播。问题是神经网络中没有这样的概率函数只有一个卷积核——我们要如何统一这两种概念呢 我们可以通过正规化来讲卷积核转化为概率密度函数。这有点像计算输出值的softmax。下面就是对第一个例子中的卷积核执行的softmax结果 现在我们就可以从扩散的角度来理解图像上的卷积了。我们可以把卷积理解为两个扩散流程。首先当像素亮度改变时黑色到白色等会发生扩散然后某个区域的扩散满足卷积核对应的概率分布。这意味着卷积核正在处理的区域中的像素点必须按照这些概率来扩散。 在上面那个边缘检测器中几乎所有临近边缘的信息都会聚集到边缘上这在流体扩散中是不可能的但这里的解释在数学上是成立的。比如说所有低于0.0001的像素都非常可能流动到中间并累加起来。与周围像素区别最大的区域会成为强度的集中地因为扩散最剧烈。反过来说强度最集中的地方说明与周围对比最强烈这也就是物体的边缘所在这解释了为什么这个核是一个边缘检测器。 所以我们就得到了物理解释卷积是信息的扩散。我们可以直接把这种解释运用到其他核上去有时候我们需要先执行一个softmax正规化才能解释但一般来讲核中的数字已经足够说明它想要干什么。比如说你是否能推断下面这个核的的意图 等等有点迷惑 对一个概率化的卷积核怎么会有确定的功能我们必须根据核对应的概率分布也就是传播子来计算单个粒子的扩散不是吗 是的确实如此。但是如果你取一小部分液体比如一滴水你仍然有几百万水分子。虽然单个分子的随机移动满足传播子但大量的分子宏观上的表现是基本确定的。这是统计学上的解释也是流体力学的解释。我们可以把传播子的概率分布解释为信息或说像素亮度的平均分布也就是说我们的解释从流体力学的角度来讲是没问题的。话说回来这里还有一个卷积的随机解释。 量子力学的启发 传播子是量子力学中的重要概念。在量子力学中一个微粒可能处于一种叠加态此时它有两个或两个以上属性使其无法确定位于观测世界中的具体位置。比如一个微粒可能同时存在于两个不同的位置。 但是如果你测量微粒的状态——比如说现在微粒在哪里——它就只能存在于一个具体位置了。换句话说你通过观测破坏了微粒的叠加态。传播子就描述了微粒出现位置的概率分布。比如说在测量后一个微粒可能——根据传播子的概率函数——30%在A70%在B。 通过量子纠缠几个粒子就可以同时储存上百或上百万个状态——这就是量子计算机的威力。 如果我们将这种解释用于深度学习我们可以把图片想象为位于叠加态于是在每个3*3的区块中每个像素同时出现在9个位置。一旦我们应用了卷积我们就执行了一次观测然后每个像素就坍缩到满足概率分布的单个位置上了并且得到的单个像素是所有像素的平均值。为了使这种解释成立必须保证卷积是随机过程。这意味着同一个图片同一个卷积核会产生不同的结果。这种解释没有显式地把谁比作谁但可能启发你如何把卷积用成随机过程或如何发明量子计算机上的卷积网络算法。量子算法能够在线性时间内计算出卷积核描述的所有可能的状态组合。 概率论的启发 卷积与互相关紧密相连。互相关是一种衡量小段信息几秒钟的音乐片段与大段信息整首音乐之间相似度的一种手段youtube使用了类似的技术检测侵权视频。 虽然互相关的公式看起来很难但通过如下手段我们可以马上看到它与深度学习的联系。在图片搜索中我们简单地将query图片上下颠倒作为核然后通过卷积进行互相关检验结果会得到一张有一个或多个亮点的图片亮点所在的位置就是人脸所在的位置。 这个例子也展示了通过补零来使傅里叶变换稳定的一种技巧许多版本的傅里叶变换都使用了这种技巧。另外还有使用了其他padding技巧比如平铺核分治等等。我不会展开讲关于傅里叶变换的文献太多了里面的技巧特别多——特别是对图像来讲。 在更底层卷积网络第一层不会执行互相关校验因为第一层执行的是边缘检测。后面的层得到的都是更抽象的特征就有可能执行互相关了。可以想象这些亮点像素会传递给检测人脸的单元Google Brain项目的网络结构中有一些单元专门识别人脸、猫等等也许用的是互相关 统计学的启发 统计模型和机器学习模型的区别是什么统计模型只关心很少的、可以解释的变量。它们的目的经常是回答问题药品A比药品B好吗 机器学习模型是专注于预测效果的对于年龄X的人群药品A比B的治愈率高17%对年龄Y则是23%。 机器学习模型通常比统计模型更擅长预测但它们不是那么可信。统计模型更擅长得到准确可信的结果就算药品A比B好17%我们也不知道这是不是偶然我们需要统计模型来判断。 对时序数据有两种重要的模型weighted moving average 和autoregressive模型后者可归入ARIMA model (autoregressive integrated moving average model)。比起LSTMARIMA很弱。但在低维度数据1-5维上ARIMA非常健壮。虽然它们有点难以解释但ARIMA绝不是像深度学习算法那样的黑盒子。如果你需要一个可信的模型这是个巨大的优势。 我们可以将这些统计模型写成卷积的形式然后深度学习中的卷积就可以解释为产生局部ARIMA特征的函数了。这两种形式并不完全重合使用需谨慎。 C是一个以核为参数的函数white noise是正规化的均值为0方差为1的互不相关的数据。 当我们预处理数据的时候经常将数据处理为类似white noise的形式将数据移动到均值为0将方差调整为1。我们很少去除数据的相关性因为计算复杂度高。但是在概念上是很简单的我们旋转坐标轴以重合数据的特征向量 现在如果我们将C作为bias我们就会觉得这与卷积神经网络很像。所以卷积层的输出可被解释为白噪音数据经过autoregressive model的输出。 weighted moving average的解释更简单就是输入数据与某个固定的核的卷积。看看文末的高斯平滑核就会明白这个解释。高斯平滑核可以被看做每个像素与其邻居的平均或者说每个像素被其邻居平均边缘模糊。 虽然单个核无法同时创建autoregressive 和 weighted moving average 特征但我们可以使用多个核来产生不同的特征。 总结 这篇博客中我们知道了卷积是什么、为什么在深度学习中这么有用。图片区块的解释很容易理解和计算但有其理论局限性。我们通过学习傅里叶变换知道傅里叶变换后的时域上有很多关于物体朝向的信息。通过强大的卷积定理我们理解了卷积是一种在像素间的信息流动。之后我们拓展了量子力学中传播子的概念得到了一个确定过程中的随机解释。我们展示了互相关与卷积的相似性并且卷积网络的性能可能是基于feature map间的互相关程度的互相关程度是通过卷积校验的。最后我们将卷积与两种统计模型关联了起来。 个人来讲我觉得写这篇博客很有趣。曾经很长一段时间我都觉得本科的数学和统计课是浪费时间因为它们太不实用了哪怕是应用数学。但之后——就像突然中大奖一样——这些知识都相互串起来了并且带了新的理解。我觉得这是个绝妙的例子启示我们应该耐心地学习所有的大学课程——哪怕它们一开始看起来没有用。 上文高斯平滑核问题的答案
http://www.zqtcl.cn/news/521019/

相关文章:

  • 网站开发php支付接口网站平台建设缴纳什么税
  • 百度文库推广网站庆云网站seo
  • 全网通网站wordpress 按点击调用热门文章
  • 添加网站栏目的步骤网站需求分析怎么做
  • 做网站用那一种语言最好武邑网站建设价格
  • 哈尔滨网站制作招聘互动的网站
  • 专业网站建设品牌网站建设基础课件
  • 自学网站编程网站建设银行北京冬奥会纪念币发行时间
  • 个人网站备案需要盖章吗做网站用什么颜色好
  • 在线制作论坛网站做网站开发团队
  • 2017年网站建设工作总结dhru商城网站建设
  • 建设网站需要申请深圳的网站建设的公司
  • 教育类的网站案例门户网站建设推广
  • 网站建设公司哪家比较好外贸网站建设公司价格
  • 做网站大概价格网站备案填写
  • 网站建设容易出现的问题网站建设学习网公司有哪些
  • 做网站的准备什么com域名
  • 百度资料怎么做网站赣州有没有做网站的
  • 网站上地图怎么做的福建省晋江市建设局网站
  • 休闲咖啡厅网站开发目标站内推广的方法和工具
  • 东莞做营销型网站怎样利用网站做引流
  • 国际1688网站网络平台宣传费用
  • 免费网站自助建站18款禁游戏黄app入口
  • 网站建设要经历哪些步骤?wordpress主题king
  • 个人定制网站外贸免费网站建设
  • ASP网站建设实训报告总结宜昌本地网站建设
  • 甘肃省建设厅官方网站张睿建立网站服务器
  • 有没有做博物馆的3d网站网页美工设计岗前培训
  • 如何防止网站被盗长沙知名网站建设
  • 汕尾住房和建设局网站山西招标网