当前位置: 首页 > news >正文

网站建设dw 什么软件佛山微信网站推广多少钱

网站建设dw 什么软件,佛山微信网站推广多少钱,学校网站建设注意什么,做ppt选小图案的网站欢迎来到循环神经网络的插图指南。我是迈克尔#xff0c;也被称为LearnedVector#xff0c;我是AI语音领域的机器学习工程师。如果你刚刚开始使用ML并希望在Recurrent神经网络背后获得一些直觉#xff0c;那么这篇文章就适合你。 循环神经网络是一种强大的技术#xff0c;… 欢迎来到循环神经网络的插图指南。我是迈克尔也被称为LearnedVector我是AI语音领域的机器学习工程师。如果你刚刚开始使用ML并希望在Recurrent神经网络背后获得一些直觉那么这篇文章就适合你。 循环神经网络是一种强大的技术如果你想进入机器学习那么理解它就变得非常重要了。如果你使用智能手机或经常上网那么你会经常使用RNN的应用程序。因为循环神经网络已经被用于语音识别、语言翻译、股票预测等等它甚至用于图像识别来描述图片中的内容。 所以我知道有许多关于循环神经网络的指南但我想以分享插图的方式解释我是如何理解它的。我将避免讲它背后的数学知识而专注于RNN背后的真实的含义。通过阅读这篇文章你应该对RNN有一个很好的理解。 序列数据 RNN是神经网络中的一种它擅长对序列数据进行建模处理。要理解这意味着什么让我们做一个小实验。假设你拍摄了一张球在时间上移动的静态快照。 我们还要说你想预测球的移动方向。因此只有你在屏幕上看到的信息你才能做到这一点。但是你可以猜测但你提出的任何答案都是随机的猜测。如果不知道球的位置就没有足够的数据来预测球的位置。 如果你连续记录球位置的快照那么你将有足够的信息来做出更好的预测。 所以这是一个序列一个特定的顺序其中是一个事物跟随另一个事物。有了这些信息你现在可以看到球向右移动。 序列数据有很多种形式。音频是一种自然的序列你可以将音频频谱图分成块并将其馈入RNN。 音频频谱图切成块 文本也是一种形式的序列你可以将文本分成一系列字符或一系列单词。 顺序存储 现在我们知道了RNN擅长处理预测的序列数据但是它是如何实现的呢 它通过我喜欢称为顺序存储的概念来做到这一点。获得顺序存储的能力意味着什么我们通过一个小例子来说明它。 我想邀请你说出你脑海中的字母。 这很简单吧如果你被教了这个特定的序列你应该能够很快记起它。 那么现在尝试反着说这些字母。 我敢打赌这要困难得多。除非你之前练过这个特定的序列否则你可能会遇到困难。 现在来一个更有趣的咱们从字母F开始。 首先你会在前几个字母上挣扎但是在你的大脑拿起图案后剩下的就会自然而然。 因此有一个非常合乎逻辑的原因是困难的。你将字母表作为序列学习顺序存储是一种使大脑更容易识别序列模式的机制。 递归神经网络 这样咱们就可以知道RNN有顺序存储的这个抽象概念但是RNN如何学习这个概念呢那么让我们来看一个传统的神经网络也称为前馈神经网络。它有输入层隐藏层和输出层。 我们如何训练一个前馈神经网络以便能够使用以前的信息来影响以后的信息呢如果我们在神经网络中添加一个可以传递先前信息的循环它将会变成什么呢 这基本上就是一个递归神经网络了。RNN让循环机制充当高速公路以允许信息从一个步骤流到下一个步骤。 将隐藏状态传递给下一个步骤 此信息是隐藏状态它是先前输入的表示。让我们通过一个RNN用例来更好地理解它是如何工作的。 假设我们想要构建一个聊天机器人以为它们现在非常受欢迎。假设聊天机器人可以根据用户输入的文本对意图进行分类。 对用户输入的意图进行分类 为了解决这个问题。首先我们将使用RNN对文本序列进行编码。然后我们将RNN输出馈送到前馈神经网络中该网络将对用户输入意图进行分类。 假设用户输入what time is it首先我们将句子分解为单个单词。RNN按顺序工作所以我们一次只能输入一个字。 将一个句子分成单词序列 第一步是将“What”输入RNNRNN编码“what”并产生输出。 对于下一步我们提供单词“time”和上一步中的隐藏状态。RNN现在有关于“what”和“time”这两个词的信息。 我们重复这个过程直到最后一步。你可以通过最后一步看到RNN编码了前面步骤中所有单词的信息。 由于最终输出是从序列的部分创建的因此我们应该能够获取最终输出并将其传递给前馈层以对意图进行分类。 对于那些喜欢在这里查看代码的人来说使用python展示了控制流程应该是最好的方式。 RNN控制流的伪代码 首先初始化网络层和初始隐藏状态。隐藏状态的形状和维度将取决于你的递归神经网络的形状和维度。然后循环输入将单词和隐藏状态传递给RNN。RNN返回输出和修改的隐藏状态接着就继续循环。最后将输出传递给前馈层然后返回预测。整个过程就是这样进行递归神经网络的正向传递的控制流程是for循环。 梯度消失 你可能已经注意到隐藏状态中奇怪的颜色分布。这是为了说明RNN被称为短期记忆的问题。 RNN的最终隐藏状态 短期记忆问题是由臭名昭着的梯度消失问题引起的这在其他神经网络架构中也很普遍。由于RNN处理很多步骤因此难以保留先前步骤中的信息。正如你所看到的在最后的时间步骤中“what”和“time”这个词的信息几乎不存在。短期记忆和梯度消失是由于反向传播的性质引起的反向传播是用于训练和优化神经网络的算法。为了理解这是为什么让我们来看看反向传播对深度前馈神经网络的影响。 训练神经网络有三个主要步骤。首先它进行前向传递并进行预测。其次它使用损失函数将预测与基础事实进行比较。损失函数输出一个错误值该错误值是对网络执行得有多糟糕的估计。最后它使用该误差值进行反向传播计算网络中每个节点的梯度。 梯度是用于调整网络内部权重的值从而更新整个网络。梯度越大调整越大反之亦然这也就是问题所在。在进行反向传播时图层中的每个节点都会根据渐变效果计算它在其前面的图层中的渐变。因此如果在它之前对层的调整很小那么对当前层的调整将更小。 这会导致渐变在向后传播时呈指数级收缩。由于梯度极小内部权重几乎没有调整因此较早的层无法进行任何学习。这就是消失的梯度问题。 梯度向后传播时收缩 让我们看看这如何适用于递归神经网络。你可以将循环神经网络中的每个时间步骤视为一个层。为了训练一个递归神经网络你使用了一种称为通过时间反向传播的方法。这样梯度值在每个时间步长传播时将呈指数级收缩。 随着时间的推移梯度会收缩 同样梯度值将用于在神经网络权重中进行调整从而允许其学习。小的渐变意味着小的调整。这将导致最前面的层没有优化。 由于梯度消失RNN不会跨时间步骤学习远程依赖性。这意味着在尝试预测用户的意图时有可能不考虑“what”和“time”这两个词。然后网络就可能作出的猜测是“is it”。这很模糊即使是人类也很难辨认这到底是什么意思。因此无法在较早的时间步骤上学习会导致网络具有短期记忆。 LSTM和GRU RNN会受到短期记忆的影响那么我们如何应对呢为了减轻短期记忆的影响研究者们创建了两个专门的递归神经网络一种叫做长短期记忆或简称LSTM。另一个是门控循环单位或GRU。LSTM和GRU本质上就像RNN一样但它们能够使用称为“门”的机制来学习长期依赖。这些门是不同的张量操作可以学习添加或删除隐藏状态的信息。由于这种能力短期记忆对他们来说不是一个问题。如果你想了解有关LSTM和GRU的更多信息你可以在其上查看我的插图视频。 总结 总而言之RNN适用于处理序列数据以进行预测但却会受到短期记忆的影响。vanilla RNN的短期存储问题并不意味着要完全跳过它们并使用更多进化版本如LSTM或GRU。RNN具有更快训练和使用更少计算资源的优势这是因为要计算的张量操作较少。当你期望对具有长期依赖的较长序列建模时你应该使用LSTM或GRU。 原文链接 本文为云栖社区原创内容未经允许不得转载。
http://www.zqtcl.cn/news/679786/

相关文章:

  • 企业网站建设顾问wordpress如何用API采集
  • win7网站后台无法编辑vr网站建设
  • 做头发个人网站制作素材dw中做网站的步骤
  • 学校网站做几级等保网页制作与维护
  • 十堰外贸网站建设松滋做网站
  • 网站导航条青浦徐泾网站建设
  • 厦门网站建设一般多少钱店铺域名是什么意思
  • 网站关键词搜索排名怎么做雅奇小蘑菇做网站好不好用
  • 手机网站案例建设网站地图素材
  • 企业网站制作比较好的如何设计一个网页首页代码
  • 维护网站成本网站建设进度图
  • asp.net做织梦网站设计手机网站建设
  • 江苏省住房和城乡建设局网站首页北京大型网站制作公司
  • 网站改版工作方案网站设计技能培训
  • 佳木斯市网站建设淄博网站开发招聘
  • 学习软件的网站先备案先建网站
  • 建立网站 知乎常州网站制作机构
  • 洛阳建设网站上海高端室内设计事务所
  • 做高清图的网站wordpress分类自定义文字
  • 创建站点如何做网站如何利用分类信息网站做推广
  • wordpress 拍卖插件找文网优化的技术团队
  • 建站素材网自助餐火锅网站建设
  • 企业型网站建设方案农村电商网站设计与发展现状
  • 建站快车凡科企业网站建设合同(一)
  • 阜平网站建设在广州做seo找哪家公司
  • 怎么做农家乐联盟网站六安建设机械网站
  • 网站开发行业标准江苏网站开发公司
  • 服装技术支持东莞网站建设如何加强企业网站建设论文
  • 中英双语网站怎么做深圳勘察设计协会
  • 用dw做网站维护教程梧州网站建设制作