当前位置: 首页 > news >正文

做3d效果图有什么好网站阜阳企业网站建设

做3d效果图有什么好网站,阜阳企业网站建设,网站建设企业号助手,绵阳网站建设费用笔记来源—— 【重温经典】大白话讲解LSTM长短期记忆网络 如何缓解梯度消失#xff0c;手把手公式推导反向传播 LSTM网络结构 RNN结构 下面拉出一个单元结构进行讲解 #xff1a;记忆细胞#xff0c;t-1时刻的记忆细胞 :表示状态,t-1时刻的状态 正是这样经过了一个单元手把手公式推导反向传播 LSTM网络结构 RNN结构 下面拉出一个单元结构进行讲解 记忆细胞t-1时刻的记忆细胞 :表示状态,t-1时刻的状态 正是这样经过了一个单元我们输出了新的的状态跟记忆细胞 门单元   :forget,遗忘门 :更新门 :输出门 公式推导 这里的小就认为是我们的 结构讲解 通过例子我们来理解一下 假设我们要考试左边的时间部A是我们的高等数学中间的时间部是我们的线性代数 假设我们要去考线性代数就相当于我们要去复习我们的线性代数打个比方就是我们已经翻开了线性代数的课本以及习题开始复习。中间那些条条就相当于我们复习形成的记忆。最后上面的就是我们要去考试就是我们考试的一个分数。复习当中会形成我们新的记忆会带着我们复习好的记忆拿去考试。最后下面的就是我们考完试的这样的一个状态。 之后就好理解了前一科我们要去考高等数学那么就是我们考完高等数学的这样一个记忆。就是我们复习完之后所形成的跟高数有关的一些记忆。左下脚的就是考完高数的这样一个状态。 然后我们就有一个目标我们希望考完的每一个得分都有好的一个目标/成绩上面的因为我们这里是一个有监督学习我们需要有一个好的成绩来监督我们每一个参数的迭代更新。 遗忘门 假设我们的脑容量是有限的我们在考完高等数学之后需要遗忘其相关内容给我们的线性代数留空间。 刚刚我们了解到我们需要去复习我们的线性代数第二步就是我们需要把线性代数没有关的内容遗忘掉所以就是遗忘掉我们过去积累下来的一些记忆。 如何操作 我们知道里面有所有的数都是介于0-1例如[01101],就是一个向量通过跟这样的一个向量相乘他就会把向量里面对应的位置的一些记忆的内容给调整是0就遗忘是1就调整。 更新门 注这里的小就是之前说的 这里作用的对象就是这里的就相当于我们形成的新的记忆但是这个新的记忆并不是全都有用所以我们这里要有一个门要去选择性的提取。所以这里的就是可以过滤掉没有用的记忆。 然后到这里就形成了我们新的记忆 这里的就很容易理解了这里的就跟我们过去的记忆和当下生成的记忆有关系将他们相加结合起来。 tanh是激活函数 输出门 这里分红色的tanh如何理解 可以理解为它可以将我们记忆的内容转化为答题的能力 因为我们复习到的东西很多很全面最后我们考试的时候不可能将所有复习到的东西都考一遍有可能只考到其中的一部分所以我们这里的的作用就是我们只需要用到其中的一部分的知识来进行答题。 RNN梯度消失回顾 什么是RNN RNN是递归神经网络Recurrent Neural Network的缩写。它是一种神经网络结构专门用于处理序列数据具有记忆和顺序处理的能力。 在传统的前馈神经网络中每个输入与输出之间都是独立的而RNN通过引入循环连接允许信息在网络中传递并保持状态。 RNN的基本结构包括 循环连接Recurrent ConnectionsRNN中的每个时间步都有一个循环连接使得网络可以在处理当前输入时考虑之前的信息。这种连接使得RNN能够处理任意长度的序列输入。 隐藏状态Hidden State在RNN的每个时间步网络都会产生一个隐藏状态用于存储之前时间步的信息。隐藏状态是RNN的记忆使得网络能够在处理序列时保持上下文信息。 时间步Time StepsRNN处理序列数据时会将输入序列分割成多个时间步。在每个时间步网络接收一个输入并生成一个输出和一个隐藏状态然后将隐藏状态传递到下一个时间步。 递归单元Recurrent UnitsRNN中的递归单元通常采用LSTMLong Short-Term Memory单元或GRUGated Recurrent Unit单元等结构以解决传统RNN中的梯度消失和梯度爆炸等问题。 RNN在自然语言处理如语言建模、机器翻译、情感分析、时间序列分析如股票预测、天气预测和序列生成如文本生成、音乐生成等领域都有广泛的应用。 对于RNN梯度消失的这个问题可以参考我这篇笔记 RNN循环神经网络及其梯度消失笔记 LSTM如何缓解梯度消失 可以看到我们的参数是非常多的 我们以参数为例推导一下我们反向传播的过程 假设我们最右边就是t3,中间t2,最前面t1 对三个位置的分别求导 这是我们求导的路径 不同路线的求偏导 简化方程 下面就是我们简化后的方程 由于要求第三个但路径是非常多的就没有写推导的方程了就写了一下路径 合并一下同类项并将这两个路径组合 把上面的这个路径简化为下面那样 我们继续把从到的路继续简化 再表达为右边的公式 最后得到的就是右边的这些而且我们发现了连乘项的出现然后我们针对这个部分对其求一下 这个式子有一个特点就是他是由4个部分进行相加的 这些参数是可以去调控他值的一个大小的也就是说我们的模型可以通过学习去控制它值的一个大小的。从而去控制的值的大小的。也就是说我可以去控制这些参数而去使得处于比较接近于一个1的数。 我们可以知道当我们的时间跨度越长的时候 我们的路径越长中间的累乘项也会更多这个部分就容易带来我们的梯度消失的可能所以这个部分我们没有办法去把控。 但是这里我们的连乘项可以灵活的去调控它的参数去实现很多1*1*1的效果就导致连乘的效果大大的削弱了梯度消失的可能性就大大的降低了所以就极大的缓解了梯度消失的可能性。
http://www.zqtcl.cn/news/967023/

相关文章:

  • 2019年的阜南县建设修路网站洛阳哪里有做网站的
  • 家里电脑可以做网站服务器吗佛山网络公司哪家最好
  • 做网站属于无形资产还是费用网站制作二维码
  • ps为什么做不了视频网站最近做网站开发有前途没
  • 平面设计师参考网站做网站建设推广好做吗
  • 网站被别的域名绑定泰安做网站网络公司
  • 建设部网站业绩如何录入免费素材图片下载
  • 佛山美容网站建设如何有效的推广宣传
  • 网站全屏轮播怎么做nginx 代理 wordpress
  • 海淀公司网站搭建二级目录怎么做网站
  • 石家庄定制网站建设凡科建站做的网站收录慢吗
  • 海口企业自助建站品牌建设三年行动方案
  • 网站建设流程平台域名分析网站
  • 旅游类网站如何做推广随机网站生成器
  • 竖导航网站做网站被坑
  • 散文古诗网站建设目标做公司网站要钱吗
  • 营销网站建设规划小浪底水利枢纽建设管理局网站
  • 建站的目的网站的月度流量统计报告怎么做
  • 网站备案添加域名拼多多代运营公司十大排名
  • 网站访客qq获取系统 报价客户管理系统入口
  • 院网站建设情况报告怎么在虚拟主机上建网站
  • 厦门网站建设系统鞍山百度网站怎么制作
  • html5建设网站app开发公司不退款该怎么投诉
  • 南昌网站建设公务手工制作代加工接单网
  • 排名好的手机网站建设你知道吗 网站
  • 网站信息组织优化成都网站制作计划
  • 网站网页背景颜色 多彩做搜狗网站点击赚钱
  • 门户网站开发 系统介绍wordpress 代码在哪
  • 石家庄网站设计建设门面设计效果图
  • 公司设计网站多少钱月子中心网站设计