当前位置: 首页 > news >正文

做药公司的网站前置审批腾网站建设

做药公司的网站前置审批,腾网站建设,怎样做约票的网站意思,存量权益登记在哪个网站上做数学原理#xff1a; (1) 前向传播的方差一致性 假设输入 x 的均值为 0#xff0c;方差为 σx2σ_x^2σx2​#xff0c;权重 W的均值为 0#xff0c;方差为 σW2σ_W^2σW2​#xff0c;则输出 zWxzWxzWx的方差为#xff1a; Var(z)nin⋅Var(W)⋅Var(x) Var(z)n_{in}⋅Va…数学原理 (1) 前向传播的方差一致性 假设输入 x 的均值为 0方差为 σx2σ_x^2σx2​权重 W的均值为 0方差为 σW2σ_W^2σW2​则输出 zWxzWxzWx的方差为 Var(z)nin⋅Var(W)⋅Var(x) Var(z)n_{in}⋅Var(W)⋅Var(x) Var(z)nin​⋅Var(W)⋅Var(x) 为了使 Var(z)Var(x)需要 nin⋅Var(W)1  ⟹  Var(W)1nin n_{in}⋅Var(W)1  ⟹  Var(W)\frac{1}{n_{in}} nin​⋅Var(W)1  ⟹  Var(W)nin​1​ 其中 ninn_{in}nin​是输入维度fan_in。这里乘以 nin 的原因是输出 z 是由 nin 个输入 x 的线性组合得到的每个输入 x 都与一个权重 W 相乘。因此输出 z 的方差是 nin 个独立的 Wx 项的方差之和。 (2) 反向传播的梯度方差一致性 在反向传播过程中梯度 ∂L∂x\frac{∂L}{∂x}∂x∂L​ 是通过链式法则计算得到的其中 L 是损失函数x 是输入z 是输出。梯度∂L∂x\frac{∂L}{∂x}∂x∂L​可以表示为 ∂L∂x∂L∂z.∂z∂x \frac{∂L}{∂x}\frac{∂L}{∂z}.\frac{∂z}{∂x} ∂x∂L​∂z∂L​.∂x∂z​ 假设 zWx其中 W 是权重矩阵那么 ∂z∂xW\frac{∂z}{∂x}W∂x∂z​W。因此梯度 ∂L∂x\frac{∂L}{∂x}∂x∂L​可以写为 ∂L∂x∂L∂zW\frac{∂L}{∂x}\frac{∂L}{∂z}W∂x∂L​∂z∂L​W 反向传播时梯度 ∂L∂x\frac{∂L}{∂x}∂x∂L​ 的方差应与 ∂L∂z\frac{∂L}{∂z}∂z∂L​ 相同因此 nout⋅Var(W)1  ⟹  Var(W)1nout n_{out}⋅Var(W)1  ⟹  Var(W)\frac{1}{n_{out}} nout​⋅Var(W)1  ⟹  Var(W)nout​1​ 其中 noutn_{out}nout​是输出维度fan_out。为了保持梯度的方差一致性我们需要确保每个输入维度 nin 的梯度方差与输出维度 nout 的梯度方差相同。因此我们需要将 W 的方差乘以 nout以确保梯度的方差在反向传播过程中保持一致。 (3) 综合考虑 为了同时平衡前向传播和反向传播Xavier 采用 Var(W)2ninnout Var(W)\frac{2}{n_{in}n_{out}} Var(W)nin​nout​2​ 权重从以下分布中采样 均匀分布 W∼U(−6ninnout,6ninnout) W\sim\mathrm{U}\left(-\frac{\sqrt{6}}{\sqrt{n_\mathrm{in}n_\mathrm{out}}},\frac{\sqrt{6}}{\sqrt{n_\mathrm{in}n_\mathrm{out}}}\right) W∼U(−nin​nout​​6​​,nin​nout​​6​​) 在Xavier初始化中我们选择 a−6ninnouta−\sqrt{\frac{6}{n_{in}n_{out}}}a−nin​nout​6​​ 和 b6ninnoutb\sqrt{\frac{6}{n_{in}n_{out}}}bnin​nout​6​​这样方差为 Var(W)(b−a)212(26ninnout)2124⋅6ninnout122ninnout Var(W)\frac{(b−a)^2}{12}\frac{(2\sqrt{\frac{6}{n_{in}n_{out}}})^2}{12}\frac{4⋅\frac{6}{ninnout}}{12}\frac{2}{n_{in}n_{out}} Var(W)12(b−a)2​12(2nin​nout​6​​)2​124⋅ninnout6​​nin​nout​2​ 正态分布 W∼N(0,2ninnout) W\sim\mathrm{N}\left(0,\frac{2}{n_\mathrm{in}n_\mathrm{out}}\right) W∼N(0,nin​nout​2​) N(0,std2) \mathcal{N}(0, \text{std}^2) N(0,std2) 其中 ninn_{\text{in}}nin​ 是当前层的输入神经元数量noutn_{\text{out}}nout​是输出神经元数量。 在前向传播中输出的方差受 ninn_{in}nin​ 影响。在反向传播中梯度的方差受 noutn_{out}nout​ 影响。
http://www.zqtcl.cn/news/71877/

相关文章:

  • 茂名网站建设wordpress自定义字段判断
  • 微信公众号网站开发注意如何做cad图纸模板下载网站
  • 织梦网站地图如何做高校学风建设专栏网站
  • dedecms学校网站模板wordpress背景颜色
  • 易语言可以做网站管理系统吗win7 iis添加网站
  • 全省建设信息网站网站关键词都没有了
  • 怎样做网站seo优化网站建设教程培训
  • dede网站模板怎么改上海人才网最新招聘2021
  • 中企做一个网站多少钱报价网站系统
  • 网站建设公司怎么发展广州地铁运营时间
  • 盐城网站开发招代理怎么搭建网站
  • 怎么把自己做的网站放到百度上百度关键词搜索热度
  • 网站设计建设定制凡科建设网站别人能进去么
  • 个人博客网站页面百度软件中心
  • 素材网站 模板网页设计实训报告范例
  • 制作个人博客网站做图模板网站有哪些内容
  • 最好的wordpress网站如何高效率的建设网站
  • 做好中心网站建设工作做特卖的网站有哪些
  • 企业门户网站开发费用怎么利用互联网平台赚钱
  • 网站网页设计公司有哪些天津网站建设设计开发公司
  • 网站被加入js广告做图哪个网站素材多
  • 安徽省住房城乡建设厅网站公示个人网站建设规划案例
  • 长春市建设厅网站asp网站后台管理系统源码
  • h5建站模板电子商务网站建设与管理a
  • 企业宣传软文淘宝客网站怎么做seo
  • 武清网站开发tjniu微信企业邮箱
  • ps工具设计网站厦门网站建设人才
  • 3g电影网站排行榜沈阳做网站最好的公司
  • 楚雄建网站建立简单网站
  • 实业有限公司网站怎么做上海排名seo公司