当前位置: 首页 > news >正文

湖南设计网站机构hcms wordpress

湖南设计网站机构,hcms wordpress,安装wordpress出现500错误,erp生产订单管理系统批量归一化#xff08;Batch Normalization, BN#xff09;和层归一化#xff08;Layer Normalization, LN#xff09;是深度学习中常用的两种归一化技术#xff0c;它们主要用于解决训练过程中的内部协变量偏移问题#xff0c;加速模型收敛和提高稳定性。 1. 为什么需要…批量归一化Batch Normalization, BN和层归一化Layer Normalization, LN是深度学习中常用的两种归一化技术它们主要用于解决训练过程中的内部协变量偏移问题加速模型收敛和提高稳定性。 1. 为什么需要归一化 由于数据来源的不同不同数据的特征分布是不一致的。模型在训练过程中学习了这个批次的特征分布如果下一批次的特征分布截然不同那么模型的参数就会剧烈变化得学习很多次之后才能平衡好不同特征分布的权重造成训练过程变慢。 借用李沐老师的一张图 在深度网络中梯度通过反向传播需要从顶部层逐层传递到底部层。由于链式法则每传递一层梯度都会乘以该层权重的导数。如果这些导数较小梯度会迅速衰减导致底部层的权重更新非常缓慢这就是所谓的梯度消失问题。 在深度学习中底层数据会学习到底层的特征比如图像的轮廓顶层数据会学习到高级的特征比如细腻的纹理等等。高级的纹理特征往往依赖于底层的基础特征如果底层没有收敛的话顶层的微调意义并不大。每一次的底层特征变化都会让顶层重新学习所以底层的收敛慢决定了整个模型的收敛速度慢。 因此需要归一化来让将所有批数据强制在统一的数据分布下加速收敛。 2. 什么是归一化 以批量归一化举例 但是批量归一化同时也降低了模型的拟合能力归一化之后的输入分布被强制拉到均值为0和标准差为1的正态分布上来简单来说特征之间的距离不会跑的很远大部分特征都在正态分布的那个峰值附近。 以Sigmoid激活函数为例批量归一化之后数据整体处于函数的非饱和区域只包含线性变换多层的线性函数跟一层线性网络是等价的网络的表达能力下降破坏了之前学习到的特征分布。因此为了使得归一化不对网络的表达能力造成负面印象可以通过一个附加的缩放和平移变换改变取值区间。 3. 归一化是怎么实现的 批量归一化和层归一化的区别可以看下图 如果卷积计算输出多个通道我们需要对这些通道的输出分别做批量归一化且每个通道都拥有独立的拉伸和偏移参数并均为标量。设小批量中有N个样本。在单个通道上假设卷积计算输出的高和宽分别为h和w。我们需要对该通道中N×h×w个元素同时做批量归一化。 而层归一化就是对一个样本中的所有通道进行取归一化计算。 个人理解是BN消除特征间的差别而保留样本间的差别LN保留了特征间的差别而消除了样本间的差别。 4. 注意点 训练时的均值和方差是计算每个批次中的样本而训练时则是计算所有样本中的均值和方差。
http://www.zqtcl.cn/news/935272/

相关文章:

  • 网站建设需要的文案一个网站的后台怎么做
  • 电影网站建设模板营销方式都有哪些
  • 书店商城网站建设方案未央免费做网站
  • 北京房产网北京二手房企业网站seo方案案例
  • 大连品牌官网建站二级建造师最好的网站
  • python开发工具搜索引擎优化的英语简称
  • 做产品代理上哪个网站好东莞公司网上推广
  • 专业制作网站公司上海广告公司联系方式
  • 古交市网站建设公司四川省建设厅电子政务网站
  • 清河网站建设费用50万做网站
  • 怎么找网站的根目录平台类网站营销方案
  • 网站关键词 价格生成山西建设工程备案网站
  • 网站开发入哪个会计科目设计师自己的网站
  • php做网站界面代码定制网页设计报价
  • 重庆智能模板建站wordpress+widget+开发
  • vps网站空间时尚网站首页设计
  • 美容行业网站建设方案网站建设需求背景
  • 贵阳做网站找哪家好长沙部分风险区域调整
  • 设计网站 常用微信网站建设口碑好
  • 网站建设加盟列举网络推广的方式
  • 大连博硕网站建设dw做网站背景音乐
  • 江苏省建设执业网站北京做胃镜哪好德胜门网站I
  • 南京网站开发南京乐识好郑州宣传片制作多少钱
  • 昆明网站制作方案定制wordpress图片广告
  • 宜宾seo网站建设辽宁专业网站建设大全
  • 同一产品做多个网站网页打不开的解决方法
  • 手机建个人网站c 做网站开发实例
  • 做网站竞价没有点击率教你用模板做网站
  • 网站与域名南宁网络系统开发
  • 网站的域名做邮箱吗怎么建立一个网站让外国人浏览