当前位置: 首页 > news >正文

深圳+服装+网站建设wordpress获取指定分类

深圳+服装+网站建设,wordpress获取指定分类,2W网站建设的作用,2023年适合小学生的新闻有哪些【深度学习】图像去噪 是在 【深度学习】计算机视觉 系列文章的基础上#xff0c;再次针对深度学习#xff08;尤其是图像去噪方面#xff09;的基础知识有更深入学习和巩固。 1 DnCNN 1.1 网络结构 1.1.1 残差学习 1.1.2 Batch Normalization (BN) 1.1.2.1 背景和目标…【深度学习】图像去噪 是在 【深度学习】计算机视觉 系列文章的基础上再次针对深度学习尤其是图像去噪方面的基础知识有更深入学习和巩固。 1 DnCNN 1.1 网络结构 1.1.1 残差学习 1.1.2 Batch Normalization (BN) 1.1.2.1 背景和目标 批归一化是DnCNN第二个特点。在阅读代码的时候我对model.train()和model.eval()产生了疑问它们的作用是什么 一般用法是在训练开始之前写上 model.trian() 在测试时写上 model.eval() 。 model.train()启用BN层和Dropout。model.eval()不启用BN层和Dropout。 Dropout此处不做过多解释对于BN层model.train()是保证BN层能够用到每一批数据的均值和方差model.eval()是保证BN层能够用全部训练数据的均值和方差。训练完 train 样本后生成的模型 model 要用来测试样本了在 model(test) 之前需要加上model.eval()否则的话有输入数据即使不训练它也会改变权值。 如果在测试的时候启用了Dropout那么网络会随机丢弃某几个神经元这样神经网络每一次生成的结果不是固定的生成的质量也不稳定。那BN是如何影响网络的这就要先学习BN具体是如何实现的。 1.1.2.2 核心问题 在CNN训练时绝大多数都采用mini-batch使用随机梯度下降算法进行训练那么随着输入数据的不断变化以及网络中参数不断调整网络的各层输入数据的分布则会不断变化那么各层在训练的过程中就需要不断的改变以适应这种新的数据分布从而造成网络训练困难难以拟合的问题。 我的理解针对网络的每一层例如x层我们需要保证不管输入什么样的图片数据经过网络层层输入到达x层后它们的数据分布总是类似的这样我们就能针对x层的特点去修改x层的权重慢慢拟合而不是刚适应了某张图片的数据特点换了一张图片又要大幅度调整。 BN算法解决的就是这样的问题他通过对每一层的输入进行归一化保证每层的输入数据分布是稳定的从而达到加速训练的目的。 1.1.2.3 步骤 Standardization首先对个进行 Standardization得到 zero mean unit variance的分布̂ 。 其中 x k x^{k} xk表示输入数据的第k维 E [ x k ] E[x^{k}] E[xk]表示该维的平均值 V a r [ x k ] \sqrt{Var[x^{k}]} Var[xk] ​为标准差。 scale and shift然后再对̂ 进行scale and shift缩放并平移到新的分布具有新的均值方差。 我们思考一个问题在第一步中减均值除方差得到的分布是正态分布我们能否认为正态分布就是最好或最能体现我们训练样本的特征分布呢不能。这种分布不一定是前面一层要学习到的数据分布这样强行归一化就会破坏掉刚刚学习到的特征比如数据本身就很不对称不符合正态分布或者激活函数未必是对“方差为1”的数据最好的效果比如Softmax激活函数在-1~1之间的函数的梯度不大那么非线性变换的作用就不能很好的体现。换言之就是减均值除方差操作后可能会削弱网络的性能。 针对上述问题BN算法在第二步中设置了两个可学习的变量γ和β然后用这两个可学习的变量去还原上一层应该学到的数据分布。 1.1.2.4 BN算法在训练和测试时的应用 了解完BN的原理后我又有个疑问如果训练过程中启用了BN但是在测试的时候没有启用BN那么输入的测试图片在x层没有经过处理它的分布可能不适用于我们训练好的权重影响模型效果。而且DnCNN最终的输出是噪声图所以我们不需要担心正则化会影响原始图片或者输入图片为什么要禁用呢其实我这里的启用和禁用理解错了。 训练时首先提取每次迭代时的每个mini-batch的平均值和方差进行归一化再通过两个可学习的变量恢复要学习的特征。 测试时没有mini-batch了即平均值为所有mini-batch的平均值的平均值而方差为每个batch的方差的无偏估计。 所以BN的启用和不启用不是说这层的存在与否而是说这层的参数是否固定。 参考来源 【Pytorch】model.train() 和 model.eval() 原理与用法 深度学习——Batch Normalization算法原理和作用 Batch Normalization的原理和作用 什么是无偏估计 无偏估计 均值和期望的关系
http://www.zqtcl.cn/news/22334/

相关文章:

  • 厨具网站模板郑州企业健康码
  • 好学校平台网站模板下载不了外贸出口公司网站建设方案
  • wordpress网站如何添加栏目中国十大管理咨询公司排名
  • 360网站运营关键词网站
  • 免费推广网站平台排名手机网页版浏览器
  • 微信公众网站怎么做的wordpress 载入慢
  • 家居企业网站建设平台企业网站开发合同
  • 网站建设中添加图片链接企业网站的规划与设计
  • 西安做网站报价怎么申请免费企业邮箱账号
  • 网站建设的多少钱阿里云网站建设方案书中山市
  • 寻找网络公司做公司网站升级改版企业自己做网站方法
  • 域名解析映射到网站空间怎么做潍坊网站制作多少钱
  • 我是做网站的打折网站建设教程下载
  • 网站培训方案o2o电子商务网站开发与运营
  • 涪陵区小城镇建设管理处网站h5怎么生成二维码
  • 国内做的比较好的旅游网站网站的空间和域名备案吗
  • 找个做游戏的视频网站毕业设计网站做几个页面
  • 建立网站的关键是定位郑州做网站哪家公司最好
  • 书画网站 建设方案临海建设局网站
  • 做轻淘客网站要多大的空间安徽省外经建设集团有限公司网站
  • 山西省网站建设价格网络广告的形式有哪些
  • 网站内部优化是什么意思音乐网站设计怎么做
  • 企业网站建设重要性肖云路那有做网站公司
  • 网站设计公司北京化妆品网站html模板
  • 渠道网站企业所得税2022年税率
  • 做百度推广网站被攻击自己做的网站很慢
  • 电脑公司网站设计qq上如何做文学网站
  • 国内flash网站公司方案策划书
  • 建设网站需要域名还有什么长沙网站建设费用
  • 西安网站建设的网站一个网站两个数据库