当前位置: 首页 > news >正文

做定制旅游最好的网站大连免费营销型建站网络推广

做定制旅游最好的网站,大连免费营销型建站网络推广,昆明网站建设论坛,全国工程建设行业优秀网站一、L1、L2 loss (分割中不常用#xff0c;主要用于回归问题)L1 LossL1 Loss 主要用来计算 input x 和 target y 的逐元素间差值的平均绝对值.pytorch表示为#xff1a;torch.nn.functional.l1_loss(input, target, size_averageTrue)size_average主要是考虑到minibatch的情况…一、L1、L2 loss (分割中不常用主要用于回归问题)L1 LossL1 Loss 主要用来计算 input x 和 target y 的逐元素间差值的平均绝对值.pytorch表示为torch.nn.functional.l1_loss(input, target, size_averageTrue)size_average主要是考虑到minibatch的情况下需要求平均。loss nn.L1Loss() input torch.randn(3, 5, requires_gradTrue) target torch.randn(3, 5) output loss(input, target) #是一个标量 output.backward() # 求这个标量loss对每个input元素的梯度 可以用input.grad显示出来L2 损失MSE lossL2 LossL2 lossL2 Loss 主要用来计算 input x 和 target y 的逐元素间差值平方的平均值.pytorch中表示为torch.nn.functional.mse_loss(input, target, size_averageTrue)具体应用不再介绍。二、交叉熵损失首先介绍一下交叉熵损失函数的由来其中将介绍为什么交叉熵可以用于分类或分割以及在one-hot多类别分类以及0-1编码二分类之间的区别1、从KL散度到交叉熵损失如果我们对于同一个随机变量 x 有两个单独的概率分布 P(x) 和 Q(x)我们可以使用 KL 散度Kullback-Leibler (KL) divergence来衡量这两个分布的差异变形可以得到等式的前一部分恰巧就是p的熵等式的后一部分就是交叉熵在一般的机器学习任务中我们需要评估label和predicts之间的差距上式中P(x)代表label、q(x)代表predicts由于label本身的熵是不变的因此我们只需要关注后面的交叉熵就可以了。所以一般机器学习任务中直接使用交叉熵作为loss用于评估模型。2. 多分类任务中的one-hot编码下的交叉熵当然one-hot也可以用于二分类首先介绍softmax操作如图softmax的输出是一种归一化的分类概率它将输出z首先经过指数级别进行差别放大之后归一化到0到1之间。可以让大的数变得更大小的数变得更小最终所有的值归一化到0、1之间。在数学上直观上看如何知道softmax的输出和真实label之间的差距呢计算交叉熵损失计算出来的y和y hat都是两个vector和都是1并且都相同的维度可以理解为两个离散的概率分布。这样就可以衡量softmax输出的概率分布和label的one-hot分布之间的差距。使用交叉熵。one-hot下的交叉熵表示为上面z符号用x表示了哈因为除了label位置对应的y hat为1其余均是0最终只剩一项 ,而y label的值就是换个角度对于这个loss我们希望的是x label越来越大其他x项越来越小loss得到之后更新都是原有的值减去lr*梯度需要类别x label对应的梯度是负值其他对应的梯度为正值。从loss可以很容易看出来哈pytorch中与Cross Entropy相关的loss Functionone-hot形式CrossEntropyLoss: combines LogSoftMax and NLLLoss in one single class也就是说我们的网络不需要在最后一层加任何输出层该loss Function为我们打包好了NLLLoss: 也就是negative log likelihood loss如果需要得到log分布则需要在网络的最后一层加上LogSoftmaxNLLLoss2d: 二维的negative log likelihood loss多用于分割问题目前已经整合到NLLLoss3. 二分类0-1编码output的编码不是one-hot只是0代表1类1代表一类真实的分布就是0和1预测的分布就是如果是1的话就是f(x),0的话自然就是1-f(x);我们希望这个loss损失达到最大值将上式进行归纳本质上就是交叉熵在伯努利分布上的表现形式即二分类用的交叉熵用的时候需要在该层前面加上 Sigmoid 函数。将输出值变到0到1之间
http://www.zqtcl.cn/news/903273/

相关文章:

  • 大学生兼职网站开发毕设论文杭州网络排名优化
  • 做教育机器网站网站建设的步骤图
  • 桔子建站是什么平台郑州公司注册网上核名
  • 网站开发技能有哪些网站建设艾金手指科杰
  • 网站建设挂什么费用网站建设学那些课
  • 网站定位与功能分析在互联网公司做网站
  • 安阳网站建设兼职做网站推广有哪些公司
  • 网站制作的一般过程怎么用手机搭建网站
  • 备案 网站名称 怎么改深圳建网站公司
  • html 企业网站模板网站策划书免费
  • 网站建设销售ppt拖拽建站系统源码
  • 网站托管费用多少网站的开发流程
  • 周到的商城网站建设北京品牌网站
  • 网站开发费用属于什么科目网站建设考试多选题
  • c asp做网站wordpress4.5.2文章采集
  • 百度网站建设电话建立网站站建设可以吗
  • 网站后台代码在哪修改网站如何做下一页
  • 网站开发职业要求百度推广代理商与总公司的区别
  • 西安网站建设中心网页 网 址网站区别
  • 技术支持东莞网站建设机械seo岗位是什么意思
  • 做商城网站需要备案什么域名硬件开发工具有哪些
  • 网络网站制作技巧wordpress全文
  • 韩国原生ip站群服务器左右悬停代码网站
  • 专门做广东11选5的网站网站 备案 营业执照
  • 免费扑克网站wordpress弹出服务协议窗口
  • 网站的反爬一般怎样做网站右键屏蔽
  • 茂名做网站dyiee青岛宣传片制作公司
  • 凡科网可以自己做网站吗编程常用网站
  • 做网站练手项目公司营业执照可以做几个网站
  • 聚通达网站建设网站并发要求