电子商务网站计划书,阅读网站怎么做,wordpress 文本 点不了,企业网站建设方案费用论文笔记整理#xff1a;申时荣#xff0c;东南大学博士生。来源#xff1a;ICML2020链接#xff1a;http://arxiv.org/abs/2002.06753元学习算法会生成特征提取器#xff0c;这些特征提取器在进行few-shot分类时就可以达到最新的性能。尽管文献中有大量的元学习方法… 论文笔记整理申时荣东南大学博士生。来源ICML2020链接http://arxiv.org/abs/2002.06753元学习算法会生成特征提取器这些特征提取器在进行few-shot分类时就可以达到最新的性能。尽管文献中有大量的元学习方法但对于为什么生成的特征提取器表现如此出色的原因知之甚少。本文对元学习的基本机制以及使用元学习训练的模型与经典训练的模型之间的差异有了更好的了解。在此过程中本文针对元学习模型为何表现更好而提出了一些假设。除了可视化之外本文还根据假设设计了一些正则化器这些正则化器可改善几次快照分类的性能。1.元学习 元学习算法的目的是产生一个网络该网络可以使用很少的数据快速适应新的类别。具体来说元学习算法会找到可以在几个优化步骤和几个数据点上进行微调的参数以实现对任务Ti的良好概括该任务Ti由来自分布和标签空间的少量数据样本组成在训练期间没有被看见。如果在看到Ti中n个类别中的每个类别的k个示例后元学习算法必须适应对Ti中的数据进行分类则该任务的特征为n-wayk-shot。 元学习方案通常依赖于带有内部循环和外部循环的双层优化问题。外循环的迭代涉及首先对“任务”进行采样该“任务”包括两组标记数据支持数据Tsi和查询数据Tqi。然后在内部循环中使用支持数据对要训练的模型进行微调。最后例程返回到外循环在该外循环中元学习算法将查询数据相对于预微调的权重的损失降至最低。通过微分内环计算并更新网络参数以使内环微调尽可能有效来执行此最小化。2.元学习有效性的解释和可视化实验发现在所有情况下元学习特征提取器均优于相同体系结构的经典训练模型。全面的性能优势表明元学习的功能在质量上与传统功能有所不同并且从根本上来说优于一次性学习。2.1在特征空间中测量聚类 首先测量不同的训练方法对特征表示的聚类程度 直观上来看使用元学习后内部的聚类性能会更好更有利于少样本去构建分类边界。2.2比较元学习和经典训练模型的特征表示 通过LDA对特征空间进行可视化可以看到元学习和原型学习的方法在语义空间中的分布更加合理。特征空间的聚类可以提高迁移的成功率。2.3为参数空间中的任务损失寻找局部极小值簇我们在特征空间图中看到由MAML特征生成的前两个LDA组件在外观上看起来是分开的类。现在我们通过为预先训练的MAML模型以及相同体系结构的经典训练模型计算我们的正则化值来量化MAML与转移学习相比的班级分离程度。我们发现实际上MAML表现出比相同体系结构的经典训练模型更差的特征分离。3总结在这项工作中阐明了元学习网络与经过经典训练的对等网络之间的两个关键区别。我们发现有证据表明相对于类之间的差异元学习算法将类中特征向量之间的差异最小化。将类内特征的变化减至最少对few-shot性能至关重要。 OpenKG开放知识图谱简称 OpenKG旨在促进中文知识图谱数据的开放与互联促进知识图谱和语义技术的普及和广泛应用。点击阅读原文进入 OpenKG 博客。