当前位置: 首页 > news >正文

响应式网站的优势建设商务网站作用

响应式网站的优势,建设商务网站作用,北京百度seo公司,什么语言做网站最好论文笔记整理#xff1a;谭亦鸣#xff0c;东南大学博士生。来源#xff1a;ICLR2020链接#xff1a;https://openreview.net/pdf?idBkxSmlBFvrKG embedding#xff08;KGE#xff09;模型的目标是学习知识图谱中实体和关系的向量表示。近年来众多的KGE方法被提出#… 论文笔记整理谭亦鸣东南大学博士生。来源ICLR2020链接https://openreview.net/pdf?idBkxSmlBFvr        KG embeddingKGE模型的目标是学习知识图谱中实体和关系的向量表示。近年来众多的KGE方法被提出不断刷新state-of-the-art。这些方法在在模型架构训练策略以及超参数优化上各有不同。这篇文章以目前较为流行的模型架构及训练策略为主体分析了上述这些条件对于模型性能的影响。实验发现当训练得当时模型之间的性能差异相对以往的结果来说相对缩小甚至反转。作者发现好的模型配置能够通过大型参数空间中的少量随机样本找到。论文的结论是研究者们应该重新审视那些先进的方法和技术从而准确评估这些方法各自的实际优势。动机        现有的KGE模型根据实体和关系的embedding联合方式的差异主要分为factorization models以RESCAL DistMultComplExTuckER为代表translationalmodel主要指TransERotatE以及比较新的卷积模型例如ConvE。很多情况下一个新的模型的提出往往伴随着新的训练策略新的训练类型例如负采样新的损失函数新的正则化形式等等。表1总结了目前具有代表性的方法的训练策略整理。这些五花八门的模型训练使得很难横向对比各自KGE模型的性能在基于前人的工作进行模型复现和改进时我们往往会沿用前人已知“效果较好”的参数设定而不同的模型所适用的参数设定往往是不同的模型A的最优参数可能是B的次优。针对上述情况作者决定总结并对不同模型方法训练策略对模型性能的影响进行经验性量化在一个commonexperiment setup中实现不同的模型方法和训练策略。不同于前人的工作。KGE模型训练评估作者选取了具有代表性的模型和训练策略表1用于本文的对比。在评估方案方面1.知识图谱中的多关系链接预测是一个典型的被用于KGE性能测试的任务即对于给定的实体集与关系集通过预测实体之间的链接关系构建出一个完整的KG。2.KGE知识图谱嵌入的目标是将实体和关系映射到低维向量空间中并保持实体之间的相对结构稳定。因此三元组表示学习之后的得分则可以量化得到从而反映图谱表示学习的质量。3.另一个最常用的KGE评估任务是实体的排序对于给定的确实了头/尾实体的三元组排序找到最合适的缺失实体。KGE模型可以粗分为可分解模型以及整体模型两类。前者仅允许具有特定关系的主体和客体的交互后者则以内需任意交互两者的评分函数不同。训练类型目前有三种常用的方法训练KGE模型主要的差异在于负例的生成方式1.随机替换正例中的元组得到负例2.1vsALL打乱头尾实体的位置利用单个三元组批量生成负例3.首先批量构建非空三元组缺头或尾实体将非空三元组标为正例或负例。损失函数目前KGE已经引入了几个损失函数RESCAL最初使用各三元组得分与正负例的平方差Trans系列模型则使用的marginrank with hinge lossMRReciprocal relationsConvE方法在KGE模型训练中引入了Reciprocal relations技术相比之前方法仅对主体或客体进行打分该技术分别为主体和客体建立的独立的打分函数。所有的打分函数共享实体的embedding但不共享关系embedding这种方式可能可以减少计算成本。正则化在embedding向量上最流行的正则化规范是L2。TransE则是在每次更新之后将embedding标准化为单位标准。ConvE在它的隐层中使用dropout。在本文的工作中作者将共同考虑L1和实体/关系embedding的dropout。超参数前人的工作中已经提出了很多的超参数设定包括不同的初始化模型参数的方法不同的优化算法包括学习率和批量规模等优化参数负例的规模实体和关系的正则权重等。实验研究数据集方面作者使用FB15K-237(Freebase的一个子集)以及WNRR来自WordNet。使用这些数据集的主要理由是它们被许多前人工作所使用它们具有难度专门面向多关系链接预测相关模型性能上具有多样性数据规模适用性。数据集的统计信息如下表模型方面RESCAL, TransE, DistMult, ComplEx以及ConvE基于它们的知名度且涵盖过去和现在的模型评估方面这里主要使用MRR以及HITS10.超参方面作者使用了一个大型超参数空间用于确保不会遗漏每个模型适用的前人提出的超参数设定。实验涵盖了所有主流的训练类型使用Reciprocal relations损失函数考虑了MR,BCE,CE正则化技术则涉及到无/L2/L3以及dropout的全部设定。优化算法包含Adam和Adagrad。作者考虑了128256512三种维度的embedding并且对实体和关系的建立独立权重用于dropout和正则化。按照作者的描述目前尚未有一个工作涉及到使用如此大的超参数搜索空间训练方面epoch的上限被设定为400每5个epoch进行一次MRR验证earlystop的patience为50epoch。训练的终止条件为50次epoch中模型在MRR验证上没有超过5%的提升。模型选择这里是使用了一个Ax框架https://ax.dev/通过Sobol序列进行准随机超参数搜索。对于每个数据集和模型作者生成了30个不同的配置。在超参数搜索之后作者添加了贝叶斯Bayesian optimization phase做进一步的调试。可复用性所有的模型训练策略超参数都基于PyTorch构建框架具备可扩展性且开源。模型性能对比1.模型的Firstreported性能与作者得到的实验性能的对比如表2 First作者发现单个模型的性能差异非常大在作者的实验中表2 Ours许多模型的性能相比First reported有了巨大提升包括RESCAL, TranE等都达到了相同方法的最佳。2.而后作者比较了本研究使用的模型之间的性能表2 Ours发现相比First reported中的结果许多模型之间的性能差距明显缩小甚至反超。这反映出训练策略对于模型的影响之大。3.表2Recent同时展现了最近最佳模型以及大型模型的性能但与Ours中的最优模型相比而言差距也并不是非常大。超参数的影响图1描述了各个模型在不同超参数设置情况下的MRR验证得分分布可以看到不同配置情况下模型的性能上下限非常明显而大多数模型的性能上界接近最优配置分析详情请看原文附录表67涵盖了全部超参数下表中给出了MRR上最优的超参数配置实验对比1.quasi-random hyperparameter search得到的最优配置表32.贝叶斯调优后得到的最优配置表8本文是难得的针对模型性能本质涵盖大量详细实验分析的扎实工作建议相关领域研究者详细阅读原文。  OpenKG开放知识图谱简称 OpenKG旨在促进中文知识图谱数据的开放与互联促进知识图谱和语义技术的普及和广泛应用。点击阅读原文进入 OpenKG 博客。
http://www.zqtcl.cn/news/601545/

相关文章:

  • 好的网页设计网站学编程要什么学历
  • 做网站公司电话福建城乡建设网站查询
  • 郑州做网站哪个公司好做二手市场类型的网站名字
  • 网站建设与维护里面的个人简历选择网站建设公司好
  • 济南浩辰网站建设公司怎么样wordpress 3.8 问题
  • 柳州正规网站制作公司网站ww正能量
  • 网站seo优化工具网站推广策略方法
  • 企业网站建设知名wordpress 自定义php
  • 用php做的网站有哪些全能网站建设
  • 网站显示正在建设中wordpress 排行榜 页面
  • 手机管理网站网站打开速度优化
  • 做微网站需要什么做的比较好的美食网站有哪些
  • 五金商城网站建设注意wordpress虚拟空
  • 成都工程网站建设网站界面设计的优点
  • 网站建设里的知识找别人做公司网站第一步做什么
  • 婚纱摄影网站模板之家专业seo网站优化公司
  • 商丘市住房和城乡建设局网站广西网站建设timkee
  • php网站开发是做什么的网站策划总结
  • 站长工具seo推广秒收录WordPress注册插件中文
  • 目前个人网站做地最好是哪几家做汽配网站需要多少钱
  • php做网站多少钱网络营销推广方案3篇
  • 浙江坤宇建设有限公司 网站省直部门门户网站建设
  • 直播类网站怎么做上海市建设质量协会网站
  • 筑巢做网站怎么样网站设计接单
  • 会ps的如何做网站wordpress 仿虎嗅
  • 免费响应式网站建设嘉兴建企业网站
  • 织梦网站首页幻灯片不显示建设银行网站特色
  • php企业网站开发东莞网站建设时间
  • 仿win8网站模板网站开发接私活的经理
  • 仿牌网站 域名注册衡水安徽网站建设