当前位置: 首页 > news >正文

上海 网站设计公司美容网站模版

上海 网站设计公司,美容网站模版,百度网站登录,公司注册域名怎么申请论文作者#xff1a;吴林娟#xff0c;天津大学#xff0c;研究方向为自然语言理解论文链接#xff1a;http://arxiv.org/abs/2204.00996代码地址#xff1a;https://github.com/wulinjuan/SSDM_MRC摘要多语言预训练模型在机器阅读理解(Machine Reading Comprehension, MR… 论文作者吴林娟天津大学研究方向为自然语言理解论文链接http://arxiv.org/abs/2204.00996代码地址https://github.com/wulinjuan/SSDM_MRC摘要多语言预训练模型在机器阅读理解(Machine Reading Comprehension, MRC)任务上能够将知识从资源丰富的语言上零资源迁移到低资源语言。然而不同语言中固有的语言差异可能会使零资源迁移后预测的答案跨度违反目标语言的句法约束。我们提出了一种新的多语言机器阅读理解框架该框架配备了孪生语义解耦模型Siamese Semantic Disentanglement Model,   实现在多语言预训练模型学习的表示中将语义与语法分离。为了显式地将丰富的语义知识迁移到目标语言我们提出了两组针对语义和句法编码和解开的损失。在三个多语言机器阅读理解评估集上实验证明了我们提出的方法的有效性。动机和思路随着多语言预训练模型和多语言机器阅读理解评估数据集的提出多语言机器阅读理解任务受到了越来越多的关注。基于多语言预训练模型的跨语言迁移方法也成为了多语言MRC的主流方法。但是我们发现基于预训练模型的迁移方法在目标语言上获取的答案跨度存在不符合句法约束的现象如下图b中的例子所示跨语言迁移模型获得的答案“月光不住”跨越了句法树的两个子树。在双语语料BiPaR上我们也进行了实验统计跨语言迁移的方法降低了目标语言答案跨度和句法约束的一致性。为了解决这类由于语言间句法差异带来的目标语言答案跨度不符合句法约束的问题我们提出了基于多语言语义解耦表示的跨语言迁移方法实现多语言阅读理解。将多语言预训练表示的语义和句法部分分离通过迁移解耦的语义表示减少句法信息对于跨语言带来的消极影响。贡献我们的贡献包括以下三点1.提出了一种多语言MRC框架通过显式迁移源语言解耦的语义知识来减少由于句法差异带给目标语言答案跨度识别的消极影响2.提出了一种多语言孪生语义解耦模型可以有效将多语言预训练模型中的语义和句法分离3.在三个公开权威的多语言MRC数据集XQuAD、MLQA和TyDiQA上证明了我们的模型相比模型•多语言机器阅读理解模型我们提出了一种新的多语言机器阅读理解框架如图(a)所示主要由多语言预训练模型、语义解耦模块和用于MRC预测的线性输出层组成。其中语义解耦模块来自于孪生解耦语义模型Siamese Semantic Disentanglement Model,   的一部分模型最终输出对于答案跨度的起始和终止位置的预测。我们的多语言MRC模型的训练主要分为两步首先使用带标注的平行语料对孪生语义解耦模型S2DM进行训练期间固定预训练模型的参数然后将训练好的  模型中的语义编码模块b中绿色的模块嵌入到MRC框架中通过在源语言MRC数据集上微调预训练模型和线性输出层实现阅读理解。训练好的模型可以在其他目标语言上测试阅读理解的效果。•多语言孪生语义解耦模型  模型构建的假设是句子  是由语义变量  和句法变量  组成。模型基于VGVAE将语义变量假设为vMF分布将句法变量假设为高斯分布句子和两个变量的联合分布形式化为其中 θ 表示生成模型由简单词袋编码器组成。VGVAE的目标函数为包括重构损失RL和两个变量分布的KL散度损失。除此之外为了让句法和语义变量获取更多相应的信息我们设计了多个损失。为了鼓励语义变量y捕捉语义信息我们额外设计了跨语言重构损失CRL和语义辨别损失SDL其中下标s表示源语言下标t表示目标语言n代表非平行的样例sim()是相似度计算函数。为了让句法信息和语义分离我们也引入了了句法相关的损失包含无监督的词序预测损失WPL和有监督的词性标注损失POS以及句法树预测损失STL。WPL和POS表示如下也就是对每个词进行位置的预测和词性的预测然后计算交叉熵损失。为了学习结构化的句法信息我们设计了句法树损失STL。这也是基于现有工作研究发现预训练模型已经编码了句子的句法结构。为了将结构信息转化为序列信号进行学习和预测我们参考结构探针的设计把句法树的预测看作两个子任务单个词在句法树的深度预测以及两个词在句法树中的距离预测。通过给定一个矩阵  对解耦的句法变量表示进行线性变换两个子任务的损失计算为其中  表示句子树中第i和第j个词之间的边数而  是经过线性变换后两个词表示的L2距离平方句法树损失就是两个子任务的和为了验证不同粒度的句法信息对于解耦模型的影响我们根据不同的句法任务设置了两个解耦模型  和  对应的损失分别为•泛化性分析由于解耦模型需要在带有标注的平行语料上训练然而不是所有语言都有相应的训练语料于是我们对模型的泛化性进行了分析。从两个重构损失和语义判别损失分别证明了解耦后的语义和句法表示的语言无关性。将两个重构损失变换后我们可以得到由于无论源语言还是目标语言的句法或语义变量最终都会拟合到相同的分布标准正态分布和均匀vMF分布。所以 θ 和 θ 最终会拟合到相同的分布 θ 和 θ 最终也会拟合到相同的分布。这符合我们使用孪生网络结构的动机。然后我们对语义判别损失进行变换得到最大化  鼓励目标语言语义向量接近并行的源语言语义向量保障了语义向量的语言无关性。综上可以证明  模型获得的语义和句法向量的语言无关性。实验结果基于mBERT和XLM-100实现了我们的MRC模型两阶段的训练集分别来自多语言通用依存树库UD 2.7和英语MRC数据集SQuAD1.0。我们在三个公开的多语言评估数据集上对模型进行了评估基线模型为基于mBERT和XLM-100微调的多语言MRC模型在MLQA数据集上和现有工作LAKM进行了比较在预训练模型的基础上引入短语知识库增加了短语边界检测预训练任务。实验结果如下几个表格我们的模型在三个数据集上有效提升了基于mBERT和XLM-100微调的多语言MRC模型而且对于没有S2DM模型训练集的语言也得到了提升例如XQuAD中和XLM相比模型在希腊语el、 罗马尼亚语ro和越南语vi上的EM值分别提升了6.2%、2.4%和1.8%。和LAKM对比其外部训练数据大小高于我们三个数量级但是我们获得了和LAKM差不多的效果。TyDiQA-GoldP数据集比XQuAD和MLQA更具挑战性。模型在所有8种低资源目标语言的EM或F1分数上都有提升。其中在与英语语系不同的芬兰语fi和俄语ru中模型  的EM性能相比基线分别提高8.4%和9.5%。  在无解耦训练语料的斯瓦希里语sw的EM比mBERT基线高13.6%。我们对设计的loss也进行了消融实验证明了每个loss的有效性和必要性。消融实验结果如下更进一步的我们对孪生网络结构、解耦效果进行了验证结合语义表示可视化说明解耦的效果。在BiPaR数据集中证明了我们的模型有效提高了目标语言答案跨度和句法约束的一致性符合我们的动机。总结本文对由于句法差异导致跨语言迁移过程中存在目标语言答案跨度和句法约束不一致的问题进行了探究通过解耦多语言的语义和句法表示然后显式迁移语义表示减少句法差异带来的消极影响。通过在三个多语言阅读理解评估集上证明我们方法的有效性并进一步通过理论分析和实验验证证明了MRC模型的泛化性以及解耦的有效性。文章从句法入手解决跨语言阅读理解的问题初步证明了句法对于跨语言语义理解任务的助益后期工作将深入探索句法信息和跨语言任务的结合欢迎大家与我们探讨交流。OpenKGOpenKG中文开放知识图谱旨在推动以中文为核心的知识图谱数据的开放、互联及众包并促进知识图谱算法、工具及平台的开源开放。点击阅读原文进入 OpenKG 网站。
http://www.zqtcl.cn/news/106210/

相关文章:

  • 如何用阿里云做网站刷题网站怎么做
  • 织梦制作手机网站上海猎头公司名单
  • 免费生成图片的网站wordpress 购物
  • 江西建设部网站国际新闻最新消息今天2023
  • 怎么做网站啊wordpress英文显示改中文
  • 建筑专业网站有哪些网站标题seo外包优化
  • 浙江建设厅网站施工员报名中国建设协会官网站
  • 网站建设优化是干嘛上海今天最新的新闻
  • 网站大全浏览器软文的概念
  • 盐山做网站价格莱芜征婚吧
  • 具有品牌的微网站建设网站设计培训班前台
  • 网站推广工具推荐html网站地图在线生成
  • 成都本地网站建设青岛电子商务的网站建设
  • 北京网站开发培训河南省百城建设提质工程网站
  • 郑州专业建网站南通网站建设技术支持
  • 简约网站程序网络营销方式较为单一
  • 绍兴企业自助建站123房产网
  • 科技类网站设计特点备案 网站首页地址
  • 做兼职网站网站建设培训速成
  • 开源的网站管理系统商务网站设计与建设实训
  • 东莞三合一网站制作江阴做网站的公司有
  • mvc5 网站开发之學 pdf百度搜索引擎首页
  • 手机进入网站自动识别城阳区规划建设局网站
  • 网站开发平台的公司订票网站开发公司
  • 郑州网站推广信息网架结构厂家
  • 提升网站流量的方法汕头站扩建
  • 响应式网站建设制作需要注意什么网站建设汇卓
  • 馨雨公司网站建设策划方案一个网站能放多少关键词
  • 福州 网站开发洛阳做网站找哪家好
  • 网站建设创业书海外短视频平台