360网站备案查询,百度网盘资源搜索引擎,wordpress 同步登录,网络服务投诉动机在远程监督任务中#xff0c;除了语料的错误标注问题#xff0c;还存在句内噪声单词过多的问题#xff0c;即多数句子都存在一些与表达关系无关的词汇#xff0c;这个问题未有人关注。当前研究的另一个问题是#xff0c;句子特征抽取器采用随机初始化的方法#xff0… 动机在远程监督任务中除了语料的错误标注问题还存在句内噪声单词过多的问题即多数句子都存在一些与表达关系无关的词汇这个问题未有人关注。当前研究的另一个问题是句子特征抽取器采用随机初始化的方法存在不健壮的问题。针对句内噪声的问题本文采用子树解析的方法去除与表达关系不相关的词汇针对关系抽取器不健壮的问题本文采用迁移学习的方法用实体分类对模型的参数做预训练。方法本文方法包括三个部分1 子树解析。首先对句子做句法解析然后找到两个实体最近的共有祖先最后取以该节点为根节点的子树保留句子中的这部分其余部分丢弃。2 构造含有多个注意力机制的关系抽取器。采用BGRU作为句子语义抽取器抽取器中添加面向单词的注意力和面向实体的注意力。然后采用面向句子的注意力方法结合一个实体对对齐的多个句子的信息作为实体对间关系的语义表示用于后续的关系分类。3 参数迁移初始化。将模型部分结构用于实体类型分类任务训练得到的参数用作关系抽取器相应参数的初始化。 实验实验进行了 held-out evaluation 和 manual evaluation结果如下图所示可见取得了较好的效果。 笔记整理刘兵东南大学计算机博士研究方向为自然语言处理、信息抽取。OpenKG.CN中文开放知识图谱简称OpenKG.CN旨在促进中文知识图谱数据的开放与互联促进知识图谱和语义技术的普及和广泛应用。转载须知转载需注明来源“OpenKG.CN”、作者及原文链接。如需修改标题请注明原标题。 点击阅读原文进入 OpenKG 博客。