网站改版 内容,wordpress 每页文章数量,网站建设 建站知识,客户管理软件有哪些论文笔记整理#xff1a;谭亦鸣#xff0c;东南大学博士。来源#xff1a;ACL 2020链接#xff1a;https://www.aclweb.org/anthology/2020.acl-main.91.pdf1.介绍在以往的工作中#xff0c;知识图谱复杂问答一般被分为两种类型分别处理#xff1a;其一是带有约束的问题谭亦鸣东南大学博士。来源ACL 2020链接https://www.aclweb.org/anthology/2020.acl-main.91.pdf1.介绍在以往的工作中知识图谱复杂问答一般被分为两种类型分别处理其一是带有约束的问题例如“Who was the first president of the U.S.?”其中仅包含一个关系“presidentof…”但存在约束“first”对于这类问题一般采用多阶段方法通过构建包含关系的主路径再对其添加约束的方式得到对应查询图其二则是多关系问题例如“Who is the wife of the founder of Facebook?”其中包含两个关系“wife of…”以及“founder of…”这类问题的回答需要考虑更长的关系路径主要挑战在于长路径带来的更大的搜索空间一般采用beam search的方式实现答案路径的构成这篇文章里作者尝试同时解决这两类问题较少有人考虑同时处理这两类问题。动机作者发现通过优先将约束合并到查询图中querygraph可以有效减少多关系情况下的搜索空间规模。基于上述动机作者提出了一种改进的阶段查询图生成方法用于灵活的生成查询图。在三个benchmark KBQA数据集上该模型均达到了最优实验效果。2.模型/方法参照过去的工作一个查询图包含四类节点如图1所示Grounded entity图1灰色矩形节点是已经存在于KG的实体节点Existential variable图1白色矩形节点未确定的KG中的实体节点Lambda variable图1圆形节点也是未确定的KG实体节点一般表示答案Aggregation function图1菱形节点是一种对实体集合的聚合函数例如argmin取最小值或count计数等 一般阶段查询图构建过程是a.从groundedentity出发确定一条主关系路径连接到一个lambda variable节点目前的工作中这主路径只包含一个关系b.向主路径中添加问题里出现的一个或多个约束约束由一个固定实体或者一个聚合函数与一个关系组成。c.对于前两步得到的所有candidate查询图通过衡量它们与问题的相似性进行排序而后挑出目标查询图一般利用CNN完成从而从KG中找到答案本文工作的挑战是多跳多关系主路径问题作者表示如果简单的利用上述方法扩充到2-hop或更多跳的问题中对于每个问题将会得到10000规模的主路径候选穷举情况下这个计算量就相当不划算了。以图1中的问题为例作者考虑的多关系问题解答过程举例如下给定一个局部主路径The Jeff Probst Show(entity)→nominated_for(elation) → y1(entity) →nominee(relation)→y2(entity)首先对y2添加约束(is_a, TV producer)约束再找y2对应实体时的搜索空间将大幅缩减。作者提出了三种action{extendconnectaggregate}用于查询图生成的循环过程从而使得生成过程更加灵活。 Extend在主路径上添加一个关系如果当前查询图仅包含一个主实体extend操作将会找到一个在KG中连接到主实体的r并扩充主路径。如果主路径上存在lambdavariableextend操作将会把该节点变为existential variable通过执行当前查询图从KG中找到所有与该节点相结合的节点并找到对应的关系添加到查询图中关系的另一端节点则标为新的lambdavariable。 Connect除了主实体之外问题中也常常存在其他确定实体connect操作将这些确定实体连接到答案节点或者某个中间节点上。 Aggregate则是将聚合操作函数作为新的节点添加到答案节点或中间节点上。 三个操作并没有严格的顺序规定因此查询图生成过程的限制相对较少。 在得到候选查询图之后作者使用一个七维特征向量衡量图与原始自然语言问题之间的相似性实现查询图排序。七维特征分别来自 BERT-based 语义匹配模型 查询图中确定实体的累计实体链接得分 确定实体在查询图中出现的数量 实体类型数时序表达以及查询图中的最高级最后一个特征是答案实体在查询图中的个数。3.实验实验数据ComplexWebQuestion, WebQuestionSP以及ComplexQuestions, 其中以ComplexWebQuestion为主要评估数据集因为其中的多关系带约束复杂问题占比相对其他两者更多。 对比模型包括三类现有的阶段查询图生成模型无法处理多跳关系beam搜索方法无法处理约束将复杂问题拆分为简单问题的方法。实验结果如下表所示 OpenKG开放知识图谱简称 OpenKG旨在促进中文知识图谱数据的开放与互联促进知识图谱和语义技术的普及和广泛应用。点击阅读原文进入 OpenKG 博客。