网站建设的方法有哪些方面,新网站怎么做排名,中国顺德手机网站设计,宁波百度关键词推广笔记整理 | 谭亦鸣#xff0c;东南大学博士生来源#xff1a;BioNLP ’21 workshop, ACL ‘21链接#xff1a;https://www.aclweb.org/anthology/2021.bionlp-1.7.pdf论文主要包含两个部分的核心工作#xff1a;emrKBQA数据集#xff0c;对应的benchmark。基于MIMIC-III … 笔记整理 | 谭亦鸣东南大学博士生来源BioNLP ’21 workshop, ACL ‘21链接https://www.aclweb.org/anthology/2021.bionlp-1.7.pdf论文主要包含两个部分的核心工作emrKBQA数据集对应的benchmark。基于MIMIC-III KB本文提出了一个面向临床医疗问答的KBQA数据集emrKBQA规模约为940K包含389种提问类型每种类型有约7.5种复述表达。为了验证数据集的质量作者建立了一个benchmark其模型流程可以大体描述为通过语义解析预测问题逻辑结构而后借助逻辑结构构建SQL查询指向答案。贡献论文建立了emrKBQA第一个面向结构化病历记录的大规模社区共享问答数据集数据集能够用于建模解决基于结构化HER的问题解析及问答作者为基于结构化病历记录的问答数据集建立了benchmark背景与动机电子病历EHRs和临床记录Clinics note在医疗过程中常常被作为临床诊断决策的支撑材料因此使机器理解和学习这些资料用于临床决策辅助是一个明确的未来趋势。在以往的研究中基于临床记录的emrQA问答数据集2018被提出通过一个半自动的问题生成过程这个数据集涵盖接近1M的问答对以及问题-逻辑结构对。但是emrQA仅仅是利用到了临床记录这一资源而没有充分利用EHRs作者认为一个完整的临床医疗问答系统应该同时利用好上述这两个资源。因此本文作者提出emrKBQA用于补充这一空白。MIMIC-III KB被用作emrKBQA的知识库资源如图1所示左侧列出了该数据集中一些问题和复述的例子右侧则是知识库里的答案形式。数据集构建根据论文的描述emrKBQA的建立过程可以描述为以下步骤半自动如图41.从emrQA获取初始问题2.从初始问题中挖空使用slot替换原本的实体slot放置该实体对应的类别标签形成模板template提问形式3.医疗专家参与实体类别归纳4.构建提问类型的逻辑形式5.归并具有相同逻辑形式的提问形式互为复述6.向template中填入合适的实体得到问题/复述这里作者根据答案的特点将问题类型分为三种事实是非和时间实际问题中可能同时涵盖这三类中的一个或多个。图2列出了各实体大类中问题类型的分布情况生成的问题如表1所示问题-逻辑形式-问题类型-答案类型如表2所示任务定义和模型作者明确给出了本数据集对应的任务定义建模对输入的知识库相关的问题给出对应的答案模型分为两个过程1.语义解析-逻辑结构参照Gu et al, 2016的工作建立了一个seq2seq模型2.逻辑结构-答案具体为一组连续的映射构建基于序列相似性得到问题-Template-SQL template-logical form评价方式包含两个1.语义解析过程使用EMExact Match即模型输出与标注结果相同算正例2.答案生成过程使用Denotation Accuracy即答案和逻辑结构均与标注结果相同算正例实验结果如表3所示作者进一步做了一些错误分析如下表 OpenKGOpenKG中文开放知识图谱旨在推动以中文为核心的知识图谱数据的开放、互联及众包并促进知识图谱算法、工具及平台的开源开放。点击阅读原文进入 OpenKG 网站。