长春建网站,专注Wordpress服务,网络整合营销是什么意思,腾讯云网站建设流程图论文笔记整理#xff1a;吴涵#xff0c;天津大学硕士#xff0c;研究方向#xff1a;自然语言处理Paper:https://www.aclweb.org/anthology/P19-1430/Code:https://github.com/thunlp/Chinese_NRE引入中文NER问题在很大程度上取决于分词的效果#xff0c;所以在中文NER问… 论文笔记整理吴涵天津大学硕士研究方向自然语言处理Paper:https://www.aclweb.org/anthology/P19-1430/Code:https://github.com/thunlp/Chinese_NRE 引入中文NER问题在很大程度上取决于分词的效果所以在中文NER问题中学者们通常先对文本进行分词然后再预测序列中单词的类别。这样一来会导致一个问题即在分词中造成的错误会影响到NER的结果。如果单纯采用字向量的话会导致拆开了很多并不应该拆开的词语从而丢失了它们本身的内在信息比如“人生”这个词如果拆成字向量就成了“人”和“生”这两个字的单独含义明显与它们组合起来的词的含义大相径庭。为了解决这个问题该论文使用了一种新型的格子结构latticestructure它能够将单词本身的含义加入基于字向量的模型中并引入义原作为外部知识。 文章摘要 本文在ACL2018的一篇论文《ChineseNER Using Lattice LSTM》上加以改进加入了义原作为外部知识可以更好地理解语义信息。由于同时考虑了词格作为一个cell自然网络中路径就变多所以要对于基本的LSTM网络的计算公式加以修改 对词格结尾的字符如图中的“市”进行计算时会有一点不同由于向“市”的cell有两个信息流的输入故需要再加一个inputgate两个门同时通过不同的信息流需要设置权重本文模型引入义原作为外部知识 加入义原后计算时在词格cell状态的计算上考虑不同义项带来的影响并为不同的义项设置不同的权重 实验结果 通过与基于词粒度和字符粒度模型进行比较可以得出加入义原的多粒度模型可以获得更好的效果同时词格模型也是性能提升的重要原因。 OpenKG开放知识图谱简称 OpenKG旨在促进中文知识图谱数据的开放与互联促进知识图谱和语义技术的普及和广泛应用。点击阅读原文进入 OpenKG 博客。