网站简单布局图,如何用wordpress做网页,wordpress浮动广告,在线做效果图有哪些网站链接#xff1a;https://arxiv.org/pdf/1809.01341.pdf动机#xff08;摘要#xff09;当前的知识库补全的方法主要是将实体和关系嵌入到一个低维的向量空间#xff0c;但是却只利用了知识库中的三元组结构 (s,r,o) 数据#xff0c;而忽略了知识库中大量存在的文本… 链接https://arxiv.org/pdf/1809.01341.pdf动机摘要 当前的知识库补全的方法主要是将实体和关系嵌入到一个低维的向量空间但是却只利用了知识库中的三元组结构 (s,r,o) 数据而忽略了知识库中大量存在的文本图片和数值信息。本文将三元组以及多模态数据一起嵌入到向量空间不仅能够使链接预测更加准确而且还能产生知识库中实体缺失的多模态数据。亮点通过不同的 encoders将多模态数据嵌入成低维向量做链接预测通过不同的 decoders能够产生实体缺失的多模态数据模型1 多模态数据的嵌入1 结构化数据对于知识库中的实体将他们的one-hot编码通过一个denselayer得到它们的embedding2 文本对于那些很短的文本比如名字和标题利用双向的GRUs编码字符对于那些相对长的文本通过CNN在词向量上卷积和池化得到最终编码。3 图片利用在ImageNet上预训练好的VGG网络得到图片的embedding4 数值信息全连接网络即通过一个从的映射获得数值的embedding5 训练目标函数cross-entropy其中t^(s,r) 是一个one-hot向量。如果知识库中存在 s, r, o 这个三元组t_o^(s,r) 值为1否则 t_o^(s,r) 值为0。p_o^(s,r)是 s, r, o 模型预测出来的这个三元组成立的概率它的值介于0到1之间。2 解码多模态数据1 数值和类别信息利用一个全连接网络输入是已经训练好的向量输出是数值和类别损失函数是RMSE数值或者cross-entropy类别2 文本利用ARAE模型输入是训练好的连续向量输出是文本3 图片利用GAN模型来产生图片 实验 本文作者在 MovieLens-100k 和 YAGO-10 两个数据集上面引入了多模态数据其中 MovieLens-100k 引入了用户信息文本电影信息文本电影海报YAGO-10 也为实体引进了图片文本数值等信息。1 链接预测可以看到在引入了实体文本描述图片和数值之后利用之前的嵌入模型达到了SOTA的效果 2 生成多模态数据可以看到引入了多模态数据之后产生出来的文本和图片的质量比起仅仅依靠知识库原本就存在的三元组信息产生的文本和图片的质量要高。 总结 本文的创新点是引入了多模态数据来做知识库中的链接预测和生成实体缺失的多模态数据。但是不足之处在于不知道到底引入的哪一部分多模态数据对最终的链接预测产生提升以及产生的多模态数据质量不是很理想。这有待于后续工作的改进。 论文笔记整理康矫健浙江大学硕士研究方向为知识图谱、自然语言处理。 OpenKG.CN中文开放知识图谱简称OpenKG.CN旨在促进中文知识图谱数据的开放与互联促进知识图谱和语义技术的普及和广泛应用。转载须知转载需注明来源“OpenKG.CN”、作者及原文链接。如需修改标题请注明原标题。 点击阅读原文进入 OpenKG 博客。