怎么做网站数据库,东莞本地招聘网站有哪些,做网站职校选什么专业,英文网站建设情况笔记整理#xff1a;仲亮靓#xff0c;东南大学硕士研究生#xff0c;研究方向是基于知识图谱的推荐系统动机新闻文本的语言非常凝练#xff0c;其中包含了很多实体和常识知识。但目前的新闻个性化推荐方法都没有利用这些外部知识#xff0c;也没有使用新闻之间潜在的知识… 笔记整理仲亮靓东南大学硕士研究生研究方向是基于知识图谱的推荐系统动机新闻文本的语言非常凝练其中包含了很多实体和常识知识。但目前的新闻个性化推荐方法都没有利用这些外部知识也没有使用新闻之间潜在的知识层面的联系。这就导致推荐的结果总是局限于简单额匹配不能合理地扩展。为了解决以上的问题文章中提出了基于内容的结合知识图谱来做新闻推荐点击率预测的方法DKNDeep Knowledge-awareNetwork。贡献文章的贡献有1新提出的DKN模型是基于内容的深度学习推荐模型适合像新闻这样的具有高度时效性的推荐2设计了KCNNKnowledge-awareCNN模块来联合学习新闻的语义层和知识层的表示3用Attention模块对用户历史点击过的新闻对于当前候选推荐新闻的影响程度进行建模方法文中提出的模型图如图 1 所示。输入一个用户点击过的新闻的标题、一条候选推荐新闻的标题输出用户点击这条候选新闻的概率步骤将新闻标题中的词和知识图谱中实体做实体链接为每个实体搜索它在知识图谱中的相邻实体以此来获得更加丰富、具有区分力的信息KCNN融合新闻的词表示和新闻表示得到一个新闻的Knowledge-aware的向量表示多通道multi-channel把word embedding、entityembedding、上下文实体embedding作为CNN的三个通道词语-实体对齐word-entity-aligned 将标题中的词向量和实体向量一一对应如果词向量在知识图谱中没有与之对应的实体就用0向量来填充。 因为词向量和实体向量来自两个不同的向量空间且训练出来的相连的维度也不一样所以通过一个线性或非线性的方法将实体向量映射到词向量空间中。最终得到新闻的如下形式的矩阵表示其中w_i 表示标题中第 i 个词的词向量e_i 表示与第i个词对应的实体的向量\bar{e_i} 表示第i词对应的实体在知识普图中的上下文信息所有与它相邻的实体的向量的均值将得到的多通道堆叠矩阵放入CNN中最终得到新闻的embedding结果Attention-based 用户兴趣抽取用户对于自己点击过的每个新闻话题的兴趣并不是完全一样的所以用户点击过的每个新闻对于用户是否点击候选推荐新闻的影响力也是不一样的因此这里需要加入Attention机制输入两条新闻标题用户点击过的一条新闻和候选新闻的KCNN embedding结果输出该条历史新闻对于候选新闻点击率的影响权重将两个embedding结果做全连接然后使用一个DNN公式中用H表示作为Attention网络最后再用softmax函数来规格化影响权重具体公式如下把这些历史新闻的向量和对应的权重做加权平均作为用户的embedding结果最后再将用户的embedding结果、候选推荐新闻的embedded结果做全连接放到一个DNN公式中用G表示中得到最终的用户点击该条候选新闻的概率图1 DKN算法模型框架实验数据来源Bing News的系统日志数据特征实验中给出了新闻数据中新闻标题所含的词语数量平均值、新闻标题中包含的实体数量平均值、添加上下文实体后得到的实体数量平均值等表明了加入知识图谱中的相邻实体确实能够丰富新闻的特征具体如下表所示。实验对比1文中把当前引入深度学习的协同过滤算法DFM和基于内容KPCNN、DSSM、DeepWide、DeepFM、YouTubeNet的个性化推荐算法都做了对比实验表明DKN算法的推荐效果最好。2 对于DKN算法中也做了使用不同知识表示学习算法、是否加入Attention机制、是否将entityembedding结果转换到word embedding结果的向量空间中、以及三种输入信息Word embedding、Entityembedding、上下文embedding组合都做了对比实验实验表明使用三种输入信息、TransD方法、非线性映射方法并加入Attention机制的效果最好。总结论文中所提出的模型主要部分还是使用了CNN和Attention这两个的组合主要创新点还是在于首次将知识图谱引入到新闻推荐算法中也就是利用知识图谱来提取更多的新闻特征应用推荐算法中。 OpenKG开放知识图谱简称 OpenKG旨在促进中文知识图谱数据的开放与互联促进知识图谱和语义技术的普及和广泛应用。点击阅读原文进入 OpenKG 博客。