当前位置: 首页 > news >正文

建设上海网站如何进行关键词分析

建设上海网站,如何进行关键词分析,网站备备份教程,wordpress生成卡密事件抽取的目标是在非结构化的文本中确认事件的触发词#xff08;Eventtrigger#xff09;和参与者#xff08;Event argument#xff09;#xff0c;并判断触法词的事件类型#xff08;Eventtype#xff09;#xff0c;判断参与者在事件中的扮演的角色#xff08;Arg… 事件抽取的目标是在非结构化的文本中确认事件的触发词Eventtrigger和参与者Event argument并判断触法词的事件类型Eventtype判断参与者在事件中的扮演的角色Argument role。有触发词和参与者的短语或文本称为EventMention。如下图的关于Transport-Person 事件的一条EventMentiondispatching是触发词下划线是参与者其中China作为Agent参与事件。目前大多数的事件抽取是基于已有的手动标记样本进行训练。常见的数据集ACE总共有8个大类33个小类对每个类有人为标记的训练语料。但是对于没有样本的新事件类型用上述语料训练的模型会显得无力。对此一是可以用远程监督的方法标记训练样本二是用迁移学习方法。本文基于第二点的提出在事件抽取任务中用零样本迁移学习方法将event mention 和event ontology联合映射到共享的语义空间上拉近两者在语义空间上的距离。具体来说对于新的语料可以用AMR得到具体事件mention的结构同时提供已定义好的关于事件类型ontology的结构。如上图所示是对上述E1进行处理后得到mention的结构和一些已定义好的ontology结构。可以看到事件触发词和事件类型名通常有一些共享含义同时两者的结构也趋于相似。本文基于这两点将mention和ontology的结构表示联合映射到同一语义空间最小化mention和对应的ontology的语义距离从而学习一个通用映射函数将已有样本训练得到的模型迁移到没有样本的事件中整体框架如下分为如下几步1. 找出候选触发词和候选参与者称为Tiggerand Argument Identification用WSD找出触发词候选项并用FrameNet中的Lexical units匹配文本扩充触发词候选项利用ARMparser找出参与者候选项。2. 确定触发词对应的事件类型称为 Tigger Classification触发词分类主要是用CNN模型模型的输入考虑了两个部分 [V_t,V_(S_t)]V_t 触发词本身的语义表示可以用word2vec来训练触发词t的结构是 S_tV_(S_t)是 S_t 的表示 ontology的 [V_y,V_(S_y)] 输入同理。对于 V_(S_t)分两步进行首先结构中的每条边可以表示为 uw_1,λ,w_2用 M_λ 表示关系可以得到每个元组的表示 V_u对应公式如下之后将 t 的所有元组的表示 V_u 拼接起来输入到CNN网络中得到V_(S_t)。对于 V_(S_y)ontology的每个元祖表示为 u^y,r, y 是事件类型r 是参与者角色 V_u 的表示如下之后也输入到CNN中得到 V_(S_y)。通过hinge loss来训练模型将mention和ontology的表示学习到同一语义空间3. 确定参与者在事件中扮演的角色称为ArgumentClassification参与角色的分类是基于触发词到参与者路径的相似度。仍以E1为例通过将dispatch-01—:ARG0—China和Transport-Person—Agent的路径信息学习到同一语义空间之后根据语义相似度判断China在Transport-Person中的扮演的角色是Agent。4. 预测新类别测试时候对于新的 t用训练好的模型得到 t 的结构化表示和所有ontology的结构化表示距离最近的就是预测的结果。本文进行了比较丰富的实验1. 在ACE数据集上进行实验实验中可见类设置如下N表示可见类的数量上述设置下得到的效果如下WSD-Embedding没有将结构信息考虑到迁移的过程中。可以在迁移学习过程中考虑更多的机构化信息得到的效果更好可见类越多效果越好。2. 用ACE的 Justice类的4个小类做训练用其余三个或用其他大类下随机的一个小类作测试。可以看到测试类跟训练类的相似度越高效果越好。3. 使用LSTM在所有类上进行训练和测试和用ZSL进行训练和测试的效果对比。可以看到用ZSL训练得到的效果和用LSTM训练近500条样本得到的效果不相上下。笔记整理王若旭浙江大学硕士研究方向为知识图谱自然语言处理.OpenKG.CN中文开放知识图谱简称OpenKG.CN旨在促进中文知识图谱数据的开放与互联促进知识图谱和语义技术的普及和广泛应用。转载须知转载需注明来源“OpenKG.CN”、作者及原文链接。如需修改标题请注明原标题。 点击阅读原文进入 OpenKG 博客。
http://www.zqtcl.cn/news/583968/

相关文章:

  • 高端网站网站设计网站建设怎么分析市场分析
  • 株洲网站设计外包运营wordpress seo插件教程
  • 做湘菜的网站wordpress外贸网站
  • 可以做书的网站做网站的软件叫什么
  • 深圳营销型网站公司电话网站优化北京如何联系?
  • 网站配资公司网站织梦怎么关闭网站
  • 建设企业网站哪家好网站页面布局设计思路
  • 长尾词在线挖掘数字营销服务商seo
  • cms傻瓜式建站系统帝国 cms 网站关键字
  • 东莞营销网站建设直播php 网站 项目
  • 网站访问量什么意思wordpress 静态商店
  • 汕头建站平台网站如何配置域名
  • 大芬网站建设石嘴山网站建设
  • 彩票网站开发解决方案wordpress网站如何与关联
  • 怎么做各大视频网站的会员代理芜湖的网站建设
  • 番禺做网站开发免费素材下载网站
  • 做网站服务公司王业美
  • 遵义网站建设推广城乡住房建设部官网查询
  • 电商设计网站素材免费建站网站seo
  • 做雕塑网站丹阳网站推广
  • 夏津网站建设公司应用分析网站
  • 长春seo网站优化个人网站要有什么
  • 网站开发流程步骤 口袋青海个人旅游网站建设
  • php企业网站多少钱图书馆网站建设建议
  • 企业网站建设综合实训学习体会个人网站空间申请
  • 企业小型网站要多少钱合肥城乡建设网站首页
  • 济南建站公司注意事项做钓鱼网站要什么工具
  • 网站建设数据录入创建网络公司
  • 行业网站建设报价摄影标志logo设计欣赏
  • 做reference的网站网站首页 模板