当前位置: 首页 > news >正文

腾讯云如何做网站北京网站建设58

腾讯云如何做网站,北京网站建设58,住建部和城乡建设官网,贵阳网络推广哪家专业来源#xff1a;SimmerChan#xff08;知乎#xff09;编辑#xff1a;Debra摘要#xff1a;本文主要分为三个部分。第一个部分介绍我们为什么需要知识图谱#xff0c;第二个部分介绍知识图谱的相关概念及其形式化表示。最后#xff0c;作一个简单的总结#xff0c;并介… 来源SimmerChan知乎编辑Debra摘要本文主要分为三个部分。第一个部分介绍我们为什么需要知识图谱第二个部分介绍知识图谱的相关概念及其形式化表示。最后作一个简单的总结并介绍该专栏后续文章会涉及的内容。一、看到的不仅仅是字符串当你看见下面这一串文本你会联想到什么Ronaldo Luís Nazário de Lima估计绝大多数中国人不明白上面的文本代表什么意思。没关系我们看看它对应的中文罗纳尔多·路易斯·纳萨里奥·德·利马这下大部分人都知道这是一个人的名字了当然不出什么意外还是个外国人。但还是有一部分人不知道这个人具体是谁。下面是关于他的某张图片从这张图片我们又得到了额外信息他是一位足球运动员。对足球不熟悉的可能还是对他没有什么印象。那么再看看下面这张图片我再加上当初那洗脑的广告词“保护嗓子请用金嗓子喉片。 广西金嗓子”。这下应该许多人都知道他是谁了毕竟多年前被这洗脑的广告语摧残了很长一段时间。之所以举这样一个例子是因为计算机一直面临着这样的困境——无法获取网络文本的语义信息。尽管近些年人工智能得到了长足的发展在某些任务上取得超越人类的成绩但离一台机器拥有一个两三岁小孩的智力这样一个目标还有一段距离。这距离的背后很大一部分原因是机器缺少知识。如同上面的例子机器看到文本的反应和我们看到罗纳尔多葡萄牙语原名的反应别无二致。为了让机器能够理解文本背后的含义我们需要对可描述的事物 (实体) 进行建模填充它的属性拓展它和其他事物的联系即构建机器的先验知识。就以罗纳尔多这个例子说明当我们围绕这个实体进行相应的扩展我们就可以得到下面这张知识图。机器拥有了这样的先验知识当它再次看到 Ronaldo Luís Nazário de Lima它就会“想”“这是一个名字叫 Ronaldo Luís Nazário de Lima 的巴西足球运动员。”这和我们人类在看到熟悉的事物会做一些联想和推理是很类似的。Notice: 需要说明的是上面的知识图并不代表知识图谱的实际组织形式相反它还会让读者对知识图谱产生一定的误解。在下一个部分我会给出这张图所包含内容在知识图谱中更形式化的表示。实际上我看到许多介绍知识图谱的文章都喜欢给出此种类型的图却又不给出相应的说明这可能会让读者一开始就进入理解的误区。Google 为了提升搜索引擎返回的答案质量和用户查询的效率于 2012 年 5 月 16 日发布了知识图谱 (Knowledge Graph)。有知识图谱作为辅助搜索引擎能够洞察用户查询背后的语义信息返回更为精准、结构化的信息更大可能地满足用户的查询需求。Google 知识图谱的宣传语“things not strings”给出了知识图谱的精髓即不要无意义的字符串而是获取字符串背后隐含的对象或事物。还是以罗纳尔多为例我们想知道罗纳尔多的相关信息 (很多情况下用户的搜索意图可能也是模糊的这里我们输入的查询为“罗纳尔多”)在之前的版本我们只能得到包含这个字符串的相关网页作为返回结果然后不得不进入某些网页查找我们感兴趣的信息现在除了相关网页搜索引擎还会返回一个“知识卡片”包含了查询对象的基本信息和其相关的其他对象 (C 罗名字简称也为罗纳尔多搜索引擎只是根据“罗纳尔多”的指代概率返回了“肥罗”这个罗纳尔多的基本资料但也许你需要 C 罗的相关信息那么搜索引擎把 C 罗这个实体作为备选项列出)如下图红色方框中的内容。如果我们只是想知道罗纳尔多的国籍、年龄、婚姻状况、子女信息那么我们不用再做多余的操作。在最短的时间内我们获取了最为简洁最为准确的信息。当然这只是知识图谱在搜索引擎上的一部分应用场景。举这个例子也是为了表明知识图谱这样一种概念、或者技术它的诞生是符合计算机科学、互联网发展潮流的。关于知识图谱的更多应用会在之后的另一篇文章中给出。二、知识图谱的前世今生通过上面这个例子读者应该对知识图谱有了一个初步的印象其本质是为了表示知识。其实知识图谱的概念并不新它背后的思想可以追溯到上个世纪五六十年代所提出的一种知识表示形式——语义网络 (Semantic Network)。语义网络由相互连接的节点和边组成节点表示概念或者对象边表示他们之间的关系 (is-a 关系比如猫是一种哺乳动物part-of 关系比如脊椎是哺乳动物的一部分)如下图。在表现形式上语义网络和知识图谱相似但语义网络更侧重于描述概念与概念之间的关系有点像生物的层次分类体系——界门纲目科属种而知识图谱则更偏重于描述实体之间的关联。除了语义网络人工智能的分支——专家系统万维网之父 Tim Berners Lee 于 1998 年提出的语义网Semantic Web和在 2006 年提出的关联数据Linked Data都和知识图谱有着千丝万缕的关系可以说它们是知识图谱前身。目前知识图谱并没有一个标准的定义 (gold standard definition)。我在这里借用一下“Exploiting Linked Data and Knowledge Graphs in Large Organisations”这本书对于知识图谱的定义A knowledge graph consists of a set of interconnected typed entities and their attributes.即知识图谱是由一些相互连接的实体和他们的属性构成的。换句话说知识图谱是由一条条知识组成每条知识表示为一个 SPO 三元组 (Subject-Predicate-Object)。在知识图谱中我们用 RDF 形式化地表示这种三元关系。RDF(Resource Description Framework)即资源描述框架是 W3C 制定的用于描述实体 / 资源的标准数据模型。RDF 图中一共有三种类型International Resource Identifiers(IRIs)blank nodes 和 literals。下面是 SPO 每个部分的类型约束Subject 可以是 IRI 或 blank node。Predicate 是 IRI。Object 三种类型都可以。IRI 我们可以看做是 URI 或者 URL 的泛化和推广它在整个网络或者图中唯一定义了一个实体 / 资源和我们的身份证号类似。literal 是字面量我们可以把它看做是带有数据类型的纯文本比如我们在第一个部分中提到的罗纳尔多原名可以表示为Ronaldo Luís Nazário de Lima^^xsd:string。blank node 简单来说就是没有 IRI 和 literal 的资源或者说匿名资源。关于其作用有兴趣的读者可以参考 W3C 的文档这里不再赘述。我个人认为 blank node 的存在有点多余不仅会给对 RDF 的理解带来额外的困难并且在处理的时候也会引入一些问题。通常我更愿意用带有 IRI 的 node 来充当 blank node行使其功能有点类似 freebase 中 CVT(compound value type) 的概念。最后的参考资料会给出一篇写 blank node 缺陷的博客有兴趣的读者可以看一看。那么“罗纳尔多的中文名是罗纳尔多·路易斯·纳扎里奥·达·利马”这样一个三元组用 RDF 形式来表示就是www.kg.com/person/1是一个 IRI用来唯一的表示“罗纳尔多”这个实体。kg:chineseName也是一个 IRI用来表示“中文名”这样一个属性。kg:是 RDF 文件中所定义的 prefix如下所示。prefix kg: http://www.kg.com/ontology/即kg:chineseName 其实就是http:// www.kg.com/ontology/chineseName的缩写。将上面的知识图用更正式的形式画出来我们其实可以认为知识图谱就包含两种节点类型资源和字面量。借用数据结构中树的概念字面量类似叶子节点出度为 0。现在读者应该知道为什么我会说之前那幅图不准确并会误导大家对知识图谱的理解了吧。罗纳尔多·路易斯·纳萨里奥·德·利马作为字面量是不能有指向外部节点的边的况且之前的图并不能直观地体现知识图谱中资源 / 实体 (用 IRI 表示) 这样一个极其重要的概念。三、总结本文通过罗纳尔多这个例子引出了知识图谱的现实需求继而给出了知识图谱的定义和相关概念并介绍了知识图谱的 RDF 形式化表示。作为一篇科普文章文中省略了许多技术细节。后续我会根据语义网技术栈Semantic Web Stack如下图来介绍知识图谱实现过程中所需要的具体技术。另外可能会结合实践介绍如何利用关系型数据库中的数据来构建一个知识图谱并搭建一个简易的基于知识图谱的问答系统 (KBQA)。参考链接W3C: RDF 1.1 Concepts and Abstract Syntaxhttps://www.w3.org/TR/rdf11-concepts/Exploiting Linked Data and Knowledge Graphs in Large OrganisationsGoogle: Introducing the Knowledge Graph: things, not stringshttps://link.zhihu.com/?targethttps%3A//googleblog.blogspot.co.uk/2012/05/introducing-knowledge-graph-things-not.htmlBlog:Problems of the RDF model: Blank Nodeshttps://link.zhihu.com/?targethttp%3A//milicicvuk.com/blog/2011/07/14/problems-of-the-rdf-model-blank-nodes/Blog:Compound Value Types in RDFhttps://link.zhihu.com/?targethttp%3A//blog.databaseanimals.com/compound-value-types-in-rdfChen, L., Zhang, H., Chen, Y., Guo, W. (2012). Blank nodes in rdf. Journal of Software, 7(9).https://link.zhihu.com/?targethttps%3A//www.researchgate.net/publication/276240316_Blank_nodes_in_RDF未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能互联网和脑科学交叉研究机构。未来智能实验室的主要工作包括建立AI智能系统智商评测体系开展世界人工智能智商评测开展互联网城市云脑研究计划构建互联网城市云脑技术和企业图谱为提升企业行业与城市的智能水平服务。  如果您对实验室的研究感兴趣欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”
http://www.zqtcl.cn/news/739605/

相关文章:

  • ppt免费下载雷锋网站WordPress5分钟建站
  • 商店网站制作做签名照的网站
  • 自己制作一个网站广州自助网站制作
  • 个人网站吗wordpress超精简主题
  • 手机版免费申请微网站wordpress 跳转链接
  • 网站建设与管理好吗广州白云最新消息
  • 织梦动漫网站模版wordpress 页面文章列表
  • 东莞做网站沃德长沙市网站开发
  • 哪些网站做的最好厦门网站建设网站
  • 网站安全事件应急处置机制建设类似百度的网站
  • 内蒙古知名网站建设网站测速工具
  • 怎样建立网站赚钱怎么登录住建局官网
  • 建站自学网页转向功能网站
  • 网站都有什么费用做酒店网站有哪些目录
  • 本地郑州网站建设东莞网站优化中易
  • 动态域名可以建网站德州公司做网站
  • 深圳建设银行官方网站wordpress 添加qq
  • 甘肃第九建设集团公司网站网站对企业的好处
  • 论坛网站建设规划书公司网站建设与设计制作
  • 做棋牌游戏网站犯法吗如何进行搜索引擎的优化
  • 常见的网站首页布局有哪几种陈光锋网站运营推广新动向
  • 手机网站活动策划方案开一个设计公司
  • 宝塔建设网站教程visual studio 2010 网站开发教程
  • 做网站购买服务器做谷歌网站使用什么统计代码吗
  • 网站系统与网站源码的关系emlog轻松转wordpress
  • 网站的简介怎么在后台炒做吉林省住房城乡建设厅网站首页
  • 泉州易尔通网站建设国际酒店网站建设不好
  • 网页下载网站福田企业网站推广公司
  • 北京网站建设开发公司哪家好网站添加在线留言
  • 新建的网站怎么做seo优化平面广告创意设计