东莞市网络seo推广平台,seo交流论坛,网站空间服务器续费,建筑人才招聘网站学习内容
小象学院 b站 第二章 【其实后面的方法学习只是一个框架式的学习#xff0c;并不明白具体的操作】
第二部 典型知识库项目简介 CYC#xff08;读音#xff1a; 赛克#xff09; CYC#xff1a; 1984年由Douglas Lenat开始创建#xff0c;最初的目标是建立人类…学习内容
小象学院 b站 第二章 【其实后面的方法学习只是一个框架式的学习并不明白具体的操作】
第二部 典型知识库项目简介 CYC读音 赛克 CYC 1984年由Douglas Lenat开始创建最初的目标是建立人类最大的常识知识库。该知识库主要由术语Terms和断言Assertions组成。 Cyc的主要特点是基于形式化的知识表示方法来刻画知识。形式化的优势是可以支持复杂的推理。但过于形式化也导致知识库的扩展性和应用的灵活性不够。Cyc提供开放版本的OpenCyc
Wordnet WordNet是最著名的词典(lexical)知识库主要用于词义消歧1985年提出的。 WordNet主要定义了名词、动词、形容词和副词之间的语义关系。 例如名词之间的上下位关系如 猫科动物是猫的上位词动词之间的蕴涵关系如打鼾蕴含着睡眠等 WordNet已经包含超过了15万个词和20万个语义关系。 ConceptNet
ConceptNet是常识知识库。来源于OMCS项目。1999年创立
ConceptNet主要依靠互联网众包、专家创建和游戏三种方法来构建。新版本导入了大量开放的结构化数据如DBPedia、WordNetdengConceptNet知识库以三元组形式的关系型知识构成。ConceptNet5版本已经包含有2800万关系描述。与Cyc相比ConceptNet采用了非形式化、更加接近自然语言的描述而不是像Cyc那样采用形式化的谓词逻辑与链接数据和谷歌知识图谱相比ConceptNet比较侧重于词与词之间的关系。从这个角度看ConceptNet更加接近于WordNet但是又比WordNet包含的关系多。此外ConceptNet完全免费开放并支持多种语言。
Freebase 三元组我们理解为主谓宾
Wikidata DBPedia
DBPedia是早期的语义网项目。DBPedia意指数据库版本的Wikipedia是从Wikipedia抽取出来的链接数据集。DBPedia采用了一个较为严格的本体包含人、地点、音乐、电影、组织机构、物种、疾病等类定义此外DBPedia还与Freebase、OpenCYC、Bio2RDF等多个数据集建立了数据链接。 DBPedia采用RDF语义数据模型总共包含30亿RDF三元组。
三元组我们理解为主谓宾
YAGO
链接 我们还添加了各种时间关系比如奥巴马是多少年任期的 鹿晗和关晓彤是多少年在一起的。
BabelNet
BabelNet是类似于WordNet的多语言词典知识库。BabelNet的目标是解决WordNet在非英语语种中数据缺乏的问题。BabelNet采用的方法是将WordNet词典与Wikipedia百科集成首先建立WordNet中的词与Wikipedia的页面标题的映射然后利用Wikipedia中的多语言链接再辅以机器翻译技术来给WordNet增加多种语言的词汇BabelNet3.7包含了271中语言1400万同义词组36,4万词语关系和3.8亿从Wikipedia中抽取的链接关系总计超过19亿RDF三元组。继承了上面两个数据库的优点构建了目前最大规模的多语言词典知识库。 我们可以利用同义词来重构搜索条件
NELL 这里是自动在web上抽取三元组知识但是需要知识抽取bootstrap来进行引导。
Concept Graph
Concept Graph是以概念层次体系为中心的知识图谱。与Freebase等知识图谱不同Concept Graph以概念定义和概念之间的IsA关系为主给定一个概念如“Microsoft”Concept Graph返回一组与“微软”有ISA关系概念组如“Company”“Software Company”这被称为概念化“Conceptualization”Concept Graph可以用于短文本理解和语义消歧。 如“工程师在吃苹果”苹果指的是苹果还是苹果公司。
OpenKG中文知识图谱资源库
Zhishi.me
英文很多中文很少。 包括百度百科 实体抽取关系抽取 --》 知识抽取 我们获取知识后再进行整合进行互补。
cnSchema开放的中文知识图谱Schema
可以自行访问