pageadmin自助建站系统,昆明seo博客南网站建设,软件工程师证书有用吗,好牌子网首先#xff0c;要制作搜索引擎#xff0c;我们首先要了解#xff0c;什么是正排索引#xff0c;什么是倒排索引#xff0c;这是一个搜索引擎的关键。
1.正排索引 正排索引#xff0c;其实就是我们的每一个文档#xff0c;对应一个文档id。 正如vector容器一样#xf…首先要制作搜索引擎我们首先要了解什么是正排索引什么是倒排索引这是一个搜索引擎的关键。
1.正排索引 正排索引其实就是我们的每一个文档对应一个文档id。 正如vector容器一样数组的每一个元素对应着一个下标。 正排索引也是这个道理一个文档对应一个文档id这也给了我们一个思路就是我们在实现正排索引的时候我们可以用vector来存储这样顺序表的下标天然的就能作为我们文档的id。 就比如这个表格我们每一个网站对应了一个id我们通过这个id就可以访问到对应的网站。
文档id文档1小米汽车2小米手机3小米家具4小米公司
2.倒排索引 倒排索引是我们搜索最关键的部分就比如我们搜索输入一个关键词比如小米品牌手机。 然后我们的搜索引擎会将这个搜索关键字进行分词变成 小米/品牌/手机。 然后我们需要进行内容匹配就比如小米这个词在文档1234都有 手机只有2有然后再设置一个权重将匹配的最多的文档id放在前面展示 关键词文档id小米1234手机2
然后我们再根据文档id去找到文档从而实现了一个正排倒排索引的配合达到我们搜索的目的。 这里的倒排索引我们可以用一个关键词匹配到的文档id用一个vector来存储然后关键词对应着一个vector那我们就可以想到用unordered_map来存储 建立关键词-文档id的一个映射关系。