特效素材免费网站,登封网站关键词优化软件,seo怎么发布外链,天晴创艺网站建设百度小程序全文索引技术是目前搜索引擎的关键技术。 试想在1M大小的文件中搜索一个词#xff0c;可能需要几秒#xff0c;在100M的文件中可能需要几十秒#xff0c;如果在更大的文件中搜索那么就需要更大的系统开销#xff0c;这样的开销是不现实的。 所以在这样的矛盾下出现了全文索… 全文索引技术是目前搜索引擎的关键技术。 试想在1M大小的文件中搜索一个词可能需要几秒在100M的文件中可能需要几十秒如果在更大的文件中搜索那么就需要更大的系统开销这样的开销是不现实的。 所以在这样的矛盾下出现了全文索引技术有时候有人叫倒排文档技术。 原理是先定义一个词库然后在文章中查找每个词条(term)出现的频率和位置把这样的频率和位置信息按照词库的顺序归纳这样就相当于对文件建立了一个以词库为目录的索引这样查找某个词的时候就能很快的定位到该词出现的位置。 问题在处理英文文档的时候显然这样的方式是非常好的因为英文自然的被空格分成若干词只要我们有足够大的词汇库就能很好的处理。但是亚洲文字因为没有空格作为断词标志所以就很难判断一个词而且人们使用的词汇在不断的变化而维护一个可扩展的词汇库的成本是很高的所以问题出现了。 解决出现这样的问题使“分词”成为全文索引的关键技术。目前有两中基本的方法 二元法 它把所有有可能的每两两汉字的组合看为一个词组这样就没有维护词库的开销。 词库法 它使使用词库中的词作为切分的标准这样也出现了词库跟不上词汇发展的问题除非你维护词库。 实际上现在很多著名的搜索引擎都使用了多种分词的办法比如“正向最大匹配”“逆向最大匹配”基于统计学的新词识别自动维护词库等技术但是显然这样的技术还没有作到完美。 目前全文索引技术正走向人工智能化也是发展的方向。 一个完整的SQL SERVER数据库全文索引的示例 日期:2009-08-28 14:18 SQL SERVER数据库全文索引的示例以pubs数据库为例。 首先介绍利用系统存储过程创建全文索引的具体步骤 1) 启动数据库的全文处理功能 (sp_fulltext_database) 2) 建立全文目录 (sp_fulltext_catalog) 3) 在全文目录中注册需要全文索引的表 (sp_fulltext_table) 4) 指出表中需要全文索引的列名 (sp_fulltext_column) 5) 为表创建全文索引 (sp_fulltext_table) 6) 填充全文目录 (sp_fulltext_catalog) ---------********示例********------------- 以对pubs数据库的title和notes列建立全文索引之后使用索引查询title列或notes列中包含有datebase 或computer字符串的图书名称 在这之前需要安装Microsoft Search服务启动SQL server全文搜索服务 user pubs --打开数据库 go --检查数据库pubs是否支持全文索引如果不支持 --则使用sp_fulltext_database 打开该功能 if(select databaseproperty(pubs,isfulltextenabled))0 execute sp_fulltext_database enable --建立全文目录FT_PUBS execute sp_fulltext_catalog FT_pubs,create --为title表建立全文索引数据元 execute sp_fulltext_table title,create,FT_pubs,UPKCL_titleidind --设置全文索引列名 execute sp_fulltext_column title,title,add execute sp_fulltext_column title,notes,add --建立全文索引 --activate是激活表的全文检索能力也就是在全文目录中注册该表 execute sp_fulltext_table title,activate --填充全文索引目录 execute sp_fulltext_catalog FT_pubs,start_full go --检查全文目录填充情况 While fulltextcatalogproperty(FT_pubs,populateStatus)0 begin --如果全文目录正处于填充状态则等待30秒后再检测一次 waitfor delay 0:0:30 end --全文目录填充完成后即可使用全文目录检索 select title form where CONTAINS(title,database) or CONTAINS(title,computer) or CONTAINS(notes,database) or CONTAINS(notes,database) --------------以下介绍一下全文操作类的系统存储过程 过程名称sp_fulltext_service 执行权限serveradmin或系统管理员 作 用设置全文搜索属性 过程名称sp_fulltext_catalog 执行权限db_owner及更高角色成员 作 用创建和删除一个全文目录启动或停止一个全文目录的索引操作 过程名称sp_fulltext_database 执行权限db_owner角色成员 作 用初始化全文索引或删除数据库中所有全文目录 过程名称sp_fulltext_table 执行权限db_ddladnmin或db_owner角色成员 作 用将一个表标识为全文索引表或非全文索引表 过程名称sp_fulltext_column 执行权限db_ddladnmin角色成员 作 用指出一个全文索引表中的那些列假如或退出全文索引 本文转自黄聪博客园博客原文链接http://www.cnblogs.com/huangcong/archive/2010/05/07/1729512.html如需转载请自行联系原作者