当前位置: 首页 > news >正文

北京品牌网站电子产品网站开发背景

北京品牌网站,电子产品网站开发背景,网站建设产品图,2023年电商数据报告什么是Lucene#xff1f; Apache LuceneTM是完全用Java编写的高性能#xff0c;功能齐全的文本搜索引擎库。 它是一项适用于几乎所有需要全文搜索的应用程序的技术#xff0c;尤其是跨平台的应用程序。 Lucene可以纯文本#xff0c;整数#xff0c;索引PDF#xff0c;Of… 什么是Lucene Apache LuceneTM是完全用Java编写的高性能功能齐全的文本搜索引擎库。 它是一项适用于几乎所有需要全文搜索的应用程序的技术尤其是跨平台的应用程序。 Lucene可以纯文本整数索引PDFOffice文档。 等等。 Lucene如何启用更快的搜索 Lucence创建了一个称为倒排索引的东西。 通常我们在文档中映射文档-术语。 但是Lucene则相反。 创建索引词-包含该词的文档列表这使搜索速度更快。 安装Lucene Maven依赖 pre classbrush:xmldependencygroupidorg.apache.lucene/groupidartifactidlucene-core/artifactidversion3.0.2/versiontypejar/typescopecompile/scope /dependency 下载依赖 从http://lucene.apache.org/下载Lucene并在类路径中添加lucene-core.jar。 Lucene如何工作 首先让我们从底部开始了解图片-中心。 原始文本用于创建Lucene“文档”使用指定的分析器对其进行分析然后根据字段的StoreTermVector和Analzed属性将文档添加到索引中。 接下来从上到下搜索。 用户以文本格式指定查询。 查询对象是基于查询文本构建的执行查询的结果作为TopDocs返回。 Lucene核心课程 目录FSDirectoryRAMDirectory 包含索引的目录 基于文件系统的索引目录 基于内存的索引目录 目录 indexDirectory FSDirectory.open新文件c// lucene // nodes; 索引作家 处理写入索引– addDocumentupdateDocumentdeleteDocumentsmerge等 IndexWriter writer 新的IndexWriterindexDirectory 新的StandardAnalyzerVersion.LUCENE_30 新的MaxFieldLength1010101; IndexSearcher 使用indexReader进行搜索-搜索查询整型 IndexSearcher searcher 新的IndexSearcherindexDirectory; 文献 DTO用于索引和搜索 Document document new Document; 领域 每个文档包含多个字段。 有2部分名称值。 新字段id1Store.YESIndex.NOT_ANALYZED 术语 测试一个字。 用于search.2零件。要搜索的字段和要搜索的值 条款term new Termid1; 询问 所有查询类型的基础-TermQueryBooleanQueryPrefixQueryRangeQueryWildcardQueryPhraseQuery等。 查询查询新的TermQueryterm; 分析仪 从文本构建令牌并帮助从文本构建索引词 新的StandardAnalyzer Lucene目录 目录–是Lucene在其上运行的数据空间。 它可以是文件系统或内存。 以下是常用的目录 目录 描述 例 FS目录 基于文件系统的目录 目录 FSDirectory.open文件文件; //文件-目录路径 RAM目录 基于内存的Lucene目录 目录新的MemoryDirectory Directory new MemoryDirectoryDirectory dir//将基于文件的目录加载到内存 创建索引条目 Lucene的“文档”对象是索引中使用的主要对象。 文档包含多个字段。 分析器在文档字段上进行工作以将其分解为令牌然后使用索引编写器写入目录。 索引作家 IndexWriter writer new IndexWriter(indexDirectory, new StandardAnalyzer(Version.LUCENE_30), true, MaxFieldLength.UNLIMITED);分析仪 将文本分析为要搜索的标记或关键字的工作。 Lucene提供的默认分析器很少。 分析器的选择定义了如何对索引文本进行标记和搜索。 以下是一些标准分析仪。 示例–分析器如何处理示例文本 定义字段索引的属性 存储–是否应存储该字段以便将来检索 分析–应将内容拆分为令牌 TermVECTOR –是否存储基于术语的详细信息 店铺 是否应将该字段存储起来以便以后撤退 是的 存储值以后可以从索引中检索 商店编号 不要储存。 与Index.ANALYZED一起使用。 当令牌仅用于搜索时 分析 如何分析文字 索引分析 将文本分解为标记对每个标记编制索引以使其可搜索 索引。NOT_ANALYZED 将整个文本作为单个标记编制索引但不要进行分析拆分 Index.ANALYZED_NO_NORMS 与ANALYZED相同但不存储规范 索引NOT_ANALYZED_NO_NORMS 与NOT_ANALYZED相同但没有规范 索引号 别 使此字段完全可搜索 词向量 相似突出显示等需要术语详细信息 TermVector.YES 记录 每个文档中的唯一条款计数无位置无偏移 TermVector.WITH_POSITIONS 记录 每个文档中的唯一条款计数位置无偏移 TermVector.WITH_OFFSETS 记录 每个文档中的唯一条款计数无位置抵消 TermVector.WITH_POSITIONS_OFFSETS 记录 每个文档中的唯一条款计数位置偏移 TermVector.NO 不要记录术语向量信息 创建索引的示例 IndexWriter writer new IndexWriter(indexDirectory, new StandardAnalyzer(Version.LUCENE_30), true,MaxFieldLength.UNLIMITED);Document document new Document(); document.add(new Field(id, 1, Store.YES, Index.NOT_ANALYZED)); document.add(new Field(name, user1, Store.YES, Index.NOT_ANALYZED)); document.add(new Field(age, 20, Store.YES, Index.NOT_ANALYZED)); writer.addDocument(document); 更新索引的示例 IndexWriter writer new IndexWriter(indexDirectory, new StandardAnalyzer(Version.LUCENE_30), true,MaxFieldLength.UNLIMITED);Document document new Document(); document.add(new Field(id, 1, Store.YES, Index.NOT_ANALYZED)); document.add(new Field(name, user1, Store.YES, Index.NOT_ANALYZED)); document.add(new Field(age, 20, Store.YES, Index.NOT_ANALYZED)); writer.addDocument(document); 删除索引的例子 IndexWriter writer new IndexWriter(indexDirectory, new StandardAnalyzer(Version.LUCENE_30), MaxFieldLength.UNLIMITED);Term term new Term(id, 1); writer.deleteDocuments(term); 搜索索引 用户以文本格式指定查询。 根据查询文本构建查询对象对其进行分析然后将执行的查询结果作为TopDocs返回。 查询是搜索的主要输入。 术语查询 布尔查询 是否合并多个查询 前缀查询 以。。开始 通配符查询 和* – *开头不允许 词组查询 精确短语 范围查询 术语范围或数字范围 模糊查询 相似词搜索 样本查询 搜索示例 IndexSearcher searcher new IndexSearcher(indexDirectory); Term term new Term(id, 1); Query query new TermQuery(term); TopDocs docs searcher.search(query, 3); for (int i 1; i docs.totalHits; i) {System.out.println(searcher.doc(i)); }Lucene诊断工具 卢克– http://code.google.com/p/luke/ Luke是一个方便的开发和诊断工具它可以访问现有的Lucene索引并允许您以几种方式显示和修改其内容 豪华轿车– http://limo.sourceforge.net/ 这个想法是要有一个小的工具作为Web应用程序运行它提供有关Lucene搜索引擎使用的索引的基本信息。 完整的例子 在这里下载 LuceneTester.java 资源资源 http://lucene.apache.org/core/ http://www.amazon.com/Lucene-Action-Second-Edition-Covers/dp/1933988177/refdp_ob_title_bk 参考 Lucene –在Techie博客的Thoughts中从我们的JCG合作伙伴 Srividhya Umashanker 快速添加了索引和搜索功能 。 翻译自: https://www.javacodegeeks.com/2012/12/lucene-quickly-add-index-and-search-capability.html
http://www.zqtcl.cn/news/49258/

相关文章:

  • 网站建设 项目背景福州市网站建设
  • asp网站加速上海公司名字
  • 商城网站建设好么什么网站做简历比较好
  • 网站建设与软件开发哪个好赚钱网站的页面由什么组成
  • 国家城乡和住房建设部网站首页go语言网站开发
  • o2o网站建设流程wordpress网站加cnzz
  • vue 网站开发狗和女人做的网站
  • 网站开发详细设计wordpress 注册 登录
  • 衡器行业网站建设模板建设银行企业网站打不开
  • 彩票网站开发制作网站硬件防火墙
  • 鼎成中考开卷通有关网站做的电子书wordpress首页内容怎么修改
  • 十大购物网站北京做网站找哪家好
  • 网站建设的地方网站模板设计
  • 百度网站怎么优化排名气象网站建设的自查报告
  • 网站开发vue青岛公司的网站设计
  • 网站建设怎么自学普通网站 用多说
  • 网站开发前台实训做旅游网站需要什么
  • t恤在线制作网站公司网站开发文档
  • 网站设置flash插件wordpress去标题版权
  • 学校校园网站建设服务辽宁建设工程信息网查
  • 朵朵软件网站建设培训课程
  • 做网站需要交钱吗附近学电脑培训班
  • 域名有了怎么建网站火车头wordpress 4.7
  • 网站建设格局wordpress打开图片预览代码
  • 怎么建设像天猫的网站网页制作与网站建设宝典 第2版
  • 直接做海报的网站音乐视频怎么做mp3下载网站
  • 一流学科建设专题网站小规模注册公司流程和费用
  • 肇庆建设工程备案的网站润商网站建设服务
  • 网站开发团队配置旧金山网站建设
  • 域名大全百家号优化上首页