博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Lucene搜索原理
阅读量:7199 次
发布时间:2019-06-29

本文共 436 字,大约阅读时间需要 1 分钟。

hot3.png

000649_3UQG_192871.png

全文检索大体分两个过程,索引创建(Indexing)和搜索索引(Search)。

索引创建:将现实世界中所有的结构化和非结构化数据提取信息,创建索引的过程。

搜索索引:就是得到用户的查询请求,搜索创建的索引,然后返回结果的过程。

于是全文检索就存在三个重要问题:

1. 索引里面究竟存些什么?(Index)

2. 如何创建索引?(Indexing)

3. 如何对索引进行搜索?(Search)

000752_p8vi_192871.png

001045_qLYc_192871.jpg

Lucene的analysis模块主要负责词法分析及语言处理而形成Term。

Lucene的index模块主要负责索引的创建,里面有IndexWriter。

Lucene的store模块主要负责索引的读写。

Lucene的QueryParser主要负责语法分析。

Lucene的search模块主要负责对索引的搜索。

Lucene的similarity模块主要负责对相关性打分的实现。

转载于:https://my.oschina.net/hrbeu05/blog/261916

你可能感兴趣的文章
delphi 里的@^#等符号都是什么意思?
查看>>
drf 富文本编辑器上传的图片路径问题
查看>>
工作记录--WPF自定义控件,实现一个可设置编辑模式的TextBox
查看>>
【LeetCode每天一题】Validate Binary Search Tree(有效的二叉搜索树)
查看>>
git学习笔记
查看>>
高手教你恢复误删文件的秘籍
查看>>
Hibernate 中property属性insert,update
查看>>
【小型系统】简单的刷票系统(突破IP限制进行投票)
查看>>
接口服务中的日志
查看>>
MyCAT部署及实现读写分离(转)
查看>>
多个(子)进程的开启,进程的常用属性和方法
查看>>
netty入门05
查看>>
python 局部变量和全局变量
查看>>
CSS样式
查看>>
【Shell】使用shell打印菜单,一键安装Web应用
查看>>
ASP.NET Json数组的反序列化
查看>>
Git服务器Gogs简易安装-Windows环境
查看>>
BZOJ-1602: [Usaco2008 Oct]牧场行走 (LCA炒鸡大裸题)
查看>>
git pull --rebase 做了什么? 以及 Cannot rebase: You have unstaged changes 解决办法
查看>>
Mashup 理解 && paper:SmashQ
查看>>