Lucene是apache軟件基金會(huì)4 jakarta項(xiàng)目組的一個(gè)子項(xiàng)目,是一個(gè)開(kāi)放源代碼的全文檢索引擎工具包,但它不是一個(gè)完整的全文檢索引擎,而是一個(gè)全文檢索引擎的架構(gòu),提供了完整的查詢(xún)引擎和索引引擎,部分文本分析引擎。Lucene的目的是為軟件開(kāi)發(fā)人員提供一個(gè)簡(jiǎn)單易用的工具包.

粘貼這句話(huà)的意思就是想說(shuō)明  Lucene僅僅是一個(gè)工具包,搜索引擎的工具包.

有人會(huì)問(wèn)?Lucene和solr的區(qū)別,solr是一個(gè)搜索系統(tǒng),打個(gè)比方,就如servlet和struts2的區(qū)別   Lucene就是servlet,solr就好比solr,solr封裝了Lucene.

下面說(shuō)說(shuō)Lucene的原理:

我們使用Lucene,其實(shí)使用的是他的倒排查詢(xún)

什么是倒排查詢(xún)?舉個(gè)例子

新華字典,我們都用過(guò)吧,新華字典分為兩部分,第一部門(mén)就是目錄的邊旁部首,第二部分就是正文,一個(gè)一個(gè)字的解釋,

我們?cè)谟眯氯A字典的時(shí)候,一般我們都是通過(guò)邊旁部首找字,沒(méi)有人一頁(yè)一頁(yè)的翻字典找字吧.

Lucene的倒排就是如此,他會(huì)檢索文本,數(shù)據(jù)庫(kù),web網(wǎng)頁(yè),在把內(nèi)容分詞,就像邊旁部首

網(wǎng)友評(píng)論